• Aucun résultat trouvé

Ce n’est pas parce qu’ils sont nombreux à avoir tort qu’ils ont raison.

N/A
N/A
Protected

Academic year: 2021

Partager "Ce n’est pas parce qu’ils sont nombreux à avoir tort qu’ils ont raison. "

Copied!
8
0
0

Texte intégral

(1)

Cette thèse doctorat est le fruit de cinq années de travail au sein de l’Unité de Bioinformatique génomique et structurale du service de Biosystèmes, Biomodélisation et Bioprocédés (3-BIO) de l’Université Libre de Bruxelles.

Mes remerciements s’adressent avant tout à ma promotrice, le Professeur Marianne Rooman, et à mon co-promoteur, le Professeur Philippe Bogaerts, sans qui cette thèse n’aurait jamais vu le jour. Marianne, merci de m’avoir guidé dans cette aventure, à travers tous les stades de mon développement personnel, de m’avoir fait confiance et de m’avoir sans cesse encouragé. Philippe, merci d’avoir toujours répondu présent à chaque appel, efficacement et toujours entre deux traits d’humour, et, évidemment, merci de m’avoir permis d’entretenir ma créativité en te trouvant chaque matin un nouveau titre honorifique digne des « ket », « pey » et autres « manneke » ! Merci pour votre confiance et votre soutien.

Je tiens à remercier Messieurs Yves Dehouck, Jean Marc Kwasigroch et Jaroslav Albert, pour leur aide précieuse et leur collaboration tout au long de ce travail. Yves, Castor, toujours prêt ... à donner un coup de main, aucune question ne te résiste plus d’un quart de seconde, merci pour ton aide inestimable. Hey J0e, ta disponibilité et ton savoir-faire m’ont été d’un immense secours, merci beaucoup. Jaro, merci pour ta collaboration et ton enthousiasme permanent. J’aurais aimé continuer à travailler avec vous.

Je désire exprimer ma reconnaissance aux membres de mon comité d’accompagnement de thèse, les Professeurs Michel Kinnaert et Benoît Haut, qui ont suivi l’ensemble de mon travail.

J’adresse aussi mes remerciements aux Professeurs Vincent Detours, Rodolphe Sepulchre et Pierre-Antoine Absil ainsi qu’à Messieurs Michel Journée et Didier Gonze, pour les discussions intéressantes que nous avons partagées.

Je remercie le Fonds pour la formation à la Recherche dans l’Industrie et l’Agriculture et la Fondation David et Alice Van Buuren pour les bourses qui m’ont été octroyées.

A tous les membres du service 3-BIO, merci pour cette bonne humeur omniprésente.

Nathalie, Danièle et Arlette, les drôles de dames du 5e, chaque « jatte » de café (9/7 chef !) me rappellera nos moments de partage. Jean-Louis, merci de m’avoir appris que la vie pouvait être une grande plaisanterie et je n’ai pas peur de le dire ! Benja et les doctorants de la Table Ronde, les mots sont dérisoires pour décrire ces discussions mémorables et tous ces rires, merci pour ces moments de pur bonheur. Marie, Souad, Anne, Malik, Zakaria, merci de m’avoir soutenu par vos sourires et votre humour, la prochaine cuvée de docteurs s’annonce être un très grand cru! Dimitri, merci pour cette bonne humeur dont tu débordes et merci de m’avoir confié l’encadrement de projets et TPs, c’était une superbe expérience. Tomasz, merci de m’avoir rappelé que la curiosité est bien la plus belle des qualités. Matthieu et Jérémy, chaque fois que l’horloge indiquera 13h59, j’aurai une pensée pour vous ! Merci pour ces instants de délires et de rires. Merci à Fabian, Niu, Patrick, pour leur présence et leurs encouragements et à Napo, pour le sourire le plus communicatif que j’aie connu.

Un tout grand merci à ces amis qui me sont si chers. Tom, je me serais senti bien seul si je ne t’avais pas su à quelques centaines de mètres de là. À quand notre prochaine discussion pour refaire le monde ? Laurent, la ligne Boondael-Châtelet restera à jamais gravée de nos fous rires et nos délires, merci pour ces belles déclarations d’humour. Jessy et Christel, merci de nous avoir si patiemment supportés et, sincèrement, pardonnez-nous, je crois que notre cas est désespéré !

Je tiens enfin à exprimer toute ma reconnaissance à ma famille pour leur soutien inconditionnel. Merci à mes parents et mon grand frère d’avoir toujours cru en moi et de m’avoir sans cesse soutenu. « L’amour pour épée, l’humour pour bouclier » comme disait l’autre. Merci à Sandrine, Bernard et mes beaux-parents pour leur présence et leurs encouragements, et à ma filleule, Sarah, et mon neveu, Robin, dont les rires sont un remède aux pires humeurs, à Marie-Paule, ma 2e maman, Michel, Alex et Colette, pour leur soutien aussi discret que chaleureux, à mes grands-parents sur la plage et à ceux partis au large. J’ai une chance immense de tous vous avoir.

A toi, mon amour. Je ne serais pas allé bien loin sans toi à mes côtés. Merci de m’avoir supporté, aidé, contredit, rassuré, encouragé, titillé, dorloté ... Merci d’être là et d’être toi. Je t’aime.

A vous tous, merci.

iii

(2)
(3)

Ce n’est pas parce qu’ils sont nombreux à avoir tort qu’ils ont raison.

Coluche

v

(4)
(5)

Résumé

Cette thèse de doctorat s’inscrit dans le développement et l’utilisation de méthodes mathématiques et informatiques qui exploitent les données temporelles d’expression des gènes issues de puces à ADN afin de rationaliser et de modéliser les réseaux de régulation génique.

Dans cette optique, nous nous sommes principalement intéressés aux données d’expression des gènes de la drosophile (Drosophila melanogaster) pendant son développement, du stade embryonnaire au stade adulte. Nous avons également étudié des données concernant le développement d’autres eucaryotes supérieurs, la réponse d’une bactérie soumises à différents stress et le cycle cellulaire d’une levure. Ce travail a été réalisé selon trois volets principaux : la détection des stades de développement et des perturbations, les classifications de profils d’expression et la modélisation de réseaux de régulation.

Premièrement, l’observation des données d’expression utilisées nous a conduits à approfondir l’étude des phénomènes survenant lors des changements de stades de développement de la drosophile. Dans ce but, deux méthodes de détection automatique de ces changements ont été développées et appliquées aux données temporelles disponibles sur le développement d’eucaryotes supérieurs. Elles ont également été appliquées à des données temporelles relatives à des perturbations externes de bactéries. Cette étude à montré qu’une formulation mathématique simple permettait de retrouver les instants expérimentaux où une perturbation ou un changement de stade de développement est observé, à partir uniquement des profils d’expression. Par ailleurs, la réponse à une perturbation externe s’avère non distinguable d’une succession de stades de développement, sur la base des seuls profils temporels d’expression.

Deuxièmement, en raison des dimensions du problème constitué par les données d’expression de plusieurs milliers de gènes et de l’impossibilité de distinguer le rôle dans la régulation des gènes qui présentent des profils d’expression similaires, il s’est avéré nécessaire de classifier les gènes selon leurs profils d’expression. En nous basant sur les résultats obtenus lors de la détection des stades de développement, la démarche suivie est de regrouper les gènes qui présentent des profils temporels d’expression aux comportements similaires non seulement au cours de la série temporelle complète, mais également dans chacun des stades de développement.

Dans cette optique, trois distances ont été proposées et utilisées dans une classification hiérarchique des données d’expression de la drosophile.

Troisièmement, des structures de modèles linéaires et non linéaires ainsi que des méthodes d’estimation et de réduction paramétriques ont été développées et utilisées pour reproduire les données d’expression du développement de la drosophile. Les résultats de ce travail ont montré qu’avec une structure de modèle linéaire simple, la reproduction des profils expérimentaux était excellente et que, dans ce cas, le réseau de régulation génique de la drosophile pouvait se contenter d’une faible connectivité (en moyenne 3 connexions par classe de gènes) et ce, sans hypothèse a priori. Toutefois, les modèles linéaires ont ensuite sérieusement été remis en question par des analyses de robustesse aux perturbations paramétriques et de stabilité des profils après extrapolation dans le temps. Dès lors, quatre structures de modèles non linéaires et cinq méthodes de réduction paramétrique ont été proposées et utilisées pour concilier les critères de reproduction des données, de robustesse et de stabilité des réseaux identifiés. En outre, ces méthodes de modélisation ont été appliquées à un sous-ensemble de 20 gènes impliqués dans le développement musculaire de la drosophile et pour lesquels 36 interactions ont été validées expérimentalement, ainsi qu’à des profils synthétiques bruités. Nous avons pu constater que plus de la moitié des connexions et non-connexions sont retrouvées par trois modèles non linéaires. Les résultats de cette étude ont permis d’éliminer certaines structures de modèle et méthodes de réduction et ont mis en lumière plusieurs directions futures à suivre dans la démarche de modélisation des réseaux de régulation génique.

vii

(6)
(7)

Notations utilisées

Constantes et paramètres

h Nombre de gènes

l Nombre de points de mesure de la série temporelle S Nombre de stades de développement

d Degré des polynômes modélisant les profils d’expression

I

agj Coefficients des polynômes modélisant le profil d’expression du gène g dans le stade I κI Indices des instants délimitant les stades de développement (I=1,..,S)

κI exp Indices des instants expérimentaux délimitant les stades de développement (I=1,..,S) α Paramètre de mise à l’échelle des profils d’expression

β Paramètre de translation des profils d’expression

bg Paramètre de translation du profil d’expression du gène g εgk Erreur de mesure pour le gène g à l’instant τk

n Nombre de classes de gènes

nopt Nombre optimal de classes de gènes

Mij Paramètres de régulation du modèle linéaire (i,j=1,…,n)

Cij Somme des signes des paramètres Mij dans les solutions réduites (i,j=1,…,n) uc Paramètres d’entrée du modèle linéaire (c=1,…,n)

N Nombre de paramètres éliminés

Nopt Nombre optimal de paramètres éliminés P Perturbation paramétrique

p Amplitude de la perturbation paramétrique q Connectivité du réseau de régulation génique ρc Paramètres de transcription (c=1,…,n)

γc Paramètres de dégradation (c=1,…,n)

λc Paramètres de constantes caractéristiques (c=1,…,n) Aij Paramètres d’activation (i=1,…,n ; j=1,…,q)

Bij Paramètres de répression (i=1,…,n ; j=1,…,q) Tij Paramètres de régulation de transcription (i=1,…,n ; j=1,…,q) Eij Paramètres de régulation de dégradation (i=1,…,n ; j=1,…,q) θm,q,r Ensemble de paramètres de la solution (m,q,r)

ξm,q,r Ensemble de paramètres de régulation de la solution (m,q,r) s Nombre total de paramètres du modèle

v Nombre de paramètres de régulation du modèle

ix

(8)

Variables et fonctions

t Temps réel continu

τk Instants de mesure de la série temporelle (k=1,…,l)

g( )k

  Intensité médiane du signal fluorescent pour le gène g à l’instant τk

g( )k

  Intensité du bruit de fond local pour le gène g à l’instant τk

g( )k

  Intensité effective du signal fluorescent pour le gène g à l’instant τk

g( )k

Y Profil d’expression du gène g (en concentrations relatives)

I( )

g k

Y  Profil d’expression du gène g (en concentrations relatives) dans le stade I

g1

Yij Taux d’expression du gène g (en concentrations relatives) de l’instant τi à l’intant τj

g

 

k

y  Profil d’expression du gène g (en échelle logarithmique)

 

F

g k

y Profil filtré d’expression du gène g (en échelle logarithmique)

( ) I u ( )

Pg t Polynôme de degré u modélisant le profil d’expression du gène g dans le stade I

P Ecart quadratique moyen entre les polynômes estimés et les profils expérimentaux

1 2

( gij, gij )

DY Y Distance entre les profils d’expression des gènes g1 et g2 entre les instants τi et τj

l

Dk Distance entre les profils d’expression sur l instants successifs avant et après τk

 

c k

  Taux d’expression moyen associé à la classe c à l’instant τk

 

gk

Taux d’expression réel du gène g à l’instant τk

 

c k

x  Profil d’expression moyen (en échelle logarithmique) associé à la classe c

 

F

c k

x Profil d’expression moyen filtré (en échelle logarithmique) associé à la classe c

 

c k

  Profil de disparité des niveaux d’expression dans la classe c

 

c k

Z Profil quelconque associé à la classe c

 

c k

X Profil d’expression moyen (en concentrations relatives) associé à la classe c

1 2

(ZgI ,ZgI )

 Distance entre les polynômes modélisant les profils ZgI1 et ZgI2dans chaque stade

1 2

(Z Zg, g )

 Distance entre les coefficients des polynômes modélisant les profils Zg1 et Zg2

cd

Critère de proximité entre les classes c et d (ω=1,...,4)

intra

 Distance (générique) moyenne entre éléments à l’intérieur des classes

inter

 Distance (générique) moyenne entre représentatifs des différentes classes δ Ecart maximal observé entre deux ensembles de n profils d’expression Jc Ecart quadratique moyen entre les profils estimé et interpolé de dxc/dt S Ecart quadratique moyen pondéré par la variance

ΔM Matrice de variation relative des paramètres lors de l’optimisation paramétrique f m,q,r Formulation mathématique du modèle m,q,r

G m,q,r Matrice de sensibilité du modèle m,q,r

F m,q,r Matrice d’information de Fisher du modèle m,q,r

K m,q,r Matrice de corrélation de la matrice d’information de Fisher du modèle m,q,r χ m,q,r Fonction de stabilité des profils d’expression du modèle m,q,r après extrapolation

Références

Documents relatifs

On rencontre des difficultés du même type que pour la détection de gènes majeurs pour déterminer la distribution des statistiques de tests, avec en

Ayant explicité l’objectif principal de cette progression, on s’aperçoit que les acti- vités scientifiques proposées ont pour but de faire construire par les enfants cette no- tion

DÉLAIS DE STAGE : périodes à compter de la date d’adhésion à la Mutuelle pendant laquelle la garan� e de la Mutuelle n’est pas due (pour certaines catégories de

Le processus de sexualisation est un mécanisme complexe qui fait intervenir à chaque étape de nombreux facteurs, chromosomiques, génétiques, hormonaux mais aussi psychologiques.

Dans certains cas M pourra s'expliciter sous forme d'un opérateur intégral (métrique plus faible que celle de L 2 ( T ) )... sur le processus transformé M X si celui-ci

4 , nous avons établi que les extensions gauches (resp. droites) d'une théorie de Lawvere [ T ] sont des (structures de théories de Lawvere sur les) catégories de Kleisli de

Identification des unités de transcription (promoteur et terminateur) Pour les gènes codant pour les protéines, prédiction fonctionnelle par recherche de similarité de

Protéome : ensemble des protéines exprimées dans une cellule, une partie d'une cellule (membranes, organites) ou un groupe de cellules (organe, organisme, groupe d'organismes)