Validation pratique du résultat de MoT-AN sur d’autres exemples 108

4.2 La méthode d’inférence brute

4.3.6 Validation pratique du résultat de MoT-AN sur d’autres exemples 108

→

δ aj ∈ R =⇒ |`| ≤ n. Soit χ le graphe d’influences entre les automates de Σ et AN0 = (Σ, S, ∅) un T-AN. AN0, Γ, χ et n sont donnés comme entrée à l’algorithme 1, MoT-AN. Ce dernier est complet car il va générer en sortie un ensemble de T-AN Φ tel que ∃ANk

appr i s = (Σ, S, Tk

appr i s) ∈ Φ avec R ⊆ Tk appr i s et k ∈ {1, ..., |Φ|}.

Démonstration. Supposons que l’algorithme 1 n’est pas complet, alors ∃τ ∈ R qui réalise un changement dans Γ telle que ∀ANk

appr i s = (Σ, S, Tk

appr i s) ∈ Φ avec k ∈ {1, ..., |Φ|}, τ 6∈ Tk

appr i s. Après l’étape 1 de l’algorithme 1, MoT-AN, génèrent selon le graphe d’influences χ dans Tappr i s toutes les transitions locales temporisées qui sont candidates de pouvoir réaliser tous les changement dans Γ. Ainsi, @τ ∈ R qui réalise effectivement un changement dans Γ qui n’est pas générée donc τ ∈ Tappr i s. Puisque τ réalise effectivement l’un des changements de Γ alors τ est générée à l’étape 1 pour tous les changements duquel elle est responsable, et donc elle ne sera pas éliminée quand MoT-AN calcule les ensembles minimaux des transitions locales temporisées des T-AN appris. Alors τ sera nécessairement présente dans au moins l’un des ensembles minimaux des transitions locales temporisées des T-AN retournés : ∃ANk

appr i s = (Σ, S, Tk

appr i s) ∈ Φ avec k ∈ {1, ..., |Φ|} tel que τ ∈ Tk

appr i s.

Par conséquent, le théorème 4.1 ci-dessus montre qu’il n’existe pas un changement de niveau d’un composant observé dans les chronogrammes (pris en entrée par l’algorithme 1, MoT-AN) sans qu’il soit expliqué dans au moins l’un des T-AN appris par la transition locale temporisée correcte ; c’est-à-dire celle qui a effectivement causé le changement. Ainsi, la propriété 4.7 ci-dessous est déduite directement de ce théorème.

Propriété 4.7. Si Tappr i s est l’ensemble des transitions locales temporisées apprises par l’algorithme 1, MoT-AN, à partir des chronogrammes Γ et R l’ensemble des transitions locales temporisées qui ont été activées pour avoir le chronogramme Γ alors R ⊆ Tappr i s.

Dans la sous-section suivante, nous appliquons la méthode la méthode d’apprentissage MoT-AN sur d’autre modèles biologiques de taille plus grande.

4.3.6 Validation pratique du résultat de MoT-AN sur d’autres exemples

Nous présentons dans la suite les résultats obtenus après l’application de l’algorithme d’apprentissage 1, MoT-AN, sur des exemples des systèmes biologiques réels. Ces systèmes sont modélisés avec le formalisme des T-AN dont la taille de chacun (i.e., le nombre de composants) est supérieur à celle de l’exemple jouet.

Ainsi, nous faisons la même démarche de validation que celle qui a été appliquée pour le T-AN de l’exemple jouet. Les étapes de la validation pratique sont détaillées dans la sous-section 4.3.1 en page 94.

Pour comparer entre les modèles qui sont appris et le modèle initial, nous prenons l’union de tous les modèles T-AN appris. Ainsi nous avons l’ensemble de toutes les transitions locales temporisées apprises. Ensuite, nous vérifions que l’ensemble des transitions locales temporisées du T-AN initial est inclus dans l’ensemble des transitions locales temporisées apprises.

Chapitre 4 — L’inférence des réseaux d’automates avec le temps 109 Dans le tableau 4.1 ci-dessous, nous donnons les caractéristiques des modèles traités : – Exemple jouet : le modèle T-AN de la figure 4.7 en page 96 ;

– Lambda phage : le bactériophage lambda (Thieffry & Thomas, 1995) qui présente des gènes viraux pour modéliser le réseau de régulation complexe nécessaire à la décision entre la lyse et la lysogénisation dans le bactériophage tempéré ;

– Mammalian : le cycle cellulaire de mammifères (Fauré et al., 2006). Modèles _|Σ|^Description_|S| _|T

i ni ti al|

Exemple jouet 3 8 5

Lambda phage 4 48 46

Mammalian 10 2¹⁰ 34

Table 4.1 : Tableau récapitulatif des dimensions de quelques systèmes biologiques sur lesquels nous avons appliqué MoT-AN. Les lignes successives résument les informations relatives à, respectivement, l’"exemple jouet" de la figure 4.7, le "Lambda phage" (Thieffry & Thomas, 1995), et le cycle cellulaire des mammifères "Mammilian" (Fauré et al., 2006). Pour chacun de ces modèles T-AN, ce tableau donne le nombre d’automates (|Σ|), le nombre d’états globaux dans le graphe d’états correspondant (|S|) et le nombre de transitions locales temporisées (|Ti ni ti al|).

Nous avons effectué les tests de la validation pratique de MoT-AN sur une centaine de chronogrammes issus des simulations des modèles décrits dans le tableau 4.1. Nous avons fait varier à chaque fois la taille des chronogrammes issus des simulations. Ensuite, nous avons lancé l’algorithme 1, MoT-AN, sur chaque ensemble de chronogrammes d’un modèle donné. Finalement, nous avons pris l’union de tous les modèles appris et nous avons comparé l’ensemble des transitions locales temporisées apprises avec l’ensemble des transitions locales temporisées du modèle initial. La même démarche est suivie précédemment pour une seule simulation de l’exemple jouet dont les chronogrammes sont de taille égale à 18 (figure 4.8 en page 96).

Dans la figure 4.9 ci-dessous, nous détaillons les résultats de la comparaison entre les transitions locales temporisées de l’union de tous les modèles appris par l’algorithme 1, MoT-AN (Tappr i s), et celles du modèle initial (Ti ni ti al) en variant la taille maximale des chronogrammes pris en entrée.

Nous remarquons que plus la taille des chronogrammes est importante (l’axe des abscisses), plus le nombre des transitions locales temporisées apprises augmente (les deux barres vertes et bleues). Ainsi, le nombre des transitions locales temporisées qui sont correctes (c’est-à-dire qui existent aussi dans le T-AN initial) présentées par les barres vertes sur la figure 4.9 augmente jusqu’à atteindre le nombre maximal des transitions locales temporisées du T-AN initial (présenté par la ligne discontinue rouge pour chaque modèle sur la figure 4.9).

Le fait de simuler un T-AN sur un certain nombre d’instants ne nous permet pas de nous assurer d’avoir activé toutes ses transitions locales temporisées. Nous rappelons que si une transition locale temporisée est activée, alors elle cause un changement d’état local d’un automate du réseau. Donc, l’algorithme 1, Mot-AN, va l’apprendre (voir théorème 4.1 en page 108 concernant la complétude de MoT-AN ). Ainsi, si une transition locale

110 4.4 — Raffinement du résultat de MoT-AN par des filtres 1000 5 10 20 30 50 70 100 initial correct extra sans filtre Exemple jouet 10 1000 5 10 20 30 50 70 100 initial correct extra sans filtre Lambda phage 1 1000 5 10 20 30 50 70 100 initial correct extra sans filtre Mammilian

Figure 4.9 : Nombre des transitions locales temporisées apprises par l’algorithme 1, MoT-AN, à partir des chronogrammes issus des simulations des modèles du tableau 4.1 selon la taille de ces chronogrammes (valeurs en abscisses) : en vert les transitions locales temporisées qui existent aussi dans le modèle initial (Tappr i s ∩ Ti ni ti al) et en bleu celles qui sont apprises en plus (Tappr i s \ Ti ni ti al). La ligne de référence en rouge indique le nombre des transitions locales temporisées du modèle initial.

temporisée n’est pas activée, alors elle ne sera pas apprise. En effet, une transition locale temporisée qui ne se manifeste pas en causant un changement de niveau d’un composant dans la dynamique du système, observée dans les chronogrammes, ne sera pas apprise par l’algorithme 1, MoT-AN. Par conséquent, étant donné que les simulations prises sont aléatoires, nous ne sommes pas sûrs que toutes les transitions locales temporisées soient activées, donc toutes les transitions du modèles ne vont pas être apprises. Ceci justifie le fait que pour le modèle "Lambda Phage" dans la figure 4.9, la barre verte n’atteint pas la ligne rouge qui indique le nombre des transitions locales temporisées du modèle initial.

D’autre part, on remarque dans la figure 4.9 ci-dessus, que le nombre des transitions locales temporisées apprises en plus (c’est-à-dire les τ ∈ Tappr i s \ Ti ni ti al) augmente avec la taille des chronogrammes (les barres en bleu). En fait, elles sont cohérentes avec les chronogrammes pris en entrée et elles appartiennent à des modèles générés par MoT-AN mais elles n’existent pas dans le modèle initial. Ainsi, notre but dans la suite est de les éliminer. Donc, nous proposons quelques filtres, qui sont appliqués sur les modèles appris par MoT-AN afin de minimiser le plus possible le nombre des transitions locales temporisées qui sont apprises en surplus.

4.4 Raffinement du résultat de MoT-AN par des filtres

La méthode d’apprentissage MoT-AN, présentée dans la section 4.2 précédente, génère autant de T-AN que possible à partir des données de séries temporelles prises en entrée. Tous ces T-AN appris satisfont : d’une part, la dynamique du système étudié qui est illustrée par les données de séries temporelles et d’autre part, la dynamique des T-AN (introduite dans le chapitre 3). De plus ces modèles appris sont minimaux (c’est-à-dire pour chaque

Chapitre 4 — L’inférence des réseaux d’automates avec le temps 111 changement dans les chronogrammes, il y a une seule transition qui l’explique) et ils sont cohérents (c’est-à-dire les transitions qui sont apprises tout en considérant qu’elles sont en conflit, elles appartiennent au même modèle).

Cependant, il peut y avoir des contradictions et/ou des incohérences dans ces modèles appris. Nous développons ces points dans cette section et nous présentons comment nous les traitons afin de les éliminer. En plus, il peut y avoir un grand nombre de modèles appris, donc, il serait difficile de distinguer le modèle correct qui modélise le système étudié.

Par conséquent, nous introduisons dans cette section, un ensemble de raffinements par des filtres. Ces filtres, permettent de ne conserver que les modèles appris qui sont considérés plus réalistes. Autrement dit, leurs comportements dynamiques sont plus proches de la dynamique du système réel.

4.4.1 Filtre de cohérence entre la dynamique du modèle et la

Dans le document Étude de la dynamique des réseaux biologiques : apprentissage des modèles, intégration des données temporelles et analyse formelle des propriétés dynamiques (Page 109-112)