Filtre associé au déterminisme des régulateurs entre les composants 114

4.2 La méthode d’inférence brute

4.4.3 Filtre associé au déterminisme des régulateurs entre les composants 114

Dans un modèle, nous ne voulons pas qu’un composant à un même niveau d’expression inhibe un composant dans certains cas et active ce même composant dans d’autres cas. En effet, cela ne semble pas avoir beaucoup de sens biologiquement. Dans un T-AN, un niveau d’expression discret d’un composant est l’état local de l’automate qui le représente. Dans la définition 4.6 ci-dessous, on formalise ceci ; dans un même T-AN appris, un composant b dans son état local bk ne peut pas participer, d’une part, à une transition locale temporisée qui active un autre composant a, et d’autre part à une autre transition locale temporisée qui l’inhibe. Nous rappelons que dans la syntaxe des T-AN, si bk participe à une transition locale temporisée τ, alors il appartient à sa condition cond(τ).

Chapitre 4 — L’inférence des réseaux d’automates avec le temps 115 Définition 4.6 (Filtre F3). [Influence déterministe] Soient AN = (Σ, S, T ) un T-AN, τ₁∈ T, a, b ∈ Σ, ai, aj ∈ Sa avec i < j et bk ∈ Sb.

Si τ1= ai `₁ −→

δ₁ aj telle que bk ∈ `₁, alors ∀τ2∈ T telle que τ2= aj `₂ −→

δ₂ ai, bk 6∈ `₂.

Par conséquent, ce filtre F3 garantit que dans un modèle T-AN appris, un automate, dans un état local précis, ne peut pas à la fois inhiber et activer un autre. Ainsi, ce filtre élimine tous les T-AN appris dans lesquels il existe des transitions locales temporisées qui violent la définition 4.6 ci-dessus, concernant les influences déterministes.

Exemple. Par exemple, dans les transitions locales temporisées apprises à partir des chronogrammes de l’exemple jouet de la figure 4.8 en page 96, les transitions locales temporisées a0 z₁ −→ 1 a₁ (dans Tc hange(4)) et a1 z₁ −→

1 a₀ (dans Tc hange(5)) ne peuvent pas appartenir au même ensemble de transitions locales temporisées d’un T-AN appris. En effet, z1 ne peut pas être à la fois responsable de l’activation et de l’inhibition de a.

Dans la figure 4.12 ci-dessous, nous donnons les résultats obtenus après l’application de ce filtre F3 sur les modèles appris par l’algorithme 1, MoT-AN. Nous remarquons que le nombre des transitions apprises qui ne sont pas correctes (en bleu) a énormément diminué par rapport à celui trouvé en exécutant la méthode MoT-AN sans les filtres (figure 4.9 en page 110). 1 1000 5 10 20 30 50 70 100 initial correct extra

filtre : inhibe actif

Exemple jouet 1 1000 5 10 20 30 50 70 100 initial correct extra inhibe active Lambda phage 1000 5 10 20 30 50 70 100 initial correct extra

filter: inhibit active

Mammilian

Figure 4.12 : Nombre des transitions locales temporisées apprises par l’algorithme 1, MoT-AN, après l’application du filtre F3 qui ne garde que les modèles T-AN dont l’ensemble des transitions locales temporisées est cohérent avec la définition 4.6 ci-dessus. Les barres en vert représentent les transitions locales temporisées qui sont correctes (i.e., existent dans le T-AN initial) et celles en bleu représentent celles apprises en plus (i.e., qui n’existent pas dans le T-AN initial). La ligne de référence en rouge discontinue représente le nombre de transitions locales temporisées dans le T-AN initial.

116 4.4 — Raffinement du résultat de MoT-AN par des filtres

4.4.4 Filtre associé à un délai moyen d’une transition locale

tempo-risée

Normalement dans un modèle T-AN, chaque transition locale temporisée n’a qu’un seul délai. Cependant, lorsque l’on apprend des modèles T-AN à partir des données de séries temporelles issues des expériences sur des systèmes biologiques réels (par exemple, des données provenant de lignées de cancers cellulaires ou des organes soumises au cycle de l’horloge circadienne...), on ne peut pas garantir que les données soient parfaites (i.e., non bruitées).

En fait, puisqu’il y a souvent du bruit dans les données, l’algorithme 1, MoT-AN, peut trouver des transitions locales temporisées qui sont presque identiques ; ne se différent que des valeurs de leurs délais. Ainsi, nous proposons de les fusionner en une seule ; ne conserver qu’une seule transition locale temporisée dont le délai est égal à un intervalle englobant tous les délais trouvés.

Définition 4.7 (Filtre F4). [Intervalle des délais] Soit AN = (Σ, S, T ) un T-AN, ∀τ₁, τ₂, ..., τn ∈ T telles que τ1 = ai ` −→ δ₁ aj, τ2 = ai ` −→ δ₂ aj, ..., τn = ai ` −→ δn aj avec ai, aj ∈ Sa, ` ∈ ℘(LS \ Sa) et δ16= δ₂6= ... 6= δn alors fusionner toutes les transitions locales temporisées τ1, τ₂, ..., τn en une seule τ avec :

τ = ai ` −→ [δmi n,δmax]aj telle que, ∀τk = ai ` −→ δ_k aj, k ∈ {1, ..., n}, δmi n ≤ δk ≤ δmax.

Une autre alternative possible est de fusionner toutes les transitions locales temporisées qui sont identiques en une seule dont le délai est égal à une valeur moyenne de leurs délais (voir définition 4.8 ci-dessous). L’intuition est que, dans la pratique, s’il y a suffisamment des données de séries temporelles, les délais de ces transitions devrait tendre vers la valeur réelle.

Définition 4.8 (Filtre F4 révisé). [Délai moyen] Soit AN = (Σ, S, T ) un T-AN, ∀τ₁, τ₂, ..., τn ∈ T telles que τ1 = ai ` −→ δ₁ aj, τ2 = ai ` −→ δ₂ aj, ..., τn = ai ` −→ δ_n aj avec ai, aj ∈ Sa, ` ∈ ℘(LS \ Sa) et δ16= δ₂6= ... 6= δn alors fusionner toutes les transitions locales temporisées τ1, τ₂, ..., τn en une seule τ avec :

τ = ai ` −→ δ_{av g} aj telle que : δav g = Pn k=1δk n

Si nous voulons que chaque transition locale temporisée ait un seul délai dans un modèle T-AN appris (délai déterministe), dans la définition 4.9 ci-dessous, nous développons ainsi un filtre supplémentaire. Ce dernier garantit le fait que dans chaque T-AN généré, chaque transition locale temporisée n’a qu’un seul délai. Ainsi, s’il existe deux transitions locales

Chapitre 4 — L’inférence des réseaux d’automates avec le temps 117 temporisées identiques mais qui ne se diffèrent que des valeurs de leurs délais, alors elles n’appartiennent jamais au même T-AN appris.

Définition 4.9 (Filtre F4 consolidé). [Délai déterministe] Soient AN = (Σ, S, T ) un T-AN, et τ1 ∈ T telle que τ1 = ai

` −→

δ₁ aj, alors @τ2 ∈ T, telle que τ2 = ai ` −→

δ₂ aj avec δ₁6= δ₂.

4 a₁ (dans Tc hange(9)) ne peuvent pas appartenir au même ensemble de transitions locales temporisées d’un T-AN appris. En effet, la transition a0

z₁ −→

δ a₁ ne peut pas avoir deux délais différents dans un même modèle T-AN appris.

Dans la figure 4.13 ci-dessous, nous donnons les résultats obtenus après l’application de ce filtre F4 consolidé sur les modèles appris par l’algorithme 1, MoT-AN. Nous remarquons que le nombre des transitions locales temporisées apprises qui ne sont pas correctes (les barres en bleu) a encore énormément diminué par rapport à leur nombre dans la figure 4.9 en page 110 sans les filtres.

1 1000

5 10 20 30 50 70 100 initial correct extra

filtre : no diff delays

Exemple jouet 1 1000 5 10 20 30 50 70 100 initial correct extra no diff delays Lambda phage 1000 5 10 20 30 50 70 100 initial correct extra

filter: no diff delays

Mammilian

Figure 4.13 : Nombre des transitions locales temporisées apprises après application du filtre F4 consolidé qui assure le déterminisme des délais pour chaque transition locale temporisée dans chaque T-AN appris (définition 4.9).

Nous avons introduit dans cette section un ensemble de filtres qui sont utiles pour s’as-surer au maximum de n’apprendre que les T-AN les plus cohérents avec les chronogrammes pris en entrée et ayant moins de contradiction. En effet, les filtres permettent d’éliminer un très grand nombre de modèles T-AN appris qui ne sont pas corrects (c’est-à-dire ne modélise pas le système réel). Ainsi, ils éliminent aussi les transitions locales temporisées apprises qui ne sont pas correctes. Nous notons que l’application de plusieurs filtres à

118 4.5 — Révision des modèles la fois est également possible. En fait, ceci permet d’optimiser davantage le résultat de l’apprentissage des modèles par MoT-AN. Il est à noter aussi que ces filtres peuvent être appliquer lors de la génération des modèles à l’étape 2 de l’algorithme 1 en page 93. Ceci est le cas des résultats des expériences que nous avons montrés dans cette section sur l’application des filtres.

Dans la section suivante nous présentons une méthode qui permet de réviser des T-AN existants à partir des données de série temporelles nouvellement fournies.

4.5 Révision des modèles

Dans cette section, nous présentons la méthode de la révision d’un T-AN existant (e.g., appris antérieurement) selon des données supplémentaires. Ces données peuvent être des nouvelles observations du système étudié illustrées par des nouvelles données de séries temporelles mais sous des nouvelles conditions (e.g., des perturbations par un ajout ou par une suppression d’un composant du système).

La méthode de la révision, consiste principalement à vérifier si le T-AN initialement proposé pour modéliser le système est aussi cohérent avec la dynamique donnée par les nouvelles observations expérimentales. Si ce n’était pas le cas, alors une complétion du T-AN initial serait nécessaire. En effet, au début il s’agit d’une complétion car nous ajoutons les transitions locales temporisées manquantes. Autrement dit, nous vérifions si tous les changements dans la dynamique du système peuvent être expliqués par des transitions locales temporisées existantes dans le T-AN initial, sinon nous apprenons des nouvelles transitions locales temporisées et nous les y ajoutons. D’autre part, une suppression des transitions locales temporisées du modèle initial pourrait-être faite par l’application d’un ou de plusieurs des filtres introduits dans la section 4.4 précédente.

Ainsi, le résultat final de la révision est un T-AN révisé selon les nouvelles données de séries temporelles. La figure 4.14 ci-dessous montre les entrées et la sortie de la méthode de la révision des T-AN RevT-AN.

T-ANrévisé Méthode de Révision des modèles (RevT-AN) Données de Séries Temporelles (observations) Graphe d’Influences T-ANinitial

Figure 4.14 : La révision d’un T-AN initial modélisant un système donné selon des nouvelles données de séries temporelles.

La complétion des modèles a fait l’objet de nombreux travaux récents. Par exemple, dans (Akutsu et al., 2009), les auteurs ont ciblé la complétion des réseaux booléens stationnaires. Cette méthode a été affinée au fil des ans. Les travaux récents (Nakajima & Akutsu, 2013) se concentrent sur la complétion dans les réseaux génétiques variables dans le temps. Ce sont des réseaux dont la topologie ne change pas avec le temps, mais la nature des interactions (activation, inhibition ou absence d’interaction) entre les composants peut

Chapitre 4 — L’inférence des réseaux d’automates avec le temps 119 changer à certains points temporels (temps fini). Ainsi, l’approche de complétion se réfère à la fois à l’addition et à la suppression des interactions, ce qui est en fait synonyme de révision. Elle a été appliquée avec succès à des études de cas biologiques ; par exemple le DREAM4 Challenge (Nakajima & Akutsu, 2014b) et dont la mise en œuvre a été améliorée par des heuristiques (Nakajima & Akutsu, 2014a). Cependant, leur méthode est limitée aux réseaux acycliques.

L’algorithme 2 ci-dessous décrit le pseudo-code de la méthode de la révision RevT-AN. Nous notons que RevT-AN est une extension de l’algorithme 1 de la méthode d’apprentissage, MoT-AN. En effet, une vérification supplémentaire est ajoutée après la génération de toutes les transitions locales temporisées candidates pour un changement donné. Cette vérification consiste à chercher dans le T-AN initial pris en entrée, s’il existe au moins une transition locale temporisée qui fait partie de l’ensemble des transitions locales temporisées candidates apprises au premier point de l’étape 1 de l’algorithme 2, RevT-AN, ci-dessous. Autrement dit, il faut vérifier s’il existe une transition locale temporisée qui explique chaque changement de niveaux d’un composant dans les chronogrammes. Sinon une complétion du modèle est effectuée par l’ajout d’une ou de plusieurs transitions locales temporisées. Ce processus est intégré dans le pseudo-code de l’algorithme 2, RevT-AN ci-dessous au deuxième point de l’étape 2.

Cette méthode de révision de modèles permet d’une part, de réviser les modèles existants et d’autre part de raffiner l’apprentissage dans le cas où nous avons plusieurs données de séries temporelles du même système mais sous des conditions différentes. En effet, après l’apprentissage d’un ensemble de modèles T-AN à partir des données de séries temporelles issues d’une expérience sous une première condition, cet ensemble de modèles appris sera révisé selon d’autres données issues d’autres expériences sous d’autres conditions.

120 4.5 — Révision des modèles Algorithm 2 RévT-AN : Révision des réseaux d’automates avec le temps.

Entrées :

- AN = (Σ, S, T ) : un T-AN à réviser ;

- Γ =^Sa∈ΣΓa : chronogrammes des données de séries temporelles ;

- χ(N, E) =^Sa∈Σχa(Na, Ea) : graphe d’influences entre les automates de AN ; - n ∈ N∗ : le nombre maximal des régulateurs sur un composant dans une transition

locale temporisée.

Sortie : Φ l’ensemble des T-AN qui réalisent les chronogrammes. – Soit Tr ev i se := T

– Étape 1 :

pour chaque point temporel t dans Γ où un composant a change son niveau discret de i vers j faire //en T-AN c’est le changement de l’état local ai vers aj

• pour chaque ` ∈ ℘(Na), |`| ≤ n faire

//pour chaque combinaison possible des régulateurs de a

τ := ai ` → δ aj telle que, si ∃ τ0=ck `c → δc cl ∈ ϕ avec ai ∈ `c, Πc t ≥ Πa t, ∀bx ∈ `, Πc t ≥ Πb t alors

//τ est bloquée par τ0 donc τ n’est activée que quand τ0 se termine à Πc

δ = t − Πc t

sinon //τ est activée à partir de l’instant qui est égal au maximum des //instants entre les derniers changements de a et des automates de `

δ = t − max(Πa t, Πd t) avec dx ∈ ` ∧ ∀bx ∈ `, b 6= d, Πb t ≤ Πd t.

ajouter τ dans Tc hange(t).

//Tc hange(t) est l’ensemble des transitions apprises par changement à l’instant t

• si Tc hange(t)⊆T alors ne rien ajouter dans Tr ev i se;

sinon, ajouter C_T(T_{c hange(t)})dans Tr ev i se, à savoir le complémentaire de Tc hange(t) par rapport à T

– Étape 2 :

Créer autant que possible dans Φ des T-AN appris, ANk

r ev i se = (Σ, S, Tk

r ev i se) avec k ≤ |Φ| et |Φ| est le nombre total des T-AN appris. Tk

r ev i se ⊆ Tr ev i se est l’ensemble minimal des transitions locales temporisées qui pourraient réaliser Γ, c’est-à-dire :

∀AN^k_{r ev i se} = (Σ, S, T_{r ev i se}^k ) ∈ Φ, @Tr ev i se^k⁰ ⊂ T_{r ev i se}^k tel que Tk0

r ev i se peut réaliser Γ, autrement dit,

∀t un point temporel dans Γ, si ∃a ∈ Σ tel que a change de niveau à t alors, |T_{r ev i se}^k ∩ T_{c hange(t)}|= 1.

Chapitre 4 — L’inférence des réseaux d’automates avec le temps 121

Dans le document Étude de la dynamique des réseaux biologiques : apprentissage des modèles, intégration des données temporelles et analyse formelle des propriétés dynamiques (Page 115-122)