• Aucun résultat trouvé

3.4 Les réseaux d’automates avec le temps par rapport à d’autres modèles

3.4.4 Chaîne de Markov(k)

D’autre part, la dynamique des T-AN peut être vue comme une sous-classe de la chaine de Markov(k). Nous donnons ci-après, une explications brève et informelle de cette considéra-tion.

Une chaîne de Markov est un processus de Markov à temps discret et à espace d’états discret. Un processus de Markov est un processus stochastique possédant la propriété de Markov : l’information utile pour la prédiction du futur est entièrement contenue dans l’état présent du processus et n’est pas dépendante des états antérieurs (système sans "mémoire"). En revanche, dans une chaine de Markov(k), l’information utile pour la prédiction du futur dépend des k états antérieurs (système avec "mémoire").

Considérant une chaine de Markov(k) représentée sous forme d’un ensemble de règles logiques, telle que chaque règle présente une prédiction de l’état d’un composant dans l’état suivant. Dans une règle (voir exemple ci-dessous), la valeur de l’atome dans la partie gauche (la tête de la règle) dépend des valeurs des atomes dans la partie droite (le corps de la règle). En effet, la partie droite représente la prédiction d’un état local d’un automate qui dépend des états antérieurs représentés dans la partie gauche de la règle.

Exemple. Quelques règles d’un programme logique représentant une chaine de Markov(k). La première règle dit que le niveau local de a sera égal à 1 au prochain état (à t + 1), si b est au niveau 1 à l’état précédent t − 1 et à l’état actuel t et si c est au niveau 1 à t − 3 et à t. La deuxième règle dit que b sera au niveau 0 à t + 1 si a est au niveau 1 à t − 2 et aussi à t − 1 et si b et c sont au niveau 1 à t.

a(1,t+1) ← b(1,t-1), b(1,t), c(1,t-3), c(0,t). b(0,t+1) ← a(1,t-2), a(1,t-1), b(1,t), c(1,t).

Pour le formalisme des T-AN, chaque transition locale temporisée (τ) peut être repré-sentée par une règle logique. En effet, la partie gauche de la règle représente dest(τ) et la partie droite représente cond(τ) et ori(τ). Nous détaillons ci-dessous, un exemple d’une transition locale temporisée exprimée par une règle logique dans un système Markov(k).

Soit la transition locale temporisée suivante : τ = a1 {b1} −→

5 a0.

Son équivalent en une chaine de Markov(k) tels que t, t − 1..., t − 5 sont des instants dans un chemin peut être représenté par la règle logique suivante :

a(0,t+1) ← a(1,t-4), b(1,t-4), a(1,t-3), b(1,t-3), a(1,t-2), b(1,t-2), a(1,t-1), b(1,t-1), a(1,t), b(1,t).

Cette règle logique exprime le fait que a passe du niveau local 0 vers 1 à l’instant t + 1, quand a = 1 et b = 1 à tous les instants t, t − 1, ..., jusqu’à t − 4. Autrement dit, a = 1 et b = 1 pendant delai(τ) unités de temps ; en l’occurrence ici 5 unités de temps. Ainsi, toute transition locale temporisée dans un T-AN peut être exprimée par une règle logique dans une chaine de Markov(k). Par conséquent, la dynamique d’un T-AN est une sous-classe de celle d’une chaine de Markov(k). En effet, ce dernier n’exige pas dans sa dynamique que les composants qui participent à l’activation d’une transition aient des niveaux constants tout au long de la période d’activation. Par exemple, b peut être au niveau 1 à t − 4 et à t −3 mais il peut changer de niveau à t − 2.

Chapitre 3 — Les Réseaux d’automates avec le temps 81

a(0,t+1) ← a(1,t-4), b(1,t-4), a(1,t-3), b(1,t-3), a(1,t-2), b(0,t-2), a(1,t-1), b(0,t-1), a(1,t), b(0,t).

Alors que dans la dynamique d’un T-AN, ce cas ne peut pas apparaître. Parce qu’on considère que si un composant est nécessaire pour l’activation d’une transition locale temporisée donnée, et s’il change de niveau au cours de l’activation de cette transition, cette dernière n’est plus jouable. Et ainsi, elle ne se termine pas et l’automate qui la contient ne change pas de niveau.

On note, de plus, une autre différence entre la sémantique de la dynamique des modèles T-AN et celle de la chaine de Markov(k) concernant la méthode du calcul d’un chemin. En effet, comme il a été montré dans la section précédente (par exemple dans le tableau 3.1 en page 76) pour simuler un T-AN et trouver son chemin, nous calculons à chaque instant t, l’ensemble des transitions locales temporisées franchissables, celles qui sont en cours et celles qui sont bloquées. Ainsi, à partir de ces ensembles, nous identifions l’ensemble des transitions à activer qui va définir les instants "futurs" auxquels les changements des niveaux locaux des automates se produisent. Par exemple, prenant la même transition locale temporisée ci-dessus, τ = a1 {b1}

−→

5 a0, si elle est activée à un instant t alors on sait d’avance que a changera de niveau à t + 5. Par contre, pour trouver une trajectoire d’une chaine de Markov(k), on doit regarder, à chaque instant t, les niveaux des automates dans le "passé". En l’occurrence, pour cet exemple, on regarde les états de a et b à t, t − 1, ... jusqu’à t − 4 pour trouver l’état de a à t + 1.

3.5 Discussion

Notre contribution présentée dans ce chapitre, consiste à raffiner la dynamique des mo-dèles discrets modélisés avec le formalisme des AN. Le raffinement est obtenu grâce à l’introduction des paramètres temporels : les délais. Un délai représente la période de temps nécessaire pour que des composants interagissent entre eux selon des niveaux d’expression précis, afin de provoquer le changement de l’un d’entre eux. Ce changement n’est qu’une activation ou inhibition du composant ciblé par cette interaction temporisée.

Nous appelons le formalisme ainsi enrichi "réseau d’automates avec le temps "(T-AN). Il est adapté à la modélisation des systèmes dynamiques complexes. Son utilisation pour la modélisation des RRB, n’écarte pas le fait qu’il peut être utilisé pour modéliser d’autres systèmes concurrents. D’ailleurs nous avons parlé dans la section 3.4, du positionnement des T-AN par rapport à d’autres formalismes existants, comme les réseaux de Petri temporisés et les chaines de Markov(k).

En outre, nous avons étudié la dynamique des T-AN qui concerne principalement la manipulation des transitions locales temporisées ayant des conflits entre elles. De plus, elle permet de raffiner la dynamique d’un AN (sans les délais) et ainsi de prévoir des comportements plus réalistes du modèle que celui présenté en AN.

Finalement, la dynamique permet aussi de concevoir des méthodes qui infèrent des T-AN à partir de leurs chemins obsevés. En fait, dans ce chapitre, nous avons le modèle, présenté avec le formalisme T-AN, et nous avons introduit la sémantique avec laquelle son évolution dynamique est trouvée (c’est-à-dire calculer son chemin). A contrario, dans le chapitre suivant, nous considérons que nous avons les chemins du modèle mais nous n’avons pas le modèle. Ainsi, le but est de réussir à proposer des méthodes qui infèrent le modèle T-AN à partir de ses chemins.

Chapitre 4

L’inférence des réseaux

d’automates avec le temps

La modélisation des réseaux de régulation biologique (RRB) repose sur la connais-sance de fond, dérivée de la littérature et/ou de l’analyse des données de séries temporelles issues des expériences biologiques. Nous comptons nous servir de ces dernières, dont la disponibilité n’est plus un problème grâce à l’évolution technologique, pour apporter une contribution à l’inférence du RRB qui modélise le système auquel les données appartiennent. Ainsi, Le but principal de ce chapitre est de présenter une nouvelle méthode d’inférence des RRB à partir des données de séries temporelles. Elle doit réussir à générer un RRB résultant aussi cohérent que possible avec la dynamique observée du système via ses données de séries temporelles. L’originalité de cette méthode repose principalement sur : (i) l’identifi-cation du signe des interactions entre les composants ; (ii) l’intégration directe des délais dans l’approche d’apprentissage (ces délais représentent la durée de temps nécessaire pour qu’une interaction se produise) ; et (iii) l’identification des niveaux discrets qualitatifs des composants participants à chaque interaction dans le réseau. Les RRB appris sont modélisés avec le formalisme des réseaux d’automates avec le temps (introduits dans le chapitre précédent). Nous étudions aussi les avantages d’une telle approche automatique par son application sur un ensemble des données synthétiques et sur des données réelles du système de l’horloge circadienne. Ce travail a été publié dans (Ben Abdallah et al., 2016) puis dans une version étendue de ce travail dans (Ben Abdallah, Ribeiro, Magnin, Roux & Inoue, 2017).

4.1 Introduction

Durant la dernière décennie, l’émergence d’une large gamme de nouvelles technologies a produit une quantité massive de données biologiques (génomique, protéomique . . . ). En effet,

84 4.1 — Introduction avec le développement de nouvelles méthodes expérimentales, telles que les microarrays d’ADN en biologie, une très grande quantité de "données de séries temporelles" (i.e., des observations expérimentales) est maintenant produite.

Les données nouvellement produites peuvent nous fournir de nouvelles idées sur le comportement d’un système vivant. Cela conduit à des développements considérables dans la biologie des systèmes qui pourraient bénéficier de cette énorme quantité de données. Cela renforce la motivation pour développer des méthodes efficaces pour l’inférence des réseaux de régulation biologique (RRB).

Ainsi, nous présentons dans ce chapitre, une méthode qui vise à effectuer un apprentis-sage automatique des RRB. L’apprentisapprentis-sage est le processus qui traite les données de séries temporelles des composants du système étudié prises comme entrée afin de construire un RRB qui pourrait présenter d’une manière équivalente sa dynamique (voir figure 4.1 ci-dessous). Dans notre méthode, les RRB sont représentés avec le formalisme des réseaux d’automates avec le temps (T-AN). Ce dernier est un modèle discret introduit dans le chapitre précédent et qui s’est avéré adéquat pour la représentation des systèmes biologiques (Ben Abdallah et al., 2016; Ben Abdallah, Ribeiro, Magnin, Roux & Inoue, 2017). Ceci est aussi valable pour sa forme initiale sans l’intégration du temps, c’est-à-dire les réseaux d’automates (AN) (Paulevé et al., 2014).

C’est ce que nous développons dans la section 4.2 et nous appelons ceci l’inférence brute. RRB (T-AN) Apprentissage des modèles Données de Séries Temporelles (observations)

Figure 4.1 : La motivation de ce chapitre est de réussir à trouver une méthode automatique qui apprenne les RRB, représentés en T-AN, à partir des données de séries temporelles.

Puis dans la section 4.3, nous étudions le résultat de la méthode de l’apprentissage et nous validons la complétude de son algorithme.

Ensuite, dans la section 4.4, nous raffinons les modèles résultant de la nouvelle méthode d’apprentissage avec l’application d’un ensemble de "filtres". Ces filtres assurent un meilleur résultat vis-à-vis des modèles appris. Ils permettent d’éliminer les incohérences, s’il en existe, entre la dynamique d’un modèle appris par rapport à la sémantique de la dynamique des T-AN (introduite au chapitre 3). Un autre filtre permet de comparer tous les modèles appris entre eux et d’éliminer les modèles qui sont moins probablement corrects. Les critères qui permettent de calculer cette probabilité sont détaillés lors de la définition de ce filtre dans la section 4.4. Nous présentons aussi d’autres filtres qui contrecarrent à des informations incorrectes apprises dans les modèles et qui sont dues aux données bruitées.

Nous montrons à la fin de cette section l’utilité de ce raffinement des modèles appris par l’algorithme d’apprentissage et nous comparons les résultats obtenus sans et avec les filtres. Pour cela, nous appliquons ces méthodes sur des données synthétiques issues des modèles biologiques réels.

Puis, nous discutons dans la section 4.5, le fait que l’algorithme d’apprentissage proposé dans ce chapitre peut être adapté pour qu’il soit capable de réviser des modèles existants.

Chapitre 4 — L’inférence des réseaux d’automates avec le temps 85 En effet, nous considérons alors qu’un modèle préliminaire existe déjà et que des données de séries temporelles issues de nouvelles expériences sont fournies. Ainsi, le but est de réviser ce modèle pré-existant pour assurer que sa dynamique est cohérente avec celle exprimée dans les données de séries temporelles nouvellement fournies.

Finalement, dans la section 4.6, nous appliquons la méthode d’apprentissage sur des données réelles issues des mesures sur le foie des souris pour étudier le système de l’horloge circadienne. Ensuite, nous discutons dans la section 4.7, les méthodes et les résultats que nous avons présentés dans ce chapitre, et nous nous positionnons par rapport à quelques autres méthodes existantes.