Autour de la robustesse des syst`emes complexes: le cas des automates cellulaires coalescents

(1)

Autour de la robustesse des syst`emes complexes:

le cas des automates cellulaires coalescents

Jean-Baptiste Rouquier avril – aoˆ ut 2005

sous la direction de Michel Morvan

Table des mati` eres

1 Syst`emes complexes 2

1.1 Vers une d´efinition . . . 2

1.1.1 Caract´eristiques . . . 2

1.1.2 Param`etres . . . 2

1.2 Exemples . . . 3

I Pr´ eliminaires : mesurer la complexit´ e 4

2 Le système et sa description 4 2.1 Complexité du système. . . 5

2.2 Complexit´e de la description . . . 5

2.3 De la description au syst`eme . . . 6

II Automates cellulaires coalescents 7

3 Coalescence : premières propriétés 10 3.1 Une preuve formelle de coalescence . . . 10

3.2 Deux preuves de coalescence avec probabilit´e 1/2 . . . 14

4 Trois pistes pour une preuve générale 16 4.1 Automates finis déterministes . . . 16

4.2 Couplage et chaˆınes de Markov . . . 17

4.3 Automates cellulaires probabilistes . . . 17

5 Transitions de phase 18 5.1 D´etermination des automates coalescents . . . 18

5.1.1 Protocole . . . 18

5.1.2 R´esultats . . . 19

5.2 Le mod`ele de la percolation dirig´ee . . . 20

5.3 Mesure deαc . . . 23

5.3.1 M´ethode. . . 23

5.3.2 Protocole . . . 25

(2)

5.3.3 R´esultats . . . 25

5.4 Mesure deβ . . . 25

5.4.1 Protocole . . . 27

5.4.2 R´esultats . . . 29

5.4.3 Conclusion . . . 30

6 Conclusions 30

1 Syst` emes complexes

1.1 Vers une d´ efinition

Il n’y a pas de définition formelle largement acceptée de ce qu’est un système complexe. On s’accorde généralement à dire qu’il doit être constitué d’un grand (mais fini) nombre d’entités simples en interaction locale évoluant parallèlement.

Mais même ces éléments de base de sont pas toujours respectés, et il est parfois fructueux d’appliquer les idées issues de la théorie des systèmes complexes

`

a des objets d’études constituées d’une partie de ces éléments seulement.

1.1.1 Caract´eristiques

On distingue des caractéristiques communes à un grand nombre de systèmes complexes, ce qui permet réciproquement de qualifier un système de complexe dès qu’il présente la plupart de ces caractéristiques.

– Beaucoup d’entit´es interconnect´ees.

– Un graphe d’interaction non trivial.

– Beaucoup d’interactions [Kauffman(1993)] pendant de l’´evolution du sys- t`eme.

– Information et interactions locales, peu d’organisation centrale.

– R´etroactions (feedback).

– Plusieurs comportements possibles en compétition, certains ordonnés et d’autres désordonnés. Le système est souvent à la limite entre ces comportements [Poon and Grebogi(1995),Lai(1999)].

– Production de motifs structur´es, ´emergence de comportements globaux, auto-organisation.

– Brisure de sym´etrie : la connaissance d’une partie de permet pas de pr´edire statistiquement le comportement des autres parties [Heylighen(1996)].

– Variété des échelles de temps et d’espace : hiérarchie de structures.

Le système peut être ouvert, il y a alors flux d’énergie et d’information aux frontières et à travers le système. Ces dernières peuvent être difficiles à détermi- ner (par exemple, à partir de quel instant la nourriture ou l’air absorbé font-ils partie du corps ?).

1.1.2 Param`etres

Un système complexe est défini par les paramètres suivants : – l’ensemble des entités en interaction,

– l’ensemble des états possibles d’une entité (il est possible de distinguer des classes d’entités, chaque classe ayant son propre ensemble d’états),

(3)

– le graphe définissant les interactions entre les entités (elles peuvent se déplacer sur ce graphe et être à plusieurs sur un sommet),

– l’extérieur du système et les frontières,

– les paramètres globaux (comme la température ou un taux de change), – la règle de transition : changement d’état d’une entité en fonction des

entités voisines, et éventuellement modification du graphe d’interaction, – la manière dont on applique la règle, c’est-à-dire la manière dont le temps

s’écoule. Il peut y avoir des vitesse différentes selon les entités, par exemple en faisant intervenir une probabilité sur la transition ou sur le temps entre les transitions. C’est ici qu’est définit le synchronisme.

1.2 Exemples

Certains systèmes sont bien trop complexes pour que l’on puisse établir des résultats généraux, ou bien font intervenir d’autres mécanismes que ceux aux- quels s’intéresse l’étude des systèmes complexes. Ils montrent néanmoins la richesse de cette approche, qui peut apporter des réponses partielles ou suggérer des angles d’étude même sur ces systèmes.

système entités interactions phénomène émergent colonie fourmis échanges de phéromones fourmilière

g´enome gˆenes activations et inhibitions tissus

cellule protéines réactions chimiques adaptation au milieu cerveau neurones impulsions électriques intelligence

bourse courtiers transactions bulles, krachs, etc.

tas de sable grains chocs avalanches

Citons encore un vol d’étourneaux ou un troupeau de moutons, la propagation d’une épidémie, d’une rumeur ou du bouche-à-oreille sur un nouveau produit, des réseaux de criminalité, le développement d’un embryon

Si l’on considère, comme objectifs successifs de la science face à un système,

« comprendre, prédire, contrôler, concevoir », on peut aussi étudier des sys- tèmes complexes artificiels, intégrer les concepts issus de cette approche dans la conception de nouveau systèmes. Ajoutons donc à nos exemples un réseau pair à pair, un réseau ad-hoc, des mécanismes de cryptographie partagées ou de robustesse aux attaques, des systèmes multi-agents. L’un des exemples les mieux formalisés est constitué par les automates cellulaires, dont nous donnons une définition à la partieIIpour en étudier quelques propriétés ensuite.

(4)

Premi` ere partie

Pr´ eliminaires : mesurer la complexit´ e

Dans la théorie des systèmes complexes, une question centrale est de définir formellement une notion de complexité. C’est même la première mesure que l’on souhaite effectuer lorsque l’on rencontre un nouveau système complexe :

« complexe oui, mais `a quel point ? ». Le premier article `a ce sujet semble ˆ

etre [Gell-Mann(1995)].

Cette question apparaˆıt tout aussi naturellement quand on s’intéresse à l’évo- lution, et particulièrement à l’accroissement de la complexité des organismes au cours de l’évolution. Elle est étudiée depuis Von Neumann (voir par exemple [McMullin(2000)]). Cet article explique que Von Neumann cherchait à exhiber des machines capables de produire d’autres machines plus complexes qu’elles mêmes. Itérativement, on obtient ainsi une évolution avec accroissement de la complexité. Un cas particulier est celui d’une machine qui s’auto-reproduit : elle produit une machine aussi complexe qu’elle même. Mais on ne trouve pas de notion précise de complexité.

Définir une complexité est bien sûr une question difficile, et il n’y aura sans doute jamais de réponse unique, mais plusieurs notions selon l’angle sous lequel on étudie un système et selon les caractéristiques qui intéressent l’observateur.

De nombreux travaux ont en effet cherché à formaliser ce point, et il existe des mesures partielles ou considérant un aspect particulier du système (par exemple, comment le définir, on bien son degré d’«aléatoirité», ou encore une adaptation de l’entropie). Puisque notre travail porte sur un point précis qui s’inscrit dans ce contexte, nous en proposons ici un tour d’horizon (une autre bibliographie et une classification différente est proposée par [Manson(2001)]).

2 Le syst` eme et sa description

Lors de l’étude d’un système complexe, on est confronté à la chaˆıne suivante.

On part donc d’un système et son observation fournit des données. On construit alors une théorie ou un modèle, que l’on cherche à valider. Le modèle permet d’exécuter des simulations, dont on compare les résultats à ceux du système de départ. Soit schématiquement :

syst`eme observation

−−−−−−−→données−→théorie ou modèle −−−−−−→^simulation comportement Lorsque l’on cherche à définir une notion de complexité, il convient de spéci- fier à quel niveau l’on se place. La complexité du modèle est souvent confondue avec celle du système. Elle n’en est qu’une première approximation. On peut rarement définir la complexité du système lui-même, mais on peut étudier

– la complexité d’un système réel directement sur les données recueillies, – celle d’un système réel à travers un modèle de ce système,

– celle d’un modèle à partir de sa définition formelle

– celle d’un mod`ele `a partir de son comportement lorsque l’on effectue des simulations.

(5)

Notons que certains modèles cherchent à être le plus fidèle possible à un système réel donné, d’autres sont plutôt un objet abstrait, cherchant à être suffisamment simple et général pour permettre des résultats théoriques. Dans ce dernier cas, c’est bien l’objet théorique en tant que système complexe dont on étudie la complexité. Citons comme exemple les automates cellulaires, les automates à seuil, les chip firing games.

Ceci suggère une ébauche de classification des mesures de complexité exis- tantes : comment cette mesure se place-t-elle par rapport au système et à sa description ?

2.1 Complexit´ e du syst` eme

C’est souvent implicitement celle que l’on veut étudier. Lorsque l’on étudie un système réel, c’est la complexité des données issues des mesures effectuées sur le système. Lorsque l’on étudie un modèle abstrait, c’est la complexité des données générées par une simulation.

Une mesure classique est l’entropie des mesures effectu´ees, sous diverses va- riantes, comme propos´e par [Pincus(1991),Martin(1997),Shiner and Davison(1999)]

ou [Andreev(2005)] qui tente d’utiliser des idées de clustering : sa complexité est d’autant plus faible que toutes les entités sont similaires dans leur comportement.

Un problème récurrent dans cette approche visant à mesurer directement la complexité du système est de distinguer les structures de la simple réalisation de l’aléatoire, de détecter des corrélations provenant d’un mécanisme inconnu.

[Crutchfield(1993)] propose une fa¸con intéressante de l’aborder. Après une re- marquable introduction aux concepts de la physique statistique, de la théorie de l’information et de la complexité de Kolmogorov, [Gell-Mann and Lloyd(1996)]

d´efinit la complexit´e effective en sens.

2.2 Complexit´ e de la description

La description peut être soit la définition du système (en langue naturelle lorsqu’il s’agit d’un système artificiel, mais aussi en code d’une machine de Turing lorsqu’il s’agit de décrire les données), soit sa formalisation (lorsqu’il s’agit d’un système réel sur lequel on a effectué des mesures).

Motivations On peut aussi étudier ce problème dans le but de choisir parmi les différents modèles proposés pour un système. En suivant le principe d’Oc- cam, on pourra préférer le modèle de complexité minimale pour expliquer un phénomène. Mais il y a souvent différents niveaux de sophistication pour modé- liser un phénomène, on peut prendre en compte l’adéquation du comportement du modèle avec les mesures effectuées sur le système, et classer les modèles en fonction de leur rapport«qualité-prix». La qualité est ici la proximité entre les données issues du modèle et les mesures effectuées sur le système ; le prix (l’ef- fort de compréhension à payer) est sa complexité. On cherche donc les modèles ayant le meilleur rapport adéquation sur complexité.

En effet, on souhaite souvent comprendre le système à différents niveaux de raffinement. Exemple typique, lorsqu’il s’agit de présenter le système à des personnes extérieures on ne peut pas l’expliquer dans tous ses détails. Lors d’une conférence, le temps disponible détermine quel niveau de complexité on peut

(6)

exposer. Dans un livre ou un cours, on commencera par donner une description grossière avant de détailler des mécanismes plus précis. Il est donc nécessaire de disposer de modèles grossiers autant que de modèles précis, les premiers devant

´

evidemment avoir une complexit´e bien moindre.

2.3 De la description au syst` eme

Une définition formelle fructueuse de la description est la complexité de Kolmogorov, la longueur du plus petit programme dont l’exécution produit la description.

Malheureusement, le fait d’appliquer directement ce concept fondamental à un système réel n’est pas très satisfaisant : une description très compacte mais demandant un long temps de calcul pour reconstituer le système sera intuitivement plus complexe qu’un système purement aléatoire (donc simple) où la longueur de la description découle du caractère probabiliste.

Ceci nous mène naturellement à la complexité algorithmique : le temps et l’espace nécessaire au calcul passant de la description au système. Ce qui pré- sente l’inconvénient inverse : il existe alors des descriptions très longues induisant un calcul très simple.

[Bennett(1990)] propose pour remédier à cela la«profondeur logique»(lo- gical depth), qui est le temps de calcul à partir de la description la plus courte (celle réalisant la complexité de Kolmogorov).

Voilà donc un aper¸cu des mesures de complexité proposées jusqu’à aujour- d’hui. Nous n’avons trouvé aucune mesure de complexité basée sur des perturbations de la dynamique.

(7)

Deuxi` eme partie

Automates cellulaires coalescents

Nous avons exposé dans la partie précédente différentes mesures de com- plexité. Une nouvelle approche pour définir une telle notion est d’étudier la robustesse du système à des perturbation de la dynamique. Précisément, nous nous sommes intéressés à des perturbations du synchronisme. Cette étude a montré un phénomène intéressant, initialement remarqué par Nazim Fatès, que nous étudions dans cette partie.

C’est un prolongement des chapitres 4, 5 et 6 de sa th`ese [Fates(2004)].

Après quelques propositions immédiates, nous étudions expérimentalement un phénomène de transition de phase.

Cette partie utilise le modèle de système complexe constitué par les automates cellulaires, que nous définissons maintenant.

Définitions. Un automate cellulaire est un uplet (Q, d, V, δ) où – Qest l’ensemble des états ;

– d∈N^∗ est la dimension ;

– V = {vi |i∈J1,|V|K} est un ensemble fini de vecteurs de Z^d, appel´e voisinage ;

– δ:Q^|V^|→Qest la r`egle de transition.

Un élément deZ^d est une cellule, une configuration est obtenue en fixant l’état de chaque cellule, c’est donc une fonction c : Z^d → Q. La règle d’évolution associe à la configurationc la configurationc⁰ définie par

c⁰(z) :=δ c(z+v₁), . . . , c(z+v_|V_|) C’est donc une ´evolution

– locale : l’état de chaque cellule ne dépend que des états précédents des cellules voisines,

– parallèle : toutes les cellules évoluent en même temps, – uniforme : toutes les cellules ont la même règle.

Ce système est donc un bon exemple de système complexe. Notons également que l’évolution est synchrone, déterministe, discrète.

On peut généraliser ce modèle en considérant un graphe de Cayley au lieu de la grilleZ^d. Si l’on considère le groupe fini (Z/nZ)^d, on obtient des configurations finies, que l’on peut identifier avec les configurations périodiques de la grille Z^d, ou plus simplement à des configurations d’une partie finie de la grille avec conditions au bord périodiques. C’est ce modèle que nous retenons. La finitude est une caractéristique essentielle de nombreux systèmes réels et est ici mieux modélisée. De plus, ce modèle offre l’avantage de permettre les simulations tout en présentant la même variété de comportements que le cas infini. Le nombre de cellules nest désormais un paramètre du système.

Nous avons donc choisi de perturber la dynamique du système en perturbant le synchronisme. Précisément, nous choisissons d’étudier la généralisation du modèle qui consiste à ne plus appliquer la règle δ de fa¸con synchrone, comme défini ci-dessous. À cette occasion nous introduisons également de l’aléatoire.

Mais l’ensemble d’´etats, l’espace et le temps resteront discrets.

Il y a deux fa¸cons de perturber le synchronisme, qui sont d´ecrites par exemple

(8)

dans [Sch¨onfish and de Roos(2000)]. L’une sera appel´ee dynamique partiellement asynchrone, l’autre, dynamiquetotalement asynchrone.

La dynamique partiellement asynchrone ou dynamique partielle. Elle consiste à ne pas mettre à jour toutes les cellules à chaque étape. Précisément, on utilise une suite de variable aléatoires de Bernouilli indépendantes identiquement distribuées, chaque cellule ayant un tirage à chaque étape. Une cellule a alors une probabilitéαde se mettre à jour à chaque étape. Le casα= 1 correspond

`

a la dynamique synchrone précédente. La cas α = 1/2 correspond à la règle probabiliste«avec une chance sur deux, faire la transition, sinon rester dans le même état». Noter que la transition peut également indiquer de rester dans le même état.

On peut bien sûr imaginer des corrélations entre les variables aléatoires indi- quant si une cellule se met à jour ou non, notamment des corrélations locales qui induiraient des mises à jours en bloc de cellules voisines. On peut aussi envisager de garder l’indépendance mais ne pas imposer que ces variable soient identiquement distribuées : certaines cellules auraient une plus grande probabilité de se mettre à jour que d’autres. Ceci modéliserait un écoulement du temps différent suivant les cellules, certaines cellules étant plus actives ou évoluant plus vite que d’autres. Ces généralisations ne seront pas étudiées ici.

La dynamique totalement asynchrone Alors que dans la dynamique pré- cédente il y avait en moyenne n α cellules se mettant à jour par étapes, cette dynamique impose qu’il y ait exactement une cellule qui se mette à jour à chaque

´

etape. Ce n’est donc plus une règle locale. La cellule qui se met à jour est tirée au sort uniformément, mais on pourrait imaginer d’autres dynamiques où certaines cellules ont plus de chances de se mettre à jour, ce qui correspondrait à nouveau à un écoulement du temps différent suivant les cellules.

Cette dynamique peut être considérée comme la limite en α → 0 de la dynamique précédente. Soit en effet t le nombre d’étapes de calcul que l’on souhaite effectuer dans la dynamique totalement asynchrone. Soit α _nt¹. Il faut 1/αétapes pour que chaque cellule se soit mise à jour (en espérance) une fois. On effectue donc t/α étapes partiellement asynchrones. Il y a alors eu n t/α points du diagramme espace-temps où un couple de cellules voisines a risqué de se mettre à jour simultanément, ce qui se produit avec probabilitéα². L’espérance du nombre de points où deux cellules voisines se mettent à jour simultanément est donc n t α1. On a ainsi simulé la dynamique totalement asynchrone par la dynamique partielle (mais cela a coûté un nombre d’étapes mnt²).

Plus intéressant, cette dynamique est équivalente (au sens de l’ordre des mise à jour) au modèle suivant. Considérons un temps continu, et attribuons une horloge à chaque cellule. Les horloges décomptent le temps vers 0 toutes à la même vitesse, et une cellule se met à jour à l’instant où son horloge atteint 0. À chacune de ses mises à jour, une cellule tire un temps selon une loi exponentielle (de paramètre arbitraire mais commun à toutes les cellules) pour«remonter» son horloge, et choisit ainsi la date de sa prochaine mise à jour. Les mises à jour des cellules sont donc effectuées presque sûrement à des dates distinctes.

Puisque les variables aléatoires utilisées par les cellules pour régler leurs horloges sont indépendantes identiquement distribuées, et grâce à une propriété de la loi

(9)

exponentielle, on peut considérer que chaque fois qu’une horloge arrive à 0, toutes les horloges sont réglées à nouveau selon une loi exponentielle. Régler toutes les horloges revient à choisir la prochaine cellule qui sera mise à jour.

Les dates de mise à jour suivent alors un processus de Poisson. La distribution de probabilité des séquences de mises à jour est donc identique entre les deux modèles.

La mesure du temps utilisée dans ce rapport est le nombre de mises à jour et est donc discrète. Cette nouvelle dynamique utilise un temps continu, qui est lié au modèle discret par la loi des grands nombres.

On peut enfin considérer cette dynamique comme une dynamique séquen- tielle, mais le propos est ici de la considérer comme une perturbation de la dynamique synchrone, c’est pourquoi nous éviterons le nom « dynamique sé- quentielle».

Nous proposons maintenant la notion de coalescence pour formaliser le comportement identifié par Nazim Fatès. L’idée est, dans une dynamique asynchrone, de choisir à l’avance les points (cellule, date) où il y aura une mise à jour, et d’appliquer cette même séquence à deux configurations distinctes au départ.

Ceci revient à utiliser la même source d’aléatoire pour deux simulations, idée déjà explorée par [Kaulakys et al.(1999)Kaulakys, Ivanauskas, and Mekauskas]

sur un autre modèle, où les auteurs observent une synchronisation des deux instances du système.

Définition. Un automate est ditcoalescent pour une dynamique asynchrone si pour tout couple de configurations initiales, en appliquant la même séquence aléatoire de mise à jour aux deux copies de l’automate, on obtient deux configurations identiques en un temps d’espérance polynomiale enn.

Tous les automates tendant rapidement vers une configuration triviale fixe sont bien sûr coalescents. Mais il existe des automates coalescents ne tendant pas vers un point fixe. Nous nous intéressons désormais seulement à ces derniers.

Nous choisissons d’utiliser le terme«coalescent» et les néologismes dérivés (parfois délicats) plutôt que le terme de « synchronisant » pour éviter toute ambigu¨ıté avec la notion de synchronisme qui est également utilisée.

Dans la suite, nous prenons comme exemple les automates cellulaires élé- mentaires, c’est-à-dire à une dimension (d= 1), 2 états (Q ={0,1}), et pour lesquels le voisinage d’une cellule est constitué des ses voisins droit et gauche ainsi qu’elle-même (V = {−1,0,1}). Le voisinage comprenant 3 cellules, il y a donc 2³= 8 configurations possibles de ce voisinage, sur lesquelles il faut définir la règle de transition δ. Il y a 8 voisinages pour lesquels il faut choisir si le nouvel état est 0 ou 1, et il existe donc 2⁸= 256 automates cellulaires élémentaires différents.

Les deux états de Q jouent un rôle symétrique. Lorsque l’on inverse les deux états d’une règle (on parle de conjugaison), on obtient une règle dont le comportement est équivalent (on passe par exemple de la règle«aller dans l’état 0 si et seulement si un voisin est dans l’état 1» à la règle« aller dans l’état 1 si et seulement si un voisin est dans l’état 0» ). Lorsque l’on obtient la même règle (c’est le cas par exemple pour la règle « recopier l’état de son voisin de gauche »), on dit que cette règle estinvariante par conjugaison.

(10)

De même, la bijectionz7→ −z sur l’ensemble des cellulesZ/nZapparie une règle à une autre obtenue simplement par symétrie du voisinage. Les comportements des deux règles sont équivalents. Lorsque l’on ne garde qu’un représentant par classe de symétrie (celui de numéro le plus faible dans la notation ci-dessous), il reste 88 règles à étudier.

Notation. Nous utilisons la notation introduite par S. Wolfram : une fonction de transitionδest représentée par le mot composé des images des|S|^|H|entrées possibles deδ. On énumère ces entrées dans l’ordre lexicographique desvj ∈H.

Par exemple,170= 2¹+ 2³+ 2⁵+ 2⁷repr´esente la fonction de transition Voisinage 1 1 1 1 1 0 1 0 1 1 0 0 0 1 1 0 1 0 0 0 1 0 0 0

Nouvel ´etat 1 0 1 0 1 0 1 0

Valeur binaire 2⁷ 2⁶ 2⁵ 2⁴ 2³ 2² 2¹ 2⁰ La règle170est donc«recopier l’état du voisin de droite». La règle0est«aller dans l’état 0 quel que soit le voisinage». Noter la police distinctive utilisée pour noter les règles :0123456789.

Notation. La notation précédente est très répandue mais le lien entre le comportement d’une règle et son numéro est difficile. Voici une notation proposée par [Fates(2004)] qui permet une lecture plus facile du comportement local de la règle. On écrit de même les voisinages possibles sur une ligne, indicés par les lettresAàF(au lieu des chiffres) pour éviter la confusion avec la numérotation de Wolfram. On retient alors les lettres des voisinages pour lesquels l’automate change d’état. La règle« changer d’état»contient donc toutes les lettres, c’est ABCDEFGH. La règle «identité»ne contient aucune lettre et est notée ∅. La règle « majorité » qui indique « passer dans l’état le plus fréquent parmi le voisinage»est

Voisinage 0 0 0 0 0 1 1 0 0 1 0 1 0 1 0 0 1 1 1 1 0 1 1 1

Nouvel ´etat 0 0 0 1 0 1 1 1

Lettre associ´ee A B C D E F G H

et s’´ecritDE.

3 Coalescence : premi` eres propri´ et´ es

Pour la dynamique totalement asynchrone, on montre facilement pour un seizi`eme des automates qu’ils ne sont pas coalescents. En effet, puisqu’`a chaque

´

etape il n’y a qu’une mise `a jour, il y a une exactement une cellule de d´esaccord

`

a l’étape juste avant la coalescence. La règle doit permettre la coalescence en ce point, c’est à dire que cette cellule change d’état dans exactement l’un des deux automates. Il faut donc que pour au moins l’un des quatre couples (A,E), (B,F), (C,G) et (D,H), la règle fasse apparaˆıtre exactement l’une des deux lettres. Ce n’est pas le cas pour 16 des 256 règles, c’est-à-dire (à symétrie près) pour les règles51,54,57,60,105,108,150,156,204.

3.1 Une preuve formelle de coalescence

Proposition 1. Les r`egles6et7sont coalescentes pour la dynamique totalement asynchrone pour nimpair.

(11)

Démonstration. Appelonsnombre de zones le nombre de motifs 01 dans une configuration c. Puisque la configuration est cyclique, c’est aussi le nombre de motifs 10 ou le nombre de suites maximales de cellules voisines dans l’état 1 (respectivement dans l’état 0). Ces suites sont appelées zones.

La preuve se fait en plusieurs ´etapes :

(a) On montre d’abord que le nombre de zones ne peut qu’augmenter.

(b) On montre ensuite qu’il augmente effectivement jusqu’à ce qu’il n’y ait plus de motif 000 ou 111. En coupant sur les motifs 00 et 11, on peut alors considérer la configuration comme une concaténation de mots (d’au moins 2 lettres) où chaque mot alterne rigoureusement 0 et 1, c’est-à-dire les mots du langage dénoté par l’expression régulière«(01)⁺0?|(10)⁺1?».

(c) On observe alors que les frontières entre ces mots suivent une marche aléatoire biaisée (i.e. à sens unique) et peuvent éventuellement se rencontrer, auquel cas un mot disparaˆıt avec probabilité non nulle. Presque sûrement, l’automate tend donc vers une configuration où il n’y a qu’un mot.

(d) Comme la taille de l’anneau est impaire, les deux lettres aux extrémités du mot sont identiques, c’est-à-dire qu’il existe un unique motif 00 ou 11 dans la configuration. Ces motifs sur chacun des deux automates superposés suivent la même marche aléatoire biaisée et finissent par se superposer, les deux automates ont alors coalescé.

Détaillons chacune de ces étapes pour la règle6.

(a) Voici la traduction de la r`egle de transition6:

Voisinage 0 0 0 0 0 1 1 0 0 1 0 1 0 1 0 0 1 1 1 1 0 1 1 1

Nouvel ´etat 0 1 0 0 1 0 0 0

Changement d’´etat oui oui oui oui

Lettre associ´ee A B C D E F G H

C’est donc la règleBFGH. Puisque qu’une seule cellule se met à jour à chaque

´

etape, on constate sur ce tableau que deux zones ne peuvent fusionner. (Le nombre de zones ne peut diminuer que si une cellule ayant un voisinage de type DouFse met à jour en changeant d’état, or la règle ne contient niDniF). Le nombre de zones ne peut donc qu’augmenter.

(b) Chaque fois qu’il y a un motif 0001, il peut se produire la suite de transitions suivante (le temps s’´ecoule de haut en bas) :

· · · 0 0 0 1 · · · B

· · · 0 0 1 1 · · · B

· · · 0 1 1 1 · · · H

· · · 0 1 0 1 · · ·

Cette suite se produit sans autre mise à jour intermédiaire des quatre cellules avec probabilité 1/4³ et en un temps d’espérance 3n. Le nombre de zones a alors augmenté.

(12)

De même, chaque fois qu’il y a un motif 111, avec probabilité 1/3 et en un temps d’espérancen, la cellule centrale se met à jour pour donner le motif 101 et le nombre de zones a augmenté.

Ainsi, tant qu’il y a des motifs 000 ou 111, une nouvelle zone apparaˆıt en tempsO(n).

(c) On considère alors la configuration comme une concaténation de mots de {0,1}^∗. On choisi comme limite entre les mots les motifs 00 et 11. On obtient une concaténation de mots (d’au moins 2 lettres) où chaque mot alterne rigoureusement 0 et 1. Comme la règle ne contient pasC, la frontière droite d’un mot ne peut pas se déplacer vers la gauche. En revanche, la règle contientBet G donc ces frontières se déplacent vers la droite suivant une marche aléatoire (biaisée). Un pas de cette marche prend un tempsO(n) en moyenne.

La longueur d’un mot suit donc une marche aléatoire (non biaisée), et lorsque cette longueur est 1 (au bout d’un temps d’espérance O(n³)), le mot a laissé place à un motif 000 ou 111. Ce motif a une probabilité Ω(1) de disparaˆıtre en faisant augmenter le nombre de zones, comme montré au point (b). Le nombre de zones augmente donc jusqu’à ce qu’il n’y ait plus qu’un motif 00 ou 11. (Noter qu’il peut apparaˆıtre d’autres motifs 000 ou 111 entre-temps.)

Ce motif suit toujours une marche al´eatoire biais´ee vers la droite.

(d) Considérons à nouveau les deux configurations, qui évoluent selon la même suite de mise à jours. Ce motif introduit un décalage de phase dans la suite (01)⁺, il fait donc passer d’une région où les deux configurations ont coalescé

`

a une région où elles sont en désaccord. Le motif de l’autre configuration fait passer de cette région où les configurations sont en désaccord à la première région d’accord (coalescence). Le couple de configurations est donc constitué d’une région d’accord suivie d’une région de désaccord. C’est la longueur de cette région que nous étudions. Cette longueur suit une marche aléatoire, au gré des déplacements des deux motifs 00 ou 11.

Lorsqu’elle atteintn, on a le couple de configurations suivant :

· · · 1 0 1 0 0 1 0 1 · · ·

· · · 0 1 0 1 1 0 1 0 · · ·

Une mise à jour sur une cellule autre que les quatrième et cinquième ne change rien, une mise à jour sur la cinquième cellule de fait que décaler et symétriser le motif. Une mise à jour sur la quatrième cellule envoie dans le couple de configurations suivant :

· · · 1 0 1 0 0 1 0 1 · · ·

· · · 0 1 0 0 1 0 1 0 · · ·

où la longueur de désaccord a diminué. La longueur n n’est donc pas un état absorbant de la chaˆıne de Markov associée à la marche aléatoire.

En revanche, lorsque la longueur de la r´egion de d´esaccord atteint 1, on est soit dans le couple de configurations suivant :

· · · 0 1 0 1 0 0 1 0 · · ·

· · · 0 1 0 1 1 0 1 0 · · ·

(13)

où une mise à jour de la cellule de désaccord (la cinquième) fait coalescer les deux automates, soit dans le couple de configurations suivant :

· · · 0 1 0 1 1 0 1 0 · · ·

· · · 0 1 0 0 1 0 1 0 · · ·

où une mise à jour de la cinquième puis de la quatrième cellule nous ramène au cas précédent. Il y a donc une probabilité non nulle de coalescer lorsque la longueur atteint 1.

Ceci prouve donc que la règle6 coalesce presque sûrement. Il nous reste à estimer le temps de coalescence.

L’étape (b) prend un temps O(n²) car le nombre de zones est borné par n/2. L’étape (c) prend un tempsO(n³). L’étape (d) prend de même un temps O(n³).¹ L’espérance du temps de coalescence est donc bien polynomial.

La preuve est analogue pour la règle7, la seule différence est qu’elle se traduit parABFGH: elle contient la lettre Aen plus, ce qui accélère la disparition des motifs 000 et donc la croissance du nombre de zones.

Cette preuve de coalescence n’est possible que grâce à un contrôle précis de ce qui se passe dans les régions où les automates sont en accord et celles où les automates sont en désaccord (ici c’est un fond fixe (01)^∗ sur lequel marchent quelques frontières). La plupart des automates ne se prêtent pas à une description aussi simple de leur comportement, et semblent plus difficiles à appréhender théoriquement.

Remarque. Si l’anneau est de taille paire, l’automate converge de même vers une concaténation de mots de (01)⁺0?| (10)⁺1?. Les frontières fusionnent de même, mais cette fois il y a un nombre pair de frontières, elles disparaissent donc presque sûrement. L’automate converge donc vers la configuration (01)^∗ (où l’on voit bien apparaˆıtre la condition de parité sur la taille de l’anneau).

A priori, selon la configuration initiale, il est possible que ce soit les cellules paires qui contiennent 1 pour un automate et les cellules impaires pour l’autre.

Dans ce cas les deux automates superposés sont en désaccord parfait. L’autre cas possible est bien sûr que les cellules contenant 1 aient la même parité dans les deux automates, ils sont alors en accord. Les deux cas sont rencontrés expé- rimentalement, apparemment avec une probabilité 1/2 chacun. Ce résultat n’est pour l’instant qu’une conjecture.

La proposition 1 entraˆıne un théorème qui dépassent le cas particulier des règles6et 7.

Théorème 2. Il existe des automates coalescents à nombre d’états arbitraire, et donc une infinité d’automates coalescents.

Démonstration. Commen¸cons par montrer qu’il existe des automates coalescents à nombre d’états arbitrairement grand. Définissons un produitA²d’un automate cellulaire élémentaireA= (Q, d, V, δ,n) avec lui même. C’est l’automate (Q², d, V, δ², n) oùδ²est définie parδ² (a,b),(c,d),(e,f)

:= δ(a,c,e), δ(b,d,f) .

1Pour des détails sur les méthodes probabilistes utilisées, on se reportera au chapitre 5 de [Fates(2004)].

(14)

Si|Q|= 2, l’automate obtenu est intuitivement l’automate `a 4 ´etats dont une configuration est obtenue par superposition de deux configurations de l’automate

`

a deux ´etats.

Par définition, siAest un automate coalescent,A² tend en un temps polynomial vers une configuration dont les états sont dans{(q,q) | q∈Q}. À partir du moment où l’automate a atteint une telle configuration,A² simule A. SiA est coalescent,A²l’est donc aussi (en un temps au maximum double du temps de coalescence deA). Il en est donc de même de (A²)², de (A²)²²

, etc.

Puisqu’il existe un automate coalescent, nous venons de construire une suite infinie d’automates coalescents `a nombre d’´etats de plus en plus grand.

Il nous reste à construire un automate à nombre d’état fixé à partir d’un automate ayant moins d’états. Or pour simuler un automate à q états par un automate à r > q états, il suffit de définir δ pour que les états surnuméraires passent dans l’un des qétats voulus quel que soit leur voisinage.

Remarque. Bien sûr, à nombre d’états fixés, la densité des automates ainsi construits parmi l’ensemble des automates possibles est faible.

Rappelons que nous nous intéressons toujours uniquement aux automates non triviaux. En initiant la construction précédente avec la règle 6 ou 7, on obtient une infinité d’automates coalescents non triviaux.

3.2 Deux preuves de coalescence avec probabilit´ e 1/2

Proposition 3. Les règles15 et170, pour les dynamiques partiellement asynchrone et totalement asynchrone, coalescent avec probabilité1/2, et tendent vers deux configurations en désaccord total dans l’autre cas.

Démonstration. Commen¸cons par le cas de170, qui est simplement «recopier le voisin de droite » (shift). On constate qu’une cellule mise à jour est dans le même état entre les deux configurations si et seulement si sa voisine de droite

´

etait en accord à l’étape précédente. On est donc ramené à un automate à deux

´

etats : accord ou d´esaccord entre les deux configurations.

Cet automate est toujours170. On utilise alors un r´esultat de [Fates(2004)]

affirmant que la règle170en dynamique partiellement asynchrone tend en temps polynomial soit vers la configuration nulle 0^∗ (correspondant à la coalescence), soit vers la configuration 1^∗ (ce qui correspond au désaccord total).

Par sym´etrie, chacun des deux cas a une probabilit´e 1/2.

Regardons maintenant le cas de15, ou plutôt de son symétrique,85. Il suffit de montrer qu’une cellule est en accord si et seulement si, si on avait appliqué la règle170au lieu de la règle de85, cette cellule aurait aussi été en accord. En d’autre termes, nous allons montrer que les cellules en accord sont les mêmes sur une évolution de la règle 170 et une évolution de la règle 85 partant des mêmes configurations initiales. On aura alors terminé.

Or85 est la règle «passer dans l’état opposé à celui du voisin de droite ».

Une cellule qui se met à jour sera donc en accord entre les deux configurations si et seulement si la cellule de droite l’était à l’étape précédente. Ce qui est la

mˆeme condition que pour170.

(15)

Remarque. Les automates présentant cette propriété de se ramener à un automate à deux états sont exactement les règles de la forme

δ(q1, q2, q3) =ε+X

i∈I

qi mod 2

oùI⊆ {1,2,3}etε∈ {0,1}. On appelle ces règles les règles additives (elles sont introduites dans [Martin et al.(1984)Martin, Odlyzko, and Wolfram] et étudiées par [Chaudhuri et al.(1997)Chaudhuri, Chowdhury, Nandi, and Chattopadhyay]

en d´etail).

Ceci appelle une courte démonstration. Si δ est une fonction constante, il suffit de prendre I = ∅. Sinon, il existe un voisinage (q1, q2, q3) pour lequel δ change si l’un des états change. Par symétrie, on peut supposer que δ(q1, q2, q3)6= δ(1−q1, q2, q3). Puisque l’on peut se ramener à un automate à deux états accord/désaccord, ceci doit être vrai quels que soient q2 et q3. En effet, s’il existaitq₂⁰ etq₃⁰ tels queδ(q1, q₂⁰, q₃⁰) =δ(1−q1, q⁰₂, q⁰₃), on aurait alors deux voisinages identiques du point de vue accord/désaccord, mais ayant un résultat différent (l’un en accord, l’autre en désaccord).

La règle est donc de la formeε+q1+δ⁰(q2, q3) mod 2. Ceci est vrai pour toute cellule du voisinage dont le résultat dépend, donc la règle est additive.

Réciproquement, une règle additive vérifie facilement cette propriété de se ramener à un automate à deux états.cqfd.

Les automates présentant cette propriété de se ramener à une automate à deux états sont donc, à symétrie près, les règles0 pour|I| = 0,204(identité), 51(not),170(shift) et15(not shift) pour|I|= 1,150(xor) et105(not xor) pour

|I|= 3, et enfin60et90pour|I|= 2. Parmi celles-ci, nous venons de décrire15 et 170, 0est trivialement coalescente,204 et 51ne peuvent pas l’être. Il reste 150, pour laquelle il semble que l’automate à 2 états ne converge qu’en temps exponentiel, comme le conjecture [Regnault(2005)], et les règles où|I|= 2 ainsi que105qui ne sont pas étudiées par la référence précédente et ne coalescent pas expérimentalement.

L’idée de se ramener à un automate à deux états ne semble donc pas utilisable pour traiter d’autres règles.

Proposition 4. Si une règle invariante par conjugaison coalesce ou tend vers une configuration de désaccord total en un temps polynomial quelle que soit la configuration initiale, alors la probabilité de chacun des deux cas est1/2.

Démonstration. On considère l’automate produit deApar lui-même défini dans la démonstration du corollaire 2. Puisque A est invariant par conjugaison,A² est identique à l’automate Bobtenu à partir deA² en échangeant deux à deux les états (p, q) et (1−p, q) (et en gardantδ). OrB est dans une configuration où tous les états sont de la forme (q,q),q∈Qsi et seulement siA²est dans une configuration où tous les états sont de la forme (q,1−q),q∈Q, si et seulement si A est dans un couple de configurations de désaccord total. De même, A a coalescé si et seulement si A² est dans une configuration où tous les états sont de la forme (q,q),q∈Q. Par symétrie, la probabilité de chacun des cas est donc

1/2.

Expérimentalement, c’est le cas des règles 15, 23, 43, 170et 178mais pas des règles (pourtant invariantes par conjugaison)51, 77, 105,142, 150, 204et 232, qui ne coalescent jamais.

(16)

4 Trois pistes pour une preuve g´ en´ erale

Nous présentons ici trois formulations du problème qui sont susceptibles de conduire à une preuve formelle générique de la coalescence de classes d’automates. Une telle preuve n’a pas été obtenue pour l’instant, mais ces pistes pourront être poursuivies lors de recherches futures.

4.1 Automates finis d´ eterministes

La th´eorie des automates et langages formels nous propose le concept fondamental d’automate fini d´eterministe.

Définitions. Un automate fini déterministe est un uplet (Q, A, δ) où – Qest un ensemble fini appelé ensemble d’états ;

– Aest un ensemble fini appel´e alphabet ; – δ:Q×A→Qest la fonction de transition.

Un automate a pour entrée un mot sur l’alphabetA. On noteq−→â q⁰ lorsque q⁰ = δ(q,a), et l’on nomme cela une transition de l’automate. La marche de l’automate sur le mot a₁. . . a_n à partir d’un état q₁ est la suite de transitions q1

a₁

−→q2 a₂

−→ · · ·−−−→^aⁿ⁻¹ qn−1 a_n

−−→qn.

Formellement, on prolongeδ:Q×A→Qenδ^∗:Q×A^∗→Qen posant :

∀q∈Q

(δ^∗(q,ε) =q

∀a∈A ∀u∈A^∗ δ^∗(q,au) =δ^∗(δ(q, a), u) On confond alorsδetδ^∗, not´eesδ.

(On ajoute le plus souvent à la spécification de l’automate un état initial et un ensemble d’états finaux, pour étudier des propriétés de reconnaissance de mots non bi-infinis.)

La notion qui nous int´eresse ici est celle d’automate synchronisant, expos´ee par exemple dans [Hopcroft and Ullman(1979)].

D´efinition. SoitAun automate (Q, A, δ). Un motwest dit synchronisant pour A si et seulement si ∃p∈Q ∀q ∈ Q δ(q,w) = p. L’automate A est alors dit synchronisant.

Nous pouvons formuler notre problème dans ce modèle. Soit en effet (Q, d, V, δ) un automate cellulaire. Dans la dynamique totalement asynchrone, on lui associe l’automate fini déterministe suivant.

– L’ensemble des ´etats estQⁿ^d : c’est l’ensemble des configurations de l’automate cellulaire.

– L’alphabet estJ1, nK

d : c’est l’ensemble des cellules.

– La règle de transition associe à l’étatq et la lettrec la configuration obtenue en appliquantδà la cellulecde la configurationq(dans l’automate cellulaire). On obtient une nouvelle configuration, qui est un état de l’automate fini.

Pour traiter le cas de la dynamique partiellement asynchrone, il suffit de modifier l’alphabet. Puisque plusieurs cellules peuvent se mettre `a jour en mˆeme temps, on prend pour alphabetP(J1, nK

d) : l’ensemble des parties de l’ensemble des cellules. Lire une lettrec dans l’automate fini correspond donc `a faire une

(17)

´

etape de calcul dans l’automate cellulaire, qui est la mise à jour de l’ensemble des cellules désignées parc.

Le parall`ele avec notre probl`eme est alors le suivant :

Lemme 5. Considérons une évolution finie d’un automate cellulaire. L’automate cellulaire a coalescé quel que soit le couple de configurations initiales si et seulement si la séquence de mise à jour effectuées, vue comme une suite de lettres, est un mot synchronisant pour l’automate fini associé.

Démonstration. Si le mot est synchronisant et menant à un état q, quelle que soit la configuration initiale de l’automate cellulaire, il est à la fin dans la confi- gurationqet a donc coalescé.

Réciproquement, considérons une configuration initiale arbitraire et notons q la configuration obtenue après la séquence de mises à jour. Puisque quel que soit le couple considéré initialement les deux copies sont dans la configurationq

`

a la fin de l’´evolution, le mot est synchronisant.

On est donc ramené au problème suivant : on considère un mot infini formé de lettres tirées au sort indépendemment selon la loi uniforme, et l’on cherche la longueur moyenne du plus court préfixe qui soit un mot synchronisant.

L’automate fini construit est énorme mais très structuré. Malheureusement, sa minimisation conduit à l’automate trivial car il accepte le langage entier. La reconnaissance de langages est justement la préoccupation principale des travaux sur les automates finis. Enfin, il semble qu’il n’y ait pas de résultat adaptable à notre problème, un résultat récent [Trahtman(2004)] prouve qu’il existe un mot synchronisant de longueur au plus (m−1)² pour une large classe d’automates (dans le cas général c’est la conjecture de ˇCzerny), où mest le nombre d’états de l’automate fini. Mais ici mn’est pas polynomial enn. Le fait de considérer la longueur moyenne (et donc de s’intéresser au cas typique et non au pire cas) simplifie peut-être la question.

4.2 Couplage et chaˆınes de Markov

Une approche plus prometteuse consiste à considérer l’automate cellulaire asynchrone comme une chaˆıne de Markov. Les états de la chaˆıne de Markov sont les configurations de l’automate, la probabilité d’aller d’un état à un autre est simplement, en reprenant l’automate fini de la section précédente, le nombre de lettres distinctes qui font passer du premier au second état, divisé par le cardinal de l’alphabet. Dit autrement, cette probabilité est le nombre de fa¸cons de passer de la première à la seconde configuration en mettant à jour certaines cellules.

Le couplage de deux chaˆınes de Markov est exactement ce qui nous pré- occupe : cela consiste à considérer deux copies de la chaˆıne avec conditions initiales distinctes, à les faire évoluer simultanément sous la même réalisation de l’aléatoire, et à mesurer le temps au bout duquel elles sont dans le même

´

etat. Des références classique à ce sujet sont [Lindvall(1992), Thorisson(2000), Häggström(2002)].

4.3 Automates cellulaires probabilistes

On peut enfin considérer notre modèle d’automate cellulaire asynchrone comme un cas particulier d’automates cellulaires probabiliste. Dans ce modèle,

(18)

la règle de transition δ n’est plus déterministe mais probabiliste. Il suffit donc de modifierδde la règle initiale pour lui ajouter une probabilité 1−αde rester dans le même état, et l’on obtient la dynamique partiellement asynchrone.

Ce point sera étudié lors d’un stage d’un mois avec des spécialistes des automates cellulaires probabilistes, en octobre, à Berlin.

5 Transitions de phase

Parallèlement à l’étude théorique, nous avons mené une étude expérimen- tale des automates coalescents. La première expérimentation visait à déterminer quels sont les automates présentant ce comportement. Il est apparu une grande richesse de comportements, dont une transition de phase. C’est cette dernière que nous avons alors étudiée en détail. Nous présentons une expérimentation et montrons que les paramètres sont ceux de la classe d’universalité de la percolation dirigée.

5.1 D´ etermination des automates coalescents

5.1.1 Protocole

Nous appelons simulation l’exécution d’un automate quand tous les para- mètres sont fixés : configuration initiale, nombre d’étapes, taux de synchronisme, etc. La simulation est stoppée dès que l’automate a coalescé, car les deux configurations sont alors définitivement identiques (le test est fait sur les étapes dont le rang est une puissances de 2).² Voici le choix des paramètres des différentes simulations effectuées.

Pour choisir la taille de l’anneau sur lequel effectuer les simulations, il n’y a de limite supérieur que la capacité de calcul. Concernant la limite inférieure, certains auteurs comme [Wuensche(1999)] laissent penser que de petites tailles (n= 30) suffisent à classifier, d’autres tels que [Broadbent and Hammersley(1957)]

assurent le contraire. Par prudence, nous prenons un grand anneau. Un pro- blème similaire étudié dans la thèse de Nazim Fatès (comme annoncé au début de cette partie [Fates(2004)]) montre une stabilisation du comportement à partir den= 200. Nous choisissons un anneau de taillen= 500 cellules.

Le but étant simplement d’établir une classification rapide des automates pour déterminer ceux sur lesquels poursuivre l’étude, il n’est pas nécessaire d’échantillonner finementα. Nous prenons l’ensemble de valeurs 0.1, 0.5 et 0.9.

On ne repère donc pas d’éventuelles règles qui seraient coalescentes pour un ensemble de valeurs deαn’intersectant pas {0.1,0.5,0.9}.

On pourrait fixer l’espérance du nombre maximal de mises à jour, et donc laisser évoluer le système plus longtemps pourαfaible (puisqu’il y a alors moins de mises à jour par étape). Cependant, le travail de [Regnault(2005)] a montré analytiquement, dans un problème plus simple, que certains automates en dynamique partiellement asynchrone ont un temps de convergence proportionnel

`

a _α(1−α)¹ . Ainsi,αélevé n’entraˆıne pas nécessairement convergence rapide. C’est

´

egalement la raison pour laquelle 0.5 fait partie des valeurs choisies pourα. Le

2Pour que les deux copies arrivent sur des configurations de désaccord total (le contraire de la coalescence) en temps polynomial, il faut qu’une région en opposition soit stable. On pourrait donc également stopper la simulation également lorsque les deux configurations sont en totale opposition.

(19)

nombre d’étapes de calcul est fixé à 2²⁰= 1 048 576, ce qui est de l’ordre den² (multiplié par une petite constante).

Pour chaqueαet chaque règle, la simulation est répétée pour 10 configurations initiales aléatoires (les mêmes pour toutes les règles et tous lesα) et la règle est retenue dès que l’une de ces simulations a été arrêtée prématurément (pour cause d’accord total). Ceci permet de vérifier la cohérence des 10 expériences.

Cette étape permet, en plus de déterminer les automates à étudier, d’estimer le temps de coalescence, ce qui permettra de fixer le paramètre Ttr à la section5.4.1et a un intérêt intrinsèque pour distinguer plus finement les comportements.

5.1.2 R´esultats

On obtient une grande richesse de comportements quant `a la coalescence, pour laquelle nous proposons les cat´egories empiriques suivantes.

– Les automates qui ne coalescent jamais (deux exemples triviaux sont les règlesidentité(∅) etnot(ABCDEFGH) car le nombre de cellules d’accord est constant) ou qui coalescent peut-être en temps exponentiel. Cette ca- tégorie contient les règles 4, 5, 12, 13, 25, 28, 29, 33, 36, 37, 41, 44, 45, 51,54,60,72,73,76,77,78,90,94,104 105,108,122,132,140,142,150, 156,164,172,200,204,232.

– Les automates qui coalescent rapidement, sans doute en un temps polynomial. Un cas simple de ce comportement consiste en les automates qui converge vers un point fixe unique et trivial quelle que soit la condition initiale. On peut alors considérer les deux configuration indépendemment, et dès que les deux ont atteint le point fixe, elles sont trivialement identiques.

Sont dans cette cat´egorie les r`egles0, 2, 8,10, 24,32, 34, 38,40, 42, 56, 74,128,130,136, 138,152,160,162,168.

– Les automates qui coalescent rapidement, mais pas vers un point fixe.

On ne peut plus considérer les deux configurations indépendemment, mais elles sont rapidement identiques et suivent alors la même orbite. C’est le cas des règles3, 11,19,35,46,154.

– Les automates qui combinent deux des trois comportements précédents, en fonction deα.18,26,106,146combinent les deux premiers comportements,50,58,134combinent les deux derniers,9,57,62,110,126réalisent la dernière combinaison possible. 7 passe du comportement décrit dans le point suivant à une coalescence systématique quand αcroˆıt. 22 et 30 passent du comportement du point suivant à une absence de coalescence.

– Les automates qui évoluent soit vers un état coalescé soit vers un état de désaccord total en fonction des mises à jour. C’est le cas de14,15,23,43, 170,178,184.

– Notons enfin que certains automates ont un temps de coalescence tr`es variable en fonction deα:1,6,27.

A la lumi`` ere de ces résultats, il apparaˆıt intéressant d’étudier plus en détail la nature de la transition qui s’opère entre le régime coalescent et le régime non coalescent pour les automates présentant les deux comportements en fonction deα. Ce sont donc les règles9,57,62,110, et126.

Nous testons l’hypothèse d’une transition de phase selon le modèle de la percolation dirigée.

(20)

5.2 Le mod` ele de la percolation dirig´ ee

Pour une présentation rapide, voir [Hinrichsen(2000)], qui contient des réfé- rences plus complètes ainsi qu’une sectiondamage spreading, qui est une autre manière de formuler notre problème.

Les modèles de diffusion font souvent apparaˆıtre une transition entre survie et extinction. La percolation dirigée en est un cas particulier. Elle met en jeu des sites d’une grille qui ont deux états possibles : actif et inactif (que l’on peut se représenter respectivement par infecté et sain). Suivant l’évolution de la population des deux états, le système peut tomber dans un état absorbant où aucun site ne peut devenir actif.

directed bond percolation isotropic bond percolation

Fig.1 – Percolation isotrope et dirig´ee. Le point de d´epart est le site central.

La diffusion est représentée par les arêtes épaisses, qui relient les sites actifs Dans la percolation classique, la diffusion d’un virus ou de gouttes d’eau se fait en suivant les liens autorisés sur une grille. La différence est ici que les liens sont orientés (voir figure1).

On appelle cluster l’ensemble des sites atteints `a partir du point de d´epart.

Le paramètre qui varie estp, la probabilité qu’un lien soit ouvert. Le paramètre mesuré est la probabilité qu’un site pris au hasard génère un cluster infini.

Les deux modèles présentent une transition de phase, dont les caractéristiques (les classes d’universalité, caractérisée par quelques exposants critiques) sont différentes.

On peut considérer la flèche de la figure 1 comme l’écoulement du temps, c’est-à-dire qu’une dimension est le temps. On obtient un système dynamique où un site inactif le reste à l’étape suivante, et où un site actif peut soit mourir (devenir inactif), soit le rester, et éventuellement rendre actif un site voisin (le contaminer).

On distingue trois régimes suivant le paramètrep. En régime sous-critique (p < pc, figure3), les sites actifs meurent plus vite qu’il ne se reproduisent, et l’on observe des branches qui meurent. En régime sur-critique (p > p_c, figure2), les sites actifs se reproduisent plus vite, et la grille a une densité constanteρde sites actifs (après un régime transitoire). Cette densité est donnée par la loi

ρ(p) =c(p−pc)^β

et l’exposant critiqueβ est commun à tous les modèles de percolation dirigée.

(21)

Fig.2 – Régime sur-critique de la règle110(α= 0,65> αc'0,566). Le temps va de gauche à droite, pour 500 étapes (horizontalement) sur 500 cellules (ver- ticalement). Les cellules où les deux automates sont en désaccord sont foncées, celles où ils sont en accord sont claires. Parmi ces dernières, l’état 1 est en bleu clair, l’état 0 est blanc.

(22)

Fig.3 – Régime sous-critique de la règle110(α= 0,47< α_c '0,566). Le reste est identique à la figure2. On observe que les branches sombres meurent.

(23)

Dans notre modèle, c’estαqui jouera le rôle du paramètre que l’on fait varier, et les sites actifs seront définis comme les cellules où les deux configurations ne sont pas dans le même état. On cherche donc à identifier l’exposant critiqueβ sous l’hypothèseρ(α) =c(α−αc)^β.

Nous nous concentrons principalement sur la mesure deβ, comme la majorité des auteurs. Faire directement une régression surc,αcetβà la fois conduit à des résultats peu précis. Une méthode classique, utilisée ici, consiste à déterminer αc dans un premier temps, puis faire une régression sur c et β sur la courbe ρ(α).

5.3 Mesure de α

_c

5.3.1 M´ethode

En régime critique, la densitéρde sites actifs décroit enρ=c t^−δ, oùtest le temps etcune constante quelconque. Elle décroˆıt plus rapidement qu’exponen- tiellement en régime sous-critique et moins rapidement en régime sur-critique (et tend alors vers une valeur non nulle). On trace doncρen fonction detdans un repère où les deux échelles sont logarithmiques, et l’on ajuste αde fa¸con à obtenir une droite. La figure4 donne un exemple.

Fig.4 – ρ(t) pourαprenant les valeurs 0,55, 0,599 et 0,65 (avec αc '0,599).

L’échelle (logarithmique) des abscisses va de 1 à 10⁶, celle des ordonnées de 0,01

` a 1.

Chaque tracé indique si leαcourant est inférieur ou supérieur à αc, ce qui permet de faire de la dichotomie. La figure5 montre les résultats obtenus pour diverses dimensions de l’anneau et valide le choix des paramètres.

(24)

Fig. 5 – Mêmes échelles que la figure 4. α = 0,6 et les dimensions choisies ici sont 2 000, 10 000 et 100 000 cellules. Il y a deux choses à remarquer sur ces courbes. D’une part, même pour des valeurs très proches deαc (ici 0,599 pour la règle 62), l’automate atteint sa densité limite après 100 000 étapes, ce qui valide le choix de T_tr pour la mesure de ρen fonction de α à la section 5.4.1.

D’autre part, augmenter le nombre de cellules rend la courbes plus pr´ecise, mais ne change pas la valeur moyenne, il n’est donc pas n´ecessaire d’augmenter encore ce nombre de cellules.

(25)

5.3.2 Protocole

Les deux configurations initiales sont aléatoires, chaque cellule ayant une probabilité 1/2 d’être dans chacun des 2 états.

Le temps d’évolution et la taille de l’anneau sont dictés par la précision des courbes : on augmente le nombre de cellules jusqu’à pouvoir lire sur la courbe si le αcourant est sur- ou sous-critique (voir figures 6et 7). On utilise jusqu’à 200 000 cellules et 10⁷ étapes de calcul.

Fig. 6 – Le comportement asymptotiques est atteint au bout d’un temps de plus en plus long au fur et a mesure que l’on s’approche de α_c, il faut donc poursuivre les simulations de plus en plus longtemps. Sur l’exemple ci contre, les deux courbes (l’une sous-critique, l’autre sur-critique) ne sont pas discernables avant t= 100 000, et il faut prolonger la simulation jusqu’`a t= 1 000 000 pour

´

ecarter toute possibilit´e de fluctuation al´eatoire.

5.3.3 R´esultats

Voici les valeurs critiques du paramètre trouvées. Rappelons qu’αc n’est pas un paramètre universel, il dépend du modèle et n’est qu’une étape dans la mesure deβ.

r`egle 9 62 110 126 57

α > . . . 0,757 0,598 0,566 0,720 0,749 α < . . . 0,758 0,599 0,567 0,721 0,750

5.4 Mesure de β

On trace maintenant ρ en fonction de α (comme sur la figure 8), on fait l’hypoth`ese queρ=c(α−αc)^β au voisinage de la transition de phase, et l’on effectue un r´egression pour mesurer l’exposantβ.

(26)

Fig.7 – Parallèlement à cela s’ajoute un autre phénomène : la densité asymptotique est de plus en plus faible (en vert pourα= 0,57, en rouge pourα= 0,58, la droitec t^−δ en bleu), donc ρest longtemps proche dec t^−δ. Or on observe de fortes fluctuations à faible densité. Il faut donc augmenter le nombre de cellules.

Fig.8 –ρ(α) pour la r`egle110et pour des anneaux de 2 000 et 10 000 cellules.

En abscisse : αde 0,55 à 1, en ordonnée : ρde 0 à 0,6.

(27)

On note un léger décrochage sur la fin de la courbe, dû à un phénomène non identifié. En fait, le décrochage se produit bien plus tôt : il faut se restreindre aux valeurs « proches » de αc pour effectuer la régression. Pour choisir ces valeurs, on prendαc pour origine des abscisses et l’on trace la même courbe en

´

echelles logarithmiques. On obtient la figure9, sur laquelle la partie de la courbe v´erifiantρ=c(α−αc)^β est une droite. Les valeurs retenues pour la r´egression sont en vert.

Fig.9 – Densité asymptotique en fonction deαpour une échelle logarithmique avec pour origine des abscissesα= 0,6'αc. Le fait que le décrochage commence tôt est bien visible (et reste visible même pour des valeurs éloignées deαccomme le montre la figure10).

Ceci est confirmé expérimentalement : la précision de la régression (estimée par une somme de carrés de différences) est meilleure si l’on se restreint aux valeurs proches de la valeur critique. Il se produit donc certainement un phé- nomène dès que l’on s’éloigne sensiblement de αc, qui tend à faire baisser la densité asymptotique.

Après régression, on obtient la figure11. À nouveau, les points retenus pour la régression sont en vert, ce qui montre une excellente adéquation entre les données et la courbe obtenue (en bleu).

5.4.1 Protocole

Les deux configurations initiales sont aléatoires, chaque cellule ayant une probabilité 1/2 d’être dans chacun des 2 états. Le système évolue pendant un temps transitoireTtr, puis l’on mesure la densité d’états de désaccord surTéch

´

etapes, la moyenne de ces mesures donnant une estimation deρ.

A` αfixé, la configuration initiale et la suite de mises à jour sont les mêmes pour toutes les règles. En revanche, ces deux réalisations de l’aléatoire sont distinctes pour toutes les valeurs de α, ce qui permet d’estimer leur influence.

(28)

Fig.10 – Le décrochage reste visible même pour une valeur deαcmal détermi- née. Par exemple, pour une origine de l’échelle logarithmiqueα= 0,65 (au lieu de 0,599), on voit déjà un point d’inflexion aux alentours de l’abscisse 0,1, c’est-

`

a-dire pourα= 0,65 + 0,1 = 0,75. C’est donc un moyen objectif de déterminer l’intervalle de valeurs sur lequel effectuer la régression. On a ajouté la courbe d’une loi de puissance sur la figure.

Fig.11 –ρ(α) et la courbe obtenue apr`es r´egression.

(29)

Nous tra¸cons les valeurs deρpour un pas de αtrès fin autour de la valeur critique (repérée en tra¸cantρsur un intervalle plus large avec un pas grossier).

Ceci permet de vérifier la précision des mesures tout an ayant un graphe plus léger que des barres d’erreur. En effet, on constate que la courbe est lisse (sauf pour les points très proches de αc), une courbe accidentée aurait signifié une grande sensibilité de la mesure à la réalisation de l’aléatoire. Nous préférons ainsi faire une régression sur un grand nombre de valeurs deα plutôt que sur un nombre plus restreint et plus précis (dans ce dernier cas, il faudrait donner une estimation de la précision au processus de régression).

Il faut également vérifier que les résultats sont peu sensibles aux variations de n,Ttr etTéch. La régularité de la courbe obtenue (chaque point a une configuration initiale et une suite de mises à jour distinctes des autres points) montre qu’il y a peu de variation d’une expérience à l’autre, la valeur choisieT_´_ech= 10 000 est donc suffisante. n= 10 000 etT_tr = 100 000 ont été validés sur la figure5.

5.4.2 R´esultats

La régression donne alors les encadrements suivants, en tenant compte de l’imprécision sur αc. Les variations observées selon les points retenus pour effectuer la régression sont légères tant que les points sont raisonnables au vu de la figure9.

La valeur expérimentale deβ mesurée sur d’autres modèles reconnus comme faisant partie de la classe de la percolation dirigée est 0,276.

r`egle 9 62 110 126 57

β > . . . 0,273 0,270 0,271 0,260 0,248 β < . . . 0,283 0,281 0,281 0,276 0,281

Pour la règle57, il est tentant de diminuer le nombre de points pris en compte dans la détermination de β en se restreignant aux points les plus proches de αc. On obtient alors un encadrement mieux centré sur la valeur communément admise 0,276, mais moins précis. Ceci peut être dû soit à une erreur systématique et inconnue, soit à un autre phénomène qui apparaˆıt non loin deαc. Lorsqu’au contraire on prend en compte plus de points, l’intervalle prend des valeurs plus faibles qui n’encadrent plus 0,276.

57 est d’ailleurs plus délicat à mesurer. Pour les mêmes paramètres de simulation, on obtient des résultats moins réguliers (i.e. avec une plus grande variance). δ semble légèrement plus élevé (0,165 au lieu de la valeur admise 0,160). La courbe densité asymptotique en fonction de α est plus haute que la loi de puissance loin de α_c, les autres règles montrant au contraire un léger décrochage (voir figure 12).

Tous ces indices tendent `a classer 57 `a part, et en effet β ne correspond

`

a la valeur théorique de la percolation dirigée que sur une région très proche de α_c (est est donc mesuré avec une moins grande précision). Le fait le plus marquant est que c’est pour les faibles valeur deαque le régime est sur-critique, la coalescence apparaissant pour les fortes valeurs de α(voir figure 12). Il est

`

a noter une similitude avec les observations de Nazim Fatès : dans ses travaux, la règle 6 présentait ce comportement « inversé » par rapport à α, et était

´

egalement plus d´elicate `a mesurer.