• Aucun résultat trouvé

Autour de la robustesse des syst`emes complexes: le cas des automates cellulaires coalescents

N/A
N/A
Protected

Academic year: 2022

Partager "Autour de la robustesse des syst`emes complexes: le cas des automates cellulaires coalescents"

Copied!
32
0
0

Texte intégral

(1)

Autour de la robustesse des syst`emes complexes:

le cas des automates cellulaires coalescents

Jean-Baptiste Rouquier avril – aoˆ ut 2005

sous la direction de Michel Morvan

Table des mati` eres

1 Syst`emes complexes 2

1.1 Vers une d´efinition . . . 2

1.1.1 Caract´eristiques . . . 2

1.1.2 Param`etres . . . 2

1.2 Exemples . . . 3

I Pr´ eliminaires : mesurer la complexit´ e 4

2 Le syst`eme et sa description 4 2.1 Complexit´e du syst`eme. . . 5

2.2 Complexit´e de la description . . . 5

2.3 De la description au syst`eme . . . 6

II Automates cellulaires coalescents 7

3 Coalescence : premi`eres propri´et´es 10 3.1 Une preuve formelle de coalescence . . . 10

3.2 Deux preuves de coalescence avec probabilit´e 1/2 . . . 14

4 Trois pistes pour une preuve g´en´erale 16 4.1 Automates finis d´eterministes . . . 16

4.2 Couplage et chaˆınes de Markov . . . 17

4.3 Automates cellulaires probabilistes . . . 17

5 Transitions de phase 18 5.1 D´etermination des automates coalescents . . . 18

5.1.1 Protocole . . . 18

5.1.2 R´esultats . . . 19

5.2 Le mod`ele de la percolation dirig´ee . . . 20

5.3 Mesure deαc . . . 23

5.3.1 M´ethode. . . 23

5.3.2 Protocole . . . 25

(2)

5.3.3 R´esultats . . . 25

5.4 Mesure deβ . . . 25

5.4.1 Protocole . . . 27

5.4.2 R´esultats . . . 29

5.4.3 Conclusion . . . 30

6 Conclusions 30

1 Syst` emes complexes

1.1 Vers une d´ efinition

Il n’y a pas de d´efinition formelle largement accept´ee de ce qu’est un syst`eme complexe. On s’accorde g´en´eralement `a dire qu’il doit ˆetre constitu´e d’un grand (mais fini) nombre d’entit´es simples en interaction locale ´evoluant parall`element.

Mais mˆeme ces ´el´ements de base de sont pas toujours respect´es, et il est par- fois fructueux d’appliquer les id´ees issues de la th´eorie des syst`emes complexes

`

a des objets d’´etudes constitu´ees d’une partie de ces ´el´ements seulement.

1.1.1 Caract´eristiques

On distingue des caract´eristiques communes `a un grand nombre de syst`emes complexes, ce qui permet r´eciproquement de qualifier un syst`eme de complexe d`es qu’il pr´esente la plupart de ces caract´eristiques.

– Beaucoup d’entit´es interconnect´ees.

– Un graphe d’interaction non trivial.

– Beaucoup d’interactions [Kauffman(1993)] pendant de l’´evolution du sys- t`eme.

– Information et interactions locales, peu d’organisation centrale.

– R´etroactions (feedback).

– Plusieurs comportements possibles en comp´etition, certains ordonn´es et d’autres d´esordonn´es. Le syst`eme est souvent `a la limite entre ces compor- tements [Poon and Grebogi(1995),Lai(1999)].

– Production de motifs structur´es, ´emergence de comportements globaux, auto-organisation.

– Brisure de sym´etrie : la connaissance d’une partie de permet pas de pr´edire statistiquement le comportement des autres parties [Heylighen(1996)].

– Vari´et´e des ´echelles de temps et d’espace : hi´erarchie de structures.

Le syst`eme peut ˆetre ouvert, il y a alors flux d’´energie et d’information aux fronti`eres et `a travers le syst`eme. Ces derni`eres peuvent ˆetre difficiles `a d´etermi- ner (par exemple, `a partir de quel instant la nourriture ou l’air absorb´e font-ils partie du corps ?).

1.1.2 Param`etres

Un syst`eme complexe est d´efini par les param`etres suivants : – l’ensemble des entit´es en interaction,

– l’ensemble des ´etats possibles d’une entit´e (il est possible de distinguer des classes d’entit´es, chaque classe ayant son propre ensemble d’´etats),

(3)

– le graphe d´efinissant les interactions entre les entit´es (elles peuvent se d´eplacer sur ce graphe et ˆetre `a plusieurs sur un sommet),

– l’ext´erieur du syst`eme et les fronti`eres,

– les param`etres globaux (comme la temp´erature ou un taux de change), – la r`egle de transition : changement d’´etat d’une entit´e en fonction des

entit´es voisines, et ´eventuellement modification du graphe d’interaction, – la mani`ere dont on applique la r`egle, c’est-`a-dire la mani`ere dont le temps

s’´ecoule. Il peut y avoir des vitesse diff´erentes selon les entit´es, par exemple en faisant intervenir une probabilit´e sur la transition ou sur le temps entre les transitions. C’est ici qu’est d´efinit le synchronisme.

1.2 Exemples

Certains syst`emes sont bien trop complexes pour que l’on puisse ´etablir des r´esultats g´en´eraux, ou bien font intervenir d’autres m´ecanismes que ceux aux- quels s’int´eresse l’´etude des syst`emes complexes. Ils montrent n´eanmoins la ri- chesse de cette approche, qui peut apporter des r´eponses partielles ou sugg´erer des angles d’´etude mˆeme sur ces syst`emes.

syst`eme entit´es interactions ph´enom`ene ´emergent colonie fourmis ´echanges de ph´eromones fourmili`ere

g´enome gˆenes activations et inhibitions tissus

cellule prot´eines r´eactions chimiques adaptation au milieu cerveau neurones impulsions ´electriques intelligence

bourse courtiers transactions bulles, krachs, etc.

tas de sable grains chocs avalanches

Citons encore un vol d’´etourneaux ou un troupeau de moutons, la propagation d’une ´epid´emie, d’une rumeur ou du bouche-`a-oreille sur un nouveau produit, des r´eseaux de criminalit´e, le d´eveloppement d’un embryon

Si l’on consid`ere, comme objectifs successifs de la science face `a un syst`eme,

« comprendre, pr´edire, contrˆoler, concevoir », on peut aussi ´etudier des sys- t`emes complexes artificiels, int´egrer les concepts issus de cette approche dans la conception de nouveau syst`emes. Ajoutons donc `a nos exemples un r´eseau pair `a pair, un r´eseau ad-hoc, des m´ecanismes de cryptographie partag´ees ou de robustesse aux attaques, des syst`emes multi-agents. L’un des exemples les mieux formalis´es est constitu´e par les automates cellulaires, dont nous donnons une d´efinition `a la partieIIpour en ´etudier quelques propri´et´es ensuite.

(4)

Premi` ere partie

Pr´ eliminaires : mesurer la complexit´ e

Dans la th´eorie des syst`emes complexes, une question centrale est de d´efinir formellement une notion de complexit´e. C’est mˆeme la premi`ere mesure que l’on souhaite effectuer lorsque l’on rencontre un nouveau syst`eme complexe :

« complexe oui, mais `a quel point ? ». Le premier article `a ce sujet semble ˆ

etre [Gell-Mann(1995)].

Cette question apparaˆıt tout aussi naturellement quand on s’int´eresse `a l’´evo- lution, et particuli`erement `a l’accroissement de la complexit´e des organismes au cours de l’´evolution. Elle est ´etudi´ee depuis Von Neumann (voir par exemple [McMullin(2000)]). Cet article explique que Von Neumann cherchait `a exhiber des machines capables de produire d’autres machines plus complexes qu’elles mˆemes. It´erativement, on obtient ainsi une ´evolution avec accroissement de la complexit´e. Un cas particulier est celui d’une machine qui s’auto-reproduit : elle produit une machine aussi complexe qu’elle mˆeme. Mais on ne trouve pas de notion pr´ecise de complexit´e.

D´efinir une complexit´e est bien sˆur une question difficile, et il n’y aura sans doute jamais de r´eponse unique, mais plusieurs notions selon l’angle sous lequel on ´etudie un syst`eme et selon les caract´eristiques qui int´eressent l’observateur.

De nombreux travaux ont en effet cherch´e `a formaliser ce point, et il existe des mesures partielles ou consid´erant un aspect particulier du syst`eme (par exemple, comment le d´efinir, on bien son degr´e d’«al´eatoirit´e», ou encore une adaptation de l’entropie). Puisque notre travail porte sur un point pr´ecis qui s’inscrit dans ce contexte, nous en proposons ici un tour d’horizon (une autre bibliographie et une classification diff´erente est propos´ee par [Manson(2001)]).

2 Le syst` eme et sa description

Lors de l’´etude d’un syst`eme complexe, on est confront´e `a la chaˆıne suivante.

On part donc d’un syst`eme et son observation fournit des donn´ees. On construit alors une th´eorie ou un mod`ele, que l’on cherche `a valider. Le mod`ele permet d’ex´ecuter des simulations, dont on compare les r´esultats `a ceux du syst`eme de d´epart. Soit sch´ematiquement :

syst`eme observation

−−−−−−−→donn´ees−→th´eorie ou mod`ele −−−−−−→simulation comportement Lorsque l’on cherche `a d´efinir une notion de complexit´e, il convient de sp´eci- fier `a quel niveau l’on se place. La complexit´e du mod`ele est souvent confondue avec celle du syst`eme. Elle n’en est qu’une premi`ere approximation. On peut rarement d´efinir la complexit´e du syst`eme lui-mˆeme, mais on peut ´etudier

– la complexit´e d’un syst`eme r´eel directement sur les donn´ees recueillies, – celle d’un syst`eme r´eel `a travers un mod`ele de ce syst`eme,

– celle d’un mod`ele `a partir de sa d´efinition formelle

– celle d’un mod`ele `a partir de son comportement lorsque l’on effectue des simulations.

(5)

Notons que certains mod`eles cherchent `a ˆetre le plus fid`ele possible `a un syst`eme r´eel donn´e, d’autres sont plutˆot un objet abstrait, cherchant `a ˆetre suffisamment simple et g´en´eral pour permettre des r´esultats th´eoriques. Dans ce dernier cas, c’est bien l’objet th´eorique en tant que syst`eme complexe dont on ´etudie la complexit´e. Citons comme exemple les automates cellulaires, les automates `a seuil, les chip firing games.

Ceci sugg`ere une ´ebauche de classification des mesures de complexit´e exis- tantes : comment cette mesure se place-t-elle par rapport au syst`eme et `a sa description ?

2.1 Complexit´ e du syst` eme

C’est souvent implicitement celle que l’on veut ´etudier. Lorsque l’on ´etudie un syst`eme r´eel, c’est la complexit´e des donn´ees issues des mesures effectu´ees sur le syst`eme. Lorsque l’on ´etudie un mod`ele abstrait, c’est la complexit´e des donn´ees g´en´er´ees par une simulation.

Une mesure classique est l’entropie des mesures effectu´ees, sous diverses va- riantes, comme propos´e par [Pincus(1991),Martin(1997),Shiner and Davison(1999)]

ou [Andreev(2005)] qui tente d’utiliser des id´ees de clustering : sa complexit´e est d’autant plus faible que toutes les entit´es sont similaires dans leur compor- tement.

Un probl`eme r´ecurrent dans cette approche visant `a mesurer directement la complexit´e du syst`eme est de distinguer les structures de la simple r´ealisation de l’al´eatoire, de d´etecter des corr´elations provenant d’un m´ecanisme inconnu.

[Crutchfield(1993)] propose une fa¸con int´eressante de l’aborder. Apr`es une re- marquable introduction aux concepts de la physique statistique, de la th´eorie de l’information et de la complexit´e de Kolmogorov, [Gell-Mann and Lloyd(1996)]

d´efinit la complexit´e effective en sens.

2.2 Complexit´ e de la description

La description peut ˆetre soit la d´efinition du syst`eme (en langue naturelle lorsqu’il s’agit d’un syst`eme artificiel, mais aussi en code d’une machine de Turing lorsqu’il s’agit de d´ecrire les donn´ees), soit sa formalisation (lorsqu’il s’agit d’un syst`eme r´eel sur lequel on a effectu´e des mesures).

Motivations On peut aussi ´etudier ce probl`eme dans le but de choisir parmi les diff´erents mod`eles propos´es pour un syst`eme. En suivant le principe d’Oc- cam, on pourra pr´ef´erer le mod`ele de complexit´e minimale pour expliquer un ph´enom`ene. Mais il y a souvent diff´erents niveaux de sophistication pour mod´e- liser un ph´enom`ene, on peut prendre en compte l’ad´equation du comportement du mod`ele avec les mesures effectu´ees sur le syst`eme, et classer les mod`eles en fonction de leur rapport«qualit´e-prix». La qualit´e est ici la proximit´e entre les donn´ees issues du mod`ele et les mesures effectu´ees sur le syst`eme ; le prix (l’ef- fort de compr´ehension `a payer) est sa complexit´e. On cherche donc les mod`eles ayant le meilleur rapport ad´equation sur complexit´e.

En effet, on souhaite souvent comprendre le syst`eme `a diff´erents niveaux de raffinement. Exemple typique, lorsqu’il s’agit de pr´esenter le syst`eme `a des personnes ext´erieures on ne peut pas l’expliquer dans tous ses d´etails. Lors d’une conf´erence, le temps disponible d´etermine quel niveau de complexit´e on peut

(6)

exposer. Dans un livre ou un cours, on commencera par donner une description grossi`ere avant de d´etailler des m´ecanismes plus pr´ecis. Il est donc n´ecessaire de disposer de mod`eles grossiers autant que de mod`eles pr´ecis, les premiers devant

´

evidemment avoir une complexit´e bien moindre.

2.3 De la description au syst` eme

Une d´efinition formelle fructueuse de la description est la complexit´e de Kolmogorov, la longueur du plus petit programme dont l’ex´ecution produit la description.

Malheureusement, le fait d’appliquer directement ce concept fondamental `a un syst`eme r´eel n’est pas tr`es satisfaisant : une description tr`es compacte mais demandant un long temps de calcul pour reconstituer le syst`eme sera intuiti- vement plus complexe qu’un syst`eme purement al´eatoire (donc simple) o`u la longueur de la description d´ecoule du caract`ere probabiliste.

Ceci nous m`ene naturellement `a la complexit´e algorithmique : le temps et l’espace n´ecessaire au calcul passant de la description au syst`eme. Ce qui pr´e- sente l’inconv´enient inverse : il existe alors des descriptions tr`es longues induisant un calcul tr`es simple.

[Bennett(1990)] propose pour rem´edier `a cela la«profondeur logique»(lo- gical depth), qui est le temps de calcul `a partir de la description la plus courte (celle r´ealisant la complexit´e de Kolmogorov).

Voil`a donc un aper¸cu des mesures de complexit´e propos´ees jusqu’`a aujour- d’hui. Nous n’avons trouv´e aucune mesure de complexit´e bas´ee sur des pertur- bations de la dynamique.

(7)

Deuxi` eme partie

Automates cellulaires coalescents

Nous avons expos´e dans la partie pr´ec´edente diff´erentes mesures de com- plexit´e. Une nouvelle approche pour d´efinir une telle notion est d’´etudier la robustesse du syst`eme `a des perturbation de la dynamique. Pr´ecis´ement, nous nous sommes int´eress´es `a des perturbations du synchronisme. Cette ´etude a montr´e un ph´enom`ene int´eressant, initialement remarqu´e par Nazim Fat`es, que nous ´etudions dans cette partie.

C’est un prolongement des chapitres 4, 5 et 6 de sa th`ese [Fates(2004)].

Apr`es quelques propositions imm´ediates, nous ´etudions exp´erimentalement un ph´enom`ene de transition de phase.

Cette partie utilise le mod`ele de syst`eme complexe constitu´e par les auto- mates cellulaires, que nous d´efinissons maintenant.

D´efinitions. Un automate cellulaire est un uplet (Q, d, V, δ) o`u – Qest l’ensemble des ´etats ;

– d∈N est la dimension ;

– V = {vi |i∈J1,|V|K} est un ensemble fini de vecteurs de Zd, appel´e voisinage ;

– δ:Q|V|→Qest la r`egle de transition.

Un ´el´ement deZd est une cellule, une configuration est obtenue en fixant l’´etat de chaque cellule, c’est donc une fonction c : Zd → Q. La r`egle d’´evolution associe `a la configurationc la configurationc0 d´efinie par

c0(z) :=δ c(z+v1), . . . , c(z+v|V|) C’est donc une ´evolution

– locale : l’´etat de chaque cellule ne d´epend que des ´etats pr´ec´edents des cellules voisines,

– parall`ele : toutes les cellules ´evoluent en mˆeme temps, – uniforme : toutes les cellules ont la mˆeme r`egle.

Ce syst`eme est donc un bon exemple de syst`eme complexe. Notons ´egalement que l’´evolution est synchrone, d´eterministe, discr`ete.

On peut g´en´eraliser ce mod`ele en consid´erant un graphe de Cayley au lieu de la grilleZd. Si l’on consid`ere le groupe fini (Z/nZ)d, on obtient des configurations finies, que l’on peut identifier avec les configurations p´eriodiques de la grille Zd, ou plus simplement `a des configurations d’une partie finie de la grille avec conditions au bord p´eriodiques. C’est ce mod`ele que nous retenons. La finitude est une caract´eristique essentielle de nombreux syst`emes r´eels et est ici mieux mod´elis´ee. De plus, ce mod`ele offre l’avantage de permettre les simulations tout en pr´esentant la mˆeme vari´et´e de comportements que le cas infini. Le nombre de cellules nest d´esormais un param`etre du syst`eme.

Nous avons donc choisi de perturber la dynamique du syst`eme en perturbant le synchronisme. Pr´ecis´ement, nous choisissons d’´etudier la g´en´eralisation du mod`ele qui consiste `a ne plus appliquer la r`egle δ de fa¸con synchrone, comme d´efini ci-dessous. `A cette occasion nous introduisons ´egalement de l’al´eatoire.

Mais l’ensemble d’´etats, l’espace et le temps resteront discrets.

Il y a deux fa¸cons de perturber le synchronisme, qui sont d´ecrites par exemple

(8)

dans [Sch¨onfish and de Roos(2000)]. L’une sera appel´ee dynamique partielle- ment asynchrone, l’autre, dynamiquetotalement asynchrone.

La dynamique partiellement asynchrone ou dynamique partielle. Elle consiste `a ne pas mettre `a jour toutes les cellules `a chaque ´etape. Pr´ecis´ement, on utilise une suite de variable al´eatoires de Bernouilli ind´ependantes identiquement distribu´ees, chaque cellule ayant un tirage `a chaque ´etape. Une cellule a alors une probabilit´eαde se mettre `a jour `a chaque ´etape. Le casα= 1 correspond

`

a la dynamique synchrone pr´ec´edente. La cas α = 1/2 correspond `a la r`egle probabiliste«avec une chance sur deux, faire la transition, sinon rester dans le mˆeme ´etat». Noter que la transition peut ´egalement indiquer de rester dans le mˆeme ´etat.

On peut bien sˆur imaginer des corr´elations entre les variables al´eatoires indi- quant si une cellule se met `a jour ou non, notamment des corr´elations locales qui induiraient des mises `a jours en bloc de cellules voisines. On peut aussi envisager de garder l’ind´ependance mais ne pas imposer que ces variable soient identique- ment distribu´ees : certaines cellules auraient une plus grande probabilit´e de se mettre `a jour que d’autres. Ceci mod´eliserait un ´ecoulement du temps diff´erent suivant les cellules, certaines cellules ´etant plus actives ou ´evoluant plus vite que d’autres. Ces g´en´eralisations ne seront pas ´etudi´ees ici.

La dynamique totalement asynchrone Alors que dans la dynamique pr´e- c´edente il y avait en moyenne n α cellules se mettant `a jour par ´etapes, cette dynamique impose qu’il y ait exactement une cellule qui se mette `a jour `a chaque

´

etape. Ce n’est donc plus une r`egle locale. La cellule qui se met `a jour est tir´ee au sort uniform´ement, mais on pourrait imaginer d’autres dynamiques o`u cer- taines cellules ont plus de chances de se mettre `a jour, ce qui correspondrait `a nouveau `a un ´ecoulement du temps diff´erent suivant les cellules.

Cette dynamique peut ˆetre consid´er´ee comme la limite en α → 0 de la dynamique pr´ec´edente. Soit en effet t le nombre d’´etapes de calcul que l’on souhaite effectuer dans la dynamique totalement asynchrone. Soit α nt1. Il faut 1/α´etapes pour que chaque cellule se soit mise `a jour (en esp´erance) une fois. On effectue donc t/α ´etapes partiellement asynchrones. Il y a alors eu n t/α points du diagramme espace-temps o`u un couple de cellules voisines a risqu´e de se mettre `a jour simultan´ement, ce qui se produit avec probabilit´eα2. L’esp´erance du nombre de points o`u deux cellules voisines se mettent `a jour simultan´ement est donc n t α1. On a ainsi simul´e la dynamique totalement asynchrone par la dynamique partielle (mais cela a coˆut´e un nombre d’´etapes mnt2).

Plus int´eressant, cette dynamique est ´equivalente (au sens de l’ordre des mise `a jour) au mod`ele suivant. Consid´erons un temps continu, et attribuons une horloge `a chaque cellule. Les horloges d´ecomptent le temps vers 0 toutes `a la mˆeme vitesse, et une cellule se met `a jour `a l’instant o`u son horloge atteint 0. `A chacune de ses mises `a jour, une cellule tire un temps selon une loi exponentielle (de param`etre arbitraire mais commun `a toutes les cellules) pour«remonter» son horloge, et choisit ainsi la date de sa prochaine mise `a jour. Les mises `a jour des cellules sont donc effectu´ees presque sˆurement `a des dates distinctes.

Puisque les variables al´eatoires utilis´ees par les cellules pour r´egler leurs horloges sont ind´ependantes identiquement distribu´ees, et grˆace `a une propri´et´e de la loi

(9)

exponentielle, on peut consid´erer que chaque fois qu’une horloge arrive `a 0, toutes les horloges sont r´egl´ees `a nouveau selon une loi exponentielle. R´egler toutes les horloges revient `a choisir la prochaine cellule qui sera mise `a jour.

Les dates de mise `a jour suivent alors un processus de Poisson. La distribution de probabilit´e des s´equences de mises `a jour est donc identique entre les deux mod`eles.

La mesure du temps utilis´ee dans ce rapport est le nombre de mises `a jour et est donc discr`ete. Cette nouvelle dynamique utilise un temps continu, qui est li´e au mod`ele discret par la loi des grands nombres.

On peut enfin consid´erer cette dynamique comme une dynamique s´equen- tielle, mais le propos est ici de la consid´erer comme une perturbation de la dynamique synchrone, c’est pourquoi nous ´eviterons le nom « dynamique s´e- quentielle».

Nous proposons maintenant la notion de coalescence pour formaliser le com- portement identifi´e par Nazim Fat`es. L’id´ee est, dans une dynamique asyn- chrone, de choisir `a l’avance les points (cellule, date) o`u il y aura une mise `a jour, et d’appliquer cette mˆeme s´equence `a deux configurations distinctes au d´epart.

Ceci revient `a utiliser la mˆeme source d’al´eatoire pour deux simulations, id´ee d´ej`a explor´ee par [Kaulakys et al.(1999)Kaulakys, Ivanauskas, and Mekauskas]

sur un autre mod`ele, o`u les auteurs observent une synchronisation des deux instances du syst`eme.

D´efinition. Un automate est ditcoalescent pour une dynamique asynchrone si pour tout couple de configurations initiales, en appliquant la mˆeme s´equence al´eatoire de mise `a jour aux deux copies de l’automate, on obtient deux confi- gurations identiques en un temps d’esp´erance polynomiale enn.

Tous les automates tendant rapidement vers une configuration triviale fixe sont bien sˆur coalescents. Mais il existe des automates coalescents ne tendant pas vers un point fixe. Nous nous int´eressons d´esormais seulement `a ces derniers.

Nous choisissons d’utiliser le terme«coalescent» et les n´eologismes d´eriv´es (parfois d´elicats) plutˆot que le terme de « synchronisant » pour ´eviter toute ambigu¨ıt´e avec la notion de synchronisme qui est ´egalement utilis´ee.

Dans la suite, nous prenons comme exemple les automates cellulaires ´el´e- mentaires, c’est-`a-dire `a une dimension (d= 1), 2 ´etats (Q ={0,1}), et pour lesquels le voisinage d’une cellule est constitu´e des ses voisins droit et gauche ainsi qu’elle-mˆeme (V = {−1,0,1}). Le voisinage comprenant 3 cellules, il y a donc 23= 8 configurations possibles de ce voisinage, sur lesquelles il faut d´efinir la r`egle de transition δ. Il y a 8 voisinages pour lesquels il faut choisir si le nou- vel ´etat est 0 ou 1, et il existe donc 28= 256 automates cellulaires ´el´ementaires diff´erents.

Les deux ´etats de Q jouent un rˆole sym´etrique. Lorsque l’on inverse les deux ´etats d’une r`egle (on parle de conjugaison), on obtient une r`egle dont le comportement est ´equivalent (on passe par exemple de la r`egle«aller dans l’´etat 0 si et seulement si un voisin est dans l’´etat 1» `a la r`egle« aller dans l’´etat 1 si et seulement si un voisin est dans l’´etat 0» ). Lorsque l’on obtient la mˆeme r`egle (c’est le cas par exemple pour la r`egle « recopier l’´etat de son voisin de gauche »), on dit que cette r`egle estinvariante par conjugaison.

(10)

De mˆeme, la bijectionz7→ −z sur l’ensemble des cellulesZ/nZapparie une r`egle `a une autre obtenue simplement par sym´etrie du voisinage. Les comporte- ments des deux r`egles sont ´equivalents. Lorsque l’on ne garde qu’un repr´esentant par classe de sym´etrie (celui de num´ero le plus faible dans la notation ci-dessous), il reste 88 r`egles `a ´etudier.

Notation. Nous utilisons la notation introduite par S. Wolfram : une fonction de transitionδest repr´esent´ee par le mot compos´e des images des|S||H|entr´ees possibles deδ. On ´enum`ere ces entr´ees dans l’ordre lexicographique desvj ∈H.

Par exemple,170= 21+ 23+ 25+ 27repr´esente la fonction de transition Voisinage 1 1 1 1 1 0 1 0 1 1 0 0 0 1 1 0 1 0 0 0 1 0 0 0

Nouvel ´etat 1 0 1 0 1 0 1 0

Valeur binaire 27 26 25 24 23 22 21 20 La r`egle170est donc«recopier l’´etat du voisin de droite». La r`egle0est«aller dans l’´etat 0 quel que soit le voisinage». Noter la police distinctive utilis´ee pour noter les r`egles :0123456789.

Notation. La notation pr´ec´edente est tr`es r´epandue mais le lien entre le com- portement d’une r`egle et son num´ero est difficile. Voici une notation propos´ee par [Fates(2004)] qui permet une lecture plus facile du comportement local de la r`egle. On ´ecrit de mˆeme les voisinages possibles sur une ligne, indic´es par les lettresA`aF(au lieu des chiffres) pour ´eviter la confusion avec la num´erotation de Wolfram. On retient alors les lettres des voisinages pour lesquels l’automate change d’´etat. La r`egle« changer d’´etat»contient donc toutes les lettres, c’est ABCDEFGH. La r`egle «identit´e»ne contient aucune lettre et est not´ee ∅. La r`egle « majorit´e » qui indique « passer dans l’´etat le plus fr´equent parmi le voisinage»est

Voisinage 0 0 0 0 0 1 1 0 0 1 0 1 0 1 0 0 1 1 1 1 0 1 1 1

Nouvel ´etat 0 0 0 1 0 1 1 1

Lettre associ´ee A B C D E F G H

et s’´ecritDE.

3 Coalescence : premi` eres propri´ et´ es

Pour la dynamique totalement asynchrone, on montre facilement pour un seizi`eme des automates qu’ils ne sont pas coalescents. En effet, puisqu’`a chaque

´

etape il n’y a qu’une mise `a jour, il y a une exactement une cellule de d´esaccord

`

a l’´etape juste avant la coalescence. La r`egle doit permettre la coalescence en ce point, c’est `a dire que cette cellule change d’´etat dans exactement l’un des deux automates. Il faut donc que pour au moins l’un des quatre couples (A,E), (B,F), (C,G) et (D,H), la r`egle fasse apparaˆıtre exactement l’une des deux lettres. Ce n’est pas le cas pour 16 des 256 r`egles, c’est-`a-dire (`a sym´etrie pr`es) pour les r`egles51,54,57,60,105,108,150,156,204.

3.1 Une preuve formelle de coalescence

Proposition 1. Les r`egles6et7sont coalescentes pour la dynamique totalement asynchrone pour nimpair.

(11)

D´emonstration. Appelonsnombre de zones le nombre de motifs 01 dans une configuration c. Puisque la configuration est cyclique, c’est aussi le nombre de motifs 10 ou le nombre de suites maximales de cellules voisines dans l’´etat 1 (respectivement dans l’´etat 0). Ces suites sont appel´ees zones.

La preuve se fait en plusieurs ´etapes :

(a) On montre d’abord que le nombre de zones ne peut qu’augmenter.

(b) On montre ensuite qu’il augmente effectivement jusqu’`a ce qu’il n’y ait plus de motif 000 ou 111. En coupant sur les motifs 00 et 11, on peut alors consid´erer la configuration comme une concat´enation de mots (d’au moins 2 lettres) o`u chaque mot alterne rigoureusement 0 et 1, c’est-`a-dire les mots du langage d´enot´e par l’expression r´eguli`ere«(01)+0?|(10)+1?».

(c) On observe alors que les fronti`eres entre ces mots suivent une marche al´eatoire biais´ee (i.e. `a sens unique) et peuvent ´eventuellement se rencontrer, auquel cas un mot disparaˆıt avec probabilit´e non nulle. Presque sˆurement, l’au- tomate tend donc vers une configuration o`u il n’y a qu’un mot.

(d) Comme la taille de l’anneau est impaire, les deux lettres aux extr´emit´es du mot sont identiques, c’est-`a-dire qu’il existe un unique motif 00 ou 11 dans la configuration. Ces motifs sur chacun des deux automates superpos´es suivent la mˆeme marche al´eatoire biais´ee et finissent par se superposer, les deux automates ont alors coalesc´e.

D´etaillons chacune de ces ´etapes pour la r`egle6.

(a) Voici la traduction de la r`egle de transition6:

Voisinage 0 0 0 0 0 1 1 0 0 1 0 1 0 1 0 0 1 1 1 1 0 1 1 1

Nouvel ´etat 0 1 0 0 1 0 0 0

Changement d’´etat oui oui oui oui

Lettre associ´ee A B C D E F G H

C’est donc la r`egleBFGH. Puisque qu’une seule cellule se met `a jour `a chaque

´

etape, on constate sur ce tableau que deux zones ne peuvent fusionner. (Le nombre de zones ne peut diminuer que si une cellule ayant un voisinage de type DouFse met `a jour en changeant d’´etat, or la r`egle ne contient niDniF). Le nombre de zones ne peut donc qu’augmenter.

(b) Chaque fois qu’il y a un motif 0001, il peut se produire la suite de transitions suivante (le temps s’´ecoule de haut en bas) :

· · · 0 0 0 1 · · · B

· · · 0 0 1 1 · · · B

· · · 0 1 1 1 · · · H

· · · 0 1 0 1 · · ·

Cette suite se produit sans autre mise `a jour interm´ediaire des quatre cellules avec probabilit´e 1/43 et en un temps d’esp´erance 3n. Le nombre de zones a alors augment´e.

(12)

De mˆeme, chaque fois qu’il y a un motif 111, avec probabilit´e 1/3 et en un temps d’esp´erancen, la cellule centrale se met `a jour pour donner le motif 101 et le nombre de zones a augment´e.

Ainsi, tant qu’il y a des motifs 000 ou 111, une nouvelle zone apparaˆıt en tempsO(n).

(c) On consid`ere alors la configuration comme une concat´enation de mots de {0,1}. On choisi comme limite entre les mots les motifs 00 et 11. On ob- tient une concat´enation de mots (d’au moins 2 lettres) o`u chaque mot alterne rigoureusement 0 et 1. Comme la r`egle ne contient pasC, la fronti`ere droite d’un mot ne peut pas se d´eplacer vers la gauche. En revanche, la r`egle contientBet G donc ces fronti`eres se d´eplacent vers la droite suivant une marche al´eatoire (biais´ee). Un pas de cette marche prend un tempsO(n) en moyenne.

La longueur d’un mot suit donc une marche al´eatoire (non biais´ee), et lorsque cette longueur est 1 (au bout d’un temps d’esp´erance O(n3)), le mot a laiss´e place `a un motif 000 ou 111. Ce motif a une probabilit´e Ω(1) de disparaˆıtre en faisant augmenter le nombre de zones, comme montr´e au point (b). Le nombre de zones augmente donc jusqu’`a ce qu’il n’y ait plus qu’un motif 00 ou 11. (Noter qu’il peut apparaˆıtre d’autres motifs 000 ou 111 entre-temps.)

Ce motif suit toujours une marche al´eatoire biais´ee vers la droite.

(d) Consid´erons `a nouveau les deux configurations, qui ´evoluent selon la mˆeme suite de mise `a jours. Ce motif introduit un d´ecalage de phase dans la suite (01)+, il fait donc passer d’une r´egion o`u les deux configurations ont coalesc´e

`

a une r´egion o`u elles sont en d´esaccord. Le motif de l’autre configuration fait passer de cette r´egion o`u les configurations sont en d´esaccord `a la premi`ere r´egion d’accord (coalescence). Le couple de configurations est donc constitu´e d’une r´egion d’accord suivie d’une r´egion de d´esaccord. C’est la longueur de cette r´egion que nous ´etudions. Cette longueur suit une marche al´eatoire, au gr´e des d´eplacements des deux motifs 00 ou 11.

Lorsqu’elle atteintn, on a le couple de configurations suivant :

· · · 1 0 1 0 0 1 0 1 · · ·

· · · 0 1 0 1 1 0 1 0 · · ·

Une mise `a jour sur une cellule autre que les quatri`eme et cinqui`eme ne change rien, une mise `a jour sur la cinqui`eme cellule de fait que d´ecaler et sym´etriser le motif. Une mise `a jour sur la quatri`eme cellule envoie dans le couple de configurations suivant :

· · · 1 0 1 0 0 1 0 1 · · ·

· · · 0 1 0 0 1 0 1 0 · · ·

o`u la longueur de d´esaccord a diminu´e. La longueur n n’est donc pas un ´etat absorbant de la chaˆıne de Markov associ´ee `a la marche al´eatoire.

En revanche, lorsque la longueur de la r´egion de d´esaccord atteint 1, on est soit dans le couple de configurations suivant :

· · · 0 1 0 1 0 0 1 0 · · ·

· · · 0 1 0 1 1 0 1 0 · · ·

(13)

o`u une mise `a jour de la cellule de d´esaccord (la cinqui`eme) fait coalescer les deux automates, soit dans le couple de configurations suivant :

· · · 0 1 0 1 1 0 1 0 · · ·

· · · 0 1 0 0 1 0 1 0 · · ·

o`u une mise `a jour de la cinqui`eme puis de la quatri`eme cellule nous ram`ene au cas pr´ec´edent. Il y a donc une probabilit´e non nulle de coalescer lorsque la longueur atteint 1.

Ceci prouve donc que la r`egle6 coalesce presque sˆurement. Il nous reste `a estimer le temps de coalescence.

L’´etape (b) prend un temps O(n2) car le nombre de zones est born´e par n/2. L’´etape (c) prend un tempsO(n3). L’´etape (d) prend de mˆeme un temps O(n3).1 L’esp´erance du temps de coalescence est donc bien polynomial.

La preuve est analogue pour la r`egle7, la seule diff´erence est qu’elle se traduit parABFGH: elle contient la lettre Aen plus, ce qui acc´el`ere la disparition des motifs 000 et donc la croissance du nombre de zones.

Cette preuve de coalescence n’est possible que grˆace `a un contrˆole pr´ecis de ce qui se passe dans les r´egions o`u les automates sont en accord et celles o`u les automates sont en d´esaccord (ici c’est un fond fixe (01) sur lequel marchent quelques fronti`eres). La plupart des automates ne se prˆetent pas `a une descrip- tion aussi simple de leur comportement, et semblent plus difficiles `a appr´ehender th´eoriquement.

Remarque. Si l’anneau est de taille paire, l’automate converge de mˆeme vers une concat´enation de mots de (01)+0?| (10)+1?. Les fronti`eres fusionnent de mˆeme, mais cette fois il y a un nombre pair de fronti`eres, elles disparaissent donc presque sˆurement. L’automate converge donc vers la configuration (01) (o`u l’on voit bien apparaˆıtre la condition de parit´e sur la taille de l’anneau).

A priori, selon la configuration initiale, il est possible que ce soit les cellules paires qui contiennent 1 pour un automate et les cellules impaires pour l’autre.

Dans ce cas les deux automates superpos´es sont en d´esaccord parfait. L’autre cas possible est bien sˆur que les cellules contenant 1 aient la mˆeme parit´e dans les deux automates, ils sont alors en accord. Les deux cas sont rencontr´es exp´e- rimentalement, apparemment avec une probabilit´e 1/2 chacun. Ce r´esultat n’est pour l’instant qu’une conjecture.

La proposition 1 entraˆıne un th´eor`eme qui d´epassent le cas particulier des r`egles6et 7.

Th´eor`eme 2. Il existe des automates coalescents `a nombre d’´etats arbitraire, et donc une infinit´e d’automates coalescents.

D´emonstration. Commen¸cons par montrer qu’il existe des automates coales- cents `a nombre d’´etats arbitrairement grand. D´efinissons un produitA2d’un au- tomate cellulaire ´el´ementaireA= (Q, d, V, δ,n) avec lui mˆeme. C’est l’automate (Q2, d, V, δ2, n) o`uδ2est d´efinie parδ2 (a,b),(c,d),(e,f)

:= δ(a,c,e), δ(b,d,f) .

1Pour des d´etails sur les m´ethodes probabilistes utilis´ees, on se reportera au chapitre 5 de [Fates(2004)].

(14)

Si|Q|= 2, l’automate obtenu est intuitivement l’automate `a 4 ´etats dont une configuration est obtenue par superposition de deux configurations de l’automate

`

a deux ´etats.

Par d´efinition, siAest un automate coalescent,A2 tend en un temps poly- nomial vers une configuration dont les ´etats sont dans{(q,q) | q∈Q}. `A partir du moment o`u l’automate a atteint une telle configuration,A2 simule A. SiA est coalescent,A2l’est donc aussi (en un temps au maximum double du temps de coalescence deA). Il en est donc de mˆeme de (A2)2, de (A2)22

, etc.

Puisqu’il existe un automate coalescent, nous venons de construire une suite infinie d’automates coalescents `a nombre d’´etats de plus en plus grand.

Il nous reste `a construire un automate `a nombre d’´etat fix´e `a partir d’un automate ayant moins d’´etats. Or pour simuler un automate `a q ´etats par un automate `a r > q ´etats, il suffit de d´efinir δ pour que les ´etats surnum´eraires passent dans l’un des q´etats voulus quel que soit leur voisinage.

Remarque. Bien sˆur, `a nombre d’´etats fix´es, la densit´e des automates ainsi construits parmi l’ensemble des automates possibles est faible.

Rappelons que nous nous int´eressons toujours uniquement aux automates non triviaux. En initiant la construction pr´ec´edente avec la r`egle 6 ou 7, on obtient une infinit´e d’automates coalescents non triviaux.

3.2 Deux preuves de coalescence avec probabilit´ e 1/2

Proposition 3. Les r`egles15 et170, pour les dynamiques partiellement asyn- chrone et totalement asynchrone, coalescent avec probabilit´e1/2, et tendent vers deux configurations en d´esaccord total dans l’autre cas.

D´emonstration. Commen¸cons par le cas de170, qui est simplement «recopier le voisin de droite » (shift). On constate qu’une cellule mise `a jour est dans le mˆeme ´etat entre les deux configurations si et seulement si sa voisine de droite

´

etait en accord `a l’´etape pr´ec´edente. On est donc ramen´e `a un automate `a deux

´

etats : accord ou d´esaccord entre les deux configurations.

Cet automate est toujours170. On utilise alors un r´esultat de [Fates(2004)]

affirmant que la r`egle170en dynamique partiellement asynchrone tend en temps polynomial soit vers la configuration nulle 0 (correspondant `a la coalescence), soit vers la configuration 1 (ce qui correspond au d´esaccord total).

Par sym´etrie, chacun des deux cas a une probabilit´e 1/2.

Regardons maintenant le cas de15, ou plutˆot de son sym´etrique,85. Il suffit de montrer qu’une cellule est en accord si et seulement si, si on avait appliqu´e la r`egle170au lieu de la r`egle de85, cette cellule aurait aussi ´et´e en accord. En d’autre termes, nous allons montrer que les cellules en accord sont les mˆemes sur une ´evolution de la r`egle 170 et une ´evolution de la r`egle 85 partant des mˆemes configurations initiales. On aura alors termin´e.

Or85 est la r`egle «passer dans l’´etat oppos´e `a celui du voisin de droite ».

Une cellule qui se met `a jour sera donc en accord entre les deux configurations si et seulement si la cellule de droite l’´etait `a l’´etape pr´ec´edente. Ce qui est la

mˆeme condition que pour170.

(15)

Remarque. Les automates pr´esentant cette propri´et´e de se ramener `a un auto- mate `a deux ´etats sont exactement les r`egles de la forme

δ(q1, q2, q3) =ε+X

i∈I

qi mod 2

o`uI⊆ {1,2,3}etε∈ {0,1}. On appelle ces r`egles les r`egles additives (elles sont introduites dans [Martin et al.(1984)Martin, Odlyzko, and Wolfram] et ´etudi´ees par [Chaudhuri et al.(1997)Chaudhuri, Chowdhury, Nandi, and Chattopadhyay]

en d´etail).

Ceci appelle une courte d´emonstration. Si δ est une fonction constante, il suffit de prendre I = ∅. Sinon, il existe un voisinage (q1, q2, q3) pour le- quel δ change si l’un des ´etats change. Par sym´etrie, on peut supposer que δ(q1, q2, q3)6= δ(1−q1, q2, q3). Puisque l’on peut se ramener `a un automate `a deux ´etats accord/d´esaccord, ceci doit ˆetre vrai quels que soient q2 et q3. En effet, s’il existaitq20 etq30 tels queδ(q1, q20, q30) =δ(1−q1, q02, q03), on aurait alors deux voisinages identiques du point de vue accord/d´esaccord, mais ayant un r´esultat diff´erent (l’un en accord, l’autre en d´esaccord).

La r`egle est donc de la formeε+q10(q2, q3) mod 2. Ceci est vrai pour toute cellule du voisinage dont le r´esultat d´epend, donc la r`egle est additive.

R´eciproquement, une r`egle additive v´erifie facilement cette propri´et´e de se ramener `a un automate `a deux ´etats.cqfd.

Les automates pr´esentant cette propri´et´e de se ramener `a une automate `a deux ´etats sont donc, `a sym´etrie pr`es, les r`egles0 pour|I| = 0,204(identit´e), 51(not),170(shift) et15(not shift) pour|I|= 1,150(xor) et105(not xor) pour

|I|= 3, et enfin60et90pour|I|= 2. Parmi celles-ci, nous venons de d´ecrire15 et 170, 0est trivialement coalescente,204 et 51ne peuvent pas l’ˆetre. Il reste 150, pour laquelle il semble que l’automate `a 2 ´etats ne converge qu’en temps exponentiel, comme le conjecture [Regnault(2005)], et les r`egles o`u|I|= 2 ainsi que105qui ne sont pas ´etudi´ees par la r´ef´erence pr´ec´edente et ne coalescent pas exp´erimentalement.

L’id´ee de se ramener `a un automate `a deux ´etats ne semble donc pas utilisable pour traiter d’autres r`egles.

Proposition 4. Si une r`egle invariante par conjugaison coalesce ou tend vers une configuration de d´esaccord total en un temps polynomial quelle que soit la configuration initiale, alors la probabilit´e de chacun des deux cas est1/2.

D´emonstration. On consid`ere l’automate produit deApar lui-mˆeme d´efini dans la d´emonstration du corollaire 2. Puisque A est invariant par conjugaison,A2 est identique `a l’automate Bobtenu `a partir deA2 en ´echangeant deux `a deux les ´etats (p, q) et (1−p, q) (et en gardantδ). OrB est dans une configuration o`u tous les ´etats sont de la forme (q,q),q∈Qsi et seulement siA2est dans une configuration o`u tous les ´etats sont de la forme (q,1−q),q∈Q, si et seulement si A est dans un couple de configurations de d´esaccord total. De mˆeme, A a coalesc´e si et seulement si A2 est dans une configuration o`u tous les ´etats sont de la forme (q,q),q∈Q. Par sym´etrie, la probabilit´e de chacun des cas est donc

1/2.

Exp´erimentalement, c’est le cas des r`egles 15, 23, 43, 170et 178mais pas des r`egles (pourtant invariantes par conjugaison)51, 77, 105,142, 150, 204et 232, qui ne coalescent jamais.

(16)

4 Trois pistes pour une preuve g´ en´ erale

Nous pr´esentons ici trois formulations du probl`eme qui sont susceptibles de conduire `a une preuve formelle g´en´erique de la coalescence de classes d’au- tomates. Une telle preuve n’a pas ´et´e obtenue pour l’instant, mais ces pistes pourront ˆetre poursuivies lors de recherches futures.

4.1 Automates finis d´ eterministes

La th´eorie des automates et langages formels nous propose le concept fon- damental d’automate fini d´eterministe.

D´efinitions. Un automate fini d´eterministe est un uplet (Q, A, δ) o`u – Qest un ensemble fini appel´e ensemble d’´etats ;

– Aest un ensemble fini appel´e alphabet ; – δ:Q×A→Qest la fonction de transition.

Un automate a pour entr´ee un mot sur l’alphabetA. On noteq−→a q0 lorsque q0 = δ(q,a), et l’on nomme cela une transition de l’automate. La marche de l’automate sur le mot a1. . . an `a partir d’un ´etat q1 est la suite de transitions q1

a1

−→q2 a2

−→ · · ·−−−→an−1 qn−1 an

−−→qn.

Formellement, on prolongeδ:Q×A→Qenδ:Q×A→Qen posant :

∀q∈Q

(q,ε) =q

∀a∈A ∀u∈A δ(q,au) =δ(δ(q, a), u) On confond alorsδetδ, not´eesδ.

(On ajoute le plus souvent `a la sp´ecification de l’automate un ´etat initial et un ensemble d’´etats finaux, pour ´etudier des propri´et´es de reconnaissance de mots non bi-infinis.)

La notion qui nous int´eresse ici est celle d’automate synchronisant, expos´ee par exemple dans [Hopcroft and Ullman(1979)].

D´efinition. SoitAun automate (Q, A, δ). Un motwest dit synchronisant pour A si et seulement si ∃p∈Q ∀q ∈ Q δ(q,w) = p. L’automate A est alors dit synchronisant.

Nous pouvons formuler notre probl`eme dans ce mod`ele. Soit en effet (Q, d, V, δ) un automate cellulaire. Dans la dynamique totalement asynchrone, on lui associe l’automate fini d´eterministe suivant.

– L’ensemble des ´etats estQnd : c’est l’ensemble des configurations de l’au- tomate cellulaire.

– L’alphabet estJ1, nK

d : c’est l’ensemble des cellules.

– La r`egle de transition associe `a l’´etatq et la lettrec la configuration ob- tenue en appliquantδ`a la cellulecde la configurationq(dans l’automate cellulaire). On obtient une nouvelle configuration, qui est un ´etat de l’au- tomate fini.

Pour traiter le cas de la dynamique partiellement asynchrone, il suffit de modifier l’alphabet. Puisque plusieurs cellules peuvent se mettre `a jour en mˆeme temps, on prend pour alphabetP(J1, nK

d) : l’ensemble des parties de l’ensemble des cellules. Lire une lettrec dans l’automate fini correspond donc `a faire une

(17)

´

etape de calcul dans l’automate cellulaire, qui est la mise `a jour de l’ensemble des cellules d´esign´ees parc.

Le parall`ele avec notre probl`eme est alors le suivant :

Lemme 5. Consid´erons une ´evolution finie d’un automate cellulaire. L’auto- mate cellulaire a coalesc´e quel que soit le couple de configurations initiales si et seulement si la s´equence de mise `a jour effectu´ees, vue comme une suite de lettres, est un mot synchronisant pour l’automate fini associ´e.

D´emonstration. Si le mot est synchronisant et menant `a un ´etat q, quelle que soit la configuration initiale de l’automate cellulaire, il est `a la fin dans la confi- gurationqet a donc coalesc´e.

R´eciproquement, consid´erons une configuration initiale arbitraire et notons q la configuration obtenue apr`es la s´equence de mises `a jour. Puisque quel que soit le couple consid´er´e initialement les deux copies sont dans la configurationq

`

a la fin de l’´evolution, le mot est synchronisant.

On est donc ramen´e au probl`eme suivant : on consid`ere un mot infini form´e de lettres tir´ees au sort ind´ependemment selon la loi uniforme, et l’on cherche la longueur moyenne du plus court pr´efixe qui soit un mot synchronisant.

L’automate fini construit est ´enorme mais tr`es structur´e. Malheureusement, sa minimisation conduit `a l’automate trivial car il accepte le langage entier. La reconnaissance de langages est justement la pr´eoccupation principale des travaux sur les automates finis. Enfin, il semble qu’il n’y ait pas de r´esultat adaptable `a notre probl`eme, un r´esultat r´ecent [Trahtman(2004)] prouve qu’il existe un mot synchronisant de longueur au plus (m−1)2 pour une large classe d’automates (dans le cas g´en´eral c’est la conjecture de ˇCzerny), o`u mest le nombre d’´etats de l’automate fini. Mais ici mn’est pas polynomial enn. Le fait de consid´erer la longueur moyenne (et donc de s’int´eresser au cas typique et non au pire cas) simplifie peut-ˆetre la question.

4.2 Couplage et chaˆınes de Markov

Une approche plus prometteuse consiste `a consid´erer l’automate cellulaire asynchrone comme une chaˆıne de Markov. Les ´etats de la chaˆıne de Markov sont les configurations de l’automate, la probabilit´e d’aller d’un ´etat `a un autre est simplement, en reprenant l’automate fini de la section pr´ec´edente, le nombre de lettres distinctes qui font passer du premier au second ´etat, divis´e par le cardinal de l’alphabet. Dit autrement, cette probabilit´e est le nombre de fa¸cons de passer de la premi`ere `a la seconde configuration en mettant `a jour certaines cellules.

Le couplage de deux chaˆınes de Markov est exactement ce qui nous pr´e- occupe : cela consiste `a consid´erer deux copies de la chaˆıne avec conditions initiales distinctes, `a les faire ´evoluer simultan´ement sous la mˆeme r´ealisation de l’al´eatoire, et `a mesurer le temps au bout duquel elles sont dans le mˆeme

´

etat. Des r´ef´erences classique `a ce sujet sont [Lindvall(1992), Thorisson(2000), H¨aggstr¨om(2002)].

4.3 Automates cellulaires probabilistes

On peut enfin consid´erer notre mod`ele d’automate cellulaire asynchrone comme un cas particulier d’automates cellulaires probabiliste. Dans ce mod`ele,

(18)

la r`egle de transition δ n’est plus d´eterministe mais probabiliste. Il suffit donc de modifierδde la r`egle initiale pour lui ajouter une probabilit´e 1−αde rester dans le mˆeme ´etat, et l’on obtient la dynamique partiellement asynchrone.

Ce point sera ´etudi´e lors d’un stage d’un mois avec des sp´ecialistes des au- tomates cellulaires probabilistes, en octobre, `a Berlin.

5 Transitions de phase

Parall`element `a l’´etude th´eorique, nous avons men´e une ´etude exp´erimen- tale des automates coalescents. La premi`ere exp´erimentation visait `a d´eterminer quels sont les automates pr´esentant ce comportement. Il est apparu une grande richesse de comportements, dont une transition de phase. C’est cette derni`ere que nous avons alors ´etudi´ee en d´etail. Nous pr´esentons une exp´erimentation et montrons que les param`etres sont ceux de la classe d’universalit´e de la percola- tion dirig´ee.

5.1 D´ etermination des automates coalescents

5.1.1 Protocole

Nous appelons simulation l’ex´ecution d’un automate quand tous les para- m`etres sont fix´es : configuration initiale, nombre d’´etapes, taux de synchronisme, etc. La simulation est stopp´ee d`es que l’automate a coalesc´e, car les deux confi- gurations sont alors d´efinitivement identiques (le test est fait sur les ´etapes dont le rang est une puissances de 2).2 Voici le choix des param`etres des diff´erentes simulations effectu´ees.

Pour choisir la taille de l’anneau sur lequel effectuer les simulations, il n’y a de limite sup´erieur que la capacit´e de calcul. Concernant la limite inf´erieure, cer- tains auteurs comme [Wuensche(1999)] laissent penser que de petites tailles (n= 30) suffisent `a classifier, d’autres tels que [Broadbent and Hammersley(1957)]

assurent le contraire. Par prudence, nous prenons un grand anneau. Un pro- bl`eme similaire ´etudi´e dans la th`ese de Nazim Fat`es (comme annonc´e au d´ebut de cette partie [Fates(2004)]) montre une stabilisation du comportement `a partir den= 200. Nous choisissons un anneau de taillen= 500 cellules.

Le but ´etant simplement d’´etablir une classification rapide des automates pour d´eterminer ceux sur lesquels poursuivre l’´etude, il n’est pas n´ecessaire d’´echantillonner finementα. Nous prenons l’ensemble de valeurs 0.1, 0.5 et 0.9.

On ne rep`ere donc pas d’´eventuelles r`egles qui seraient coalescentes pour un ensemble de valeurs deαn’intersectant pas {0.1,0.5,0.9}.

On pourrait fixer l’esp´erance du nombre maximal de mises `a jour, et donc laisser ´evoluer le syst`eme plus longtemps pourαfaible (puisqu’il y a alors moins de mises `a jour par ´etape). Cependant, le travail de [Regnault(2005)] a montr´e analytiquement, dans un probl`eme plus simple, que certains automates en dy- namique partiellement asynchrone ont un temps de convergence proportionnel

`

a α(1−α)1 . Ainsi,α´elev´e n’entraˆıne pas n´ecessairement convergence rapide. C’est

´

egalement la raison pour laquelle 0.5 fait partie des valeurs choisies pourα. Le

2Pour que les deux copies arrivent sur des configurations de d´esaccord total (le contraire de la coalescence) en temps polynomial, il faut qu’une r´egion en opposition soit stable. On pourrait donc ´egalement stopper la simulation ´egalement lorsque les deux configurations sont en totale opposition.

(19)

nombre d’´etapes de calcul est fix´e `a 220= 1 048 576, ce qui est de l’ordre den2 (multipli´e par une petite constante).

Pour chaqueαet chaque r`egle, la simulation est r´ep´et´ee pour 10 configura- tions initiales al´eatoires (les mˆemes pour toutes les r`egles et tous lesα) et la r`egle est retenue d`es que l’une de ces simulations a ´et´e arrˆet´ee pr´ematur´ement (pour cause d’accord total). Ceci permet de v´erifier la coh´erence des 10 exp´eriences.

Cette ´etape permet, en plus de d´eterminer les automates `a ´etudier, d’esti- mer le temps de coalescence, ce qui permettra de fixer le param`etre Ttr `a la section5.4.1et a un int´erˆet intrins`eque pour distinguer plus finement les com- portements.

5.1.2 R´esultats

On obtient une grande richesse de comportements quant `a la coalescence, pour laquelle nous proposons les cat´egories empiriques suivantes.

– Les automates qui ne coalescent jamais (deux exemples triviaux sont les r`eglesidentit´e(∅) etnot(ABCDEFGH) car le nombre de cellules d’accord est constant) ou qui coalescent peut-ˆetre en temps exponentiel. Cette ca- t´egorie contient les r`egles 4, 5, 12, 13, 25, 28, 29, 33, 36, 37, 41, 44, 45, 51,54,60,72,73,76,77,78,90,94,104 105,108,122,132,140,142,150, 156,164,172,200,204,232.

– Les automates qui coalescent rapidement, sans doute en un temps poly- nomial. Un cas simple de ce comportement consiste en les automates qui converge vers un point fixe unique et trivial quelle que soit la condition ini- tiale. On peut alors consid´erer les deux configuration ind´ependemment, et d`es que les deux ont atteint le point fixe, elles sont trivialement identiques.

Sont dans cette cat´egorie les r`egles0, 2, 8,10, 24,32, 34, 38,40, 42, 56, 74,128,130,136, 138,152,160,162,168.

– Les automates qui coalescent rapidement, mais pas vers un point fixe.

On ne peut plus consid´erer les deux configurations ind´ependemment, mais elles sont rapidement identiques et suivent alors la mˆeme orbite. C’est le cas des r`egles3, 11,19,35,46,154.

– Les automates qui combinent deux des trois comportements pr´ec´edents, en fonction deα.18,26,106,146combinent les deux premiers comporte- ments,50,58,134combinent les deux derniers,9,57,62,110,126r´ealisent la derni`ere combinaison possible. 7 passe du comportement d´ecrit dans le point suivant `a une coalescence syst´ematique quand αcroˆıt. 22 et 30 passent du comportement du point suivant `a une absence de coalescence.

– Les automates qui ´evoluent soit vers un ´etat coalesc´e soit vers un ´etat de d´esaccord total en fonction des mises `a jour. C’est le cas de14,15,23,43, 170,178,184.

– Notons enfin que certains automates ont un temps de coalescence tr`es variable en fonction deα:1,6,27.

A la lumi`` ere de ces r´esultats, il apparaˆıt int´eressant d’´etudier plus en d´etail la nature de la transition qui s’op`ere entre le r´egime coalescent et le r´egime non coalescent pour les automates pr´esentant les deux comportements en fonction deα. Ce sont donc les r`egles9,57,62,110, et126.

Nous testons l’hypoth`ese d’une transition de phase selon le mod`ele de la percolation dirig´ee.

(20)

5.2 Le mod` ele de la percolation dirig´ ee

Pour une pr´esentation rapide, voir [Hinrichsen(2000)], qui contient des r´ef´e- rences plus compl`etes ainsi qu’une sectiondamage spreading, qui est une autre mani`ere de formuler notre probl`eme.

Les mod`eles de diffusion font souvent apparaˆıtre une transition entre survie et extinction. La percolation dirig´ee en est un cas particulier. Elle met en jeu des sites d’une grille qui ont deux ´etats possibles : actif et inactif (que l’on peut se repr´esenter respectivement par infect´e et sain). Suivant l’´evolution de la population des deux ´etats, le syst`eme peut tomber dans un ´etat absorbant o`u aucun site ne peut devenir actif.

directed bond percolation isotropic bond percolation

Fig.1 – Percolation isotrope et dirig´ee. Le point de d´epart est le site central.

La diffusion est repr´esent´ee par les arˆetes ´epaisses, qui relient les sites actifs Dans la percolation classique, la diffusion d’un virus ou de gouttes d’eau se fait en suivant les liens autoris´es sur une grille. La diff´erence est ici que les liens sont orient´es (voir figure1).

On appelle cluster l’ensemble des sites atteints `a partir du point de d´epart.

Le param`etre qui varie estp, la probabilit´e qu’un lien soit ouvert. Le param`etre mesur´e est la probabilit´e qu’un site pris au hasard g´en`ere un cluster infini.

Les deux mod`eles pr´esentent une transition de phase, dont les caract´eristiques (les classes d’universalit´e, caract´eris´ee par quelques exposants critiques) sont diff´erentes.

On peut consid´erer la fl`eche de la figure 1 comme l’´ecoulement du temps, c’est-`a-dire qu’une dimension est le temps. On obtient un syst`eme dynamique o`u un site inactif le reste `a l’´etape suivante, et o`u un site actif peut soit mourir (devenir inactif), soit le rester, et ´eventuellement rendre actif un site voisin (le contaminer).

On distingue trois r´egimes suivant le param`etrep. En r´egime sous-critique (p < pc, figure3), les sites actifs meurent plus vite qu’il ne se reproduisent, et l’on observe des branches qui meurent. En r´egime sur-critique (p > pc, figure2), les sites actifs se reproduisent plus vite, et la grille a une densit´e constanteρde sites actifs (apr`es un r´egime transitoire). Cette densit´e est donn´ee par la loi

ρ(p) =c(p−pc)β

et l’exposant critiqueβ est commun `a tous les mod`eles de percolation dirig´ee.

(21)

Fig.2 – R´egime sur-critique de la r`egle110(α= 0,65> αc'0,566). Le temps va de gauche `a droite, pour 500 ´etapes (horizontalement) sur 500 cellules (ver- ticalement). Les cellules o`u les deux automates sont en d´esaccord sont fonc´ees, celles o`u ils sont en accord sont claires. Parmi ces derni`eres, l’´etat 1 est en bleu clair, l’´etat 0 est blanc.

(22)

Fig.3 – R´egime sous-critique de la r`egle110(α= 0,47< αc '0,566). Le reste est identique `a la figure2. On observe que les branches sombres meurent.

(23)

Dans notre mod`ele, c’estαqui jouera le rˆole du param`etre que l’on fait varier, et les sites actifs seront d´efinis comme les cellules o`u les deux configurations ne sont pas dans le mˆeme ´etat. On cherche donc `a identifier l’exposant critiqueβ sous l’hypoth`eseρ(α) =c(α−αc)β.

Nous nous concentrons principalement sur la mesure deβ, comme la majorit´e des auteurs. Faire directement une r´egression surc,αcetβ`a la fois conduit `a des r´esultats peu pr´ecis. Une m´ethode classique, utilis´ee ici, consiste `a d´eterminer αc dans un premier temps, puis faire une r´egression sur c et β sur la courbe ρ(α).

5.3 Mesure de α

c

5.3.1 M´ethode

En r´egime critique, la densit´eρde sites actifs d´ecroit enρ=c t−δ, o`utest le temps etcune constante quelconque. Elle d´ecroˆıt plus rapidement qu’exponen- tiellement en r´egime sous-critique et moins rapidement en r´egime sur-critique (et tend alors vers une valeur non nulle). On trace doncρen fonction detdans un rep`ere o`u les deux ´echelles sont logarithmiques, et l’on ajuste αde fa¸con `a obtenir une droite. La figure4 donne un exemple.

Fig.4 – ρ(t) pourαprenant les valeurs 0,55, 0,599 et 0,65 (avec αc '0,599).

L’´echelle (logarithmique) des abscisses va de 1 `a 106, celle des ordonn´ees de 0,01

` a 1.

Chaque trac´e indique si leαcourant est inf´erieur ou sup´erieur `a αc, ce qui permet de faire de la dichotomie. La figure5 montre les r´esultats obtenus pour diverses dimensions de l’anneau et valide le choix des param`etres.

(24)

Fig. 5 – Mˆemes ´echelles que la figure 4. α = 0,6 et les dimensions choisies ici sont 2 000, 10 000 et 100 000 cellules. Il y a deux choses `a remarquer sur ces courbes. D’une part, mˆeme pour des valeurs tr`es proches deαc (ici 0,599 pour la r`egle 62), l’automate atteint sa densit´e limite apr`es 100 000 ´etapes, ce qui valide le choix de Ttr pour la mesure de ρen fonction de α `a la section 5.4.1.

D’autre part, augmenter le nombre de cellules rend la courbes plus pr´ecise, mais ne change pas la valeur moyenne, il n’est donc pas n´ecessaire d’augmenter encore ce nombre de cellules.

(25)

5.3.2 Protocole

Les deux configurations initiales sont al´eatoires, chaque cellule ayant une probabilit´e 1/2 d’ˆetre dans chacun des 2 ´etats.

Le temps d’´evolution et la taille de l’anneau sont dict´es par la pr´ecision des courbes : on augmente le nombre de cellules jusqu’`a pouvoir lire sur la courbe si le αcourant est sur- ou sous-critique (voir figures 6et 7). On utilise jusqu’`a 200 000 cellules et 107 ´etapes de calcul.

Fig. 6 – Le comportement asymptotiques est atteint au bout d’un temps de plus en plus long au fur et a mesure que l’on s’approche de αc, il faut donc poursuivre les simulations de plus en plus longtemps. Sur l’exemple ci contre, les deux courbes (l’une sous-critique, l’autre sur-critique) ne sont pas discernables avant t= 100 000, et il faut prolonger la simulation jusqu’`a t= 1 000 000 pour

´

ecarter toute possibilit´e de fluctuation al´eatoire.

5.3.3 R´esultats

Voici les valeurs critiques du param`etre trouv´ees. Rappelons qu’αc n’est pas un param`etre universel, il d´epend du mod`ele et n’est qu’une ´etape dans la mesure deβ.

r`egle 9 62 110 126 57

α > . . . 0,757 0,598 0,566 0,720 0,749 α < . . . 0,758 0,599 0,567 0,721 0,750

5.4 Mesure de β

On trace maintenant ρ en fonction de α (comme sur la figure 8), on fait l’hypoth`ese queρ=c(α−αc)β au voisinage de la transition de phase, et l’on effectue un r´egression pour mesurer l’exposantβ.

(26)

Fig.7 – Parall`element `a cela s’ajoute un autre ph´enom`ene : la densit´e asympto- tique est de plus en plus faible (en vert pourα= 0,57, en rouge pourα= 0,58, la droitec t−δ en bleu), donc ρest longtemps proche dec t−δ. Or on observe de fortes fluctuations `a faible densit´e. Il faut donc augmenter le nombre de cellules.

Fig.8 –ρ(α) pour la r`egle110et pour des anneaux de 2 000 et 10 000 cellules.

En abscisse : αde 0,55 `a 1, en ordonn´ee : ρde 0 `a 0,6.

(27)

On note un l´eger d´ecrochage sur la fin de la courbe, dˆu `a un ph´enom`ene non identifi´e. En fait, le d´ecrochage se produit bien plus tˆot : il faut se restreindre aux valeurs « proches » de αc pour effectuer la r´egression. Pour choisir ces valeurs, on prendαc pour origine des abscisses et l’on trace la mˆeme courbe en

´

echelles logarithmiques. On obtient la figure9, sur laquelle la partie de la courbe v´erifiantρ=c(α−αc)β est une droite. Les valeurs retenues pour la r´egression sont en vert.

Fig.9 – Densit´e asymptotique en fonction deαpour une ´echelle logarithmique avec pour origine des abscissesα= 0,6'αc. Le fait que le d´ecrochage commence tˆot est bien visible (et reste visible mˆeme pour des valeurs ´eloign´ees deαccomme le montre la figure10).

Ceci est confirm´e exp´erimentalement : la pr´ecision de la r´egression (estim´ee par une somme de carr´es de diff´erences) est meilleure si l’on se restreint aux valeurs proches de la valeur critique. Il se produit donc certainement un ph´e- nom`ene d`es que l’on s’´eloigne sensiblement de αc, qui tend `a faire baisser la densit´e asymptotique.

Apr`es r´egression, on obtient la figure11. `A nouveau, les points retenus pour la r´egression sont en vert, ce qui montre une excellente ad´equation entre les donn´ees et la courbe obtenue (en bleu).

5.4.1 Protocole

Les deux configurations initiales sont al´eatoires, chaque cellule ayant une probabilit´e 1/2 d’ˆetre dans chacun des 2 ´etats. Le syst`eme ´evolue pendant un temps transitoireTtr, puis l’on mesure la densit´e d’´etats de d´esaccord surT´ech

´

etapes, la moyenne de ces mesures donnant une estimation deρ.

A` αfix´e, la configuration initiale et la suite de mises `a jour sont les mˆemes pour toutes les r`egles. En revanche, ces deux r´ealisations de l’al´eatoire sont distinctes pour toutes les valeurs de α, ce qui permet d’estimer leur influence.

(28)

Fig.10 – Le d´ecrochage reste visible mˆeme pour une valeur deαcmal d´etermi- n´ee. Par exemple, pour une origine de l’´echelle logarithmiqueα= 0,65 (au lieu de 0,599), on voit d´ej`a un point d’inflexion aux alentours de l’abscisse 0,1, c’est-

`

a-dire pourα= 0,65 + 0,1 = 0,75. C’est donc un moyen objectif de d´eterminer l’intervalle de valeurs sur lequel effectuer la r´egression. On a ajout´e la courbe d’une loi de puissance sur la figure.

Fig.11 –ρ(α) et la courbe obtenue apr`es r´egression.

(29)

Nous tra¸cons les valeurs deρpour un pas de αtr`es fin autour de la valeur critique (rep´er´ee en tra¸cantρsur un intervalle plus large avec un pas grossier).

Ceci permet de v´erifier la pr´ecision des mesures tout an ayant un graphe plus l´eger que des barres d’erreur. En effet, on constate que la courbe est lisse (sauf pour les points tr`es proches de αc), une courbe accident´ee aurait signifi´e une grande sensibilit´e de la mesure `a la r´ealisation de l’al´eatoire. Nous pr´ef´erons ainsi faire une r´egression sur un grand nombre de valeurs deα plutˆot que sur un nombre plus restreint et plus pr´ecis (dans ce dernier cas, il faudrait donner une estimation de la pr´ecision au processus de r´egression).

Il faut ´egalement v´erifier que les r´esultats sont peu sensibles aux variations de n,Ttr etT´ech. La r´egularit´e de la courbe obtenue (chaque point a une configura- tion initiale et une suite de mises `a jour distinctes des autres points) montre qu’il y a peu de variation d’une exp´erience `a l’autre, la valeur choisieT´ech= 10 000 est donc suffisante. n= 10 000 etTtr = 100 000 ont ´et´e valid´es sur la figure5.

5.4.2 R´esultats

La r´egression donne alors les encadrements suivants, en tenant compte de l’impr´ecision sur αc. Les variations observ´ees selon les points retenus pour ef- fectuer la r´egression sont l´eg`eres tant que les points sont raisonnables au vu de la figure9.

La valeur exp´erimentale deβ mesur´ee sur d’autres mod`eles reconnus comme faisant partie de la classe de la percolation dirig´ee est 0,276.

r`egle 9 62 110 126 57

β > . . . 0,273 0,270 0,271 0,260 0,248 β < . . . 0,283 0,281 0,281 0,276 0,281

Pour la r`egle57, il est tentant de diminuer le nombre de points pris en compte dans la d´etermination de β en se restreignant aux points les plus proches de αc. On obtient alors un encadrement mieux centr´e sur la valeur commun´ement admise 0,276, mais moins pr´ecis. Ceci peut ˆetre dˆu soit `a une erreur syst´ematique et inconnue, soit `a un autre ph´enom`ene qui apparaˆıt non loin deαc. Lorsqu’au contraire on prend en compte plus de points, l’intervalle prend des valeurs plus faibles qui n’encadrent plus 0,276.

57 est d’ailleurs plus d´elicat `a mesurer. Pour les mˆemes param`etres de si- mulation, on obtient des r´esultats moins r´eguliers (i.e. avec une plus grande variance). δ semble l´eg`erement plus ´elev´e (0,165 au lieu de la valeur admise 0,160). La courbe densit´e asymptotique en fonction de α est plus haute que la loi de puissance loin de αc, les autres r`egles montrant au contraire un l´eger d´ecrochage (voir figure 12).

Tous ces indices tendent `a classer 57 `a part, et en effet β ne correspond

`

a la valeur th´eorique de la percolation dirig´ee que sur une r´egion tr`es proche de αc (est est donc mesur´e avec une moins grande pr´ecision). Le fait le plus marquant est que c’est pour les faibles valeur deαque le r´egime est sur-critique, la coalescence apparaissant pour les fortes valeurs de α(voir figure 12). Il est

`

a noter une similitude avec les observations de Nazim Fat`es : dans ses travaux, la r`egle 6 pr´esentait ce comportement « invers´e » par rapport `a α, et ´etait

´

egalement plus d´elicate `a mesurer.

Références

Documents relatifs

Sur ce syst`eme mod`ele, nous montrons que, du point de vue entr´ee/sortie et sous l’hypoth`ese standard des petites oscillations, il n’y a pas de diff´erence entre des

F., A Robbins-Monro procedure for estimation in semiparametric regression models, Annals of

Soit F un sous espace vectoriel ferm´ e d’un espace de Hilbert muni d’un produit scalaire h., .i et d’une

A partir d’une r´ egle locale, Emergence d’un comportement global (synchronisation).. Automate cellulaire

Pour r´ esoudre un syst` eme, on va faire des combinaisons lin´ eaires d’´ equations, et produire ainsi des ´ equations plus simples... Equations horizontales

[r]

On a donc trouv´ e une condition suffisante pour qu’un syst` eme de trois ´ equations lin´ eaires ` a deux inconnues, dont les deux premi` eres ont une solution commune, ait

Pour r´ esoudre un syst` eme, on va faire des combinaisons lin´ eaires d’´ equations, et produire ainsi des ´ equations plus simples... Equations horizontales