• Aucun résultat trouvé

Nous supposons que les définitions des notions de base en théorie des probabilités telles que univers, distribution de probabilité, variable aléatoire sont connues.

Définitions.

Définition 3. Un processus stochastique est un ensemble de variables

aléatoires indexées par Z : (Xn)n∈Z.

Nous écrirons qu’un processus stochastique (Xn)n∈Z est i.i.d lorsque les

Xnsont indépendantes et identiquement distribuées.

Nous pouvons également voir un processus stochastique comme un ensemble de variables aléatoires indexées par les nœuds du chemin infini. En effet, cela serait un cas particulier d’un ensemble de variables aléatoires (Xv)v∈V, où V est l’ensemble des sommets d’un graphe G avec un nombre dénombrable de sommets.

Définition 4. Un processus stochastique (Xn)n∈Zeststationnaire si (Xn)n∈Za la même distribution que (Xn+1)n∈Z.

Nous pourrions donc dire qu’un processus stationnaire est un processus dont la distribution est invariante par décalage d’indices.

Définition 5. Un processus stochastique (Xn)n∈Z est un r-block factor s’il

existe un processus stochastique i.i.d (Yn)n∈Z et une fonction1tels que Xn = f (Yn+1, . . . , Yn+r) ∀n ∈ Z.

1. Plus précisément, une fonction mesurable, mais ce détail n’a pas d’importance pour ce qui suit.

Autrement dit, la valeur de chaque Xn est fonction d’un « bloc » de r variables consécutives de (Yn)n∈Z.

Définition 6. Un processus stochastique est k-dépendant si pour tout n ∈ Z, (X≤n) := (. . . , Xn−1, Xn) et (X>n) := (Xn+k+1, Xn+k+2, . . . ) sont indépendantes.

La k-dépendance est une généralisation de l’indépendance : en effet, il est facile de voir qu’un processus 0-dépendant est tout simplement un processus indépendant. C’est une notion qui a été développée dans les années 1940-1950, où des variantes du théorème central limite pour les variables aléatoires k-dépendantes ont été démontrées [HR48,Dia55].

Liens avec des notions étudiées en calcul distribué. Nous allons maintenant faire quelques remarques sur le rapport entre ces notions et des choses que nous avons vues dans le domaine du calcul distribué.

• Il est facile de voir que la notion de r-block factor est très proche de celle de calculabilité distribuée classique en un nombre f(r) de rondes (par exemple, f(r) = r s’il s’agit d’un chemin orienté, ou f(r) = r/2 si r est pair et qu’il s’agit d’un chemin non-orienté). En effet, si nous reprenons l’exemple de la coloration, en considérant que la répartition des identifiants est donnée par un processus i.i.d (Yn)n∈Zet la répartition des couleurs par un processus (Xn)n∈Z, dire que (Xn)n∈Zest un r-block factor de (Yn)n∈Z signifie que la coloration (aléatoire) d’un nœud est calculée à partir des identifiants (répartis aléatoirement) de r nœuds consécutifs (dont le nœud en question) sur le chemin.

• De même, la notion de k-dépendance (plus la stationnarité) est proche de celle de φ-LOCAL en un nombre f(k) de rondes. En effet, dans une distribution φ-LOCAL, la sortie d’un nœud ne dépend que des entrées des variables à une certaine distance de lui. Donc, un ou plusieurs nœuds ne peuvent déduire aucune information autre que celle qui est disponible dans un rayon limité autour d’eux. Or, dans une distribution

k-dépendant stationnaire, un ou plusieurs nœuds à distance plus de k l’un de l’autre ne peuvent pas connaître leurs indices à partir de leurs valeurs : autrement dit, ils ne peuvent connaître ni leur position absolue, ni leur distance, ni leur ordre.

• De plus, il est facile de voir que tout processus (Xn)n∈Z qui est un r-block factor est nécessairement (r − 1)-dépendant. En effet, pour un tel processus on a :

Xn= f (Yn+1, . . . , Yn+r)

Xn+r = f (Yn+r+1, . . . , Yn+2r)

On voit que la variable Yn+r apparaît à la fois dans l’écriture de Xn et celle de Xn+r−1, donc il est possible que ces deux variables ne soient pas indépendantes2, auquel cas le processus ne peut pas être (r − 2)-dépendant. Par contre, l’ensemble des variables intervenant dans l’écriture de Xn et l’ensemble de celles intervenant dans l’écriture de

Xn+ront une intersection vide, et puisque le processus (Yn)n∈Zest i.i.d, cela signifie que Xn et Xn+r sont indépendantes. Cette indépendance vaut a fortiori pour des variables à une distance plus grande (c’est-à-dire,

Xiavec i < n et Xjavec j > n+r) d’où nous concluons que le processus est (r − 1)-dépendant.

Pour faire le lien avec le calcul distribué, cette remarque pourrait s’interpréter de la manière suivante pour dire quelque chose de trivial : tout ce qui est calculable classiquement de façon distribuée en un certain nombre de ronde l’est aussi dans le modèle φ-LOCAL en le même nombre de rondes.

Lien entre k-dépendance et r-block factor. Nous avons montré plus haut que tout processus (Xn)n∈Z qui est un r-block factor est nécessairement (r − 1)-dépendant. Une question plus intéressante est celle de savoir, pour un processus k-dépendant, s’il existe un r ∈ N tel que ce processus est nécessairement un r-block factor3.

La réponse à cette question est donnée pour la première fois par [AGKdV89]. Dans cet article, les auteurs construisent des processus 1-dépendant qui ne sont pas des 2-block factors, démontrant ainsi qu’au moins la contraposée de la remarque précédente (i.e. tout r-block factor est (r − 1)-dépendant) est fausse. On a trouvé d’autres exemples répondant à la question plus générale depuis, cependant tous ces exemples partagent la caractéristique d’être plutôt « artificiels ».

En 2015 et 2016, Alexander Holroyd et Thomas Liggett construisent des processus de 3-coloration 2-dépendant et de q-coloration 1-dépendant pour

q ≥ 4à titre d’exemples « naturels » de processus k-dépendant qui ne sont des r-block factor pour aucun r ∈ N [HL15,HL16]. Pour voir ce dernier point (i.e. un processus de coloration ne peut pas être un r-block factor quelque 2. En effet, elles peuvent être indépendantes si f est telle que Yn+rn’intervient pas dans le calcul du résultat ou si son influence est en quelque sort annulée. Mais le fait que Yn+rapparaît comme paramètre de la fonction signifie que cela n’est pas toujours le cas.

3. La réponse à cette question n’a toutefois pas beaucoup d’importance par rapport au calcul distribué. En effet, cela aurait l’implication que tout ce qui est φ-LOCAL en un nombre constant de rondes est ou n’est pas calculable classiquement de façon distribuée en un autre nombre constant de rondes si la φ-LOCALité impliquait la k-dépendance, ce qui n’est pas le cas (même si sa contraposée est vraie).

soit r ∈ N), notons qu’il est aisé de traduire la preuve de Naor [Nao91] dans un langage probabiliste pour démontrer que le « rayon » d’un tel bloc est plus grand que n’importe quel entier r avec une probabilité positive s’exprimant comme une tour d’exponentielle dépendant de r [HSW16].

Nous décrirons le processus construit par Holroyd et Liggett plus longuement dans la dernière section de ce chapitre.

Enfin, notons que même si nous avons défini toutes les notions présentées dans cette section pour des variables indicées par Z, ces notions ou des notions analogues existent pour des ensembles de variables aléatoires indicées par un intervalle fini de Z (par exemple {1, . . . , n}) ou les sommets d’un graphe aussi.