• Aucun résultat trouvé

Coups consécutifs identiques égaux à pile ou face

Chapitre 17. Quelques exemples de simulations

2. Jets de pièces et dés en tout genre

2.4 Coups consécutifs identiques égaux à pile ou face

 Supposons par exemple que l’on jette 100 fois une pièce de monnaie et que l’on note tous les résultats successifs dans l’ordre où ils sont apparus.

Pour simplifier, nous appellerons séquence toute suite de coups identiques, constitué soit de « pile » soit de « face ».

Nous nous intéresserons plus particulièrement à la probabilité, lorsqu’on jette 100 fois la pièce, d’obtenir une séquence de longueur au moins 6.

Évidemment, on va réaliser d’abord une simulation17 dans l’application Tableur & listes pour étudier la fréquence de l’événement proposé dans notre feuille de calcul.

17 Pile pour 1 et face pour 0, mais peu importe !

Dans la simulation précédente, on observe une séquence de longueur 2, puis suivent trois séquences de longueur 1, enfin une séquence de 6 zéros consécutifs. On peut d’ores et déjà conclure que l’événement que l’on étudie est réalisé. L’apparition d’une séquence de longueur au moins 6 est-elle rare ou non ?

L’intérêt est bien sûr d’automatiser dans la feuille de calcul la détermination de la longueur de la séquence maximale.

Il suffit d’utiliser la colonne B pour compter, comme on le ferait d’ailleurs à la main. On commence bien sûr par 1 ; ensuite il faut faire un test : si le nombre est identique au précédent, on ajoute 1, sinon on recommence à 1. D’où le test proposé en B2 et recopié sur 100 lignes :

=when(a2=a1,b1+1,1)

Il reste à renvoyer en D1 la longueur maximale de la colonne B avec max(b[])+rand()/108, le rand() sert ici à assurer la capture pour le cas où deux expériences consécutives donnerait le même résultat18. Il reste à organiser la capture dans la colonne E, puis dans la colonne F à se débarrasser des chiffres après la virgule inutiles. En G2 (voir sur l’écran ci-dessous), on calcule la fréquence des résultats supérieurs ou égaux à 6, encadrée par la fourchette en 1

n ; en H6, on donne pour information le nombre n de simulations réalisées, soit le nombre d’éléments de la variable a qui ne peut pas dépasser 2 500.

En conclusion, la fréquence obtenue dépasse 80 %. On peut penser qu’il en est de même pour la probabilité.

 On aurait pu aussi écrire une fonction pour réaliser un nombre plus grand nombre d’expériences que dans une feuille de calcul.

Ci-dessous une première fonction coupscons(n) qui compte la longueur de la plus grande séquence au cours de n lancers et une deuxième lcc(m,n) qui dresse la liste des longueurs de séquences maximales quand on répète m fois n fois le lancer d’une pièce.

18 Deux résultats identiques surviennent de temps en temps dans cette situation. Il est impératif de pouvoir en tenir compte !

Un premier « jet » est simulé avec randInt(0,1) et stocké dans anc (ancien c, c’est-à-dire la valeur de c qui précède celle qu’on est en train de traiter) et la variable ct, qui compte le nombre de coups consécutifs égaux, est initialisée à 1. Le maximum m est lui initialisé à 1.

On poursuit les tirages dans la boucle For, pour i allant de 2 jusqu’à n (le premier tirage a été fait hors de la boucle). Le nouveau « jet » randInt(0,1) est mémorisé dans une variable c. À chaque étape, on compare c et anc :

si ces deux variables sont les mêmes, c’est que les coups sont de même nature et l’on incrémente ct de 1 ; on remplace aussi m par le maximum entre m et ct ;

sinon, les coups ne sont pas de même nature et l’on remet à 1 la variable ct.

Avant de repartir dans la boucle, il faut penser que c devient anc pour la valeur suivante de i.

On retourne à la fin la valeur maximale rencontrée, contenue dans m.

Lors de la mise au point de la fonction, les résultats obtenus lors des n lancers du dé étaient mémorisés dans une liste : il fallait bien s’assurer d’une façon ou d’une autre que le maximum de coups consécutifs renvoyé par la fonction était correct. Les lignes qui correspondent, inutiles maintenant, ont été mises en commentaire.

Cette dernière liste peut être étudiée statistiquement. En particulier, une boîte à moustaches peut donner une idée de la répartition des valeurs. On observe en particulier que la médiane est 7, le premier quartile 6, le troisième 8 et que le maximum obtenu s’élève à 18… ce qui peut paraître d’ailleurs énorme.

 Comment peut-on justifier un tel résultat19 ?

Démontrons le résultat non pas quand on jette la pièce 200 fois mais n fois où n est un entier naturel quelconque au moins égal à 1.

Un résultat de cette expérience peut alors s’interpréter comme une n-liste de l’ensemble {0,1}. On sait qu’il y en a en tout a 2n, chacune de ces n-listes ayant la même probabilité d’apparaître.

Nous voulons donc déterminer le nombre de n-listes présentant au moins une séquence de longueur 6.

Nous raisonnerons par événement contraire en cherchant à déterminer le nombre un de listes ne contenant aucune séquence de longueur au moins 6.

La probabilité qu’une telle liste présente au moins une séquence de longueur 6 sera donc 2n – un

2n . Il reste à évaluer un.

De façon évidente, u1 = 2 ; u2 = 22 = 4 ; u3 = 23 = 8 ; u4 = 24 = 16 ; u5 = 25 = 32

car toutes les listes précédentes, possédant strictement moins de 6 éléments, ne risquent pas d’avoir une séquence de longueur au moins 6 !

Mais pour u6, cela devient possible : il y a en tout 26 listes et seulement 2 avec 6 éléments consécutifs égaux, 000000 et 111111. On a donc u6 = 26 – 2 = 64 – 2 = 62.

Quid de u7 ? On a 27 = 128 résultats possibles... Seulement 6 listes contiennent une séquence de longueur au moins 6 :

0000001 ; 1000000 (liste commençant ou terminant par 6 « 0 »)

19 Une démonstration analogue est proposée dans L’induction statistique au lycée par Philippe Dutarte, éditions Didier. Je m’en suis inspiré.

1111110 ; 0111111 (liste commençant ou terminant par 6 « 1 ») 0000000 ; 1111111.

On a donc u7 = 27 – 6 = 122.

Enfin pour u8... On dénombre cette fois 16 listes contenant une séquence de longueur au moins 6. Ce sont :

00000011 ; 00000010 (liste commençant par 6 « 0 ») 01000000 ; 11000000 (liste terminant par 6 « 0 ») 10000001 (liste avec 6 « 0 » au milieu)

00000001 ; 10000000 (liste commençant ou terminant par 7 « 0 ») 00000000 (liste avec 8 « 0 »)

et huit autres suites semblables en échangeant les 0 et les 1.

Bilan : u8 = 28 – 16 = 256 – 16 = 240.

Or on constate sur ces premiers calculs que un = un – 1 + un – 2 + un – 3 + un – 4 + un – 5. Généralisons ce résultat par récurrence.

On suppose donc que la propriété est vraie à l’ordre n. On a donc : un = un – 1 + un – 2 + un – 3 + un – 4 + un – 5.

où un désigne le nombre de listes de n éléments qui ne contiennent que des séquences de longueur 5 au maximum.

Calculons maintenant un + 1.

Nécessairement pour fabriquer une liste de n + 1 éléments sans séquence de longueur au moins 6, on doit partir d’une liste de n éléments sans séquence de longueur au moins 6.

La question est de savoir comment, à partir d’une des un listes de n lancers sans séquence de longueur au moins 6, on peut obtenir à l’aide d’un lancer supplémentaire une liste de n + 1 lancers sans séquence de longueur au moins 6.

Or, de deux choses l’une :

soit la liste de n lancers se termine par une séquence de longueur 5, et on doit la compléter soit par un 1 (si la séquence est une séquence de 5 « 0 ») soit par un 0 sinon.

soit la liste de n lancers ne se termine pas par une séquence de longueur 5, et on peut la compléter indifféremment soit par un 0 soit par un 1.

Combien y-a-t-il de listes de la première sorte c’est-à-dire de listes de n lancers se terminant par une séquence de longueur 5 ?

Elles peuvent se terminer soit par 00000, soit par 11111.

Dans le premier cas, les n – 5 premiers termes de cette liste forment une liste de n – 5 lancers, sans séquence de longueur 6, dont le dernier lancer est un 1 ; de la même façon, les n – 5 premiers termes d’une liste de n lancers se terminant par 11111 forment une liste de n – 5 lancers, sans séquence de longueur 6, dont le dernier lancer est un 0.

Il y a donc exactement un – 5 listes de n lancers se terminant par une séquence de longueur 5 ; et pour chacune d’elles une seule façon de la compléter pour en faire une liste de n + 1 lancers sans séquence de longueur au moins 6.

Combien y a-t-il de listes de la deuxième sorte ? Comme il y en a en tout un, il en reste servons-nous de la réflexion matricielle que servons-nous avons mise en œuvre lors de l’étude de la suite de Fibonacci.

La transformation matricielle du problème en avait accéléré le traitement. En posant :

0 1 0 0 0

Par conséquent, et de proche en proche :

96 95 94 1 [0,1,0,0,0;0,0 etc.]… le point-virgule permettant de changer de ligne…

Le nombre cherché u100 est le cinquième du vecteur colonne obtenu :

et la probabilité qu’une suite de 100 termes contiennent au moins 6 éléments consécutifs égaux est :

100

1 100

2u

 0,806 soit un peu plus de 80 % !

Remarquons que si l’on jette la pièce 200 fois, l’événement est devenu presque une certitude :