Chapitre 17. Quelques exemples de simulations 17

(1)

17

Chapitre

« Anyone who considers arithmetical methods of producing random digits is, of course, in a state of sin. » John Von Neuman, 1951 On « définit » la probabilité en lycée comme la « limite » de la fréquence statistique, quand on répète un très grand nombre de fois et dans des conditions identiques, une expérience aléatoire donnée. C’est ce qui caractérise l’approche fréquentiste des probabilités, qui a l’avantage, en faisant le lien avec les statistiques, de donner à une notion abstraite un support intuitif presque concret.

Sans doute dans une première approche faut-il faire effectivement de véritables expériences avec des objets du monde réel – pièces, punaises et autres dés – ne serait-ce que pour en percevoir la lenteur et le caractère laborieux.

Bien sûr la simulation automatisée permise par la calculatrice ou l’ordinateur, grâce aux générateurs pseudo-aléatoires, est d’une toute autre efficacité, même si, selon Von Neumann, le pseudo-hasard qu’elle met en œuvre nous plonge dans un état de péché.

La rédemption est cependant au bout des algorithmes...

Sommaire

Chapitre 17. Quelques exemples de simulations ... 427

1. Un problème de référence : la chasse aux canards ... 429

1.1 Chassons le canard ... 429

1.2 Simulation sur le tableur ... 430

1.3 Capture de la variable ... 430

1.4 Écriture d’une fonction ... 432

1.5 Quelques éléments théoriques ... 434

2. Jets de pièces et dés en tout genre ... 436

2.1 Simulation d’un jet de dé ... 436

2.2 Simulation du jet d’une pièce ... 439

2.3 Le paradoxe du Grand-Duc de Toscane ... 443

2.4 Coups consécutifs identiques égaux à pile ou face ... 446

Chapitre 17.

Quelques exemples

de simulations

(2)

2.5 Obtenir tous les numéros quand on jette un dé ... 453

3. Autres problèmes classiques ... 461

3.1 Le paradoxe des anniversaires ... 461

3.2 Un problème de rencontre ... 466

3.3 Numéros consécutifs au loto ... 472

4. Des probabilités géométriques ... 477

4.1 Somme de rand() ... 477

4.2 Calcul approché de  par une méthode de Monte-Carlo ... 480

4.3 Le jeu de franc-carreau ... 485

ANNEXE : dénombrer les surjections ... 489

(3)

1. Un problème de référence : la chasse aux canards

1.1 Chassons le canard

 C’est un problème de référence dans la situation d’une part, mais aussi dans la façon dont nous traiterons cette simulation avec TI-Nspire.

C’est une simulation classique qui apparaît pour la première fois sans doute dans l’excellent livre d’Arthur Engel Les certitudes du hasard¹.

Le cadre : dix chasseurs tirent sur dix canards.

Comme ils sont adroits… les chasseurs… ils ne ratent jamais leur cible.

Comme ils n’ont pas de chance… les canards… ils passent de vie à trépas dès qu’ils sont touchés…

Un vrai cauchemar pour les volatiles ! Leur seul espoir de s’en tirer, enfin pour quelques-uns seulement : les chasseurs ne se mettent pas d’accord sur le canard qu’ils visent et ne tirent qu’une fois… Si un malheureux canard, visé par plusieurs chasseurs, est en quelque sorte « tué » plusieurs fois, d’autres survivront !

Pas la peine de faire un dessin : le nombre de canards survivants est donc au mieux de neuf, si tous les chasseurs se sont défoulés au hasard sur un seul oiseau (sera-t-il seulement mangeable, le pauvre ?) ; au pire, aucun si les chasseurs sans le vouloir ont tous tué chacun le leur.

Une seule question, pour les canards, mais aussi pour les chasseurs, pour des raisons exactement opposées : combien peut-on en moyenne espérer de survivants après cette boucherie ?

Première méthode : on fait venir les chasseurs, les canards etc. On les met par 10, chasseurs, canards, dans une pièce, les coups de feu expédient les canards ad patres… On compte les survivants… enfin chez les canards…

Et puis, on recommence avec une autre série²…

Ou alors on fait une simulation. Ceux qui n’en verront pas l’avantage seront de mauvaise foi. Elle est moins bruyante, moins traumatisante et surtout moins sanglante. Plus propre, plus rapide et plus économique.

Certes, mais comment simuler cette partie de chasse ?

L’idée est de récupérer une succession de 10 chiffres aléatoires, comme par exemple : 9 0 6 8 4 6 5 2 8 8.

en convenant qu’un chiffre représente le numéro du canard tué. Ainsi, dans notre exemple, on peut constater que le canard 8, le pauvre, a été tué 3 fois³… Oui mais son sacrifice a permis que le canard 1 ou 3 par exemple en réchappe.

Combien de survivants dans notre exemple ? 3 canards, les 1, 3, 7, correspondant aux chiffres qui n’apparaissent pas…

Remarquons que selon ce modèle, chaque canard a autant de chances d’être tué ou de survivre que son voisin.

1 Qu’on ne peut que recommander si vous ne l’avez pas encore dans votre bibliothèque. ALEAS Editeur.

2 Pensez à changer les canards car les survivants seront traumatisés !

3 Par les chasseurs 4, 9 et 10… ce qui correspond aux rangs des 8 dans les 10 chiffres.

(4)

1.2 Simulation sur le tableur

 Le tableur est particulièrement indiqué. Dans une feuille de calcul, on saisit dans la colonne A l’instruction =randint(0,9,10). On peut appeler cette colonne salve.

Reste à déterminer les numéros qui ne sont pas sortis dans cette salve… Le plus simple est de compter combien de fois chaque numéro de 0 à 9 apparaît. Par conséquent, dans la colonne B, on écrit donc tous les nombres entiers de 0 à 9, correspondant à chaque numéro de canard. En C1, on rentre

=countif(salve,b1). La recopie vers le bas donne les autres réponses.

Les survivants sont donc les indemnes, c’est-à-dire les numéros en face desquels se trouve un 0.

Combien y en-a-t-il ? On peut le faire toujours avec countif. Dans la cellule D1, on tape :

=countif(c1:c10,0).

et on mémorise le résultat dans la variable surv. Réponse : 4 dans notre exemple…

Pour la répéter, on relance les calculs avec CTRL R. Le résultat oscille souvent autour des valeurs 3 et 4.

1.3 Capture de la variable

 Mais il faudrait pouvoir garder la trace de ces résultats. On peut le faire en capturant les données, selon les modalités qui suivent :

on ajoute à surv dans la cellule D1 un petit quelque chose d’aléatoire (rand()/10⁸) qui permet d’être sûr qu’à chaque répétition, la variable surv change de valeur⁴, si ce n’est sur le nombre de survivants, au moins sur cette partie aléatoire⁵ ;

la capture proprement dit se fait dans la colonne F ;

la colonne G permet de récupérer le bon résultat, en prenant la partie entière ;

On peut alors en H1 calculer le nombre moyen de survivants, en I5 et I6 leur maximum et minimum.

4 Faute de quoi, la variable surv n’est capturée qu’une fois, ce qui fausse évidemment le résultat.

5 Il est en effet très peu probable que rand()/10⁸ prenne deux fois de suite la même valeur.

(5)

CTRL R⁶ relance l’expérience et les valeurs capturées apparaissent alors dans la colonne F. On observe que le nombre moyen de survivants s’élève à peu près à 3,5, avec un minimum d’aucun survivant – c’est sans doute très rare – et un maximum de 6 survivants.

Évidemment les outils de représentation graphique statistiques peuvent-être utilisés (en nommant par exemple ff la colonne G de tous les résultats des simulations).

Voici ce que donnent par exemple les diagrammes en bâtons : on peut de visu constater les effectifs plus importants des 3 et 4…

6 Quand CTRL est pressée, un appui long sur la touche R fait avancer la simulation de quelques dizaines d’expériences.

(6)

 Pourquoi sur cet exemple ne pas pousser l’automatisation jusqu’au bout… CTRL R, c’est bien pour relancer le calcul mais quelque peu fastidieux. On gagnerait à appuyer une fois sur un bouton pour lancer les simulations.

On commence par partager horizontalement la feuille de calcul.

Dans la partie inférieure, on ouvre l’application Géométrie, juste pour y insérer un curseur, associé à une variable n, dont les valeurs par exemple varient à 1 à 2000 par pas entier (cliquer sur le menu contextuel Réglages).

La variable du curseur n en se modifiant doit permettre le re-calcul de toute la feuille. Mais il faut la placer à un endroit stratégique : la colonne A, celle que nous avons appelé salve, est tout indiquée. Il suffit d’ajouter au calcul précédent 0 × n, qui ne changera rien au calcul effectué, mais qui relancera le calcul à chaque changement de la variable n. Autrement dit nous saisissons :

salve:=int(randint(0,9,10)+0×n Et c’est tout…

L’animation du curseur relance le calcul de la colonne A et par contrecoup provoque les simulations successives ; le fait que le curseur varie de 1 en 1 permet de contrôler, même sommairement, le nombre de simulations effectué⁷.

L’ensemble du classeur est remis à jour, et notamment le diagramme statistique, dont il vaut mieux graduer l’axe vertical en pourcentages. En demandant Zoom - Données, on ajuste parfaitement la fenêtre aux valeurs obtenues.

1.4 Écriture d’une fonction

Demeure aussi la possibilité d’écrire une fonction : c’est sûrement moins beau, mais plus rapide. On peut procéder de façon très simple, en gérant une liste à n éléments, représentant nos canards (n = 10 pour nous… mais rien n’interdit de généraliser).

7 Il faut alors penser à réinitialiser la capture. On se place sur l’instruction capture et on valide par ENTER.

(7)

La liste est initialisée à 0 : ces 0 signifient que les canards au départ sont tous vivants. Et puis commencent les tirs des chasseurs : tir simulé avec randint(0,n–1). Le résultat, comme pour le tableur, représente le numéro du canard abattu ; pour indiquer que le canard est tué, on choisit de mettre un 1 dans la liste à l’élément correspondant à ce canard (s’il était à 0 juste avant, c’est que le canard vient d’être tué ; sinon, c’est que le canard a été tué « plusieurs fois », mais on s’en soucie peu). Remarquer le décalage d’indice, car le canard numéro 0 se trouve à la position 1 de la liste…

À la fin des n salves, il reste juste à compter le nombre de 0 dans la liste, correspondant aux canards ayant échappé à tous les coups de fusil.

Les résultats obtenus sont les suivants…

Enfin pour calculer le nombre moyen de canards survivants, il suffit de définir en ligne de commande la fonction suivante :

Avec 10 canards, on peut donc raisonnablement espérer qu’en moyenne 3,48 canards survivent à cette boucherie.

Cela ouvre la porte à des simulations plus étoffées, comme le montrent les exemples ci-dessous, qui s’exécute à l’ordinateur en un.

Avec un millier de ces volatiles caquetant, on peut espérer presque 368 survivants.

(8)

On obtient proportionnellement plus de survivants, mais la boucherie frappe l’un dans l’autre à peu près la même fraction de la population totale.

1.5 Quelques éléments théoriques

 L’étude théorique confirme cette valeur empirique. En effet, un canard particulier a une probabilité de survie de

9 10

0,3486 10

  

 

  : il survit lorsque chacun des 10 chasseurs vise de façon indépendante n’importe lequel des 9 autres canards.

Cette probabilité est bien sûr la même pour chacun des canards. Par conséquent, si l’on raisonne globalement, à la fin des 10 tirs, un peu plus de 34 % des canards auront survécu.

Le nombre moyen de survivants que l’on peut espérer à l’issue de l’expérience « sanglante » est donc :

10  0,3486  3,486

résultat peu éloigné de ceux que l’on a obtenu lors de nos simulations.

Attention aux conclusions hâtives… Malgré les apparences, la loi qui donne le nombre de canards tués n’est pas une loi binomiale : pour s’en convaincre, il suffit de se souvenir que les épreuves successives ne sont pas indépendantes. Par exemple, pour le 10^e canard, si par un curieux hasard on apprend qu’aucun des autres canards ne sera tué, on ne donnera pas cher de sa peau… et pour cause ! Remarquons enfin que dans le cas de n chasseurs et n canards, avec les mêmes règles du jeu, la probabilité de survie d’un canard particulier est 1 1

 1

    

   

   

n n

n

n n , qui est aussi la proportion de canards survivants à l’issue des n tirs. On sait que quand n tend vers l’infini, cette dernière probabilité tend vers ¹ 0,367

e . On retrouve là la valeur qu’on a obtenue avec 1 000 canards à peu de choses près.

Bref, même si n grandit, il demeurera toujours un peu plus d’un tiers de canards survivants en moyenne.

(9)

 La loi du nombre de survivants peut être déterminée, mais c’est un peu plus délicat. Nous nous placerons dans le cas de 10 canards.

Notons  = {H1, …, H10} l’ensemble des 10 chasseurs, et  = {C1, …, C10}, supposés distingués par des prénoms (Alphonse, Bernard, … pour les premiers ; Donald, Saturnin, … pour les seconds) ou si l’on préfère des numéros autour du cou.

Une salve peut s’interpréter comme une application de  dans , chaque chasseur ayant pour image le canard qu’il a tué. Application comme on l’a vu qui est tout à fait quelconque. Il y a donc autant de salves possibles que d’applications de  dans  soit 10¹⁰.

Appelons maintenant X la variable aléatoire égale au nombre de canards survivants après la boucherie.

Soit k un entier compris entre 0 et 9, le nombre de survivants possibles.

Dire que X = k signifie qu’il y a exactement k survivants, donc 10 – k tués.

Pour commencer, de combien de façons peut-on par exemple tuer les 10 – k premiers canards et exactement ceux-là et laisser survivre les k derniers ? D’autant de façons que de surjections de l’ensemble  sur le sous-ensemble de  égal à {C1, …, C10–k} : chacun des canards de cet ensemble doit avoir au moins un antécédent qui n’est autre qu’un de ses « meurtriers ». On sait qu’il existe



^10,10



S k ⁸ surjections entre ces deux ensembles.

Ceci donne le nombre de façons de tuer les 10 – k premiers, et de laisser survivre les k derniers.

Mais d’autre part, on a  10

  k façons choisir les k survivants parmi les 10 canards et comme précédemment pour chacun de ces choix, ^S



^10,10^^k



façons de tuer les 10–k autres canards. Bref, on a donc ¹⁰ ^S



^10,10 ^k



k

  

   façons d’avoir k survivants à une salve.

En termes de probabilité, on peut écrire que :

     

10 10

10,10 10,10

10

10 10

S k S k

k k

p X k

   

 

    

   

   .

On sait par ailleurs que le nombre de surjections⁹ d’un ensemble à n éléments sur un ensemble à p

éléments est :

 

¹

   

0

, 1

p k n

k

S n p p p k

k





   

      

   



Après avoir saisi la valeur de S_n^p dans l’application Calculs, puis celle de ^{p X}



^^k



sous la forme d’une fonction p(k)…

8 S(n,p) désigne le nombre de surjections d’un ensemble à n éléments dans un ensemble à p éléments.

9 Voir l’annexe de ce chapitre.

(10)

… on peut comparer entre les résultats obtenus sur une simulation de 10 000 salves déterminée par la fonction suivante :

… et les valeurs théoriques attendues.

On obtient évidemment des valeurs très proches :

Les trois dernières colonnes préparent un test de khi2 à la mode terminale : la distance khi2 obtenue vaut 3,03, soit bien moins que 16,919 (=invkhi2(0.95,9))

Il reste le calcul de l’espérance du nombre de canards tués :

Le chemin était plus tortueux, certes, mais on retrouve la même valeur que précédemment !

2. Jets de pièces et dés en tout genre

2.1 Simulation d’un jet de dé

 Rien n’est plus facile que de simuler le jet d’un dé. Il suffit d’utiliser randInt(1,6), qui renvoie un entier aléatoire entre 1 et 6, suivant la loi équirépartie sur {1,2,3,4,5,6}.

(11)

L’instruction randInt(1,6,100) répète 100 fois l’expérience et renvoie les résultats successifs dans une liste :

 Dans l’application Tableurs & listes, on peut alors facilement compter la fréquence de chacun des résultats possibles, et même faire varier la valeur de n avec un curseur :

La variable n est stockée dans la cellule A1, et pilotée à l’aide d’un curseur de l’application Géométrie, après un partage en deux de la fenêtre¹⁰ ; la variable n peut aussi être modifiée directement dans le tableur.

On remarquera la souplesse de la construction de cette feuille par rapport à un tableur classique.

Jointe aux fonctionnalités d’un véritable tableur, l’utilisation de variables et d’instructions de listes de la calculatrice, simplifie considérablement le travail. L’instruction randint est saisie dans la zone grisée et la liste, qui s’adapte à la taille de n, remplit la colonne B. La liste de tous les résultats est par ailleurs nommée r tout en haut de la colonne.

10 On peut alors réduire au minimum la fenêtre inférieure, pour qu’on ne voie que le curseur.

(12)

La fréquence des 1 est alors égale à countif(r,d2)/n et la recopie vers le bas donne la fréquence des autres chiffres.

On constate bien sûr que les fréquences tendent à se rapprocher de la probabilité 1

6– si l’on suppose parfait notre dé – lorsque le nombre d’expériences n augmente. C’est en ce sens que l’on dit que les fréquences convergent vers les probabilités, selon la « loi des grands nombres » qui fonde les probabilités du lycée.

 Facile, pour ne pas dire immédiat, de visualiser cette convergence avec un histogramme. Ouvrons l’application Données & statistiques et ajoutons la variable r sur l’axe horizontal. On demande ensuite la représentation par histogramme (réglage des rectangles : largeur 0,2, alignement 0,9… pour avoir des diagrammes en bâtons). Verticalement on demande la graduation en pourcentages (Menu Propriétés, Propriétés de l’histogramme). On peut même placer un curseur (menu Actions, Insérer un curseur) pour piloter depuis cette application le changement de valeur de n. La visualisation est encore plus nette quand on trace la droite d’équation y = 1/6 (Menu Analyser, Tracer la fonction puis f1(x) = 100/6 puisque la graduation est en pourcentages). Bref, on obtient très rapidement la fenêtre suivante :

L’animation du curseur (clic droit sur le curseur, puis animer) à partir de la valeur 1 montre la lente stabilisation¹¹ des fréquences vers 1/6.

 Enfin, pour les nostalgiques de la programmation – bien qu’elle devienne moins nécessaire –, on peut encore écrire une fonction renvoyant la fréquence de chaque résultat lorsqu’on a répété l’expérience n fois.

La liste qui reçoit les fréquences est initialisée à 0 avec newList. À chaque résultat r obtenu, l[r] est incrémentée de 1. La fonction renvoie tout à la fin la fréquence obtenue en divisant les valeurs de l par n.

11 Attention la liste des résultats est intégralement recalculée lorsque la valeur de n change…

(13)

Voici quelques-uns des résultats obtenus :

Un test de khi-deux peut être demandé à partir de ce dernier résultat, pour tester s’il en était encore besoin, l’adéquation à la loi équirépartie¹² : la valeur que l’on obtient 3,141188 conduit à accepter le modèle équiréparti.

2.2 Simulation du jet d’une pièce

 De la même façon, le jet d’une pièce équilibrée peut être facilement simulé avec randInt(0,1). On peut toujours convenir que pile correspond à 1, et face à 0… ou le contraire d’ailleurs.

Si la même étude que précédemment peut être menée, nous préférons, sur cet exemple, privilégier une autre approche pour illustrer la convergence de la fréquence vers la probabilité.

Avec l’application Tableur & listes, simulons le lancer d’une pièce un certain nombre de fois et mesurons, à chaque étape, la fréquence d’apparition du nombre de piles.

On se propose alors d’afficher, au moment de l’expérience numéro i, le point d’abscisse i et d’ordonnée la fréquence de piles à ce moment.

12 N’oublions pas que l’instruction chi2GOF impose que l’on travaille avec des effectifs entiers.

(14)

Préparons tout d’abord la feuille de calcul.

Dans la colonne A, que l’on nomme rang, on met le numéro de l’expérience (de 1 à 500… prévoir même beaucoup moins pour la calculatrice) : seq(k,k,1,500).

Dans la colonne B, nommée res, les simulations de jets de pièces : randInt(0,1,500).

Dans la colonne C, que l’on nomme freq1, on récupère les fréquences de sortie des 1 (donc pile) : il suffit de saisir dans la zone grisée =cumulativesum(res)/rang.

Ci-dessous un exemple d’utilisation de l’instruction cumulativesum : les sommes cumulées sont renvoyées dans une liste.

On aurait pu utiliser dans la cellule C1 l’instruction sum($b$1:b1)/rang à la manière des tableurs classiques… mais cela nécessitait une recopie vers le bas, contrairement à cumulativesum.

(15)

Il reste à représenter graphiquement le nuage de points dont l’abscisse est donnée par rang et l’ordonnée par freq1.

Enfin, pour relancer le calcul depuis la fenêtre graphique elle-même, on peut insérer un curseur commandant une variable n prenant des valeurs – peu importe lesquelles – entre 0 ou 10. On utilise alors un petit artifice classique : il suffit de remplacer randInt(0,1,500) par randInt(0,1,500)+0^.n pour relancer les calculs à chaque changement de la valeur de n et donc relancer un nouvel affichage.

 Tous ces exemples peuvent s’interpréter en termes de loi normale. Si on appelle Xi la variable aléatoire de Bernoulli donnant le résultat de la i^e expérience, on sait que la fréquence de pile au bout des n lancers est égale à

1





ⁿ

n i

i

X X

n . Par ailleurs, on sait que Xi a pour espérance p = 1/2 et pour

(16)

écart-type  =



¹



¹

 2

p p . D’après le théorème limite central, lorsque n est suffisamment grand, la fréquence des piles, soit X_n, suit la loi normale de moyenne 1

2 et d’écart-type 

n = 0,5 n .

On peut faire une simulation pour observer ce résultat. Simulons à l’aide d’une fonction un certain nombre d’expériences dans lesquelles on jette la pièce 500 fois et récupérons dans une liste les différentes fréquences obtenues pour « pile », par exemple 1 dans la simulation. C’est l’objet des deux fonctions ci-dessous :

On obtient les résultats suivants, pour n = 500 et k = 3000 :

On peut représenter graphiquement les résultats de 3000 simulations de l’expérience qui consiste à jeter une pièce 500 fois et à mesurer la fréquence de « pile » obtenue, non sans au préalable avoir mémorisé ces résultats dans une liste liste. En réglant l’axe vertical sur la densité de fréquence, on constate la parenté très étroite entre l’histogramme obtenu et la courbe de la densité de la loi normale d’espérance 1

2 et d’écart-type 0,5

500, comme le prévoit le théorème limite central.

(17)

D’autre part, on sait que pour une loi normale, on trouve 95 % des valeurs dans un intervalle de rayon 2 autour de l’espérance (et 99 % pour un intervalle de rayon 3).

Par conséquent pour n = 500, 95 % des valeurs sont dans un intervalle de rayon

0,5 1 1

2 0,0447

   500 

n n autour de la moyenne 1

2. Autrement dit 95 % des valeurs sont dans l’intervalle [0,4553 ; 0,5447].

De plus, quand n grandit, l’écart-type de la loi normale diminue et l’intervalle autour de la moyenne 1/2 devient de plus en plus petit : c’est le sens d’ailleurs de la convergence de la fréquence vers la probabilité. Par exemple, pour n = 10 000, deux fois l’écart-type de la loi normale donne

1 1

100 0,01

10 000  et dans 95 % des cas, la fréquence sera comprise entre 0,49 et 0,51.

Ci-dessous ont été ajoutées les bornes de l’intervalle de fluctuation, selon la valeur de n :

2.3 Le paradoxe du Grand-Duc de Toscane

 Galilée (1564-1642), plus connu pour ses travaux sur l’astronomie et l’application des mathématiques au « grand livre de la nature », est l’un des premiers mathématiciens¹³ à écrire sur les probabilités, bien avant la célèbre correspondance entre Fermat et Pascal qui en marque la naissance officielle. Vers 1620¹⁴, il écrit un petit mémoire sur les jeux de dés pour répondre à une question posée par le Grand-Duc de Toscane.

À cette époque, on jouait beaucoup à la Cour de Florence et le Grand-Duc, fin observateur et grand pratiquant des dés et jeux en tout genre, avait remarqué, sans doute à l’issue d’un grand nombre de lancers, qu’il était plus facile d’obtenir une somme égale à 10 qu’une somme égale à 9 en jetant trois dés. Surprenant selon lui, car il y avait autant de façons d’écrire 10 que 9 comme sommes de trois entiers compris entre 1 et 6, à savoir :

10 = 6 + 3 + 1 = 6 + 2 + 2 = 5 + 4 + 1 = 5 + 3 + 2 = 4 + 4 + 2 = 4 + 3 + 3 (6 possibilités)

13 Cardan écrit en 1526 un Liber de ludo aleae, Livre des jeux de hasard, qui ne sera publié qu’en 1663.

14 Malheureusement publié bien plus tard…

(18)

9 = 6 + 2 + 1 = 5 + 3 + 1 = 5 + 2 + 2 = 4 + 4 + 1 = 4 + 3 + 2 = 3 + 3 + 3 (6 possibilités)

 À défaut d’avoir le coup d’œil du Grand-Duc, on peut faire une simulation avec le tableur TI- Nspire.

La simulation se fait sans difficulté particulière en recopiant depuis A1 jusqu’à A200 la formule randInt(1,6)+randInt(1,6)+randInt(1,6).

Dans la cellule B1, on mesure la fréquence des 9 dans les 200 lancers avec =countif(9,aa)/200, résultat mémorisé dans f9. Dans la cellule C1, on procède de façon analogue pour déterminer la fréquence des 10, que l’on stocke dans f10. On ajoute à ces deux nombres un petit nombre aléatoire rand()/10⁸ pour être quasi-sûr que les fréquences vont varier d’une fois sur l’autre et que la capture se fera¹⁵.

Dans la colonne E et dans la colonne F, nommées respectivement ff et gg, on capture les variables f9 et f10 obtenues à la suite des 200 lancers. Dans la cellule H3, on calcule le nombre total de lancers (=200^.dim(ff)).

Enfin dans les cellules marquées en rouge, figurent les bornes d’un intervalle de fluctuation de la

fréquence de type 1 1

,

f f

n n

 

 

 

 . Nous nous appuierons sur une conjecture de Louis-Marie Bonneval, démontrée en 2001 par Christian Maillard¹⁶. Pour n suffisamment grand (n  552) – ce qui est le cas ici –, on a l’inégalité :

1 0.95

p f p n

 

  

 

  .

15 Ruse classique... En effet, si la valeur ne change pas, ce qui est d’ailleurs très peu probable ici, la capture n’a pas lieu. Les décimales ajoutées influent très peu sur le résultat obtenu, d’autant qu’il est affiché avec 3 décimales.

16 Voir par exemple http://www.apmep-aix-mrs.org/bulletin/num11/load/maillard.pdf.

(19)

Quand la probabilité est connue, ce résultat donne un intervalle de fluctuation de la fréquence dans 95 % des cas. Si la fréquence est donnée, il donne un intervalle de confiance de la probabilité inconnue. Ici, avec les 3 200 lancers effectués, on peut en déduire que dans 95 % des cas, la probabilité d’obtenir 9 est comprise entre 0,10138 et 0,13674 tandis que la probabilité d’avoir 10 est comprise entre 0,11888 et 0,15424. Les deux intervalles se chevauchent et il serait bien imprudent de conclure quoi que ce soit.

On peut répéter la simulation et s’arranger si c’est possible pour que les intervalles de confiance obtenus ne se chevauchent plus. C’est ce que donne la feuille de calcul suivante :

Les résultats sont plus satisfaisants, avec par exemple 150 000 lancers : dans 95 % des cas, la probabilité d’obtenir 9 est comprise entre 0,1126 et 0,11776 tandis que la probabilité d’avoir 10 est comprise entre 0,1223 et 0,12746. Dans 95 % des cas, comme le Grand-Duc de Toscane, nous sommes en mesure de conclure que la fréquence du 9 est légèrement inférieure à la fréquence de 10 : soulignons l’énorme expérience en matière de jeu de dé, doublée d’une mémoire infaillible, du Grand- Duc de Toscane qui pouvait ne s’appuyer que sur ses propres observations.

 Déterminons par exemple la probabilité d’obtenir une somme égale à 10. Nous sommes clairement dans une situation d’équiprobabilité et la probabilité d’un résultat particulier, dans l’ordre où il est écrit vaut 1₃ 1

6  216.

Nous avons cité plus haut toutes les façons d’obtenir 10 :

10 = 6 + 3 + 1 = 6 + 2 + 2 = 5 + 4 + 1 = 5 + 3 + 2 = 4 + 4 + 2 = 4 + 3 + 3 (6 possibilités)

… mais il faut concrètement dénombrer le nombre de façons de les répartir sur les 3 dés…

Ainsi 1 + 3 + 6, dans cet ordre, donne 10 et a pour probabilité 1₃ 1

6  216. Mais avec ces même numéros répartis autrement sur les 3 dés, on peut obtenir 10 de 3! = 6 façons :

1 + 3 + 6, 1 + 6 + 3, 3 + 1 + 6, 3 + 6 + 1, 6 + 1 + 3 et 6 + 3 + 1.

La probabilité d’obtenir 10 avec ces 3 numéros dans n’importe quel ordre est donc 6 216.

(20)

La probabilité d’obtenir 10 avec 5, 4, 1 et 5, 3, 2 est aussi pour les même raisons de 6 . 216 . Examinons le cas de 6 + 2 + 2, dont la probabilité dans cet ordre est aussi 1₃ 1

216

6  . Mais le nombre de façon de l’obtenir est un peu plus petit à cause du numéro qui se répète. On a en effet 3 façons de placer le 6 et une seule de placer alors les 2 qui restent :

6 + 2 + 2, 2 + 6 + 2, 2 + 2 + 6

et la probabilité d’obtenir 10 avec 6, 2, 2 vaut 3

216. Résultat analogue pour 4, 4, 2 et 4, 3, 3.

Si bien que la probabilité d’obtenir 10 vaut :

6 6 6 3 3 3 27 1 0,125

216 216 216 216 216 216     216  8 .

Par un raisonnement analogue, à partir de toutes les décompositions de 9 en somme de trois entiers compris entre 1 et 6 :

9 = 6 + 2 + 1 = 5 + 3 + 1 = 5 + 2 + 2 = 4 + 4 + 1 = 4 + 3 + 2 = 3 + 3 + 3 (6 possibilités) on peut en conclure que la probabilité d’une somme égale à 9 vaut :

6 6 3 3 6 1 25 0,11574

216 216 216 216 216 216      216 

car le triplet 3, 3, 3 ne peut être obtenu d’une seule façon quand on jette les trois dés.

On retrouve à très peu près les valeurs de la simulation.

2.4 Coups consécutifs identiques égaux à pile ou face

 Supposons par exemple que l’on jette 100 fois une pièce de monnaie et que l’on note tous les résultats successifs dans l’ordre où ils sont apparus.

Pour simplifier, nous appellerons séquence toute suite de coups identiques, constitué soit de « pile » soit de « face ».

Nous nous intéresserons plus particulièrement à la probabilité, lorsqu’on jette 100 fois la pièce, d’obtenir une séquence de longueur au moins 6.

Évidemment, on va réaliser d’abord une simulation¹⁷ dans l’application Tableur & listes pour étudier la fréquence de l’événement proposé dans notre feuille de calcul.

17 Pile pour 1 et face pour 0, mais peu importe !

(21)

Dans la simulation précédente, on observe une séquence de longueur 2, puis suivent trois séquences de longueur 1, enfin une séquence de 6 zéros consécutifs. On peut d’ores et déjà conclure que l’événement que l’on étudie est réalisé. L’apparition d’une séquence de longueur au moins 6 est-elle rare ou non ?

L’intérêt est bien sûr d’automatiser dans la feuille de calcul la détermination de la longueur de la séquence maximale.

Il suffit d’utiliser la colonne B pour compter, comme on le ferait d’ailleurs à la main. On commence bien sûr par 1 ; ensuite il faut faire un test : si le nombre est identique au précédent, on ajoute 1, sinon on recommence à 1. D’où le test proposé en B2 et recopié sur 100 lignes :

=when(a2=a1,b1+1,1)

(22)

Il reste à renvoyer en D1 la longueur maximale de la colonne B avec max(b[])+rand()/10⁸, le rand() sert ici à assurer la capture pour le cas où deux expériences consécutives donnerait le même résultat¹⁸. Il reste à organiser la capture dans la colonne E, puis dans la colonne F à se débarrasser des chiffres après la virgule inutiles. En G2 (voir sur l’écran ci-dessous), on calcule la fréquence des résultats supérieurs ou égaux à 6, encadrée par la fourchette en 1

n ; en H6, on donne pour information le nombre n de simulations réalisées, soit le nombre d’éléments de la variable a qui ne peut pas dépasser 2 500.

En conclusion, la fréquence obtenue dépasse 80 %. On peut penser qu’il en est de même pour la probabilité.

 On aurait pu aussi écrire une fonction pour réaliser un nombre plus grand nombre d’expériences que dans une feuille de calcul.

Ci-dessous une première fonction coupscons(n) qui compte la longueur de la plus grande séquence au cours de n lancers et une deuxième lcc(m,n) qui dresse la liste des longueurs de séquences maximales quand on répète m fois n fois le lancer d’une pièce.

18 Deux résultats identiques surviennent de temps en temps dans cette situation. Il est impératif de pouvoir en tenir compte !

(23)

Un premier « jet » est simulé avec randInt(0,1) et stocké dans anc (ancien c, c’est-à-dire la valeur de c qui précède celle qu’on est en train de traiter) et la variable ct, qui compte le nombre de coups consécutifs égaux, est initialisée à 1. Le maximum m est lui initialisé à 1.

On poursuit les tirages dans la boucle For, pour i allant de 2 jusqu’à n (le premier tirage a été fait hors de la boucle). Le nouveau « jet » randInt(0,1) est mémorisé dans une variable c. À chaque étape, on compare c et anc :

si ces deux variables sont les mêmes, c’est que les coups sont de même nature et l’on incrémente ct de 1 ; on remplace aussi m par le maximum entre m et ct ;

sinon, les coups ne sont pas de même nature et l’on remet à 1 la variable ct.

Avant de repartir dans la boucle, il faut penser que c devient anc pour la valeur suivante de i.

On retourne à la fin la valeur maximale rencontrée, contenue dans m.

Lors de la mise au point de la fonction, les résultats obtenus lors des n lancers du dé étaient mémorisés dans une liste : il fallait bien s’assurer d’une façon ou d’une autre que le maximum de coups consécutifs renvoyé par la fonction était correct. Les lignes qui correspondent, inutiles maintenant, ont été mises en commentaire.

Cette dernière liste peut être étudiée statistiquement. En particulier, une boîte à moustaches peut donner une idée de la répartition des valeurs. On observe en particulier que la médiane est 7, le premier quartile 6, le troisième 8 et que le maximum obtenu s’élève à 18… ce qui peut paraître d’ailleurs énorme.

(24)

 Comment peut-on justifier un tel résultat¹⁹ ?

Démontrons le résultat non pas quand on jette la pièce 200 fois mais n fois où n est un entier naturel quelconque au moins égal à 1.

Un résultat de cette expérience peut alors s’interpréter comme une n-liste de l’ensemble {0,1}. On sait qu’il y en a en tout a 2ⁿ, chacune de ces n-listes ayant la même probabilité d’apparaître.

Nous voulons donc déterminer le nombre de n-listes présentant au moins une séquence de longueur 6.

Nous raisonnerons par événement contraire en cherchant à déterminer le nombre un de listes ne contenant aucune séquence de longueur au moins 6.

La probabilité qu’une telle liste présente au moins une séquence de longueur 6 sera donc 2ⁿ – un

2ⁿ . Il reste à évaluer un.

De façon évidente, u1 = 2 ; u2 = 2² = 4 ; u3 = 2³ = 8 ; u4 = 2⁴ = 16 ; u5 = 2⁵ = 32

car toutes les listes précédentes, possédant strictement moins de 6 éléments, ne risquent pas d’avoir une séquence de longueur au moins 6 !

Mais pour u6, cela devient possible : il y a en tout 2⁶ listes et seulement 2 avec 6 éléments consécutifs égaux, 000000 et 111111. On a donc u6 = 2⁶ – 2 = 64 – 2 = 62.

Quid de u7 ? On a 2⁷ = 128 résultats possibles... Seulement 6 listes contiennent une séquence de longueur au moins 6 :

0000001 ; 1000000 (liste commençant ou terminant par 6 « 0 »)

19 Une démonstration analogue est proposée dans L’induction statistique au lycée par Philippe Dutarte, éditions Didier. Je m’en suis inspiré.

(25)

1111110 ; 0111111 (liste commençant ou terminant par 6 « 1 ») 0000000 ; 1111111.

On a donc u7 = 2⁷ – 6 = 122.

Enfin pour u8... On dénombre cette fois 16 listes contenant une séquence de longueur au moins 6. Ce sont :

00000011 ; 00000010 (liste commençant par 6 « 0 ») 01000000 ; 11000000 (liste terminant par 6 « 0 ») 10000001 (liste avec 6 « 0 » au milieu)

00000001 ; 10000000 (liste commençant ou terminant par 7 « 0 ») 00000000 (liste avec 8 « 0 »)

et huit autres suites semblables en échangeant les 0 et les 1.

Bilan : u8 = 2⁸ – 16 = 256 – 16 = 240.

Or on constate sur ces premiers calculs que un = un – 1 + un – 2 + un – 3 + un – 4 + un – 5. Généralisons ce résultat par récurrence.

On suppose donc que la propriété est vraie à l’ordre n. On a donc : un = un – 1 + un – 2 + un – 3 + un – 4 + un – 5.

où un désigne le nombre de listes de n éléments qui ne contiennent que des séquences de longueur 5 au maximum.

Calculons maintenant un + 1.

Nécessairement pour fabriquer une liste de n + 1 éléments sans séquence de longueur au moins 6, on doit partir d’une liste de n éléments sans séquence de longueur au moins 6.

La question est de savoir comment, à partir d’une des un listes de n lancers sans séquence de longueur au moins 6, on peut obtenir à l’aide d’un lancer supplémentaire une liste de n + 1 lancers sans séquence de longueur au moins 6.

Or, de deux choses l’une :

soit la liste de n lancers se termine par une séquence de longueur 5, et on doit la compléter soit par un 1 (si la séquence est une séquence de 5 « 0 ») soit par un 0 sinon.

soit la liste de n lancers ne se termine pas par une séquence de longueur 5, et on peut la compléter indifféremment soit par un 0 soit par un 1.

Combien y-a-t-il de listes de la première sorte c’est-à-dire de listes de n lancers se terminant par une séquence de longueur 5 ?

Elles peuvent se terminer soit par 00000, soit par 11111.

Dans le premier cas, les n – 5 premiers termes de cette liste forment une liste de n – 5 lancers, sans séquence de longueur 6, dont le dernier lancer est un 1 ; de la même façon, les n – 5 premiers termes d’une liste de n lancers se terminant par 11111 forment une liste de n – 5 lancers, sans séquence de longueur 6, dont le dernier lancer est un 0.

Il y a donc exactement un – 5 listes de n lancers se terminant par une séquence de longueur 5 ; et pour chacune d’elles une seule façon de la compléter pour en faire une liste de n + 1 lancers sans séquence de longueur au moins 6.

(26)

Combien y a-t-il de listes de la deuxième sorte ? Comme il y en a en tout un, il en reste un – un – 5 et on a vu qu’on pouvait les compléter de deux façons différentes pour en faire une liste de n + 1 lancers sans séquence de longueur au moins 6.

Par conséquent :

un + 1 = 2(un – un – 5) + un – 5 = 2un – un – 5 = un + (un – un – 5) = un + un – 1 + un – 2 + un – 3 + un – 4

ce qu’il fallait prouver.

 On peut maintenant calculer u100 avec la calculatrice. Plutôt que d’écrire une fonction, servons- nous de la réflexion matricielle que nous avons mise en œuvre lors de l’étude de la suite de Fibonacci.

La transformation matricielle du problème en avait accéléré le traitement. En posant :

0 1 0 0 0

0 0 1 0 0

0 0 0 1 0

0 0 0 0 1

1 1 1 1 1

 

 

 

 

 

M

on peut écrire :

4 5

3 4

2 3

1 2

1

 



   

   

   

   

   

n n

u u

u M u

u u

Par conséquent, et de proche en proche :

96 95 94 1

97 96 95 2

2 95 95

98 97 96 3

99 98 97 4

5

100 99 98

2 4

... 8

16 32

         

         

          

         

           

     

u u u u

u M u M u M u M

u u u u

u

u u u

.

Il ne reste plus qu’à finir le calcul à la calculatrice. On rappelle que pour enter la matrice on tape [0,1,0,0,0;0,0 etc.]… le point-virgule permettant de changer de ligne…

Le nombre cherché u100 est le cinquième du vecteur colonne obtenu :

(27)

et la probabilité qu’une suite de 100 termes contiennent au moins 6 éléments consécutifs égaux est :

100

1 100

2u

 0,806 soit un peu plus de 80 % !

Remarquons que si l’on jette la pièce 200 fois, l’événement est devenu presque une certitude :

2.5 Obtenir tous les numéros quand on jette un dé

 C’est une question que l’on peut se poser naturellement : combien de fois faut-il en moyenne lancer un dé pour obtenir les 6 numéros possibles au moins une fois²⁰ ?

Six coups au minimum sont nécessaires, si l’on a de la chance… mais il est possible au moins en théorie de poursuivre indéfiniment les lancers...

 Écrivons pour commencer un programme, pour à la fois voir la succession des résultats et le nombre de coups nécessaires à obtenir toutes les faces du dé.

On peut par exemple procéder de la façon suivante. Tout d’abord, une liste l de 6 éléments est initialisée à 0. Lorsqu’un numéro sort, par exemple le 2, on met la valeur 1 dans l[2]. On s’arrête lorsqu’il n’y a plus que des 1 dans l – et donc lorsque le produit de ses éléments fait 1.

Parallèlement au travail précédent, on mémorise dans une liste rr les résultats successifs du jet du dé.

20 Ou bien combien faut-il acheter de tablettes de chocolat Poulain pour avoir les 10 images d’une collection complète. Dans un cadre général, c’est ce que l’on appelle un problème de collection.

(28)

On obtient par exemple les résultats suivants :

Cette fonction étant écrite, on peut en proposer l’analyse dans une page Tableur & listes.

Dans la zone grisée de la colonne A, on rentre =collec(6). Cette colonne peut être appelée a.

Enfin dans la cellule B1, on saisit alors =dim(a) et on stocke le résultat dans une variable r. On peut alors observer les différents résultats obtenus.

On peut alors observer ce qui se passe et selon les expériences réalisées, voir varier le nombre de lancers nécessaires pour obtenir tous les numéros du dé.

Évidemment, il est souhaitable en capturant les données de garder la trace de tous les résultats obtenus. En utilisant le procédé habituel, on capture les différentes valeurs de r dans la colonne C :

(29)

dans B1, on met dim(a)+rand()/10^8 ;

on capture r égale à la valeur précédente dans la colonne C ;

dans la zone grisée de la colonne D, on saisit =int(C[]) pour neutraliser l’effet de rand(), on nomme alors d la colonne D.

Enfin, on peut demander en E1 le calcul de la moyenne de la colonne D et son nombre d’éléments en E2.

Il semble qu’en moyenne il faille entre 14 et 15 coups pour qu’en jetant un dé, on ait obtenu tous les résultats possibles. On peut faire une étude statistique plus détaillée, soit avec des histogrammes ou encore avec des boîtes à moustaches.

Remarquons que dans un cas, il a fallu attendre jusqu’à 72 lancers de dé pour qu’apparaissent les 6 numéros : c’est la plus grande valeur qu’on observe sur la boîte à moustaches précédente !

(30)

 Étude théorique

Tentons de modéliser cette situation. Une série de lancers peut être représentée par une liste ordonnée d’entiers compris entre 0 et 6, comme par exemple :

(4,4,3,6,6,4,5,1,4,5,

2

,2,2,2,5,…)

Notons que cette liste peut être poursuivie indéfiniment.

Si l’on observe l’exemple précédent, on a obtenu tous les numéros du dé en 11 lancers, à l’apparition du premier 2, représenté en grand dans la liste.

Appelons X la variable aléatoire réelle égale au nombre de lancers nécessaires pour obtenir pour la première fois au moins une fois chaque face. X est susceptible de prendre pour valeurs tous les entiers naturels supérieurs ou égaux à 6²¹. Sur l’exemple précédent, X prend la valeur 11.

Nous nous proposons de déterminer la loi de X.

Nous commencerons par nous intéresser à l’événement X  n, que nous noterons An, où n est un entier supérieur ou égal à 6.

Quelle est la probabilité de An ?

Quand l’événement An est réalisé, cela signifie qu’on a obtenu tous les numéros du dé au bout du n^e lancer, pas nécessairement pour la première fois au rang n mais certainement à un rang k  n.

Ainsi pour la série qui nous a servi d’exemple précédemment où X prend la valeur 11, les événements A15 par exemple ou A20 sont réalisés, car au bout de 15 ou 20 lancers, on a bien obtenu tous les numéros du dé.

Raisonnons par événement contraire.

L’événement A_n signifie qu’au cours des n lancers, il manque au moins un numéro, c’est-à-dire qu’il manque le 1, ou le 2, ou le 3, ou le 4, ou le 5 ou le 6²².

En notant B_in l’événement « au cours des n lancers, le numéro i n’est pas sorti », pour k entier entre 1 et 6, on peut écrire :

1 2 ... 6

   

n n n n

A B B B .

Pour calculer p A

 

n , la formule de Poincaré²³ s’impose. Elle s’écrit :

       

   

 

1 2 6

1 6 1 6 1 6

1 6 1 6

1 2 3 4 5 6

...

        

          

        

        

     

  

 

n n n in in jn in jn kn

i i j i j k

in jn kn ln in jn kn ln pn

i j k l i j k l p

n n n n n n

p B B B p B p B B p B B B

p B B B B p B B B B B

p B B B B B B

Évaluons d’abord les p B

 

in pour i = 1,…,6 c’est-à-dire la probabilité qu’un numéro donné ne sorte pas au cours des n lancers.

Pour un lancer, cette probabilité vaut 5

6 et donc pour les n lancers indépendants, elle vaut 5 6

  

 

n

. Six termes de ce type figurent dans la formule de Poincaré, pour chacun des six numéros possibles.

21 Mais pas moins !

22 Ou inclusif car plusieurs numéros peuvent manquer… mais pas tous !

23 Qui donne la probabilité de la réunion d’un nombre fini d’événements.

(31)

On aura aussi besoin de p B



in^Bjn



pour i  j qui n’est autre que la probabilité que les deux numéros i et j ne sortent pas, probabilité qui vaut 4

6

  

 

n

avec 6 2 15

 

   termes de ce type dans la formule.

Puis

 

³

6

      

n

in jn kn

p B B B , avec 6

3 20

 

   termes dans la formule.

On poursuit sur la même lancée avec :

6 15

4

 

   termes tous égaux à 2 6

  

 

n

pour les intersections des événements quatre à quatre ;

6 6

5

 

   termes tous égaux à 1 6

  

 

n

pour les intersections des événements cinq à cinq ;

1 terme égal à 0 pour l’intersection des 6 événements… car au cours des n lancers, obligatoirement un numéro est sorti.

La formule de Poincaré permet alors d’écrire :

  ^

1 2 ... 6

^

5 4 3 2 1

6 15 20 15 6 0

6 6 6 6 6

   

         

                    

n n n n

n n n n n

p A p B B B

Par conséquent :

   

¹

 

5 4 3 2 1

1 6 15 20 15 6

6 6 6 6 6

6 6 5 15 4 20 3 15 2 6

6

   

         

               

         

        



n n

n n n n n

n

p X n p A p A

Nous sommes maintenant en mesure de déterminer la loi de X. En effet, on peut écrire :



Xn

 

 Xn

 

 X n 1



… le – ici étant un moins d’ensemble… et en déduire :









 

_n 



_n1



p X n p A p A … ce qui conduit à la valeur suivante pour ^{p X}



^ⁿ



^:

 

1 1 1 1 1

1

2 1 1 1 1

1 1 1 1 1 1

6 6 5 15 4 20 3 15 2 6 6 6 5 15 4 20 3 15 2 6

6 6

6 6 5 15 4 20 3 15 2 6 6 6 5 90 4 120 3 90 2 36

6

6 5 30 4 60 3 60 2 30 5 5 4 10 3

6

n n n n n n n n n n

n n

n n n n n n n n n n

n

n n n n n n n

n

p X n

    



   

      

                 

  

                  



           

  ₁ ¹ 10 2 ¹ 5

6

n n



  

Cette formule, quelque peu compliquée, peut être retrouvée en utilisant le dénombrement des surjections proposé en annexe, dénombrement qui s’appuie sur une démonstration très proche que celle qu’on vient de faire.

(32)

Conservons les mêmes notations. Un lancer particulier peut être représenté par une liste ordonnée d’entiers compris entre 1 et 6, comme par exemple :

(1,3,2,4,5,1,2,3,5,6,3,6,…).

Sur cet exemple, on a obtenu tous les numéros du dé en 10 lancers : tous les numéros de 1 à 5 sur les 9 premiers lancers, puis le 6 au dixième lancer.

Dénombrons les séquences de 10 lancers donnant les 6 numéros du dé et se terminant par un 6.

Or donc, il n’y a qu’une façon de choisir le 6 en 10^e place.

Pour les 10 – 1 = 9 premières places, on peut associer à un tirage particulier une surjection de l’ensemble E = {1,2,3,4,5,6,7,8,9} sur l’ensemble F = {1,2,3,4,5} : l’image de i  E est le résultat obtenu par le dé au i^e lancer.

C’est bien une surjection car chaque numéro autre que 6 doit être obtenu au moins une fois dans les 9 premiers tirages. Inversement, toute surjection de E sur F définit clairement un tirage. Par exemple celle qui correspond à notre tirage de référence serait la surjection suivante :

1 2 3 4 5 6 7

8 9

1 2

3

4

5

Il y a donc autant de tirages possibles en 10 lancers se terminant par 6 que de surjections de {1,2,3,4,5,6,7,8,9} sur l’ensemble {1,2,3,4,5} : soit ^S

 

^9,5 , que nous savons dénombrer dans l’annexe de ce chapitre.

Pour des raisons évidentes de symétrie, il y en a autant qui se terminent par 5, ou 4, ou 3, ou 2, ou 1.

Le nombre de tirages qui donnent tous les numéros du dé en 10 lancers est égal à 6 S(9,5). Comme il existe 6¹⁰ résultats possibles, tous équiprobables, lorsqu’on jette le dé 10 fois, on en déduit que :

   

10

6 9,5

10 6

p X S

 

Mais le raisonnement que nous venons de tenir est susceptible d’être généralisé à une quelconque valeur n  6.

En procédant de la même façon, dénombrons d’abord toutes les listes se terminant au n^e lancer par 6, et ayant vu dans les n – 1 premiers lancers tous les numéros de 1 à 5 : pour les mêmes raisons que précédemment, il y en a autant que de surjections de {1,2,...,n–1} sur l’ensemble {1,2,3,4,5}, soit



^1,5



S n .

La probabilité que les 6 numéros sortent en n lancers exactement est donc

   

1

6 1,5 1,5

6ⁿ 6ⁿ

S n S n



  

 .

On retrouve bien la formule précédente, sans doute de façon plus simple, car :

(33)

 

¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹ ¹

1 1 1

5 5 5 5

5 4 3 2 1

1,5 1 2 3 4 5 5 4 10 3 10 2 5 1

6 6 6

n n n n n

n n n

S n

    

  

       

       

                  

On peut maintenant faire apparaître dans le tableur les probabilités d’obtenir tous les numéros en k lancers, à partir de k = 6 :

On observe un maximum pour n = 11. La probabilité décroît très vite, pour être quasiment nulle à partir de n = 40.

On a fait figurer dans la cellule E1 le calcul d’une valeur approchée de l’espérance mathématique de X pour les valeurs affichées dans le tableur (sur notre exemple de 6 à 100) : on trouve environ 14,7.

Faisons le calcul exact de cette espérance à partir des formules que nous avons établies. On sait que c’est la somme de la série suivante :