• Aucun résultat trouvé

Chapitre 13 et 14 - Notion de probabilité

N/A
N/A
Protected

Academic year: 2022

Partager "Chapitre 13 et 14 - Notion de probabilité"

Copied!
12
0
0

Texte intégral

(1)

Chapitre 13 et 14 - Notion de probabilité

Ce cours permet un travail à plusieurs niveaux :

Force 1 L’essentiel pour le kit de survie pour les élèves ne prenant pas la spécialité « mathématiques » en première.

C’est le niveau préconisé par le programme.

Force 3 des compléments pour les élèves qui souhaitent aller un peu plus loin.

I. Vocabulaire

Statistiques ? Probabilités ?

 Les statistiques étudient des événements qui se sont vraiment déroulés dans le passé. A partir d'un grand nombre de données recueillies, les statisticiens analysent, interprètent, résument, présentent ces informations, recherchent des liens, etc. Les statistiques sont ancrées dans la réalité.

La fréquence est le rapport entre le nombre d'évènements effectivement réalisés et l'effectif de l'échantillon.

 Les probabilités s'intéressent quant à elles à l'avenir. Elles essayent de fournir des modélisations efficaces pour les phénomènes aléatoires.

La probabilité, est un nombre « théorique » qui indique la tendance de voir se réaliser un évènement.

Sondage Lorsqu’on travaille sur une très grande population, il est souvent impossible de relever toutes les données.

On limite alors l’étude à une partie de la population. On dit qu’on a prélevé un échantillon.

Un enjeu majeur est d’obtenir un échantillon représentatif de la population. Une méthode consiste à tirer au hasard la composition de l’échantillon.

Echantillon de taille 𝒏 dans le cadre d’une expérience aléatoire

Lorsqu’on répète 𝑛 fois de manière indépendante une même expérience aléatoire, on appelle échantillon de taille n l’ensemble des 𝑛 résultats.

Exemple : on lance une pièce et on note la face obtenue.

Pour obtenir un échantillon de taille 3, on effectue trois lancers de suite. Il y a 8 échantillons possibles et, pour chacun d’eux, on peut calculer la fréquence d’apparition de « pile ».

(𝑃; 𝑃; 𝑃) 𝑓𝑝𝑖𝑙𝑒= 1 (𝐹; 𝑃; 𝑃) 𝑓𝑝𝑖𝑙𝑒=2

3 (𝑃; 𝐹; 𝑃) 𝑓𝑝𝑖𝑙𝑒=2

3 (𝑃; 𝑃; 𝐹) 𝑓𝑝𝑖𝑙𝑒=2

3

(𝐹; 𝐹; 𝑃) 𝑓𝑝𝑖𝑙𝑒=1

3 (𝐹; 𝑃; 𝐹) 𝑓𝑝𝑖𝑙𝑒=1

3 (𝑃; 𝐹; 𝐹) 𝑓𝑝𝑖𝑙𝑒=1

3 (𝑃; 𝑃; 𝑃) 𝑓𝑝𝑖𝑙𝑒= 0

II. Simuler une expérience aléatoire

Un générateur de nombres pseudo-aléatoires est un algorithme qui renvoie une séquence de nombre présentant certaines similitudes avec le « hasard » : il est difficile de distinguer une séquence de nombres obtenus par une expérience aléatoire, d’une séquence générée par l’algorithme.

Les simulations d’expériences aléatoires vont nous permettre d’obtenir rapidement des résultats « assez proches » de ceux qu’on aurait pu avoir en réalisant réellement l’expérience.

1 2 3

1

1

1

(2)

Les calculatrices et de nombreux langages de programmation implémentent un générateur pseudo-aléatoire. Sous Python, pour l’utiliser, on doit mettre en-tête de programme, l’instruction 𝑓𝑟𝑜𝑚 𝑟𝑎𝑛𝑑𝑜𝑚 𝑖𝑚𝑝𝑜𝑟𝑡 * pour pouvoir utiliser les instructions le générateur.

 𝑟𝑎𝑛𝑑𝑖𝑛𝑡(𝑎, 𝑏) renvoie un entier de l’intervalle [𝑎 ; 𝑏]. Chaque entier a la même probabilité d’être choisi.

 𝑟𝑎𝑛𝑑𝑜𝑚() renvoie un nombre de l’intervalle [0 ; 1[

Exercice :

1) Comment simuler un tirage à pile ou face ? 2) Comment simuler le lancer d’un dé à six faces ?

3) Comment simuler le tirage d’un angle géométrique (angle dont la mesure est comprise entre 0° et 180°).

4) Comment simuler le choix au hasard d’une date dans l’année 2021

5) Comment simuler un tirage aléatoire dans une urne qui contient 2 boules blanches et 3 boules rouges.

Des solutions :

1) 𝑟𝑎𝑛𝑑𝑖𝑛𝑡(0, 1) On peut décider que 0 représente « pile » tandis que « 1 représente « face » 2) 𝑟𝑎𝑛𝑑𝑖𝑛𝑡(1, 6) simule le lancer d’un dé usuel à six faces.

3) Un angle a une mesure continue : elle peut prendre toutes les valeurs réelles [0 ; 180] aussi on va utiliser l’instruction 𝑟𝑎𝑛𝑑𝑜𝑚 plutôt que 𝑟𝑎𝑛𝑑𝑖𝑛𝑡

360 * 𝑟𝑎𝑛𝑑𝑜𝑚() simule le tirage aléatoire d’un angle en degré Justification : 0 ≤ 𝑟𝑎𝑛𝑑𝑜𝑚() < 1

En multipliant par 360 (positif) 0 ≤ 360*𝑟𝑎𝑛𝑑𝑜𝑚() ≤ 360 4) 𝑟𝑎𝑛𝑑𝑖𝑛𝑡(1, 365) simule le tirage d’un jour dans une année non bissextile.

1 désigne le premier janvier, 32 le premier février, …, 365 le 31 décembre.

5) 𝑟𝑎𝑛𝑑𝑖𝑛𝑡(1, 5) on peut imaginer que sur chaque boule on rajoute un numéro à la main

On décide que 1, 2 désignent une boule blanche tandis que 3, 4, 5 désignent une boule rouge Autre idée

𝑟𝑎𝑛𝑑𝑜𝑚() Si le résultat est inférieur à 0.4 la boule est blanche, sinon elle est rouge.

Illustration :

III. Problématique

Situation : Un sac contient une boule rouge et deux boules blanches.

On pioche au hasard une boule et on note sa couleur.

Il est communément admis qu’il y a une chance sur trois d’obtenir une boule rouge.

Problématique Qu’est-ce que cela veut dire ?

Ecrire sa réponse sous forme de phrase sur son brouillon puis vérifier qu’elle ne figure pas parmi les réponses suivantes … qui sont fausses.

2

2

1

(3)

Des réponses non satisfaisantes d’élèves

 « Comme il y a deux couleurs possibles, blanche et rouge, les chances d’obtenir la boule rouge ne sont pas de 13 mais de 12 ». Il y a une confusion entre le nombre d’issues et la probabilité de chacune des couleurs.

 « Cela veut dire que pour 3 tirages de suite avec remise, on obtient une boule rouge et deux boules blanches » Cette conception est complétement erronée. Par exemple à « pile ou face », il est facile d’obtenir deux piles de suite en deux lancers … essayez (recommencer plusieurs fois si nécessaire) !

 « Cela veut dire que le nombre de boules rouges tirées est le tiers du nombre de tirage. »

Ne pas confondre le nombre de « rouge » avec la fréquence des « rouges ». De même, il faut différencier le nombre de boules « rouges » et la fréquence des boules « rouges ».

Imaginons que nous ayons fait 900000 tirages avec 270000 boules rouges. L’écart entre 300000 (le tiers du nombre de tirages) et 270 000 (le nombre de boules rouges réellement obtenues) est énorme : il y a 30000 boules de différence ! Et pourtant, 270 000900 000= 0,3 ≈1

3

De même, au jeu de pile ou face, il est erroné de penser que sur un grand nombre de lancers, le nombre de

« pile » et le nombre de « face » vont forcément s’égaliser. Ce sont les fréquences de « pile » et de « face » qui sur un grand nombre de lancers, sauf exception, vont devenir toutes les deux proches de 1

2.

« Cela veut dire qu’il y a un cas qui permet d’obtenir la boule rouge sur trois cas possibles » Nous ne validerons pas ici cette interprétation de la probabilité car :

- elle n’est pas assez générale : dans la roulette ci-contre, il y a aussi un seul secteur gris pour trois secteurs au total et pourtant on pressent bien qu’il n’y a pas une chance sur trois d’obtenir le secteur gris

- cette affirmation correspond bien au calcul d’une probabilité dans des cas très particuliers mais les conditions d’utilisation ne sont pas évoquées par l’élève !

 « Cela veut dire qu’il y a 33,3 % de chances d’obtenir la boule rouge »

« Cela veut dire que la probabilité d’obtenir la boule rouge est de 13 »

Ces interprétations ne sont que des redites de l’énoncé en utilisant un vocabulaire différent : elles n’apportent aucune information supplémentaire.

« On ne peut pas prédire c’est du hasard »

Les probabilités sont des prédictions théoriques. Effectivement, elles ne décrivent pas une certitude mais des tendances assez performantes si elles sont bien utilisées et interprétées.

Le saviez-vous ? Si vous jouez une grille à l’EuroMillions, vous avez presque autant de chances de tirer la seule boule rouge dans une urne qui contient aussi 140 millions de boules blanches que de remporter le gros gain !

Par contre, cela ne veut pas dire qu’il n’y a jamais de gros gagnants. En 2020, en moyenne, il a été joué plus de 55 millions de grilles par semaine …

Modélisation On fait le choix de l’équiprobabilité des 3 boules Couleur Rouge Blanche Probabilité 1

3

2 3 Dans la situation, comment interpréter que 𝑃(𝑅𝑜𝑢𝑔𝑒) =1

3 ?

En s’appuyant sur ce modèle, on va pouvoir faire des simulations. Ils vont nous permettre d’affiner nos conceptions des probabilités. Mais en aucun cas de prouver que 𝑃(𝑅𝑜𝑢𝑔𝑒) =1

3 puisque cette probabilité est utilisée pour produire les simulations.

(4)

IV. Une première interprétation avec la loi des grands nombres

Algorithme : Compléter la fonction Python, nommée 𝑓𝑟𝑒𝑞𝑢𝑒𝑛𝑐𝑒_𝑒𝑐ℎ𝑎𝑛𝑡𝑖𝑙𝑙𝑜𝑛 qui simule un échantillon de taille 𝑛 puis renvoie la fréquence des boules rouges dans l’échantillon.

L’instruction Python 𝑟𝑎𝑛𝑑𝑖𝑛𝑡(1,3) renvoie soit 1, soit 2, soit 3 avec la même probabilité.

Pour l’utiliser, on doit déclarer le module 𝑟𝑎𝑛𝑑𝑜𝑚 en début de fichier en mettant l’instruction :

𝑓𝑟𝑜𝑚 𝑟𝑎𝑛𝑑𝑜𝑚 𝑖𝑚𝑝𝑜𝑟𝑡 ∗

Correction Pour comprendre le code : on peut imaginer que l’on a ajouté, à l’aide d’un marqueur, un numéro sur chaque boule. La boule rouge porte le numéro 1 tandis que les deux blanches sont marquées 2 et 3.

Les marques si elles existaient ne changerai pas les chances pour chaque boule d’être tirée.

Le code ci-contre peut être copier/coller dans 𝐸𝑑𝑢𝑃𝑦𝑡ℎ𝑜𝑛 ou en ligne sur codabrainy.com

from random import *

def frequence_echantillon( n ) : rouge = 0

for k in range(1, n+1) : if randint(1, 3) == 1 : rouge = rouge + 1 return( rouge / n )

Simulations Sous EduPython, en mode console, on a tapé le code ci-contre.

La fonction 𝑓𝑟𝑒𝑞𝑢𝑒𝑛𝑐𝑒_𝑒𝑐ℎ𝑎𝑛𝑡𝑖𝑙𝑙𝑜𝑛 simule 𝑛 tirages puis renvoie la fréquence des boules rouges parmi les 𝑛 boules.

Correction de l’interprétation :

 Il y a eu 9 échantillons simulés :

o le premier de taille 5 ne contenait aucune boule « Rouge »

o dans le deuxième de taille 20, 20 % des boules sorties sont rouges donc il y a 20 × 0,2 boules rouges o dans le troisième de taille 80, la fréquence des boules rouges est de 0,34 environ.

o …

D’une étape à l’autre, la taille 𝑛 de l’échantillon est multipliée par 4.

 On constate que lorsque la taille de l’échantillon est grande, sauf exception, la fréquence observée est proche de la probabilité 13

 Quand la taille des échantillons est petite, la prédiction peut être loin d’être vérifiée !

On peut aussi remarquer que pour l’échantillon de taille 1280, la fréquence obtenue 0,33 est plus proche de la probabilité 1

3 que pour l’échantillon de taille 5120.

1 2

2

(5)

Dire qu’« il y a 1 chance sur 3 d’obtenir la boule rouge » peut s’interpréter comme « si on recommence un grand nombre de fois l’expérience aléatoire, la fréquence de rouge a tendance à être proche de 13. ».

Mais une tendance n’est pas une certitude : on peut tomber sur des échantillons exceptionnels (au sens où ils existent mais sont assez rares parmi tous les échantillons de taille fixée) !

Loi des grands nombres :

C’est le nom d’un théorème de mathématique qui a des conditions précises d’utilisation et qui se démontre à l’aide du calcul des probabilités. Nous en donnons, ici, simplement une formulation vulgarisée :

Lorsque la taille de l’échantillon est grande, sauf exception, la fréquence observée est proche de la probabilité

V. Une deuxième interprétation avec l’évolution des fréquences

Comprendre un graphique

Toujours avec la même urne qui contient une boule rouge et deux boules blanches, on a simulé 5 tirages, on calcule la fréquence de boules rouges obtenues depuis le début.

Sur un graphique, on place les points que l’on relie par des segments pour bien visualiser l’ordre.

Numéro tirage 1 2 3 4 5

Résultat B B R R B

Fréquence « rouge » 0 0 1

3≈ 0,333 2

4= 0,5 2 5= 0,4 Points sur graphique (1 ; 0) (2 ; 0) (3 ; 0,333) (4 ; 0,5) (5 ; 0,4)

Exercice : Dans la même situation, en procédant de même, mais avec d’autres simulations, on a obtenu le graphique ci-contre.

1) Que représentent les nombres sur l’axe des abscisses ? 2) Que représentent les nombres sur l’axe des ordonnées ? 3) Qu’indique le point de coordonnées (4 ; 0,5) ?

4) Combien a-t-on fait de simulations ?

5) Donner la liste des couleurs relevée dans l’ordre d’apparition

6) Si on avait fait une autre simulation et qu’on avait obtenu

« rouge », quelles auraient été les coordonnées du point ? 7) Donner un titre au graphique.

Réponses

1) Les numéros des tirages

2) Les fréquences des boules rouges obtenus depuis le début

3) Après le quatrième tirage, la fréquence des boules rouges parmi les boules tirées était de 0,5.

Dit autrement, après quatre tirages, on a obtenu autant de boules blanches que de boules rouges.

1

1

(6)

4) Il y a eu 7 simulations de tirages 5) R B R B B B R

6) En rajoutant une boule rouge on aurait eu 4 boules rouges en 8 tirages, soit une fréquence de 48= 0,5.

Le point aurait eu comme coordonnées (8 ; 0,5)

7) Un titre possible : « Evolution de la fréquence des boules rouges au fur et à mesure des tirages »

Remarque : Il y a peu de tirages … on ne voit pas le lien avec 1

3 (la probabilité d’obtenir une boule rouge)

Exercice : visualiser le graphique quand le nombre de simulations devient plus important Le code ci-contre, permet de réaliser des simulations

dans la situation et de visualiser l’évolution des .

fréquences des boules rouges

On ne demande ni de comprendre le code, ne de savoir le refaire … juste de savoir interpréter les résultats.

1) Copier le code ci-contre dans 𝐸𝑑𝑢𝑃𝑦𝑡ℎ𝑜𝑛 ou en ligne sur codabrainy.com

2) L’exécuter plusieurs fois ! 3) Commenter

from random import * # utiliser randint import matplotlib.pyplot as plt # pour tracer

def evolution_fréquence(n) :

X = [] # liste abscisses: le numéro du tirage Y = [] # liste ordonnées: la fréquence de rouges rouge = 0

for k in range(1, n+1):

if randint(1, 3) == 1:

rouge = rouge + 1 X.append( k ) Y.append( rouge/ k ) plt.plot(X, Y)

plt.grid(True) plt.show()

# execution

evolution_fréquence(2000)

Correction : une deuxième interprétation de la probabilité 𝟏𝟑

Voici le résultat d’une des simulations faites. Bien entendu, les résultats changent d’un échantillon à l’autre : c’est la fluctuation1 d’échantillonnage.

1 « Variations successives et en sens contraires (surtout pluriel) » d’après le dictionnaire Larousse

Zone zoomée ci-dessous

1

(7)

En calculant la fréquence d’apparition des boules rouges depuis le début, au fur et à mesure des tirages, on constate que :

 au début, les fluctuations sont très importantes

 pour 𝑛 suffisamment grand, la fréquence de boules rouges parmi les 𝑛 tirages semble devoir se stabiliser autour d’un nombre que l’on peut penser être 13

Attention, la fréquence continue de fluctuer mais les variations deviennent imperceptibles (sans zoomer sur le graphique). Voici un grossissement pour 𝑛 proche de 2000 :

Si au lieu de les simuler, nous avions fait réellement répéter de manière indépendante, les tirages, nous aurions (sauf exceptions) obtenu une stabilisation proche de 13. Ceci en vertu de la loi des grands nombres, dont voici une autre formulation grossière appliquée à notre situation :

Dire qu’« il y a 1 chance sur 3 d’obtenir la boule rouge » peut s’interpréter comme « il est très peu probable que, si l’on fait un nombre suffisamment grand d’expériences, la fréquence des boules rouges ne se stabilise pas autour de 1

3 ».

Histoire des mathématiques

La loi des grands nombres apparait dans l’ouvrage Ars Conjectandi de Jacques Bernoulli. Ce livre sera publié de en 1713 par Nicolas Bernoulli (son neveu).

VI. Une troisième interprétation avec des « intervalles de fluctuations »

Intervalle, centre, rayon, distance de deux réels

1) a) Quel est le centre et le rayon de l’intervalle [−3 ; 9] ?

b) Traduire à l’aide d’une valeur absolue « la distance entre 𝑥 et 6 est inférieure ou égal à 3 » c) Sachant que 𝑟 > 0, traduire à l’aide d’une valeur absolue 𝑎 − 𝑟 ≤ 𝑥 ≤ 𝑎 + 𝑟

d) Traduire avec d’un intervalle puis d’une valeur absolue « 4 ≤ 𝑥 ≤ 10 »

2) On considère l’intervalle « cible » = [0,23 ; 0,43] . Voici cinq échantillons de taille 7.

(𝐵; 𝐵; 𝑅; 𝐵; 𝐵; 𝐵 ) (𝐵; 𝐵; 𝑅; 𝐵; 𝑅; 𝐵 ) (𝐵; 𝐵; 𝐵; 𝐵; 𝐵; 𝐵 ) (𝑅; 𝐵; 𝑅; 𝐵; 𝐵; 𝑅 ) (𝑅; 𝐵; 𝑅; 𝐵; 𝑅; 𝑅 ) Calculer la proportion de ces échantillons qui ont une fréquence des boules rouges est dans 𝐼

Pour se corriger Question 1

a) [−3 ; 9] a pour centre 6 et pour rayon 3

b) « la distance entre 𝑥 et 6 est inférieure ou égal à 3 » si et seulement si

|𝑥 − 6| ≤ 3

c) 𝑎 − 𝑟 ≤ 𝑥 ≤ 𝑎 + 𝑟 si et seulement si |𝑥 − 𝑎| ≤ 𝑟

1

1

2

1

(8)

d) 4 ≤ 𝑥 ≤ 10 SSI 𝑥 appartient à l’intervalle de centre 7 et de rayon 3 SSI 𝑥 ∈ [4 ; 10] SSI |𝑥 − 7| ≤ 3

Question 2 On considère l’intervalle « cible » 𝐼 = [0,23 ; 0,43]. Voici cinq échantillons de taille 7.

 Dans (𝐵; 𝐵; 𝑅; 𝐵; 𝐵; 𝐵 ), la fréquence des boules rouges est 1

7≈ 0,143. Cette fréquence n’est pas dans 𝐼

 Dans (𝐵 ; 𝐵 ; 𝑅 ; 𝐵 ; 𝑅 ; 𝐵 ), la fréquence des boules rouges est 27≈ 0,286 Cette fréquence est dans 𝐼

 Dans (𝐵; 𝐵; 𝐵; 𝐵; 𝐵; 𝐵 ), la fréquence des boules rouges est 0. Cette fréquence n’est pas dans 𝐼

 Dans (𝑅; 𝐵; 𝑅; 𝐵; 𝐵; 𝑅 ), la fréquence des boules rouges est 3

7≈ 0,429. Cette fréquence est dans 𝐼

 Dans (𝑅; 𝐵; 𝑅; 𝐵; 𝑅; 𝑅 ), la fréquence des boules rouges est 4

7≈ 0,571 Cette fréquence n’est pas dans 𝐼 Comme 2

5= 0,4 = 40

100, 40 % des 5 échantillons de taille 7 ont leur fréquence de boules rouges dans 𝐼

Algorithme : Soit 𝑟 > 0. On définit l’intervalle « cible » [1

3 − 𝑟 ; 1

3+ 𝑟]. Il est centré sur 1

3 et de rayon 𝑟.

On génère 1000 échantillons de taille 𝑛.

On calcule la proportion des 1000 échantillons de taille 𝑛 pour lesquels la fréquence de boules rouges est dans l’intervalle « cible ».

1) A la suite de 𝑓𝑟𝑒𝑞𝑢𝑒𝑛𝑐𝑒_𝑒𝑐ℎ𝑎𝑛𝑡𝑖𝑙𝑙𝑜𝑛 , écrire une fonction Python, nommée 𝑑𝑎𝑛𝑠_𝑐𝑖𝑏𝑙𝑒 , qui

 prend comme paramètre 𝑛 la taille des échantillons et 𝑟 le rayon de l’intervalle

 simule 1000 échantillons de taille 𝑛

 renvoie la proportion des échantillons dont la fréquence des rouges est dans [1

3− 𝑟 ; 1

3+ 𝑟 ] 2) En mode console, on exécute les instructions

Interpréter les résultats obtenus

Correction

Question 1

On peut remplacer la ligne contenant le 𝑖𝑓 par

qui utilise la fonction absolue, 𝑎𝑏𝑠 en Python qui renvoie la valeur absolue d’un réel.

La distance entre les réels 𝑥et 𝑦 est donnée par : 𝑎𝑏𝑠(𝑥 − 𝑦) qu’on note en mathématiques |𝑥 − 𝑦|

Question 2

 Le rayon de l’intervalle est 0,01. L’intervalle « cible » est dont : [13− 0,01 ;13+ 0,01] ≈ [0,332 ; 0,334]

 Il y a eu quatre séries de 1000 échantillons simulés

Parmi les 1000 échantillons de taille 10, aucun n’avait une fréquence de « rouge » dans l’intervalle « cible » 16,7 % des 1000 échantillons de taille 100 avait une fréquence de « rouge » dans l’intervalle « cible »

2

1

(9)

52 % des 1000 échantillons de taille 1000 avait une fréquence de « rouge » dans l’intervalle « cible » 97,1 % des 1000 échantillons de taille 10000 avait une fréquence de « rouge » dans l’intervalle « cible »

Utiliser un nuage de points pour comprendre

Dans les échantillons (𝐵; 𝐵; 𝑅; 𝐵; 𝐵; 𝐵 );

(𝐵; 𝐵; 𝑅; 𝐵; 𝑅; 𝐵 ) ; (𝐵; 𝐵; 𝐵; 𝐵; 𝐵; 𝐵) ; (𝑅; 𝐵; 𝑅; 𝐵; 𝐵; 𝑅 ) ; (𝑅; 𝐵; 𝑅; 𝐵; 𝑅; 𝑅 ) les fréquences respectives de «boules rouges sont 1

7 ;2

7; 0 ;3

7 ;4

7

Dans un repère, en mettant en abscisses le numéro de l’échantillon et en ordonnée la fréquence de rouge dans l’échantillon, on obtient cinq points.

Voici un graphique construit sur le même principe. Chaque point

représente un échantillon de taille 500.

1) Combien a-t-on simulé d’échantillons ? 2) Les droites horizontales ont pour

équations respectives 𝑦 =1

31

√500 et 𝑦 =1

3+ 1

√500

Déterminer la proportion des échantillons dont la fréquence des boules rouges est dans l’intervalle

« cible » [ 1

31

√500 ; 1

3+ 1

√500]

Pour se corriger

1) La plus grande abscisse pour un des points du graphique est 100 donc on a simulé 100 échantillons.

2) On dénombre 4 échantillons sur les 100 qui ne sont pas sur ou entre les deux droites : soit 4 % des échantillons.

Il y a donc 96 % des échantillons dont la fréquence de boules rouges est dans [ 1

31

√500 ; 1

3+ 1

√500].

Une troisième interprétation de la probabilité 𝟏𝟑 On se fixe un intervalle centré sur 1

3 et de rayon 𝑟. On fixe : 𝑟 « assez petit ».

Pour 𝑛 suffisament grand, une grande majorité des échantillon de taille 𝑛, ont une fréquence d’apparition des boules rouges dans l’intervalle « cible » [1

3− 𝑟 ;1

3+ 𝑟]

On démontre que pour 𝑛 assez grand, qu’environ 95 % des échantillons auront leur fréquence d’apparition de boules rouges dans l’intervalle de centre 1

3 et de rayon 1

√𝑛 1

1

(10)

Compléments facultatifs:

Pour ceux qui veulent générer d’autres graphiques, copier le code ci-dessous et l’exécuter dans 𝐸𝑑𝑢𝑃𝑦𝑡ℎ𝑜𝑛 ou en ligne sur

codabrainy.com

On ne demande pas ni de comprendre, ni de savoir refaire le code Python utilisé.

Vous pouvez changer la taille des échantillons, notamment

𝑡𝑎𝑖𝑙𝑙𝑒 = 30 𝑡𝑎𝑖𝑙𝑙𝑒 = 150 𝑡𝑎𝑖𝑙𝑙𝑒 = 500 𝑡𝑎𝑖𝑙𝑙𝑒 = 2000

En augmentant significativement la taille des échantillons, la proportion des échantillons « dans la cible » devient impressionnante !

import matplotlib.pyplot as plt from random import *

def frequence_echantillon(n):

rouge = 0

for k in range(1, n+1):

if randint(1,3) == 1 : rouge = rouge + 1 return( rouge / n )

def affiche_nuage(n) :

X = [ k for k in range(0,100) ] Y = []

nombre_echantillon = 100

for k in range(0, 100) :

f = frequence_echantillon(n) Y.append(f)

plt.plot(X, Y, "*")

plt.plot([0, nombre_echantillon], [0.28861, 0.28861]) plt.plot([0, nombre_echantillon], [0.378055, 0.378055]) plt.grid(True)

plt.show()

taille = 500

affiche_nuage( taille )

VII. Déterminer des probabilités

Première démarche : en choisissant un modèle

Considérons les situations suivantes : « pile ou face », « tirage dans une urne », « lancer de dés non truqués »,

« jeux de cartes », « tirage au sort d’un individu dans une population », etc.

Il parait naturel d’affecter les mêmes chances à chaque résultat possible. Il faut prendre conscience qu’il s’agit d’un choix : on fait le choix de l’équiprobabilité des issues possibles.

En 1816, Lacroix dans son Traité élémentaire de calcul des probabilités écrivait :

« La probabilité mathématique se forme, comme on le voit, en divisant le nombre de chances favorables à l’événement par le nombre de total des chances ; mais il faut faire attention que toutes les chances comparées soient également possibles ».

3

3

(11)

Jeu de « pile ou face » « Lancer d’un dé à quatre faces » « Urne contenant 2 boules blanches et 1 rouge »

Issues Pile Face Issues 1 2 3 4 Urne R B

Probabilités 1 2 1

2

Probabilités 1 4

1 4

1 4

1 4

Probabilités 1 3

2 3 Le modèle choisit est acceptable s’il permet des prédictions qui se vérifient dans la réalité.

Limitation de cette approche

Mais, comme le fait remarquer Jacques Bernoulli en 1713, de nombreux phénomènes de la vie réelle ne peuvent pas se modéliser ainsi : « cela peut se voir à peine dans quelques très rares cas et ne se produit presque pas en dehors des jeux de hasard (…) Mais qui donc parmi les mortels définira par exemple le nombre de maladies, (…) qui encore recensera les cas innombrables des changements auxquels l’air est soumis chaque jour

? (…) Il serait donc absolument d’un insensé de vouloir connaître quelque chose de cette matière »

Deuxième démarche :

Jacques Bernoulli a proposé de choisir comme probabilités les fréquences observées dans un grand nombre de cas suffisamment représentatifs : « Mais à la vérité ici s’offre à nous un autre chemin pour obtenir ce que nous cherchons. Ce qu’il n’est pas donné d’obtenir a priori l’est du moins a posteriori, c’est-à-dire qu’il sera possible de l’extraire en observant l’issue de nombreux exemples semblables…. »

C’est ce que font par exemple les assurances : en faisant des statistiques sur les dernières années écoulées, elles établissent des modèles probabilistes pour anticiper l’année à venir et fixer le montant des cotisations.

Exercice : 36 % de la population française est du groupe sanguin 𝑂 +

On choisit un lyonnais de moins de 20 ans au hasard et on regarde si son groupe sanguin est 𝑂 + Proposer une modélisation.

Réponse : L’âge n’a aucune influence sur le groupe sanguin. Le fait d’habiter Lyon ou ailleurs (sans doute) non plus. Du point de vue de l’appartenance au groupe 𝑂 +, les lyonnais de moins de 20 ans devrait constituer un échantillon représentatif de la population française, on choisit donc :

Issues 𝑂 + 𝑛𝑜𝑛 𝑂 +

Probabilités 0,36 0,64

Un peu d’histoire :

« Etats-Unis 1936. Deux candidats s’affrontent pour l’élection présidentielle américaine : Franklin Roosevelt, le président sortant, et Landon. On s’interroge : qui remportera ?

Le magazine Literary Digest, pour donner la réponse, ne lésine pas : il interroge deux millions d’électeurs sur leurs intentions de vote, et conclut, sûr de ses méthodes : Landon va l’emporter. George Gallup, de son côté, avec de petits moyens, n’interroge que 3000 personnes, et prédit publiquement, chiffres à l’appui, la réélection de Roosevelt. Sa prévision paraissait insignifiante, et pourtant … c’est bien Roosevelt qui a été élu cette année-là !

Pourquoi l’échantillon de loin le plus petit a-t-il été le plus fiable ?

Literary Digest avait trouvé pratique d’interroger son échantillon par téléphone, et ne s’était donc adressé qu’aux abonnés du téléphone. Or, en 1936, qui avait le téléphone même aux Etats-Unis ? La bourgeoisie, plus riche, plus cultivée, celle qui vivait en ville … et cela faussa le résultat, qui ne correspondait pas au vote de l’Américain moyen.

3 1

1 3

3

(12)

Représentatif ou pas ? Telle est la question ! Les statisticiens diront que l’échantillon de Literary Digest était biaisé. Gallup, lui, par contre, avait eu l’astuce de choisir un échantillon qui reflétait bien la population américaine : son échantillon était représentatif. »

Exemple proportion filles / garçon à la naissance

Expérience aléatoire : On titre au hasard un bébé parmi tous ceux qui sont aujourd’hui dans une maternité en France. On regarde s’il s’agit d’une fille ou d’un garçon. Modéliser.

 Première modélisation : on décide à priori qu’il y a autant de chances que ce soit un garçon ou une fille

Issues 𝐹𝑖𝑙𝑙𝑒𝑠 𝐺𝑎𝑟ç𝑜𝑛

Probabilités 0,5 0,5

 Seconde modélisation : on s’appuie sur les connaissances qu’on les démographes du passé

« En 1660, le négociant anglais GRAUNT découvrait, d’après les registres des baptêmes anglicans,

un rapport de 105 garçons pour 100 filles, rapport présentant deux étranges particularités : sa remarquable constance d’un pays à l’autre et d’une époque à l’autre et son accroissement après les guerres ou les famines ! ». En choisissant de prendre pour probabilités les fréquences, on obtient :

Issues 𝐹𝑖𝑙𝑙𝑒𝑠 𝐺𝑎𝑟ç𝑜𝑛

Probabilités 0,488 0,512

En 2019, en France, on a compté 349 105 naissances de filles sur 714 029 naissances au total.

Comme 349105

714029≈ 0,489 , le second modèle parait plus efficace.

A retenir

Cadre expérimental :

statistiques (analyse de résultats réels) fréquences observés

Cadre théorique :

calcul des probabilités (étude de modèles) probabilité d’un événement

Loi des grands nombres (par cœur)

Lorsque la taille de l’échantillon est grande, sauf exception, les fréquences observées sont proches des probabilités

3

1

Références

Documents relatifs

« Soient A, B, C les trois cordes. Les intersections en dedans du cercle de BC, de ÇA et de AB sont trois événements que l'on peut désigner par P, Q, R. La position d'une

Si les trois boules tirées sont rouges, le joueur gagne 100 € ; si exactement deux boules tirées sont rouges il gagne 15 € et si une seule est rouge il gagne 4 €.. Dans tous

On suppose maintenant qu’un candidat connaît la réponse correcte à deux questions et qu’il répond au hasard aux trois autres

d étant un réel positif, on note X d la variable aléatoire égale au nombre d’autocars n’ayant subi aucun incident après avoir parcouru d kilomètres. (b) Donne r le nombre

Remarque : le problème est mal posé : en effet, le pisciculteur pourra peut être rejeter l ’ hypothèse que son bassin contient autant de truites de chaque variété mais il ne

Traçons la parallèle à (AB) passant par C, la tangente au cercle en C. La corde [PQ] fait alors un angle α avec cette tangente, orientée comme le vecteur  AB. Pour chaque point

L'étendue est la différence entre la plus grande valeur et la plus petite valeur d'une série statistique ( on connaît donc son unité de mesure : la même que la série ).. Exemple

Si les briques des murs extérieurs ont été posées de cette manière, c’est certainement pour offrir le maximum de résistance aux attaques extérieures, aux tirs de l’ennemi,