D ´enombrement et ´echantillonnage
Laurent Delsol (MAPMO, Universit ´e d’Orl ´eans.)
Centre Galois, 21/06/2013, Orl ´eans.
(laurent.delsol@univ-orleans.fr)
Motivations g ´en ´erales
Dans de nombreuses situations on cherche `ad ´enombrer le nombre d’individus, d’animaux, de v ´eg ´etaux ou d’objets se trouvantdans une zone g ´eographiquedonn ´ee.
d ´ecompte exactdes individus souventtr `es difficile, voire impossible(grande ´etendue, population est trop
importante).
m ´ethodes d’ ´echantillonnage→approximation de la taille de la populationen n’observant que :
certains individus
certaines zones g ´eographiques.
L’objectif de cet atelier :
se familiariser avec ces m ´ethodes au travers de quelques exemples.
pr ´esenter les r ´esultats math ´ematiques sur lesquels elles reposent.
Plan de l’atelier
1 Introduction
2 Echantillonnage al ´eatoire
3 M ´ethode de capture re-capture
4 Maximum de vraisemblance
5 Conclusion
Tests m ´edicaux Sondages
Sondages sur donn ´ees sensibles
Observations r ´ep ´et ´ees de ph ´enom `enes al ´eatoires
Chaque participant lance6 fois 5 d ´eset note les r ´esultats.
Calculer lescore moyen et le nombre de 5 ou 6observ ´es.
Comparer les r ´esultats obtenus par chacun d’entre vous.
D’o `u proviennent ces diff ´erences ? Lorsqu’on lance un d ´e :
quelle est la probabilit ´e que l’on tombe sur une certaine face ?
quelle est la probabilit ´e de tomber sur 5 ou 6 ? quel est le score moyen auquel on peut s’attendre ? Quelle est la proportion globale de 5 ou 6 observ ´es ? Quelle est la moyenne globale des scores obtenus ? Que remarquez-vous ?
Observations r ´ep ´et ´ees de ph ´enom `enes al ´eatoires
Chaque participant lance6 fois 5 d ´eset note les r ´esultats.
Calculer lescore moyen et le nombre de 5 ou 6observ ´es.
Comparer les r ´esultats obtenus par chacun d’entre vous.
D’o `u proviennent ces diff ´erences ? Lorsqu’on lance un d ´e :
quelle est la probabilit ´e que l’on tombe sur une certaine face ?
quelle est la probabilit ´e de tomber sur 5 ou 6 ? quel est le score moyen auquel on peut s’attendre ? Quelle est la proportion globale de 5 ou 6 observ ´es ? Quelle est la moyenne globale des scores obtenus ? Que remarquez-vous ?
Observations r ´ep ´et ´ees de ph ´enom `enes al ´eatoires
Chaque participant lance6 fois 5 d ´eset note les r ´esultats.
Calculer lescore moyen et le nombre de 5 ou 6observ ´es.
Comparer les r ´esultats obtenus par chacun d’entre vous.
D’o `u proviennent ces diff ´erences ? Lorsqu’on lance un d ´e :
quelle est la probabilit ´e que l’on tombe sur une certaine face ?
quelle est la probabilit ´e de tomber sur 5 ou 6 ? quel est le score moyen auquel on peut s’attendre ? Quelle est la proportion globale de 5 ou 6 observ ´es ? Quelle est la moyenne globale des scores obtenus ? Que remarquez-vous ?
Observations r ´ep ´et ´ees de ph ´enom `enes al ´eatoires
Chaque participant lance6 fois 5 d ´eset note les r ´esultats.
Calculer lescore moyen et le nombre de 5 ou 6observ ´es.
Comparer les r ´esultats obtenus par chacun d’entre vous.
D’o `u proviennent ces diff ´erences ? Lorsqu’on lance un d ´e :
quelle est la probabilit ´e que l’on tombe sur une certaine face ?
quelle est la probabilit ´e de tomber sur 5 ou 6 ? quel est le score moyen auquel on peut s’attendre ? Quelle est la proportion globale de 5 ou 6 observ ´es ? Quelle est la moyenne globale des scores obtenus ? Que remarquez-vous ?
Observations r ´ep ´et ´ees de ph ´enom `enes al ´eatoires
Chaque participant lance6 fois 5 d ´eset note les r ´esultats.
Calculer lescore moyen et le nombre de 5 ou 6observ ´es.
Comparer les r ´esultats obtenus par chacun d’entre vous.
D’o `u proviennent ces diff ´erences ? Lorsqu’on lance un d ´e :
quelle est la probabilit ´e que l’on tombe sur une certaine face ?
quelle est la probabilit ´e de tomber sur 5 ou 6 ? quel est le score moyen auquel on peut s’attendre ? Quelle est la proportion globale de 5 ou 6 observ ´es ? Quelle est la moyenne globale des scores obtenus ? Que remarquez-vous ?
Observations r ´ep ´et ´ees de ph ´enom `enes al ´eatoires
Chaque participant lance6 fois 5 d ´eset note les r ´esultats.
Calculer lescore moyen et le nombre de 5 ou 6observ ´es.
Comparer les r ´esultats obtenus par chacun d’entre vous.
D’o `u proviennent ces diff ´erences ? Lorsqu’on lance un d ´e :
quelle est la probabilit ´e que l’on tombe sur une certaine face ?
quelle est la probabilit ´e de tomber sur 5 ou 6 ? quel est le score moyen auquel on peut s’attendre ? Quelle est la proportion globale de 5 ou 6 observ ´es ? Quelle est la moyenne globale des scores obtenus ? Que remarquez-vous ?
Observations r ´ep ´et ´ees de ph ´enom `enes al ´eatoires
Chaque participant lance6 fois 5 d ´eset note les r ´esultats.
Calculer lescore moyen et le nombre de 5 ou 6observ ´es.
Comparer les r ´esultats obtenus par chacun d’entre vous.
D’o `u proviennent ces diff ´erences ? Lorsqu’on lance un d ´e :
quelle est la probabilit ´e que l’on tombe sur une certaine face ?
quelle est la probabilit ´e de tomber sur 5 ou 6 ? quel est le score moyen auquel on peut s’attendre ? Quelle est la proportion globale de 5 ou 6 observ ´es ? Quelle est la moyenne globale des scores obtenus ? Que remarquez-vous ?
Observations r ´ep ´et ´ees de ph ´enom `enes al ´eatoires
Chaque participant lance6 fois 5 d ´eset note les r ´esultats.
Calculer lescore moyen et le nombre de 5 ou 6observ ´es.
Comparer les r ´esultats obtenus par chacun d’entre vous.
D’o `u proviennent ces diff ´erences ? Lorsqu’on lance un d ´e :
quelle est la probabilit ´e que l’on tombe sur une certaine face ?
quelle est la probabilit ´e de tomber sur 5 ou 6 ? quel est le score moyen auquel on peut s’attendre ? Quelle est la proportion globale de 5 ou 6 observ ´es ? Quelle est la moyenne globale des scores obtenus ? Que remarquez-vous ?
Loi des grands nombres
Ce ph ´enom `ene, appel ´e loi des grands nombre est `a la base de nombreuses m ´ethodes statistiques.
Th ´eor `eme
Soient n observations al ´eatoires et ind ´ependantes(X1, . . . ,Xn) d’un ph ´enom `ene X de valeur moyenne m.
Sous des hypoth `eses g ´en ´erales on montre que
(X1+· · ·+Xn)
n →
n→+∞m. (P,p.s.) En d’autres termes, sinest assez grand :
la valeur moyenne deX peut ˆetre approch ´ee par la moyenne denobservations ind ´ependantes.
la probabilit ´e d’un ´ev ´enement peut ˆetre approch ´ee par la proportion de fois o `u il a ´et ´e observ ´e au cours den observations ind ´ependantes.
Loi des grands nombres
Ce ph ´enom `ene, appel ´e loi des grands nombre est `a la base de nombreuses m ´ethodes statistiques.
Th ´eor `eme
Soient n observations al ´eatoires et ind ´ependantes(X1, . . . ,Xn) d’un ph ´enom `ene X de valeur moyenne m.
Sous des hypoth `eses g ´en ´erales on montre que
(X1+· · ·+Xn)
n →
n→+∞m. (P,p.s.) En d’autres termes, sinest assez grand :
la valeur moyenne deX peut ˆetre approch ´ee par la moyenne denobservations ind ´ependantes.
la probabilit ´e d’un ´ev ´enement peut ˆetre approch ´ee par la proportion de fois o `u il a ´et ´e observ ´e au cours den observations ind ´ependantes.
Loi des grands nombres
Ce ph ´enom `ene, appel ´e loi des grands nombre est `a la base de nombreuses m ´ethodes statistiques.
Th ´eor `eme
Soient n observations al ´eatoires et ind ´ependantes(X1, . . . ,Xn) d’un ph ´enom `ene X de valeur moyenne m.
Sous des hypoth `eses g ´en ´erales on montre que
(X1+· · ·+Xn)
n →
n→+∞m. (P,p.s.) En d’autres termes, sinest assez grand :
la valeur moyenne deX peut ˆetre approch ´ee par la moyenne denobservations ind ´ependantes.
la probabilit ´e d’un ´ev ´enement peut ˆetre approch ´ee par la proportion de fois o `u il a ´et ´e observ ´e au cours den observations ind ´ependantes.
Limite centrale et intervalles de confiance
Notations :
moyenne :X = 1n(X1+· · ·+Xn)
variance :σn−12 = n−11 ((X1−X)2+· · ·+ (Xn−X)2).
renormalisation :T = (X−m)/
qσ2n−1 n .
Construites `a partir d’observations de ph ´enom `enes al ´eatoires, nos approximations pr ´esentent une certaine variabilit ´e.
Celle-ci diminue lorsque le nombre d’observationsncroˆıt.
Pournassez grand, les valeurs deT se r ´epartissent `a peu pr `es suivant une loiN(0,1)[th. de la limite centrale].
P(X− qσ2n−1
n ×1.96≤m≤X+ qσ2n−1
n ×1.96)≈0.95.
Limite centrale et intervalles de confiance
Notations :
moyenne :X = 1n(X1+· · ·+Xn)
variance :σn−12 = n−11 ((X1−X)2+· · ·+ (Xn−X)2).
renormalisation :T = (X−m)/
qσ2n−1 n .
Construites `a partir d’observations de ph ´enom `enes al ´eatoires, nos approximations pr ´esentent une certaine variabilit ´e.
Celle-ci diminue lorsque le nombre d’observationsncroˆıt.
Pournassez grand, les valeurs deT se r ´epartissent `a peu pr `es suivant une loiN(0,1)[th. de la limite centrale].
P(X− qσ2n−1
n ×1.96≤m≤X+ qσ2n−1
n ×1.96)≈0.95.
Limite centrale et intervalles de confiance
Notations :
moyenne :X = 1n(X1+· · ·+Xn)
variance :σn−12 = n−11 ((X1−X)2+· · ·+ (Xn−X)2).
renormalisation :T = (X−m)/
qσ2n−1 n .
Construites `a partir d’observations de ph ´enom `enes al ´eatoires, nos approximations pr ´esentent une certaine variabilit ´e.
Celle-ci diminue lorsque le nombre d’observationsncroˆıt.
Pournassez grand, les valeurs deT se r ´epartissent `a peu pr `es suivant une loiN(0,1)[th. de la limite centrale].
P(X− qσ2n−1
n ×1.96≤m≤X+ qσ2n−1
n ×1.96)≈0.95.
Limite centrale et intervalles de confiance
Notations :
moyenne :X = 1n(X1+· · ·+Xn)
variance :σn−12 = n−11 ((X1−X)2+· · ·+ (Xn−X)2).
renormalisation :T = (X−m)/
qσ2n−1 n .
Construites `a partir d’observations de ph ´enom `enes al ´eatoires, nos approximations pr ´esentent une certaine variabilit ´e.
Celle-ci diminue lorsque le nombre d’observationsncroˆıt.
Pournassez grand, les valeurs deT se r ´epartissent `a peu pr `es suivant une loiN(0,1)[th. de la limite centrale].
P(X− qσ2n−1
n ×1.96≤m≤X+ qσ2n−1
n ×1.96)≈0.95.
Limite centrale et intervalles de confiance
Notations :
moyenne :X = 1n(X1+· · ·+Xn)
variance :σn−12 = n−11 ((X1−X)2+· · ·+ (Xn−X)2).
renormalisation :T = (X−m)/
qσ2n−1 n .
Construites `a partir d’observations de ph ´enom `enes al ´eatoires, nos approximations pr ´esentent une certaine variabilit ´e.
Celle-ci diminue lorsque le nombre d’observationsncroˆıt.
Pournassez grand, les valeurs deT se r ´epartissent `a peu pr `es suivant une loiN(0,1)[th. de la limite centrale].
P(X− qσ2n−1
n ×1.96≤m≤X+ qσ2n−1
n ×1.96)≈0.95.
Limite centrale et intervalles de confiance
Notations :
moyenne :X = 1n(X1+· · ·+Xn)
variance :σn−12 = n−11 ((X1−X)2+· · ·+ (Xn−X)2).
renormalisation :T = (X−m)/
qσ2n−1 n .
Construites `a partir d’observations de ph ´enom `enes al ´eatoires, nos approximations pr ´esentent une certaine variabilit ´e.
Celle-ci diminue lorsque le nombre d’observationsncroˆıt.
Pournassez grand, les valeurs deT se r ´epartissent `a peu pr `es suivant une loiN(0,1)[th. de la limite centrale].
P(X− qσ2n−1
n ×1.96≤m≤X+ qσ2n−1
n ×1.96)≈0.95.
Limite centrale et intervalles de confiance
Notations :
moyenne :X = 1n(X1+· · ·+Xn)
variance :σn−12 = n−11 ((X1−X)2+· · ·+ (Xn−X)2).
renormalisation :T = (X−m)/
qσ2n−1 n .
Construites `a partir d’observations de ph ´enom `enes al ´eatoires, nos approximations pr ´esentent une certaine variabilit ´e.
Celle-ci diminue lorsque le nombre d’observationsncroˆıt.
Pournassez grand, les valeurs deT se r ´epartissent `a peu pr `es suivant une loiN(0,1)[th. de la limite centrale].
P(X− qσ2n−1
n ×1.96≤m≤X+ qσ2n−1
n ×1.96)≈0.95.
Echantillonnage al ´eatoire
Probl `eme concret
On cherche `a ´evaluer le nombreN d’ ´erables se trouvant dans une for ˆet s’ ´etendant sur une grande superficie.
Comment faire ?
0 5 10 15
051015
Position des arbres dans la foret
Pensez-vous que cela soit envisagable de d ´enombrer tous les ´erables de cette for ˆet ?
les ´erables se trouvant dans diff ´erentes zones d’assez petite taille ?
Comment faire ?
0 5 10 15
051015
Position des arbres dans la foret
Pensez-vous que cela soit envisagable de d ´enombrer tous les ´erables de cette for ˆet ?
les ´erables se trouvant dans diff ´erentes zones d’assez petite taille ?
Comment faire ?
On suppose que l’on peut d ´ecouper la for ˆet en 256 zones plus petites et de m ˆeme forme.
Quel est, en fonction deN, le nombre moyenmd’ ´erables par zone ?
Comment pensez-vous que l’on puisse donner une approximation demen observant seulement un petit nombre de ces zones ?
Comment choisir les zones `a ´etudier ? Combien faut-il en prendre ?
Choix d ´eterministe peut pr ´esenter des d ´efauts (zones s ´electionn ´ees peuvent ˆetre non repr ´esentatives).
⇒ ´echantillonnage al ´eatoire: choisir al ´eatoirement (et avec remise) les zones `a ´etudier.
Dans le cas le plus simple (arbres r ´epartis de mani `ere homog `ene), toutes les zones ont la m ˆeme probabilit ´e d’ ˆetre observ ´ees.
Comment faire ?
On suppose que l’on peut d ´ecouper la for ˆet en 256 zones plus petites et de m ˆeme forme.
Quel est, en fonction deN, le nombre moyenmd’ ´erables par zone ?
Comment pensez-vous que l’on puisse donner une approximation demen observant seulement un petit nombre de ces zones ?
Comment choisir les zones `a ´etudier ? Combien faut-il en prendre ?
Choix d ´eterministe peut pr ´esenter des d ´efauts (zones s ´electionn ´ees peuvent ˆetre non repr ´esentatives).
⇒ ´echantillonnage al ´eatoire: choisir al ´eatoirement (et avec remise) les zones `a ´etudier.
Dans le cas le plus simple (arbres r ´epartis de mani `ere homog `ene), toutes les zones ont la m ˆeme probabilit ´e d’ ˆetre observ ´ees.
Comment faire ?
On suppose que l’on peut d ´ecouper la for ˆet en 256 zones plus petites et de m ˆeme forme.
Quel est, en fonction deN, le nombre moyenmd’ ´erables par zone ?
Comment pensez-vous que l’on puisse donner une approximation demen observant seulement un petit nombre de ces zones ?
Comment choisir les zones `a ´etudier ? Combien faut-il en prendre ?
Choix d ´eterministe peut pr ´esenter des d ´efauts (zones s ´electionn ´ees peuvent ˆetre non repr ´esentatives).
⇒ ´echantillonnage al ´eatoire: choisir al ´eatoirement (et avec remise) les zones `a ´etudier.
Dans le cas le plus simple (arbres r ´epartis de mani `ere homog `ene), toutes les zones ont la m ˆeme probabilit ´e d’ ˆetre observ ´ees.
Comment faire ?
On suppose que l’on peut d ´ecouper la for ˆet en 256 zones plus petites et de m ˆeme forme.
Quel est, en fonction deN, le nombre moyenmd’ ´erables par zone ?
Comment pensez-vous que l’on puisse donner une approximation demen observant seulement un petit nombre de ces zones ?
Comment choisir les zones `a ´etudier ? Combien faut-il en prendre ?
Choix d ´eterministe peut pr ´esenter des d ´efauts (zones s ´electionn ´ees peuvent ˆetre non repr ´esentatives).
⇒ ´echantillonnage al ´eatoire: choisir al ´eatoirement (et avec remise) les zones `a ´etudier.
Dans le cas le plus simple (arbres r ´epartis de mani `ere homog `ene), toutes les zones ont la m ˆeme probabilit ´e d’ ˆetre observ ´ees.
Comment faire ?
On suppose que l’on peut d ´ecouper la for ˆet en 256 zones plus petites et de m ˆeme forme.
Quel est, en fonction deN, le nombre moyenmd’ ´erables par zone ?
Comment pensez-vous que l’on puisse donner une approximation demen observant seulement un petit nombre de ces zones ?
Comment choisir les zones `a ´etudier ? Combien faut-il en prendre ?
Choix d ´eterministe peut pr ´esenter des d ´efauts (zones s ´electionn ´ees peuvent ˆetre non repr ´esentatives).
⇒ ´echantillonnage al ´eatoire: choisir al ´eatoirement (et avec remise) les zones `a ´etudier.
Dans le cas le plus simple (arbres r ´epartis de mani `ere homog `ene), toutes les zones ont la m ˆeme probabilit ´e d’ ˆetre observ ´ees.
Mise en pratique :
Exemples de choix al ´eatoires :
x 6 9 3 16 10 10 6 9 9 2 11 5 4 3 9 11
y 8 13 13 11 14 15 10 7 4 7 6 1 10 4 1 11
x 15 9 2 2 12 14 5 6 15 14 11 15 14 5 10 11
y 9 16 10 4 13 14 9 12 13 9 1 12 4 16 6 16
x 8 12 8 6 13 5 6 3
y 10 8 15 1 1 7 10 4
Compter le nombre d’ ´erables se trouvant dans les zones s ´electionn ´ees par cet ´echantillonnage al ´eatoire.
Donner une approximation dem `a partir des donn ´ees recueillies.
En d ´eduire une approximation deN.
On peut aller plus loin :
Calculer la variance de nos observations.
Donner la valeur de l’intervalle de confiance associ ´e `am.
En d ´eduire un intervalle de confiance pourN.
Mise en pratique :
Exemples de choix al ´eatoires :
x 6 9 3 16 10 10 6 9 9 2 11 5 4 3 9 11
y 8 13 13 11 14 15 10 7 4 7 6 1 10 4 1 11
x 15 9 2 2 12 14 5 6 15 14 11 15 14 5 10 11
y 9 16 10 4 13 14 9 12 13 9 1 12 4 16 6 16
x 8 12 8 6 13 5 6 3
y 10 8 15 1 1 7 10 4
Compter le nombre d’ ´erables se trouvant dans les zones s ´electionn ´ees par cet ´echantillonnage al ´eatoire.
Donner une approximation dem `a partir des donn ´ees recueillies.
En d ´eduire une approximation deN.
On peut aller plus loin :
Calculer la variance de nos observations.
Donner la valeur de l’intervalle de confiance associ ´e `am.
En d ´eduire un intervalle de confiance pourN.
Mise en pratique :
Exemples de choix al ´eatoires :
x 6 9 3 16 10 10 6 9 9 2 11 5 4 3 9 11
y 8 13 13 11 14 15 10 7 4 7 6 1 10 4 1 11
x 15 9 2 2 12 14 5 6 15 14 11 15 14 5 10 11
y 9 16 10 4 13 14 9 12 13 9 1 12 4 16 6 16
x 8 12 8 6 13 5 6 3
y 10 8 15 1 1 7 10 4
Compter le nombre d’ ´erables se trouvant dans les zones s ´electionn ´ees par cet ´echantillonnage al ´eatoire.
Donner une approximation dem `a partir des donn ´ees recueillies.
En d ´eduire une approximation deN.
On peut aller plus loin :
Calculer la variance de nos observations.
Donner la valeur de l’intervalle de confiance associ ´e `am.
En d ´eduire un intervalle de confiance pourN.
Mise en pratique :
Exemples de choix al ´eatoires :
x 6 9 3 16 10 10 6 9 9 2 11 5 4 3 9 11
y 8 13 13 11 14 15 10 7 4 7 6 1 10 4 1 11
x 15 9 2 2 12 14 5 6 15 14 11 15 14 5 10 11
y 9 16 10 4 13 14 9 12 13 9 1 12 4 16 6 16
x 8 12 8 6 13 5 6 3
y 10 8 15 1 1 7 10 4
Compter le nombre d’ ´erables se trouvant dans les zones s ´electionn ´ees par cet ´echantillonnage al ´eatoire.
Donner une approximation dem `a partir des donn ´ees recueillies.
En d ´eduire une approximation deN.
On peut aller plus loin :
Calculer la variance de nos observations.
Donner la valeur de l’intervalle de confiance associ ´e `am.
En d ´eduire un intervalle de confiance pourN.
Mise en pratique :
Exemples de choix al ´eatoires :
x 6 9 3 16 10 10 6 9 9 2 11 5 4 3 9 11
y 8 13 13 11 14 15 10 7 4 7 6 1 10 4 1 11
x 15 9 2 2 12 14 5 6 15 14 11 15 14 5 10 11
y 9 16 10 4 13 14 9 12 13 9 1 12 4 16 6 16
x 8 12 8 6 13 5 6 3
y 10 8 15 1 1 7 10 4
Compter le nombre d’ ´erables se trouvant dans les zones s ´electionn ´ees par cet ´echantillonnage al ´eatoire.
Donner une approximation dem `a partir des donn ´ees recueillies.
En d ´eduire une approximation deN.
On peut aller plus loin :
Calculer la variance de nos observations.
Donner la valeur de l’intervalle de confiance associ ´e `am.
En d ´eduire un intervalle de confiance pourN.
Mise en pratique :
Exemples de choix al ´eatoires :
x 6 9 3 16 10 10 6 9 9 2 11 5 4 3 9 11
y 8 13 13 11 14 15 10 7 4 7 6 1 10 4 1 11
x 15 9 2 2 12 14 5 6 15 14 11 15 14 5 10 11
y 9 16 10 4 13 14 9 12 13 9 1 12 4 16 6 16
x 8 12 8 6 13 5 6 3
y 10 8 15 1 1 7 10 4
Compter le nombre d’ ´erables se trouvant dans les zones s ´electionn ´ees par cet ´echantillonnage al ´eatoire.
Donner une approximation dem `a partir des donn ´ees recueillies.
En d ´eduire une approximation deN.
On peut aller plus loin :
Calculer la variance de nos observations.
Donner la valeur de l’intervalle de confiance associ ´e `am.
En d ´eduire un intervalle de confiance pourN.
M ´ethode de capture
re-capture
Un autre probl `eme concret
On souhaite donner un ordre de grandeur du nombre de poissons se trouvant dans une grande ´etendue d’eau.
On suppose que l’on ne peut observer qu’un poisson `a la fois.
Exp ´erimentation et mise en pratique :
-Vous disposez d’un r ´ecipient contenant un nombreNinconnu d’objets identiques.
-Vous ne pouvez sortir du r ´ecipient qu’un objet `a la fois et devez m ´elanger avant chaque tirage.
-Vous avez `a votre disposition un feutre ind ´el ´ebile.
Comment pensez-vous que l’on puisse avoir une id ´ee du nombre total d’objets pr ´esents dans la boˆıte ?
A quoi peut servir le feutre ?
Un autre probl `eme concret
On souhaite donner un ordre de grandeur du nombre de poissons se trouvant dans une grande ´etendue d’eau.
On suppose que l’on ne peut observer qu’un poisson `a la fois.
Exp ´erimentation et mise en pratique :
-Vous disposez d’un r ´ecipient contenant un nombreNinconnu d’objets identiques.
-Vous ne pouvez sortir du r ´ecipient qu’un objet `a la fois et devez m ´elanger avant chaque tirage.
-Vous avez `a votre disposition un feutre ind ´el ´ebile.
Comment pensez-vous que l’on puisse avoir une id ´ee du nombre total d’objets pr ´esents dans la boˆıte ?
A quoi peut servir le feutre ?
Un autre probl `eme concret
On souhaite donner un ordre de grandeur du nombre de poissons se trouvant dans une grande ´etendue d’eau.
On suppose que l’on ne peut observer qu’un poisson `a la fois.
Exp ´erimentation et mise en pratique :
-Vous disposez d’un r ´ecipient contenant un nombreNinconnu d’objets identiques.
-Vous ne pouvez sortir du r ´ecipient qu’un objet `a la fois et devez m ´elanger avant chaque tirage.
-Vous avez `a votre disposition un feutre ind ´el ´ebile.
Comment pensez-vous que l’on puisse avoir une id ´ee du nombre total d’objets pr ´esents dans la boˆıte ?
A quoi peut servir le feutre ?
Un autre probl `eme concret
On souhaite donner un ordre de grandeur du nombre de poissons se trouvant dans une grande ´etendue d’eau.
On suppose que l’on ne peut observer qu’un poisson `a la fois.
Exp ´erimentation et mise en pratique :
-Vous disposez d’un r ´ecipient contenant un nombreNinconnu d’objets identiques.
-Vous ne pouvez sortir du r ´ecipient qu’un objet `a la fois et devez m ´elanger avant chaque tirage.
-Vous avez `a votre disposition un feutre ind ´el ´ebile.
Comment pensez-vous que l’on puisse avoir une id ´ee du nombre total d’objets pr ´esents dans la boˆıte ?
A quoi peut servir le feutre ?
Comment faire ?
Si un nombre connuNM d’objets portent un signe distinctif.
Quelle serait la probabilit ´ePde choisir au hasard un objet portant un signe distinctif en fonction deN?
Supposons que l’on fassentirages avec remise dans le r ´ecipient en notant si l’objet porte une marque ou non.
Comment peut-on donner une approximationpndeP? D ´eduire depnune approximation deN.
Revenons `a notre probl `eme concret.
Proposer une m ´ethode permettant de se ramener `a l’ ´etude d’un r ´ecipient contenant 20 objets marqu ´es.
[ETAPE DE CAPTURE]
M ´elanger les objets pour mod ´eliser la r ´epartition uniforme des individus marqu ´es dans la zone d’ ´etude.
[DELAI D’ATTENTE]
Effectuer ensuiten=40 tirages avec remise. En d ´eduire une approximation deN.[ETAPE DE RECAPTURE]
Comment faire ?
Si un nombre connuNM d’objets portent un signe distinctif.
Quelle serait la probabilit ´ePde choisir au hasard un objet portant un signe distinctif en fonction deN?
Supposons que l’on fassentirages avec remise dans le r ´ecipient en notant si l’objet porte une marque ou non.
Comment peut-on donner une approximationpndeP? D ´eduire depnune approximation deN.
Revenons `a notre probl `eme concret.
Proposer une m ´ethode permettant de se ramener `a l’ ´etude d’un r ´ecipient contenant 20 objets marqu ´es.
[ETAPE DE CAPTURE]
M ´elanger les objets pour mod ´eliser la r ´epartition uniforme des individus marqu ´es dans la zone d’ ´etude.
[DELAI D’ATTENTE]
Effectuer ensuiten=40 tirages avec remise. En d ´eduire une approximation deN.[ETAPE DE RECAPTURE]
Comment faire ?
Si un nombre connuNM d’objets portent un signe distinctif.
Quelle serait la probabilit ´ePde choisir au hasard un objet portant un signe distinctif en fonction deN?
Supposons que l’on fassentirages avec remise dans le r ´ecipient en notant si l’objet porte une marque ou non.
Comment peut-on donner une approximationpndeP? D ´eduire depnune approximation deN.
Revenons `a notre probl `eme concret.
Proposer une m ´ethode permettant de se ramener `a l’ ´etude d’un r ´ecipient contenant 20 objets marqu ´es.
[ETAPE DE CAPTURE]
M ´elanger les objets pour mod ´eliser la r ´epartition uniforme des individus marqu ´es dans la zone d’ ´etude.
[DELAI D’ATTENTE]
Effectuer ensuiten=40 tirages avec remise. En d ´eduire une approximation deN.[ETAPE DE RECAPTURE]
Comment faire ?
Si un nombre connuNM d’objets portent un signe distinctif.
Quelle serait la probabilit ´ePde choisir au hasard un objet portant un signe distinctif en fonction deN?
Supposons que l’on fassentirages avec remise dans le r ´ecipient en notant si l’objet porte une marque ou non.
Comment peut-on donner une approximationpndeP? D ´eduire depnune approximation deN.
Revenons `a notre probl `eme concret.
Proposer une m ´ethode permettant de se ramener `a l’ ´etude d’un r ´ecipient contenant 20 objets marqu ´es.
[ETAPE DE CAPTURE]
M ´elanger les objets pour mod ´eliser la r ´epartition uniforme des individus marqu ´es dans la zone d’ ´etude.
[DELAI D’ATTENTE]
Effectuer ensuiten=40 tirages avec remise. En d ´eduire une approximation deN.[ETAPE DE RECAPTURE]
Comment faire ?
Si un nombre connuNM d’objets portent un signe distinctif.
Quelle serait la probabilit ´ePde choisir au hasard un objet portant un signe distinctif en fonction deN?
Supposons que l’on fassentirages avec remise dans le r ´ecipient en notant si l’objet porte une marque ou non.
Comment peut-on donner une approximationpndeP? D ´eduire depnune approximation deN.
Revenons `a notre probl `eme concret.
Proposer une m ´ethode permettant de se ramener `a l’ ´etude d’un r ´ecipient contenant 20 objets marqu ´es.
[ETAPE DE CAPTURE]
M ´elanger les objets pour mod ´eliser la r ´epartition uniforme des individus marqu ´es dans la zone d’ ´etude.
[DELAI D’ATTENTE]
Effectuer ensuiten=40 tirages avec remise. En d ´eduire une approximation deN.[ETAPE DE RECAPTURE]
Comment faire ?
Si un nombre connuNM d’objets portent un signe distinctif.
Quelle serait la probabilit ´ePde choisir au hasard un objet portant un signe distinctif en fonction deN?
Supposons que l’on fassentirages avec remise dans le r ´ecipient en notant si l’objet porte une marque ou non.
Comment peut-on donner une approximationpndeP? D ´eduire depnune approximation deN.
Revenons `a notre probl `eme concret.
Proposer une m ´ethode permettant de se ramener `a l’ ´etude d’un r ´ecipient contenant 20 objets marqu ´es.
[ETAPE DE CAPTURE]
M ´elanger les objets pour mod ´eliser la r ´epartition uniforme des individus marqu ´es dans la zone d’ ´etude.
[DELAI D’ATTENTE]
Effectuer ensuiten=40 tirages avec remise. En d ´eduire une approximation deN.[ETAPE DE RECAPTURE]
Pour aller un peu plus loin
Supposons que sur 1000 observations on ait une proportion de 0.199 poissons marqu ´es.
Donner un intervalle de confiance pourP.
En d ´eduire un intervalle de confiance pourN.
M ´ethode du maximum de
vraisemblance
Un autre exemple concret
L’id ´ee principale est de choisir la valeur deNavec laquelle on a le plus de chance d’obtenir les observations qui ont ´et ´e faites.
On cherche `a donner une approximation du nombre de rhinoc ´eros se trouvant dans une zone g ´eographique assez vaste.
On suppose que les rhinoc ´eros ont
une probabilit ´e de 13 d’aller se d ´esalt ´erer `a l’un des rares points d’eau en fin d’apr `es-midi.
des comportements ind ´ependants les uns des autres.
On fait les observations suivantes :
Nombre de rhinoc ´eros 0 1 2 2 1
Un autre exemple concret
L’id ´ee principale est de choisir la valeur deNavec laquelle on a le plus de chance d’obtenir les observations qui ont ´et ´e faites.
On cherche `a donner une approximation du nombre de rhinoc ´eros se trouvant dans une zone g ´eographique assez vaste.
On suppose que les rhinoc ´eros ont
une probabilit ´e de 13 d’aller se d ´esalt ´erer `a l’un des rares points d’eau en fin d’apr `es-midi.
des comportements ind ´ependants les uns des autres.
On fait les observations suivantes :
Nombre de rhinoc ´eros 0 1 2 2 1
Un autre exemple concret
L’id ´ee principale est de choisir la valeur deNavec laquelle on a le plus de chance d’obtenir les observations qui ont ´et ´e faites.
On cherche `a donner une approximation du nombre de rhinoc ´eros se trouvant dans une zone g ´eographique assez vaste.
On suppose que les rhinoc ´eros ont
une probabilit ´e de 13 d’aller se d ´esalt ´erer `a l’un des rares points d’eau en fin d’apr `es-midi.
des comportements ind ´ependants les uns des autres.
On fait les observations suivantes :
Nombre de rhinoc ´eros 0 1 2 2 1
La m ´ethode du maximum de vraisemblance
On peut donner une expression explicite de la probabilit ´e d’avoir observ ´e 0,1,2,2,1 rhinoc ´eros en fonction deN:
PN(Observations:0,1,2,2,1) = 2
3 5N
N4(N−1)2
28 .
Est-ce que N peut valoir 0 ou 1 ?
A partir du graphique, pour quelle valeur deNla probabilit ´e est la plus forte que se produise ce que l’on a observ ´e ?
0 2 4 6 8 10
0.00000.00050.00100.00150.00200.00250.0030
N
P(Observations:0,1,2,2,1)
En d ´eduire la valeur deNla plus vraisemblable.
La m ´ethode du maximum de vraisemblance
On peut donner une expression explicite de la probabilit ´e d’avoir observ ´e 0,1,2,2,1 rhinoc ´eros en fonction deN:
PN(Observations:0,1,2,2,1) = 2
3 5N
N4(N−1)2
28 .
Est-ce que N peut valoir 0 ou 1 ?
A partir du graphique, pour quelle valeur deNla probabilit ´e est la plus forte que se produise ce que l’on a observ ´e ?
0 2 4 6 8 10
0.00000.00050.00100.00150.00200.00250.0030
N
P(Observations:0,1,2,2,1)
En d ´eduire la valeur deNla plus vraisemblable.
La m ´ethode du maximum de vraisemblance
On peut donner une expression explicite de la probabilit ´e d’avoir observ ´e 0,1,2,2,1 rhinoc ´eros en fonction deN:
PN(Observations:0,1,2,2,1) = 2
3 5N
N4(N−1)2
28 .
Est-ce que N peut valoir 0 ou 1 ?
A partir du graphique, pour quelle valeur deNla probabilit ´e est la plus forte que se produise ce que l’on a observ ´e ?
0 2 4 6 8 10
0.00000.00050.00100.00150.00200.00250.0030
N
P(Observations:0,1,2,2,1)
En d ´eduire la valeur deNla plus vraisemblable.
La m ´ethode du maximum de vraisemblance
On peut donner une expression explicite de la probabilit ´e d’avoir observ ´e 0,1,2,2,1 rhinoc ´eros en fonction deN:
PN(Observations:0,1,2,2,1) = 2
3 5N
N4(N−1)2
28 .
Est-ce que N peut valoir 0 ou 1 ?
A partir du graphique, pour quelle valeur deNla probabilit ´e est la plus forte que se produise ce que l’on a observ ´e ?
0 2 4 6 8 10
0.00000.00050.00100.00150.00200.00250.0030
N
P(Observations:0,1,2,2,1)
En d ´eduire la valeur deNla plus vraisemblable.
Un autre exemple :
Imaginons par exemple qu’un nouveau participant arrive en fin de s ´eance et qu’il ne sache pas combien de d ´es vous avez lanc ´es au d ´ebut.
S’il dispose uniquement du nombre de 5 ou 6 observ ´es pour chaque lanc ´e de 5 d ´es, il peut utiliser la m ´ethode du maximum de vraisemblance pour d ´eterminer `a partir des observations la valeur la plus vraisemblable de d ´es que vous avez jet ´es.
En effet, ici aussi le nombre de 5 ou 6 obtenus `a chacun de vos lanc ´es peut ˆetre mod ´elis ´e par une variable de loiBin(N,13), o `u Nrepr ´esente le nombre inconnu de d ´es que vous avez lanc ´es.
Conclusion
Conclusion et commentaires
m ´ethodes statistiques permettent de donner une
approximation du nombre d’individus mais aussi de donner un ordre de grandeur de la pr ´ecision de notre estimation.
certaine variabilit ´e de nos r ´esultats, qui diminue cependant lorsque le nombre d’observations augmente.
important de prendre en compte la qualit ´e des donn ´ees (taille de l’ ´echantillon, repr ´esentativit ´e) lorsque l’on cherche `a interpr ´eter les r ´esultats donn ´es par une m ´ethode d’estimation (par exemple un sondage).
m ´ethodes plus fines et pr ´ecises sont g ´en ´eralement utilis ´ees.
Conclusion et commentaires
m ´ethodes statistiques permettent de donner une
approximation du nombre d’individus mais aussi de donner un ordre de grandeur de la pr ´ecision de notre estimation.
certaine variabilit ´e de nos r ´esultats, qui diminue cependant lorsque le nombre d’observations augmente.
important de prendre en compte la qualit ´e des donn ´ees (taille de l’ ´echantillon, repr ´esentativit ´e) lorsque l’on cherche `a interpr ´eter les r ´esultats donn ´es par une m ´ethode d’estimation (par exemple un sondage).
m ´ethodes plus fines et pr ´ecises sont g ´en ´eralement utilis ´ees.
Conclusion et commentaires
m ´ethodes statistiques permettent de donner une
approximation du nombre d’individus mais aussi de donner un ordre de grandeur de la pr ´ecision de notre estimation.
certaine variabilit ´e de nos r ´esultats, qui diminue cependant lorsque le nombre d’observations augmente.
important de prendre en compte la qualit ´e des donn ´ees (taille de l’ ´echantillon, repr ´esentativit ´e) lorsque l’on cherche `a interpr ´eter les r ´esultats donn ´es par une m ´ethode d’estimation (par exemple un sondage).
m ´ethodes plus fines et pr ´ecises sont g ´en ´eralement utilis ´ees.
Conclusion et commentaires
m ´ethodes statistiques permettent de donner une
approximation du nombre d’individus mais aussi de donner un ordre de grandeur de la pr ´ecision de notre estimation.
certaine variabilit ´e de nos r ´esultats, qui diminue cependant lorsque le nombre d’observations augmente.
important de prendre en compte la qualit ´e des donn ´ees (taille de l’ ´echantillon, repr ´esentativit ´e) lorsque l’on cherche `a interpr ´eter les r ´esultats donn ´es par une m ´ethode d’estimation (par exemple un sondage).
m ´ethodes plus fines et pr ´ecises sont g ´en ´eralement utilis ´ees.
Tests m ´edicaux
Les donn ´ees
On souhaite ´etudier l’efficacit ´e d’un test m ´edical permettant de d ´epister une maladie pr ´esente chez 0.5%de la population. Le fabricant de ce test indique qu’il est positif pour 99%des malades et n ´egatif pour 95%des personnes saines.
bigskip
On dispose de donn ´ees (simul ´ees) concernant un
´echantillon de 1000000 individus.
Pour chacun de ces individus on observe une variable Sant ´e donnant l’ ´etat de sant ´e de l’individu et une variable Test donnant le r ´esultat du test de d ´epistage.
Sondages
Les donn ´ees
Une enqu ˆete est men ´ee aupr `es d’un ´echantillon de n ´electeurs potentiels. On leur demande s’ils sont plut ˆot favorables au candidat 1 ou au candidat 2. On obtient 53%d’intentions de vote pour le candidat num ´ero 1.
Peut-on affirmer que le candidat 1 rassemble plus d’intentions de vote dans l’ensemble de la population ?
Quelle information nous manque ?
On suppose que n=100, l’intervalle de confiance pour p est [0.4321784;0.6278216]. Peut-on conclure quelque chose ? Quelle taille d’ ´echantillon est n ´ecessaire pour avoir une pr ´ecision de 0.03 ?
Les donn ´ees
Une enqu ˆete est men ´ee aupr `es d’un ´echantillon de n ´electeurs potentiels. On leur demande s’ils sont plut ˆot favorables au candidat 1 ou au candidat 2. On obtient 53%d’intentions de vote pour le candidat num ´ero 1.
Peut-on affirmer que le candidat 1 rassemble plus d’intentions de vote dans l’ensemble de la population ?
Quelle information nous manque ?
On suppose que n=100, l’intervalle de confiance pour p est [0.4321784;0.6278216]. Peut-on conclure quelque chose ? Quelle taille d’ ´echantillon est n ´ecessaire pour avoir une pr ´ecision de 0.03 ?
Les donn ´ees
Une enqu ˆete est men ´ee aupr `es d’un ´echantillon de n ´electeurs potentiels. On leur demande s’ils sont plut ˆot favorables au candidat 1 ou au candidat 2. On obtient 53%d’intentions de vote pour le candidat num ´ero 1.
Peut-on affirmer que le candidat 1 rassemble plus d’intentions de vote dans l’ensemble de la population ?
Quelle information nous manque ?
On suppose que n=100, l’intervalle de confiance pour p est [0.4321784;0.6278216]. Peut-on conclure quelque chose ? Quelle taille d’ ´echantillon est n ´ecessaire pour avoir une pr ´ecision de 0.03 ?
Sondages sur donn ´ees
sensibles
La m ´ethode utilis ´ee :
On souhaite ´evaluer la proportion P de personnes faisant des t ´el ´echargements ill ´egaux dans une population.
On ne peux pas leur poser directement la question car ils risquent de ne pas nous dire la v ´erit ´e par peur d’ ´eventuels probl `emes judiciaires.
Un statisticien propose la d ´emarche suivante : demander aux individus de lancer un d ´e dans un isoloir puis de donner seulement la reponse `a la question :
Q1 : avez-vous obtenu 1 ou 2 ?, s’ils telechargent illegalement.
Q2 : avez-vous obtenu 3,4,5 ou 6 ?, s’ils ne telechargent pas illegalement.
Seule la personne interrog ´ee connait la question `a laquelle elle r ´epond.
La m ´ethode utilis ´ee :
On souhaite ´evaluer la proportion P de personnes faisant des t ´el ´echargements ill ´egaux dans une population.
On ne peux pas leur poser directement la question car ils risquent de ne pas nous dire la v ´erit ´e par peur d’ ´eventuels probl `emes judiciaires.
Un statisticien propose la d ´emarche suivante : demander aux individus de lancer un d ´e dans un isoloir puis de donner seulement la reponse `a la question :
Q1 : avez-vous obtenu 1 ou 2 ?, s’ils telechargent illegalement.
Q2 : avez-vous obtenu 3,4,5 ou 6 ?, s’ils ne telechargent pas illegalement.
Seule la personne interrog ´ee connait la question `a laquelle elle r ´epond.
Comment marche-t-elle ?
Quelle est la probabilit ´e qu’une personne qui t ´el ´echarge ill ´egalement r ´eponde OUI ?
Quelle est la probabilit ´e qu’une personne qui ne t ´el ´echarge pas ill ´egalement r ´eponde OUI ?
Quelle est la probabilit ´e qu’une personne interrog ´ee r ´eponde OUI ?
pOUI =pPIRATES1
3+ (1−pPIRATES)2
3 = 2−pPIRATES
3 .
Comment marche-t-elle ?
Quelle est la probabilit ´e qu’une personne qui t ´el ´echarge ill ´egalement r ´eponde OUI ?
Quelle est la probabilit ´e qu’une personne qui ne t ´el ´echarge pas ill ´egalement r ´eponde OUI ?
Quelle est la probabilit ´e qu’une personne interrog ´ee r ´eponde OUI ?
pOUI =pPIRATES1
3+ (1−pPIRATES)2
3 = 2−pPIRATES
3 .
Comment marche-t-elle ?
Quelle est la probabilit ´e qu’une personne qui t ´el ´echarge ill ´egalement r ´eponde OUI ?
Quelle est la probabilit ´e qu’une personne qui ne t ´el ´echarge pas ill ´egalement r ´eponde OUI ?
Quelle est la probabilit ´e qu’une personne interrog ´ee r ´eponde OUI ?
pOUI =pPIRATES1
3+ (1−pPIRATES)2
3 = 2−pPIRATES
3 .
Comment marche-t-elle ?
Quelle est la probabilit ´e qu’une personne qui t ´el ´echarge ill ´egalement r ´eponde OUI ?
Quelle est la probabilit ´e qu’une personne qui ne t ´el ´echarge pas ill ´egalement r ´eponde OUI ?
Quelle est la probabilit ´e qu’une personne interrog ´ee r ´eponde OUI ?
pOUI =pPIRATES1
3+ (1−pPIRATES)2
3 = 2−pPIRATES
3 .
Comment marche-t-elle ?
Comment peut-on donner une valeur approch ´ee depOUI? En d ´eduire une valeur approch ´ee depPIRATES.
pPIRATES=2−3pOUI ⇒pˆPIRATES =2−3ˆpOUI
Application.
Comment marche-t-elle ?
Comment peut-on donner une valeur approch ´ee depOUI? En d ´eduire une valeur approch ´ee depPIRATES.
pPIRATES=2−3pOUI ⇒pˆPIRATES =2−3ˆpOUI
Application.
Comment marche-t-elle ?
Comment peut-on donner une valeur approch ´ee depOUI? En d ´eduire une valeur approch ´ee depPIRATES.
pPIRATES=2−3pOUI ⇒pˆPIRATES =2−3ˆpOUI
Application.