• Aucun résultat trouvé

Observations r ´ep ´et ´ees de ph ´enom `enes al ´eatoires

N/A
N/A
Protected

Academic year: 2022

Partager "Observations r ´ep ´et ´ees de ph ´enom `enes al ´eatoires"

Copied!
78
0
0

Texte intégral

(1)

D ´enombrement et ´echantillonnage

Laurent Delsol (MAPMO, Universit ´e d’Orl ´eans.)

Centre Galois, 21/06/2013, Orl ´eans.

(laurent.delsol@univ-orleans.fr)

(2)

Motivations g ´en ´erales

Dans de nombreuses situations on cherche `ad ´enombrer le nombre d’individus, d’animaux, de v ´eg ´etaux ou d’objets se trouvantdans une zone g ´eographiquedonn ´ee.

d ´ecompte exactdes individus souventtr `es difficile, voire impossible(grande ´etendue, population est trop

importante).

m ´ethodes d’ ´echantillonnage→approximation de la taille de la populationen n’observant que :

certains individus

certaines zones g ´eographiques.

L’objectif de cet atelier :

se familiariser avec ces m ´ethodes au travers de quelques exemples.

pr ´esenter les r ´esultats math ´ematiques sur lesquels elles reposent.

(3)

Plan de l’atelier

1 Introduction

2 Echantillonnage al ´eatoire

3 M ´ethode de capture re-capture

4 Maximum de vraisemblance

5 Conclusion

Tests m ´edicaux Sondages

Sondages sur donn ´ees sensibles

(4)

Observations r ´ep ´et ´ees de ph ´enom `enes al ´eatoires

Chaque participant lance6 fois 5 d ´eset note les r ´esultats.

Calculer lescore moyen et le nombre de 5 ou 6observ ´es.

Comparer les r ´esultats obtenus par chacun d’entre vous.

D’o `u proviennent ces diff ´erences ? Lorsqu’on lance un d ´e :

quelle est la probabilit ´e que l’on tombe sur une certaine face ?

quelle est la probabilit ´e de tomber sur 5 ou 6 ? quel est le score moyen auquel on peut s’attendre ? Quelle est la proportion globale de 5 ou 6 observ ´es ? Quelle est la moyenne globale des scores obtenus ? Que remarquez-vous ?

(5)

Observations r ´ep ´et ´ees de ph ´enom `enes al ´eatoires

Chaque participant lance6 fois 5 d ´eset note les r ´esultats.

Calculer lescore moyen et le nombre de 5 ou 6observ ´es.

Comparer les r ´esultats obtenus par chacun d’entre vous.

D’o `u proviennent ces diff ´erences ? Lorsqu’on lance un d ´e :

quelle est la probabilit ´e que l’on tombe sur une certaine face ?

quelle est la probabilit ´e de tomber sur 5 ou 6 ? quel est le score moyen auquel on peut s’attendre ? Quelle est la proportion globale de 5 ou 6 observ ´es ? Quelle est la moyenne globale des scores obtenus ? Que remarquez-vous ?

(6)

Observations r ´ep ´et ´ees de ph ´enom `enes al ´eatoires

Chaque participant lance6 fois 5 d ´eset note les r ´esultats.

Calculer lescore moyen et le nombre de 5 ou 6observ ´es.

Comparer les r ´esultats obtenus par chacun d’entre vous.

D’o `u proviennent ces diff ´erences ? Lorsqu’on lance un d ´e :

quelle est la probabilit ´e que l’on tombe sur une certaine face ?

quelle est la probabilit ´e de tomber sur 5 ou 6 ? quel est le score moyen auquel on peut s’attendre ? Quelle est la proportion globale de 5 ou 6 observ ´es ? Quelle est la moyenne globale des scores obtenus ? Que remarquez-vous ?

(7)

Observations r ´ep ´et ´ees de ph ´enom `enes al ´eatoires

Chaque participant lance6 fois 5 d ´eset note les r ´esultats.

Calculer lescore moyen et le nombre de 5 ou 6observ ´es.

Comparer les r ´esultats obtenus par chacun d’entre vous.

D’o `u proviennent ces diff ´erences ? Lorsqu’on lance un d ´e :

quelle est la probabilit ´e que l’on tombe sur une certaine face ?

quelle est la probabilit ´e de tomber sur 5 ou 6 ? quel est le score moyen auquel on peut s’attendre ? Quelle est la proportion globale de 5 ou 6 observ ´es ? Quelle est la moyenne globale des scores obtenus ? Que remarquez-vous ?

(8)

Observations r ´ep ´et ´ees de ph ´enom `enes al ´eatoires

Chaque participant lance6 fois 5 d ´eset note les r ´esultats.

Calculer lescore moyen et le nombre de 5 ou 6observ ´es.

Comparer les r ´esultats obtenus par chacun d’entre vous.

D’o `u proviennent ces diff ´erences ? Lorsqu’on lance un d ´e :

quelle est la probabilit ´e que l’on tombe sur une certaine face ?

quelle est la probabilit ´e de tomber sur 5 ou 6 ? quel est le score moyen auquel on peut s’attendre ? Quelle est la proportion globale de 5 ou 6 observ ´es ? Quelle est la moyenne globale des scores obtenus ? Que remarquez-vous ?

(9)

Observations r ´ep ´et ´ees de ph ´enom `enes al ´eatoires

Chaque participant lance6 fois 5 d ´eset note les r ´esultats.

Calculer lescore moyen et le nombre de 5 ou 6observ ´es.

Comparer les r ´esultats obtenus par chacun d’entre vous.

D’o `u proviennent ces diff ´erences ? Lorsqu’on lance un d ´e :

quelle est la probabilit ´e que l’on tombe sur une certaine face ?

quelle est la probabilit ´e de tomber sur 5 ou 6 ? quel est le score moyen auquel on peut s’attendre ? Quelle est la proportion globale de 5 ou 6 observ ´es ? Quelle est la moyenne globale des scores obtenus ? Que remarquez-vous ?

(10)

Observations r ´ep ´et ´ees de ph ´enom `enes al ´eatoires

Chaque participant lance6 fois 5 d ´eset note les r ´esultats.

Calculer lescore moyen et le nombre de 5 ou 6observ ´es.

Comparer les r ´esultats obtenus par chacun d’entre vous.

D’o `u proviennent ces diff ´erences ? Lorsqu’on lance un d ´e :

quelle est la probabilit ´e que l’on tombe sur une certaine face ?

quelle est la probabilit ´e de tomber sur 5 ou 6 ? quel est le score moyen auquel on peut s’attendre ? Quelle est la proportion globale de 5 ou 6 observ ´es ? Quelle est la moyenne globale des scores obtenus ? Que remarquez-vous ?

(11)

Observations r ´ep ´et ´ees de ph ´enom `enes al ´eatoires

Chaque participant lance6 fois 5 d ´eset note les r ´esultats.

Calculer lescore moyen et le nombre de 5 ou 6observ ´es.

Comparer les r ´esultats obtenus par chacun d’entre vous.

D’o `u proviennent ces diff ´erences ? Lorsqu’on lance un d ´e :

quelle est la probabilit ´e que l’on tombe sur une certaine face ?

quelle est la probabilit ´e de tomber sur 5 ou 6 ? quel est le score moyen auquel on peut s’attendre ? Quelle est la proportion globale de 5 ou 6 observ ´es ? Quelle est la moyenne globale des scores obtenus ? Que remarquez-vous ?

(12)

Loi des grands nombres

Ce ph ´enom `ene, appel ´e loi des grands nombre est `a la base de nombreuses m ´ethodes statistiques.

Th ´eor `eme

Soient n observations al ´eatoires et ind ´ependantes(X1, . . . ,Xn) d’un ph ´enom `ene X de valeur moyenne m.

Sous des hypoth `eses g ´en ´erales on montre que

(X1+· · ·+Xn)

n →

n→+∞m. (P,p.s.) En d’autres termes, sinest assez grand :

la valeur moyenne deX peut ˆetre approch ´ee par la moyenne denobservations ind ´ependantes.

la probabilit ´e d’un ´ev ´enement peut ˆetre approch ´ee par la proportion de fois o `u il a ´et ´e observ ´e au cours den observations ind ´ependantes.

(13)

Loi des grands nombres

Ce ph ´enom `ene, appel ´e loi des grands nombre est `a la base de nombreuses m ´ethodes statistiques.

Th ´eor `eme

Soient n observations al ´eatoires et ind ´ependantes(X1, . . . ,Xn) d’un ph ´enom `ene X de valeur moyenne m.

Sous des hypoth `eses g ´en ´erales on montre que

(X1+· · ·+Xn)

n →

n→+∞m. (P,p.s.) En d’autres termes, sinest assez grand :

la valeur moyenne deX peut ˆetre approch ´ee par la moyenne denobservations ind ´ependantes.

la probabilit ´e d’un ´ev ´enement peut ˆetre approch ´ee par la proportion de fois o `u il a ´et ´e observ ´e au cours den observations ind ´ependantes.

(14)

Loi des grands nombres

Ce ph ´enom `ene, appel ´e loi des grands nombre est `a la base de nombreuses m ´ethodes statistiques.

Th ´eor `eme

Soient n observations al ´eatoires et ind ´ependantes(X1, . . . ,Xn) d’un ph ´enom `ene X de valeur moyenne m.

Sous des hypoth `eses g ´en ´erales on montre que

(X1+· · ·+Xn)

n →

n→+∞m. (P,p.s.) En d’autres termes, sinest assez grand :

la valeur moyenne deX peut ˆetre approch ´ee par la moyenne denobservations ind ´ependantes.

la probabilit ´e d’un ´ev ´enement peut ˆetre approch ´ee par la proportion de fois o `u il a ´et ´e observ ´e au cours den observations ind ´ependantes.

(15)

Limite centrale et intervalles de confiance

Notations :

moyenne :X = 1n(X1+· · ·+Xn)

variance :σn−12 = n−11 ((X1−X)2+· · ·+ (Xn−X)2).

renormalisation :T = (X−m)/

qσ2n−1 n .

Construites `a partir d’observations de ph ´enom `enes al ´eatoires, nos approximations pr ´esentent une certaine variabilit ´e.

Celle-ci diminue lorsque le nombre d’observationsncroˆıt.

Pournassez grand, les valeurs deT se r ´epartissent `a peu pr `es suivant une loiN(0,1)[th. de la limite centrale].

P(X qσ2n−1

n ×1.96mX+ qσ2n−1

n ×1.96)0.95.

(16)

Limite centrale et intervalles de confiance

Notations :

moyenne :X = 1n(X1+· · ·+Xn)

variance :σn−12 = n−11 ((X1−X)2+· · ·+ (Xn−X)2).

renormalisation :T = (X−m)/

qσ2n−1 n .

Construites `a partir d’observations de ph ´enom `enes al ´eatoires, nos approximations pr ´esentent une certaine variabilit ´e.

Celle-ci diminue lorsque le nombre d’observationsncroˆıt.

Pournassez grand, les valeurs deT se r ´epartissent `a peu pr `es suivant une loiN(0,1)[th. de la limite centrale].

P(X qσ2n−1

n ×1.96mX+ qσ2n−1

n ×1.96)0.95.

(17)

Limite centrale et intervalles de confiance

Notations :

moyenne :X = 1n(X1+· · ·+Xn)

variance :σn−12 = n−11 ((X1−X)2+· · ·+ (Xn−X)2).

renormalisation :T = (X−m)/

qσ2n−1 n .

Construites `a partir d’observations de ph ´enom `enes al ´eatoires, nos approximations pr ´esentent une certaine variabilit ´e.

Celle-ci diminue lorsque le nombre d’observationsncroˆıt.

Pournassez grand, les valeurs deT se r ´epartissent `a peu pr `es suivant une loiN(0,1)[th. de la limite centrale].

P(X qσ2n−1

n ×1.96mX+ qσ2n−1

n ×1.96)0.95.

(18)

Limite centrale et intervalles de confiance

Notations :

moyenne :X = 1n(X1+· · ·+Xn)

variance :σn−12 = n−11 ((X1−X)2+· · ·+ (Xn−X)2).

renormalisation :T = (X−m)/

qσ2n−1 n .

Construites `a partir d’observations de ph ´enom `enes al ´eatoires, nos approximations pr ´esentent une certaine variabilit ´e.

Celle-ci diminue lorsque le nombre d’observationsncroˆıt.

Pournassez grand, les valeurs deT se r ´epartissent `a peu pr `es suivant une loiN(0,1)[th. de la limite centrale].

P(X qσ2n−1

n ×1.96mX+ qσ2n−1

n ×1.96)0.95.

(19)

Limite centrale et intervalles de confiance

Notations :

moyenne :X = 1n(X1+· · ·+Xn)

variance :σn−12 = n−11 ((X1−X)2+· · ·+ (Xn−X)2).

renormalisation :T = (X−m)/

qσ2n−1 n .

Construites `a partir d’observations de ph ´enom `enes al ´eatoires, nos approximations pr ´esentent une certaine variabilit ´e.

Celle-ci diminue lorsque le nombre d’observationsncroˆıt.

Pournassez grand, les valeurs deT se r ´epartissent `a peu pr `es suivant une loiN(0,1)[th. de la limite centrale].

P(X qσ2n−1

n ×1.96mX+ qσ2n−1

n ×1.96)0.95.

(20)

Limite centrale et intervalles de confiance

Notations :

moyenne :X = 1n(X1+· · ·+Xn)

variance :σn−12 = n−11 ((X1−X)2+· · ·+ (Xn−X)2).

renormalisation :T = (X−m)/

qσ2n−1 n .

Construites `a partir d’observations de ph ´enom `enes al ´eatoires, nos approximations pr ´esentent une certaine variabilit ´e.

Celle-ci diminue lorsque le nombre d’observationsncroˆıt.

Pournassez grand, les valeurs deT se r ´epartissent `a peu pr `es suivant une loiN(0,1)[th. de la limite centrale].

P(X qσ2n−1

n ×1.96mX+ qσ2n−1

n ×1.96)0.95.

(21)

Limite centrale et intervalles de confiance

Notations :

moyenne :X = 1n(X1+· · ·+Xn)

variance :σn−12 = n−11 ((X1−X)2+· · ·+ (Xn−X)2).

renormalisation :T = (X−m)/

qσ2n−1 n .

Construites `a partir d’observations de ph ´enom `enes al ´eatoires, nos approximations pr ´esentent une certaine variabilit ´e.

Celle-ci diminue lorsque le nombre d’observationsncroˆıt.

Pournassez grand, les valeurs deT se r ´epartissent `a peu pr `es suivant une loiN(0,1)[th. de la limite centrale].

P(X qσ2n−1

n ×1.96mX+ qσ2n−1

n ×1.96)0.95.

(22)

Echantillonnage al ´eatoire

(23)

Probl `eme concret

On cherche `a ´evaluer le nombreN d’ ´erables se trouvant dans une for ˆet s’ ´etendant sur une grande superficie.

(24)

Comment faire ?

0 5 10 15

051015

Position des arbres dans la foret

Pensez-vous que cela soit envisagable de d ´enombrer tous les ´erables de cette for ˆet ?

les ´erables se trouvant dans diff ´erentes zones d’assez petite taille ?

(25)

Comment faire ?

0 5 10 15

051015

Position des arbres dans la foret

Pensez-vous que cela soit envisagable de d ´enombrer tous les ´erables de cette for ˆet ?

les ´erables se trouvant dans diff ´erentes zones d’assez petite taille ?

(26)

Comment faire ?

On suppose que l’on peut d ´ecouper la for ˆet en 256 zones plus petites et de m ˆeme forme.

Quel est, en fonction deN, le nombre moyenmd’ ´erables par zone ?

Comment pensez-vous que l’on puisse donner une approximation demen observant seulement un petit nombre de ces zones ?

Comment choisir les zones `a ´etudier ? Combien faut-il en prendre ?

Choix d ´eterministe peut pr ´esenter des d ´efauts (zones s ´electionn ´ees peuvent ˆetre non repr ´esentatives).

⇒ ´echantillonnage al ´eatoire: choisir al ´eatoirement (et avec remise) les zones `a ´etudier.

Dans le cas le plus simple (arbres r ´epartis de mani `ere homog `ene), toutes les zones ont la m ˆeme probabilit ´e d’ ˆetre observ ´ees.

(27)

Comment faire ?

On suppose que l’on peut d ´ecouper la for ˆet en 256 zones plus petites et de m ˆeme forme.

Quel est, en fonction deN, le nombre moyenmd’ ´erables par zone ?

Comment pensez-vous que l’on puisse donner une approximation demen observant seulement un petit nombre de ces zones ?

Comment choisir les zones `a ´etudier ? Combien faut-il en prendre ?

Choix d ´eterministe peut pr ´esenter des d ´efauts (zones s ´electionn ´ees peuvent ˆetre non repr ´esentatives).

⇒ ´echantillonnage al ´eatoire: choisir al ´eatoirement (et avec remise) les zones `a ´etudier.

Dans le cas le plus simple (arbres r ´epartis de mani `ere homog `ene), toutes les zones ont la m ˆeme probabilit ´e d’ ˆetre observ ´ees.

(28)

Comment faire ?

On suppose que l’on peut d ´ecouper la for ˆet en 256 zones plus petites et de m ˆeme forme.

Quel est, en fonction deN, le nombre moyenmd’ ´erables par zone ?

Comment pensez-vous que l’on puisse donner une approximation demen observant seulement un petit nombre de ces zones ?

Comment choisir les zones `a ´etudier ? Combien faut-il en prendre ?

Choix d ´eterministe peut pr ´esenter des d ´efauts (zones s ´electionn ´ees peuvent ˆetre non repr ´esentatives).

⇒ ´echantillonnage al ´eatoire: choisir al ´eatoirement (et avec remise) les zones `a ´etudier.

Dans le cas le plus simple (arbres r ´epartis de mani `ere homog `ene), toutes les zones ont la m ˆeme probabilit ´e d’ ˆetre observ ´ees.

(29)

Comment faire ?

On suppose que l’on peut d ´ecouper la for ˆet en 256 zones plus petites et de m ˆeme forme.

Quel est, en fonction deN, le nombre moyenmd’ ´erables par zone ?

Comment pensez-vous que l’on puisse donner une approximation demen observant seulement un petit nombre de ces zones ?

Comment choisir les zones `a ´etudier ? Combien faut-il en prendre ?

Choix d ´eterministe peut pr ´esenter des d ´efauts (zones s ´electionn ´ees peuvent ˆetre non repr ´esentatives).

⇒ ´echantillonnage al ´eatoire: choisir al ´eatoirement (et avec remise) les zones `a ´etudier.

Dans le cas le plus simple (arbres r ´epartis de mani `ere homog `ene), toutes les zones ont la m ˆeme probabilit ´e d’ ˆetre observ ´ees.

(30)

Comment faire ?

On suppose que l’on peut d ´ecouper la for ˆet en 256 zones plus petites et de m ˆeme forme.

Quel est, en fonction deN, le nombre moyenmd’ ´erables par zone ?

Comment pensez-vous que l’on puisse donner une approximation demen observant seulement un petit nombre de ces zones ?

Comment choisir les zones `a ´etudier ? Combien faut-il en prendre ?

Choix d ´eterministe peut pr ´esenter des d ´efauts (zones s ´electionn ´ees peuvent ˆetre non repr ´esentatives).

⇒ ´echantillonnage al ´eatoire: choisir al ´eatoirement (et avec remise) les zones `a ´etudier.

Dans le cas le plus simple (arbres r ´epartis de mani `ere homog `ene), toutes les zones ont la m ˆeme probabilit ´e d’ ˆetre observ ´ees.

(31)

Mise en pratique :

Exemples de choix al ´eatoires :

x 6 9 3 16 10 10 6 9 9 2 11 5 4 3 9 11

y 8 13 13 11 14 15 10 7 4 7 6 1 10 4 1 11

x 15 9 2 2 12 14 5 6 15 14 11 15 14 5 10 11

y 9 16 10 4 13 14 9 12 13 9 1 12 4 16 6 16

x 8 12 8 6 13 5 6 3

y 10 8 15 1 1 7 10 4

Compter le nombre d’ ´erables se trouvant dans les zones s ´electionn ´ees par cet ´echantillonnage al ´eatoire.

Donner une approximation dem `a partir des donn ´ees recueillies.

En d ´eduire une approximation deN.

On peut aller plus loin :

Calculer la variance de nos observations.

Donner la valeur de l’intervalle de confiance associ ´e `am.

En d ´eduire un intervalle de confiance pourN.

(32)

Mise en pratique :

Exemples de choix al ´eatoires :

x 6 9 3 16 10 10 6 9 9 2 11 5 4 3 9 11

y 8 13 13 11 14 15 10 7 4 7 6 1 10 4 1 11

x 15 9 2 2 12 14 5 6 15 14 11 15 14 5 10 11

y 9 16 10 4 13 14 9 12 13 9 1 12 4 16 6 16

x 8 12 8 6 13 5 6 3

y 10 8 15 1 1 7 10 4

Compter le nombre d’ ´erables se trouvant dans les zones s ´electionn ´ees par cet ´echantillonnage al ´eatoire.

Donner une approximation dem `a partir des donn ´ees recueillies.

En d ´eduire une approximation deN.

On peut aller plus loin :

Calculer la variance de nos observations.

Donner la valeur de l’intervalle de confiance associ ´e `am.

En d ´eduire un intervalle de confiance pourN.

(33)

Mise en pratique :

Exemples de choix al ´eatoires :

x 6 9 3 16 10 10 6 9 9 2 11 5 4 3 9 11

y 8 13 13 11 14 15 10 7 4 7 6 1 10 4 1 11

x 15 9 2 2 12 14 5 6 15 14 11 15 14 5 10 11

y 9 16 10 4 13 14 9 12 13 9 1 12 4 16 6 16

x 8 12 8 6 13 5 6 3

y 10 8 15 1 1 7 10 4

Compter le nombre d’ ´erables se trouvant dans les zones s ´electionn ´ees par cet ´echantillonnage al ´eatoire.

Donner une approximation dem `a partir des donn ´ees recueillies.

En d ´eduire une approximation deN.

On peut aller plus loin :

Calculer la variance de nos observations.

Donner la valeur de l’intervalle de confiance associ ´e `am.

En d ´eduire un intervalle de confiance pourN.

(34)

Mise en pratique :

Exemples de choix al ´eatoires :

x 6 9 3 16 10 10 6 9 9 2 11 5 4 3 9 11

y 8 13 13 11 14 15 10 7 4 7 6 1 10 4 1 11

x 15 9 2 2 12 14 5 6 15 14 11 15 14 5 10 11

y 9 16 10 4 13 14 9 12 13 9 1 12 4 16 6 16

x 8 12 8 6 13 5 6 3

y 10 8 15 1 1 7 10 4

Compter le nombre d’ ´erables se trouvant dans les zones s ´electionn ´ees par cet ´echantillonnage al ´eatoire.

Donner une approximation dem `a partir des donn ´ees recueillies.

En d ´eduire une approximation deN.

On peut aller plus loin :

Calculer la variance de nos observations.

Donner la valeur de l’intervalle de confiance associ ´e `am.

En d ´eduire un intervalle de confiance pourN.

(35)

Mise en pratique :

Exemples de choix al ´eatoires :

x 6 9 3 16 10 10 6 9 9 2 11 5 4 3 9 11

y 8 13 13 11 14 15 10 7 4 7 6 1 10 4 1 11

x 15 9 2 2 12 14 5 6 15 14 11 15 14 5 10 11

y 9 16 10 4 13 14 9 12 13 9 1 12 4 16 6 16

x 8 12 8 6 13 5 6 3

y 10 8 15 1 1 7 10 4

Compter le nombre d’ ´erables se trouvant dans les zones s ´electionn ´ees par cet ´echantillonnage al ´eatoire.

Donner une approximation dem `a partir des donn ´ees recueillies.

En d ´eduire une approximation deN.

On peut aller plus loin :

Calculer la variance de nos observations.

Donner la valeur de l’intervalle de confiance associ ´e `am.

En d ´eduire un intervalle de confiance pourN.

(36)

Mise en pratique :

Exemples de choix al ´eatoires :

x 6 9 3 16 10 10 6 9 9 2 11 5 4 3 9 11

y 8 13 13 11 14 15 10 7 4 7 6 1 10 4 1 11

x 15 9 2 2 12 14 5 6 15 14 11 15 14 5 10 11

y 9 16 10 4 13 14 9 12 13 9 1 12 4 16 6 16

x 8 12 8 6 13 5 6 3

y 10 8 15 1 1 7 10 4

Compter le nombre d’ ´erables se trouvant dans les zones s ´electionn ´ees par cet ´echantillonnage al ´eatoire.

Donner une approximation dem `a partir des donn ´ees recueillies.

En d ´eduire une approximation deN.

On peut aller plus loin :

Calculer la variance de nos observations.

Donner la valeur de l’intervalle de confiance associ ´e `am.

En d ´eduire un intervalle de confiance pourN.

(37)

M ´ethode de capture

re-capture

(38)

Un autre probl `eme concret

On souhaite donner un ordre de grandeur du nombre de poissons se trouvant dans une grande ´etendue d’eau.

On suppose que l’on ne peut observer qu’un poisson `a la fois.

Exp ´erimentation et mise en pratique :

-Vous disposez d’un r ´ecipient contenant un nombreNinconnu d’objets identiques.

-Vous ne pouvez sortir du r ´ecipient qu’un objet `a la fois et devez m ´elanger avant chaque tirage.

-Vous avez `a votre disposition un feutre ind ´el ´ebile.

Comment pensez-vous que l’on puisse avoir une id ´ee du nombre total d’objets pr ´esents dans la boˆıte ?

A quoi peut servir le feutre ?

(39)

Un autre probl `eme concret

On souhaite donner un ordre de grandeur du nombre de poissons se trouvant dans une grande ´etendue d’eau.

On suppose que l’on ne peut observer qu’un poisson `a la fois.

Exp ´erimentation et mise en pratique :

-Vous disposez d’un r ´ecipient contenant un nombreNinconnu d’objets identiques.

-Vous ne pouvez sortir du r ´ecipient qu’un objet `a la fois et devez m ´elanger avant chaque tirage.

-Vous avez `a votre disposition un feutre ind ´el ´ebile.

Comment pensez-vous que l’on puisse avoir une id ´ee du nombre total d’objets pr ´esents dans la boˆıte ?

A quoi peut servir le feutre ?

(40)

Un autre probl `eme concret

On souhaite donner un ordre de grandeur du nombre de poissons se trouvant dans une grande ´etendue d’eau.

On suppose que l’on ne peut observer qu’un poisson `a la fois.

Exp ´erimentation et mise en pratique :

-Vous disposez d’un r ´ecipient contenant un nombreNinconnu d’objets identiques.

-Vous ne pouvez sortir du r ´ecipient qu’un objet `a la fois et devez m ´elanger avant chaque tirage.

-Vous avez `a votre disposition un feutre ind ´el ´ebile.

Comment pensez-vous que l’on puisse avoir une id ´ee du nombre total d’objets pr ´esents dans la boˆıte ?

A quoi peut servir le feutre ?

(41)

Un autre probl `eme concret

On souhaite donner un ordre de grandeur du nombre de poissons se trouvant dans une grande ´etendue d’eau.

On suppose que l’on ne peut observer qu’un poisson `a la fois.

Exp ´erimentation et mise en pratique :

-Vous disposez d’un r ´ecipient contenant un nombreNinconnu d’objets identiques.

-Vous ne pouvez sortir du r ´ecipient qu’un objet `a la fois et devez m ´elanger avant chaque tirage.

-Vous avez `a votre disposition un feutre ind ´el ´ebile.

Comment pensez-vous que l’on puisse avoir une id ´ee du nombre total d’objets pr ´esents dans la boˆıte ?

A quoi peut servir le feutre ?

(42)

Comment faire ?

Si un nombre connuNM d’objets portent un signe distinctif.

Quelle serait la probabilit ´ePde choisir au hasard un objet portant un signe distinctif en fonction deN?

Supposons que l’on fassentirages avec remise dans le r ´ecipient en notant si l’objet porte une marque ou non.

Comment peut-on donner une approximationpndeP? D ´eduire depnune approximation deN.

Revenons `a notre probl `eme concret.

Proposer une m ´ethode permettant de se ramener `a l’ ´etude d’un r ´ecipient contenant 20 objets marqu ´es.

[ETAPE DE CAPTURE]

M ´elanger les objets pour mod ´eliser la r ´epartition uniforme des individus marqu ´es dans la zone d’ ´etude.

[DELAI D’ATTENTE]

Effectuer ensuiten=40 tirages avec remise. En d ´eduire une approximation deN.[ETAPE DE RECAPTURE]

(43)

Comment faire ?

Si un nombre connuNM d’objets portent un signe distinctif.

Quelle serait la probabilit ´ePde choisir au hasard un objet portant un signe distinctif en fonction deN?

Supposons que l’on fassentirages avec remise dans le r ´ecipient en notant si l’objet porte une marque ou non.

Comment peut-on donner une approximationpndeP? D ´eduire depnune approximation deN.

Revenons `a notre probl `eme concret.

Proposer une m ´ethode permettant de se ramener `a l’ ´etude d’un r ´ecipient contenant 20 objets marqu ´es.

[ETAPE DE CAPTURE]

M ´elanger les objets pour mod ´eliser la r ´epartition uniforme des individus marqu ´es dans la zone d’ ´etude.

[DELAI D’ATTENTE]

Effectuer ensuiten=40 tirages avec remise. En d ´eduire une approximation deN.[ETAPE DE RECAPTURE]

(44)

Comment faire ?

Si un nombre connuNM d’objets portent un signe distinctif.

Quelle serait la probabilit ´ePde choisir au hasard un objet portant un signe distinctif en fonction deN?

Supposons que l’on fassentirages avec remise dans le r ´ecipient en notant si l’objet porte une marque ou non.

Comment peut-on donner une approximationpndeP? D ´eduire depnune approximation deN.

Revenons `a notre probl `eme concret.

Proposer une m ´ethode permettant de se ramener `a l’ ´etude d’un r ´ecipient contenant 20 objets marqu ´es.

[ETAPE DE CAPTURE]

M ´elanger les objets pour mod ´eliser la r ´epartition uniforme des individus marqu ´es dans la zone d’ ´etude.

[DELAI D’ATTENTE]

Effectuer ensuiten=40 tirages avec remise. En d ´eduire une approximation deN.[ETAPE DE RECAPTURE]

(45)

Comment faire ?

Si un nombre connuNM d’objets portent un signe distinctif.

Quelle serait la probabilit ´ePde choisir au hasard un objet portant un signe distinctif en fonction deN?

Supposons que l’on fassentirages avec remise dans le r ´ecipient en notant si l’objet porte une marque ou non.

Comment peut-on donner une approximationpndeP? D ´eduire depnune approximation deN.

Revenons `a notre probl `eme concret.

Proposer une m ´ethode permettant de se ramener `a l’ ´etude d’un r ´ecipient contenant 20 objets marqu ´es.

[ETAPE DE CAPTURE]

M ´elanger les objets pour mod ´eliser la r ´epartition uniforme des individus marqu ´es dans la zone d’ ´etude.

[DELAI D’ATTENTE]

Effectuer ensuiten=40 tirages avec remise. En d ´eduire une approximation deN.[ETAPE DE RECAPTURE]

(46)

Comment faire ?

Si un nombre connuNM d’objets portent un signe distinctif.

Quelle serait la probabilit ´ePde choisir au hasard un objet portant un signe distinctif en fonction deN?

Supposons que l’on fassentirages avec remise dans le r ´ecipient en notant si l’objet porte une marque ou non.

Comment peut-on donner une approximationpndeP? D ´eduire depnune approximation deN.

Revenons `a notre probl `eme concret.

Proposer une m ´ethode permettant de se ramener `a l’ ´etude d’un r ´ecipient contenant 20 objets marqu ´es.

[ETAPE DE CAPTURE]

M ´elanger les objets pour mod ´eliser la r ´epartition uniforme des individus marqu ´es dans la zone d’ ´etude.

[DELAI D’ATTENTE]

Effectuer ensuiten=40 tirages avec remise. En d ´eduire une approximation deN.[ETAPE DE RECAPTURE]

(47)

Comment faire ?

Si un nombre connuNM d’objets portent un signe distinctif.

Quelle serait la probabilit ´ePde choisir au hasard un objet portant un signe distinctif en fonction deN?

Supposons que l’on fassentirages avec remise dans le r ´ecipient en notant si l’objet porte une marque ou non.

Comment peut-on donner une approximationpndeP? D ´eduire depnune approximation deN.

Revenons `a notre probl `eme concret.

Proposer une m ´ethode permettant de se ramener `a l’ ´etude d’un r ´ecipient contenant 20 objets marqu ´es.

[ETAPE DE CAPTURE]

M ´elanger les objets pour mod ´eliser la r ´epartition uniforme des individus marqu ´es dans la zone d’ ´etude.

[DELAI D’ATTENTE]

Effectuer ensuiten=40 tirages avec remise. En d ´eduire une approximation deN.[ETAPE DE RECAPTURE]

(48)

Pour aller un peu plus loin

Supposons que sur 1000 observations on ait une proportion de 0.199 poissons marqu ´es.

Donner un intervalle de confiance pourP.

En d ´eduire un intervalle de confiance pourN.

(49)

M ´ethode du maximum de

vraisemblance

(50)

Un autre exemple concret

L’id ´ee principale est de choisir la valeur deNavec laquelle on a le plus de chance d’obtenir les observations qui ont ´et ´e faites.

On cherche `a donner une approximation du nombre de rhinoc ´eros se trouvant dans une zone g ´eographique assez vaste.

On suppose que les rhinoc ´eros ont

une probabilit ´e de 13 d’aller se d ´esalt ´erer `a l’un des rares points d’eau en fin d’apr `es-midi.

des comportements ind ´ependants les uns des autres.

On fait les observations suivantes :

Nombre de rhinoc ´eros 0 1 2 2 1

(51)

Un autre exemple concret

L’id ´ee principale est de choisir la valeur deNavec laquelle on a le plus de chance d’obtenir les observations qui ont ´et ´e faites.

On cherche `a donner une approximation du nombre de rhinoc ´eros se trouvant dans une zone g ´eographique assez vaste.

On suppose que les rhinoc ´eros ont

une probabilit ´e de 13 d’aller se d ´esalt ´erer `a l’un des rares points d’eau en fin d’apr `es-midi.

des comportements ind ´ependants les uns des autres.

On fait les observations suivantes :

Nombre de rhinoc ´eros 0 1 2 2 1

(52)

Un autre exemple concret

L’id ´ee principale est de choisir la valeur deNavec laquelle on a le plus de chance d’obtenir les observations qui ont ´et ´e faites.

On cherche `a donner une approximation du nombre de rhinoc ´eros se trouvant dans une zone g ´eographique assez vaste.

On suppose que les rhinoc ´eros ont

une probabilit ´e de 13 d’aller se d ´esalt ´erer `a l’un des rares points d’eau en fin d’apr `es-midi.

des comportements ind ´ependants les uns des autres.

On fait les observations suivantes :

Nombre de rhinoc ´eros 0 1 2 2 1

(53)

La m ´ethode du maximum de vraisemblance

On peut donner une expression explicite de la probabilit ´e d’avoir observ ´e 0,1,2,2,1 rhinoc ´eros en fonction deN:

PN(Observations:0,1,2,2,1) = 2

3 5N

N4(N−1)2

28 .

Est-ce que N peut valoir 0 ou 1 ?

A partir du graphique, pour quelle valeur deNla probabilit ´e est la plus forte que se produise ce que l’on a observ ´e ?

0 2 4 6 8 10

0.00000.00050.00100.00150.00200.00250.0030

N

P(Observations:0,1,2,2,1)

En d ´eduire la valeur deNla plus vraisemblable.

(54)

La m ´ethode du maximum de vraisemblance

On peut donner une expression explicite de la probabilit ´e d’avoir observ ´e 0,1,2,2,1 rhinoc ´eros en fonction deN:

PN(Observations:0,1,2,2,1) = 2

3 5N

N4(N−1)2

28 .

Est-ce que N peut valoir 0 ou 1 ?

A partir du graphique, pour quelle valeur deNla probabilit ´e est la plus forte que se produise ce que l’on a observ ´e ?

0 2 4 6 8 10

0.00000.00050.00100.00150.00200.00250.0030

N

P(Observations:0,1,2,2,1)

En d ´eduire la valeur deNla plus vraisemblable.

(55)

La m ´ethode du maximum de vraisemblance

On peut donner une expression explicite de la probabilit ´e d’avoir observ ´e 0,1,2,2,1 rhinoc ´eros en fonction deN:

PN(Observations:0,1,2,2,1) = 2

3 5N

N4(N−1)2

28 .

Est-ce que N peut valoir 0 ou 1 ?

A partir du graphique, pour quelle valeur deNla probabilit ´e est la plus forte que se produise ce que l’on a observ ´e ?

0 2 4 6 8 10

0.00000.00050.00100.00150.00200.00250.0030

N

P(Observations:0,1,2,2,1)

En d ´eduire la valeur deNla plus vraisemblable.

(56)

La m ´ethode du maximum de vraisemblance

On peut donner une expression explicite de la probabilit ´e d’avoir observ ´e 0,1,2,2,1 rhinoc ´eros en fonction deN:

PN(Observations:0,1,2,2,1) = 2

3 5N

N4(N−1)2

28 .

Est-ce que N peut valoir 0 ou 1 ?

A partir du graphique, pour quelle valeur deNla probabilit ´e est la plus forte que se produise ce que l’on a observ ´e ?

0 2 4 6 8 10

0.00000.00050.00100.00150.00200.00250.0030

N

P(Observations:0,1,2,2,1)

En d ´eduire la valeur deNla plus vraisemblable.

(57)

Un autre exemple :

Imaginons par exemple qu’un nouveau participant arrive en fin de s ´eance et qu’il ne sache pas combien de d ´es vous avez lanc ´es au d ´ebut.

S’il dispose uniquement du nombre de 5 ou 6 observ ´es pour chaque lanc ´e de 5 d ´es, il peut utiliser la m ´ethode du maximum de vraisemblance pour d ´eterminer `a partir des observations la valeur la plus vraisemblable de d ´es que vous avez jet ´es.

En effet, ici aussi le nombre de 5 ou 6 obtenus `a chacun de vos lanc ´es peut ˆetre mod ´elis ´e par une variable de loiBin(N,13), o `u Nrepr ´esente le nombre inconnu de d ´es que vous avez lanc ´es.

(58)

Conclusion

(59)

Conclusion et commentaires

m ´ethodes statistiques permettent de donner une

approximation du nombre d’individus mais aussi de donner un ordre de grandeur de la pr ´ecision de notre estimation.

certaine variabilit ´e de nos r ´esultats, qui diminue cependant lorsque le nombre d’observations augmente.

important de prendre en compte la qualit ´e des donn ´ees (taille de l’ ´echantillon, repr ´esentativit ´e) lorsque l’on cherche `a interpr ´eter les r ´esultats donn ´es par une m ´ethode d’estimation (par exemple un sondage).

m ´ethodes plus fines et pr ´ecises sont g ´en ´eralement utilis ´ees.

(60)

Conclusion et commentaires

m ´ethodes statistiques permettent de donner une

approximation du nombre d’individus mais aussi de donner un ordre de grandeur de la pr ´ecision de notre estimation.

certaine variabilit ´e de nos r ´esultats, qui diminue cependant lorsque le nombre d’observations augmente.

important de prendre en compte la qualit ´e des donn ´ees (taille de l’ ´echantillon, repr ´esentativit ´e) lorsque l’on cherche `a interpr ´eter les r ´esultats donn ´es par une m ´ethode d’estimation (par exemple un sondage).

m ´ethodes plus fines et pr ´ecises sont g ´en ´eralement utilis ´ees.

(61)

Conclusion et commentaires

m ´ethodes statistiques permettent de donner une

approximation du nombre d’individus mais aussi de donner un ordre de grandeur de la pr ´ecision de notre estimation.

certaine variabilit ´e de nos r ´esultats, qui diminue cependant lorsque le nombre d’observations augmente.

important de prendre en compte la qualit ´e des donn ´ees (taille de l’ ´echantillon, repr ´esentativit ´e) lorsque l’on cherche `a interpr ´eter les r ´esultats donn ´es par une m ´ethode d’estimation (par exemple un sondage).

m ´ethodes plus fines et pr ´ecises sont g ´en ´eralement utilis ´ees.

(62)

Conclusion et commentaires

m ´ethodes statistiques permettent de donner une

approximation du nombre d’individus mais aussi de donner un ordre de grandeur de la pr ´ecision de notre estimation.

certaine variabilit ´e de nos r ´esultats, qui diminue cependant lorsque le nombre d’observations augmente.

important de prendre en compte la qualit ´e des donn ´ees (taille de l’ ´echantillon, repr ´esentativit ´e) lorsque l’on cherche `a interpr ´eter les r ´esultats donn ´es par une m ´ethode d’estimation (par exemple un sondage).

m ´ethodes plus fines et pr ´ecises sont g ´en ´eralement utilis ´ees.

(63)

Tests m ´edicaux

(64)

Les donn ´ees

On souhaite ´etudier l’efficacit ´e d’un test m ´edical permettant de d ´epister une maladie pr ´esente chez 0.5%de la population. Le fabricant de ce test indique qu’il est positif pour 99%des malades et n ´egatif pour 95%des personnes saines.

bigskip

On dispose de donn ´ees (simul ´ees) concernant un

´echantillon de 1000000 individus.

Pour chacun de ces individus on observe une variable Sant ´e donnant l’ ´etat de sant ´e de l’individu et une variable Test donnant le r ´esultat du test de d ´epistage.

(65)

Sondages

(66)

Les donn ´ees

Une enqu ˆete est men ´ee aupr `es d’un ´echantillon de n ´electeurs potentiels. On leur demande s’ils sont plut ˆot favorables au candidat 1 ou au candidat 2. On obtient 53%d’intentions de vote pour le candidat num ´ero 1.

Peut-on affirmer que le candidat 1 rassemble plus d’intentions de vote dans l’ensemble de la population ?

Quelle information nous manque ?

On suppose que n=100, l’intervalle de confiance pour p est [0.4321784;0.6278216]. Peut-on conclure quelque chose ? Quelle taille d’ ´echantillon est n ´ecessaire pour avoir une pr ´ecision de 0.03 ?

(67)

Les donn ´ees

Une enqu ˆete est men ´ee aupr `es d’un ´echantillon de n ´electeurs potentiels. On leur demande s’ils sont plut ˆot favorables au candidat 1 ou au candidat 2. On obtient 53%d’intentions de vote pour le candidat num ´ero 1.

Peut-on affirmer que le candidat 1 rassemble plus d’intentions de vote dans l’ensemble de la population ?

Quelle information nous manque ?

On suppose que n=100, l’intervalle de confiance pour p est [0.4321784;0.6278216]. Peut-on conclure quelque chose ? Quelle taille d’ ´echantillon est n ´ecessaire pour avoir une pr ´ecision de 0.03 ?

(68)

Les donn ´ees

Une enqu ˆete est men ´ee aupr `es d’un ´echantillon de n ´electeurs potentiels. On leur demande s’ils sont plut ˆot favorables au candidat 1 ou au candidat 2. On obtient 53%d’intentions de vote pour le candidat num ´ero 1.

Peut-on affirmer que le candidat 1 rassemble plus d’intentions de vote dans l’ensemble de la population ?

Quelle information nous manque ?

On suppose que n=100, l’intervalle de confiance pour p est [0.4321784;0.6278216]. Peut-on conclure quelque chose ? Quelle taille d’ ´echantillon est n ´ecessaire pour avoir une pr ´ecision de 0.03 ?

(69)

Sondages sur donn ´ees

sensibles

(70)

La m ´ethode utilis ´ee :

On souhaite ´evaluer la proportion P de personnes faisant des t ´el ´echargements ill ´egaux dans une population.

On ne peux pas leur poser directement la question car ils risquent de ne pas nous dire la v ´erit ´e par peur d’ ´eventuels probl `emes judiciaires.

Un statisticien propose la d ´emarche suivante : demander aux individus de lancer un d ´e dans un isoloir puis de donner seulement la reponse `a la question :

Q1 : avez-vous obtenu 1 ou 2 ?, s’ils telechargent illegalement.

Q2 : avez-vous obtenu 3,4,5 ou 6 ?, s’ils ne telechargent pas illegalement.

Seule la personne interrog ´ee connait la question `a laquelle elle r ´epond.

(71)

La m ´ethode utilis ´ee :

On souhaite ´evaluer la proportion P de personnes faisant des t ´el ´echargements ill ´egaux dans une population.

On ne peux pas leur poser directement la question car ils risquent de ne pas nous dire la v ´erit ´e par peur d’ ´eventuels probl `emes judiciaires.

Un statisticien propose la d ´emarche suivante : demander aux individus de lancer un d ´e dans un isoloir puis de donner seulement la reponse `a la question :

Q1 : avez-vous obtenu 1 ou 2 ?, s’ils telechargent illegalement.

Q2 : avez-vous obtenu 3,4,5 ou 6 ?, s’ils ne telechargent pas illegalement.

Seule la personne interrog ´ee connait la question `a laquelle elle r ´epond.

(72)

Comment marche-t-elle ?

Quelle est la probabilit ´e qu’une personne qui t ´el ´echarge ill ´egalement r ´eponde OUI ?

Quelle est la probabilit ´e qu’une personne qui ne t ´el ´echarge pas ill ´egalement r ´eponde OUI ?

Quelle est la probabilit ´e qu’une personne interrog ´ee r ´eponde OUI ?

pOUI =pPIRATES1

3+ (1−pPIRATES)2

3 = 2−pPIRATES

3 .

(73)

Comment marche-t-elle ?

Quelle est la probabilit ´e qu’une personne qui t ´el ´echarge ill ´egalement r ´eponde OUI ?

Quelle est la probabilit ´e qu’une personne qui ne t ´el ´echarge pas ill ´egalement r ´eponde OUI ?

Quelle est la probabilit ´e qu’une personne interrog ´ee r ´eponde OUI ?

pOUI =pPIRATES1

3+ (1−pPIRATES)2

3 = 2−pPIRATES

3 .

(74)

Comment marche-t-elle ?

Quelle est la probabilit ´e qu’une personne qui t ´el ´echarge ill ´egalement r ´eponde OUI ?

Quelle est la probabilit ´e qu’une personne qui ne t ´el ´echarge pas ill ´egalement r ´eponde OUI ?

Quelle est la probabilit ´e qu’une personne interrog ´ee r ´eponde OUI ?

pOUI =pPIRATES1

3+ (1−pPIRATES)2

3 = 2−pPIRATES

3 .

(75)

Comment marche-t-elle ?

Quelle est la probabilit ´e qu’une personne qui t ´el ´echarge ill ´egalement r ´eponde OUI ?

Quelle est la probabilit ´e qu’une personne qui ne t ´el ´echarge pas ill ´egalement r ´eponde OUI ?

Quelle est la probabilit ´e qu’une personne interrog ´ee r ´eponde OUI ?

pOUI =pPIRATES1

3+ (1−pPIRATES)2

3 = 2−pPIRATES

3 .

(76)

Comment marche-t-elle ?

Comment peut-on donner une valeur approch ´ee depOUI? En d ´eduire une valeur approch ´ee depPIRATES.

pPIRATES=2−3pOUI ⇒pˆPIRATES =2−3ˆpOUI

Application.

(77)

Comment marche-t-elle ?

Comment peut-on donner une valeur approch ´ee depOUI? En d ´eduire une valeur approch ´ee depPIRATES.

pPIRATES=2−3pOUI ⇒pˆPIRATES =2−3ˆpOUI

Application.

(78)

Comment marche-t-elle ?

Comment peut-on donner une valeur approch ´ee depOUI? En d ´eduire une valeur approch ´ee depPIRATES.

pPIRATES=2−3pOUI ⇒pˆPIRATES =2−3ˆpOUI

Application.

Références

Documents relatifs

N o u s nous placerons dans un espace vectoriel rrel, 6ventuellement muni d'une topologie vectorielle (ce qui sera prrcis6 dans chaque 6noncr) et adopterons les

[r]

[r]

Avoir au moins deux appartements rentables est l’´ ev´ enement contraire d’en avoir 0 ou 1.. Si elle s’arrˆ ´ ete au deux feux elle perd 2 minutes, elle met donc

Lire graphiquement le coefficient direc- teur ou indiquer s’il n’existe pas la

Lorsque deux droites sont perpendiculaires à une même troisième alors elles sont parallèles donc (AB) et (FE) sont parallèles... 2) Dans le triangle OFE, (AB) et (FE) sont parallèles

Dans le triangle ABC : (CE) est une droite qui passe par un sommet et qui est perpendiculaires au côté opposé : donc (CE) est une hauteur de ABC.. 3) Dans le triangle ABC (CE) est

w Demander en début de séance s’il y a eu des difficultés (et lesquelles) en cherchant les solutions des exercices w Interagir avec les étudiants, (répondre à leurs questions…).