Chapitre 2. Échantillonnage

(1)

Chapitre 2. Échantillonnage

Pierre Duchesne

August 1, 2017

(2)

I En théorie des probabilités, une question intéressante pourrait être de la forme: Si on lance une pièce de

monnaie régulière à 1000 reprises, quelle est la probabilité d’observer 503 faces?

I En statistique, la question intéressante serait plutôt: Si on lance une pièce de monnaie à 1000 reprises et que l’on observe 503 faces, est-ce que la pièce est régulière?

(3)

Les deux disciplines s’intéressent à un caractère étudié qui serait ici:

X =nombre de faces en 1000 lancers de la pièce.

Ainsi, en probabilités, on suppose que l’on connaît tous les paramètres qui définissent la loi de probabilité. Dans ce cas-ci, X ∼Bin(1000,¹₂).

En statistique, on ne connaît pas tous les paramètres. On aurait iciX ∼Bin(1000,p)avec 0≤p≤1.

(4)

Typiquement, nous pouvons dire qu’il y a deux grands problèmes dans le domaine de la statistique:

1. Théorie de l’estimation: le problème du statisticien consiste à attribuer une valeur à un paramètre inconnu;

2. Théorie des tests d’hypothèses: le statisticien cherche à vérifier une conjecture sur le paramètre inconnu.

Les deux théories ci-dessus forment ce que l’on appelle l’inférence statistique.

(5)

I Lorsque l’on effectue de l’inférence statistique, nous devons disposer d’information sur le caractère à l’étude, et ceci s’obtient au moyen d’un échantillon.

I Dans l’exemple du lancer de la pièce, on pourrait avoir comme échantillon la chaîne décrivant les 1000 résultats:

PFPP . . . F, avecF pour face, etP pour pile.

I Alternativement, on pourrait poser:

X_i =

1, siF au tiragei, 0, sinon.

I On aurait alors dans la chaîne de caractères précédente:

X₁=0,X₂=1,X₃=X₄=0, . . . ,X₁₀₀₀=1.

(6)

Chapitre 2.1 Échantillonnage dans une population infinie

Considérons une populationfiniepour laquelle on étudie le caractèreX suivant:

X =nombre d’enfants dans la famille.

Dans notre exemple, la populationP est composée de cinq familles.

unité nb d’enfants

1 0

2 1

3 1

4 2

5 3

(7)

1 0

2 1

3 1

4 2

5 3

Ainsi la loi de probabilité deX est:

0 1/5

1 2/5

2 1/5

3 1/5

(8)

Supposons maintenant que l’on prélève un échantillon de taille n=2 dans la population finie.

Deux plans d’échantillonnage sont possibles:

I Échantillonnage aléatoire simpleavecremise;

I Échantillonnage aléatoire simplesansremise.

Le tirage aléatoire simple sans remise est sans doute plus naturel, mais le tirage avec remise offre des propriétés plus intéressantes (et surtout plus commodes mathématiquement).

(9)

Échantillonnage avec remise

ConsidéronsX₁etX₂les variables aléatoires pour chacun des deux tirages.

Nous avons queX₁a la même loi que la loi du caractère étudié X:

0 1/5

1 2/5

2 1/5

3 1/5

De même,X₂a la même loi que la loi du caractère étudiéX. De plus,X₁etX₂sont indépendantes.

(10)

Échantillonnage sans remise

Considérons encoreX₁etX₂les variables aléatoires pour chacun des deux tirages.

Encore ici,X₁est une variable aléatoire dont la loi est identique à celle deX.

Cependant, à prime abord, la loi deX₂n’est plus aussi évidente.

En effet, dans un échantillonnage sans remise, la valeur que prendraX₂dépend maintenant de la valeur qui aura été prise parX₁.

(11)

Afin de prendre la loi deX₂, une façon de procéder est de trouver la loi conjointe du couple(X₁,X₂), que l’on note p_X₁_,X₂(x₁,x₂).

p_X₁_,X₂(x₁,x₂) =P(X₁=x₁,X₂=x₂) =P(X₁=x₁)P(X₂=x₂|X₁=x₁).

(12)

1 0

2 1

3 1

4 2

5 3

On trouve:

x₁\x₂ 0 1 2 3 p_X₁(x₁) 0 0/20 2/20 1/20 1/20 4/20 = 1/5 1 2/20 2/20 2/20 2/20 8/20 = 2/5 2 1/20 2/20 0/20 1/20 4/20 = 1/5 3 1/20 2/20 1/20 0 4/20 = 1/5 p_X₂(x₂) 1/5 2/5 1/5 1/5 20/20 = 1

(13)

On remarque queX₁est de même loi queX, et il en va de même deX₂, qui a même loi queX.

Cependant,X₁etX₂sont dépendantes, et on peut montrer que:

cov(X₁,X₂) =− 26 100.

Ainsi les tirages avec remise, quoique moins naturels, ont des propriétés mathématiques plus intéressantes.

Si la population était de taille infinie (en pratique si la population est très grande), tirer au hasard avec ou sans remise revient à toute fin pratique au même.

(14)

Échantillon aléatoire

On va donc considérer à partir de maintenant que l’on a affaire à des populations infinies.

SoitX un caractère étudié dans une populationP. Alors E:X₁,X₂, . . . ,X_n est un échantillon aléatoire de taillensi X₁,X₂, . . . ,Xnsont indépendantes et chacune de même loi que X.

Un caractèreX est une v.a. et on appelleraµ_X =E(X)la moyenne de la population ou encore la moyenne théorique. De même,σ_X² =E{(X −µ_X)²}est la variance de la population ou encore la variance théorique.

(15)

Moments théoriques

En général, sik est un entier, nous noterons:

αk =E(X^k) =moment théorique d’ordrek, µ_k =E{(X−µ_X)^k}=moment théorique centré d’ordrek. On note queα₁=µ_X, et queµ₁=0, etµ₂=σ²_X.

(16)

Chapitre 2.2 Statistiques et moments expérimentaux

Une statistique est une variable aléatoire qui n’est fonction que d’un échantillon aléatoireE:X₁,X₂, . . . ,X_ndans une population P.

Plus précisément, soitX est un caractère étudié dans une populationP. SiE:X₁,X₂, . . . ,X_n associé àX, alors une statistiqueT =t(X₁, . . . ,Xn)oùt :Rⁿ→Rest une fonction entièrement connue.

(17)

Exemples:Soit un échantillon aléatoireE :X₁,X₂, . . . ,X_n associé àX.

1. La fonctiont(x₁, . . . ,n_n) = ¹_nPn

i=1x_i donne lieu à la statistiqueT = ¹_nPn

i=1X_i, appelée lamoyenne échantillonnale.

2. La fonctiont(x₁, . . . ,n_n) =max_1≤i≤nx_i−min_1≤i≤nx_i. La statistique estT =max1≤i≤nX_i−min1≤i≤nX_i et permet d’introduirel’étendue.

3. La fonctiont(x₁, . . . ,nn) = ¹_nP

x_i^k permet d’introduire les moments expérimentauxT = ¹_nPn

i=1X_i^k (oùk est un entier).

4. La fonctiont(x₁, . . . ,nn) = ¹_nP

(x_i−µ_X)^k permet d’introduire lesmoments expérimentaux centrés T = ¹_nPn

i=1(X_i−µ_X)^k (oùk est un entier etµ_X est présumé connu).

(18)

Lorsquek =2, la statistiqueT = _n¹P

(X_i−µ_X)²est appelée la variance échantillonnale. On pose:

ˆ σ²= 1

n

X(X_i−µX)².

C’est une statistique en autant queµ_X est connue. Siµ_X est inconnueσˆ²n’est plus une statistique et on introduit plutôt:

S²= 1 n−1

X(X_i−X¯)².

On appelleS²la variance échantillonnale corrigée.

(19)

Variance échantillonnale corrigée

On rappelle que:

E{[X−µ_X]²} = E{X²−2µ_XX+µ²_X},

= E(X²)−2µ²_X +µ²_X,

= E(X²)− {E(X)}².

(20)

Les mêmes étapes donnent:

S² = 1 n−1

n

X

i=1

{X_i −X¯}²,

= 1

n−1

n

X

i=1

{X_i²−2X X¯ i+ ¯X²},

= 1

n−1 ( _n

X

i=1

X_i²−2X¯

n

X

i=1

X_i+nX¯² )

,

= 1

n−1 ( _n

X

i=1

X_i²−2nX¯²+nX¯² )

,

= 1

n−1 ( _n

X

i=1

X_i²−nX¯² )

,

= n (

1Xⁿ

X²−X¯² )

.

(21)

En résumé:σ²=E{[X −µ_X]²}=E(X²)− {E(X)}²est fonction du premier moment théorique et du second moment théorique (élevé au carré).

De même,S²= _n−1ⁿ ₁

n

Pn

i=1X_i²−X¯² est fonction du premier moment échantillonnal et du second moment échantillonal (élevé au carré).

(22)

Espérance et variance de X ¯ , σ ˆ

²

et S

²

Soit un échantillon aléatoireE :X₁,X₂, . . . ,Xnassocié àX. SoitX¯ = ¹_nPn

i=1X_i. Alors:

E( ¯X) = µ_X, var( ¯X) = σ²

n . Soitσˆ²= ¹_nPn

i=1(X_i−µ_X)². Posonsµ_k =E{(X−µ_X)^k}. Alors:

E(ˆσ²) = σ², var(ˆσ²) = µ₄−µ²₂

n ,

= µ4−σ⁴ .

(23)

Espérance et variance de X ¯ , σ ˆ

²

et S

²

(suite)

Soit un échantillon aléatoireE :X₁,X₂, . . . ,X_nassocié àX. SoitS²= _n−1¹ Pn

i=1(X_i−X¯)². Alors:

E(S²) = σ², var(S²) =

n n−1

2(

µ₄−µ²₂

n −2(µ₄−2µ²₂

n² ) +µ₄−3µ²₂ n³

)

Le résultat précédent sur la variance est général. Si on suppose queX est de loi normale,X ∼ N(µ_X, σ²), alors

var(S²) = 2σ⁴ n−1.