Chapitre 12 Statistique inf´erentielle

(1)

Chapitre 12

Statistique inf´ erentielle

Cours de math´ ematiques de BCPST Deuxi` eme ann´ ee

(2)

Table des mati` eres

1 Estimation 2

1.1 Notion d’estimateur . . . 2

1.2 Notion de biais . . . 3

1.3 Estimateur de la moyenne . . . 4

1.4 Estimateur de la variance . . . 5

2 Intervalle de confiance 7 2.1 Objectif . . . 7

2.2 Théorème central limite (Deuxième forme) . . . 8

2.3 Cons´equence . . . 8

3 Test de conformit´e de la moyenne 13 3.1 Principe . . . 13

3.2 Test . . . 14

4 Exercices du td 17

(3)

Chapitre 12: Statistique inf´erentielle Estimation

Dans tout ce chapitre, n d´esignera un entier naturel non nul.

Les statistiques consistent à extraire de l’information pertinente d’une série statistique. Contrai- rement aux probabilités où on modélise une expérience puis on calcule la probabilité de certains

événements, en statistiques, on observe plusieurs résultats d’une expérience aléatoire puis on cherche

`

a en d´eduire un mod`ele qui permet d’expliquer au mieux ces observations.

On distingue deux types de statistiques :

• Les statistiques descriptives.

Si on s’intéresse à n individus et qu’on en déduit de l’information pour ces n individus, on parle de statistique descriptive.

• Les statistiques inf´erentielles.

Si on s’intéresse à n individus et qu’on en déduit de l’information pour un ensemble plus grand d’individus, on parle de statistique inférentielles. Les mathématiques permettent alors de justifier au mieux cette généralisation. On suppose donc que le caractère étudié de l’ensemble de la population est une variable aléatoireX suivant une certaine loi. A partir de l’échantillon observé, on souhaite obtenir le maximum d’information sur cette loi.

En BCPST1, on s’intéresse aux statistiques descriptives. Cette année, on va faire des statistiques inférentielles. En statistiques inférentielles, deux objectifs sont poursuivis :

1. Faire des prévisions (estimation donnée avec un encadrement et un taux de confiance associé).

C’est par exemple le cas si on mesure le taux de cholestérol sur 200 femmes âgées de 50 ans.

On cherche alors à avoir une idée du taux de cholestérol moyen pour une femme de 50 ans. On peut aussi interroger 1000 personnes d’une ville et leur demander si elles vont voter pour un candidat donné. On cherche alors à prédire combien de personne voteront pour ce candidat.

2. Prendre des décisions au vu des données. C’est par exemple le cas si on mesure le taux de cholestérol sur 200 femmes âgées de 50 ans avant et après un traitement médical. On veut savoir si le traitement médical est efficace ou non. On va donc estimer des paramètres et essayer d’estimer si la différence entre ces paramètres est dues au traitement médical ou au hasard.

1 Estimation

1.1 Notion d’estimateur

Soit X une variable aléatoire. Unn-échantillon de X est unn-uplet (X₁;X₂;· · ·;X_n) de variables aléatoires mutuellement indépendantes et de même loi que X.

D´efinition 1

* Remarque :

On utilise les notations de la précédente définition. Dans tout ce chapitre, X peut-être une variable aléatoire prenant un nombre fini de valeurs, une variable aléatoire discrète, une variable aléatoire à densité ou une variable aléatoire d’un type plus général.

, Exemple :

On utilise les notations de la précédente définition. On peut par exemple choisir au hasard un fran¸cais et noterXsa taille en centimètre. On va interroger au hasardnfran¸cais.X₁sera la taille en centimètre du premier interrogé,X₂ du second, ..., X_n du dernier.

(4)

Soient X une variable aléatoire dont la loi dépend d’un paramètre θ et (X₁;X₂;· · ·;X_n) un n-échantillon de X.

On appelle estimateur de θ toute variable aléatoire T_n fonction de (X₁;X₂;· · ·;X_n) donnant des informations sur θ. T_n peut donc s’écrire sous la forme f(X₁;X₂;· · ·;X_n) avec f une fonction numérique définie sur (X₁;X₂;· · ·;X_n) (Ω).

D´efinition 2

* Remarque :

On utilise les notations de la précédente définition.

1. A partir d’un ´echantillon, un estimateur donne une valeur. Cette valeur est l’estimation du param`etre.

2. On se rend compte que la définition d’un estimateur n’impose aucune contrainte entre ce dernier et le paramètre estimé. Il existe des estimateurs plus intéressants que d’autres,certains n’ont aucun intérêt !

3. Ce que l’on attend d’un estimateur T_n, c’est la suite (T_n)_n_∈N converge (convergence à définir rigoureusement !) vers θ. Ainsi, quand n sera grand,T_n donnera une valeur approchée de θ.

4. Dans ce cours, on s’intéressera uniquement uniquement à des estimateurs de l’espérance (si X admet une espérance) ou de la variance de X (siX admet une variance). On essaye donc,

`

a partir d’un ´echantillon, de donner une estimation fiable de l’esp´erance et de la variance de X.

5. Il est possible que la loi de X dépende de plusieurs paramètres. θ est l’un de ces paramètres.

θ n’est pas une variable al´eatoire, il est fix´e (mais pas connu !).

1.2 Notion de biais

Soient X une variable aléatoire dont la loi dépend d’un paramètre θ et (X₁;X₂;· · ·;X_n) un n-échantillon de X. Soit T_n un estimateur deθ.

• On appelle erreur d’estimation de T_n la variableT_n−θ.

• L’espérance de cette variable aléatoire (en cas d’existence) est appelée biais de T_n, on le noteb(T_n). On a donc, sous réserve d’existence, l’égalité suivante :

b(T_n) = E(T_n)−θ.

• On dit queT_n est un estimateur sans biais de θ siT_n son biais est nul, autrement dit si T_n admet une espérance et que cette espérance vaut θ. Sinon, on dit que l’estimateur est biaisé.

D´efinition 3

* Remarque :

On utilise les notations de la précédente définition. Même si T_n est sans biais, il est possible que

(5)

l’erreur entre l’estimation et le paramètre à estimer soit très importante car le biais ne donne qu’une information sur l’espérance (les écarts peuvent se compenser). Pour en savoir plus, on introduit le concept de risque quadratique.

Soient X une variable aléatoire dont la loi dépend d’un paramètre θ et (X₁;X₂;· · ·;X_n) un n-échantillon de X. Soit T_n un estimateur deθ.

• Le moment d’ordre 2 de T_n−θ (en cas d’existence) est appelé risque quadratique deT_n, on le note r(T_n). On a donc, sous réserve d’existence, l’égalité suivante :

r(T_n) = E (T_n−θ)² .

• SiT_n est un estimateur sans biais alors son risque quadratique est sa variance.

D´efinition 4

* Remarque :

On utilise les notations de la précédente définition. Notre objectif va être d’obtenir des estimateurs sans biais et avec le risque quadratique le plus faible possible.

1.3 Estimateur de la moyenne

Soient X une variable al´eatoire et (X₁;X₂;· · ·;X_n) un n-´echantillon de X. On pose : X_n= X₁+· · ·+X_n

n .

X_n est appel´e la moyenne empirique de X.

D´efinition 5

Soient X une variable al´eatoire admettant une esp´erance m et (X₁;X₂;· · ·;X_n) un n-

´echantillon de X. On note X_n la moyenne empirique de X.

• X_n est un estimateur sans biais dem.

• Si X admet une variance σ² alors le risque quadratique de cet estimateur vaut σ²

n . Proposition 6

* Remarque :

On utilise les notations de la pr´ec´edente proposition. On a donc lim

n−→+∞ r X_n

= 0. X_n est donc un bon estimateur de m. On peut dire de lui qu’il a les qualit´es suivantes :

1. Il est sans biais.

(6)

2. Il est asymptotiquement efficace car son risque quadratique tend vers 0.

3. Il est fortement convergent d’apr`es la loi faible des grands nombres.

4. La loi de l’erreur d’approximation est approximativement gaussienne quandnest grand d’après le théorème central limite.

6 Un peu de python:

Listing 1 – estimationesperance.py i m p o r t n u m p y as np

def e x p o(mu):

r e t u r n -np.log(1 -np.r a n d o m.r a n d()) /mu

def m o y e m p i r i q u e(n,mu):

s=0

for i in r a n g e(n):

s+=e x p o(mu) r e t u r n (s/n)

def e r r e u r(n,mu):

s=0

for i in r a n g e( 1 0 0 ) :

s+=abs(m o y e m p i r i q u e(n,mu) -1/mu) r e t u r n (s/ 1 0 0 )

En utilisant ce programme, on a obtenu : In [ 1 9 ] : e r r e u r(5 ,2)

Out[ 1 9 ] : 0 . 2 0 4 0 5 4 8 5 0 1 0 9 0 3 3 1

In [ 2 0 ] : e r r e u r(500 ,2)

Out[ 2 0 ] : 0 . 0 1 5 7 5 6 3 1 2 6 4 7 5 3 1 4 8 1

In [ 2 1 ] : e r r e u r( 5 0 0 0 , 2 )

Out[ 2 1 ] : 0 . 0 0 5 6 2 2 8 3 6 9 8 4 7 2 1 9 0 7 3

1.4 Estimateur de la variance

Soient X une variable al´eatoire et (X₁;X₂;· · ·;X_n) un n-´echantillon de X. On pose : S_n² = X₁²+· · ·+X_n²

n − X_n2

. S_n² est appel´e la variance empirique de X.

D´efinition 7

(7)

Soient X une variable aléatoire admettant une espérance m et une variance σ² et (X₁;X₂;· · ·;X_n) un n-échantillon de X. On note S_n² la variance empirique de X et S_n⁰² l’estimateur corrigé de la variance X. S_n² n’est pas un estimateur sans biais de la variance de X. On a :

E S_n²

−σ² =−σ² n . Proposition 8

* Remarque :

On utilise les notations de la pr´ec´edente proposition.

1. S_n² n’est pas un estimateur sans biais de la variance de X mais on note tout de mˆeme que :

n−→+∞lim b S_n²

= 0.

2. La plupart des tableurs utilisent donc S_n⁰², l’estimateur corrig´e de la variance X, pour estimer la variance X. Il est d´efini par :

S_n⁰² = n n−1S_n².

On prouve ais´ement que S_n⁰² est un estimateur sans biais de la variance de X.

3. On peut prouver que le risque quadratique de l’ estimateurS_n²vaut (n−1)×((n−1)µ⁴−(n−3)σ⁴)

n³ .

6 Un peu de python:

Listing 2 – estimationvariance.py i m p o r t n u m p y as np

def e x p o(mu):

r e t u r n -np.log(1 -np.r a n d o m.r a n d()) /mu

def m o y e m p i r(n,mu):

s=0

s+=e x p o(mu) r e t u r n (s/n)

def v a r i a n c c(n,mu):

s=0

s+=e x p o(mu) * * 2

r e t u r n (s/n-(m o y e m p i r(n,mu) ) * * 2 )

def e r r e u r(n,mu):

s=0

for i in r a n g e( 1 0 0 ) :

s+=abs(v a r i a n c e m p i r(n,mu) -(1/mu) * * 2 )

(8)

Chapitre 12: Statistique inf´erentielle Intervalle de confiance

r e t u r n (s/ 1 0 0 )

def v a r i a n c e m p i r c(n,mu):

s=0

s+=e x p o(mu) * * 2

r e t u r n ((s/n-(m o y e m p i r(n,mu) ) * * 2 ) * (n/(n- 1 ) ) )

def e r r e u r c(n,mu):

s=0

for i in r a n g e( 1 0 0 ) :

s+=abs(v a r i a n c e m p i r c(n,mu) -(1/mu) * * 2 ) r e t u r n (s/ 1 0 0 )

En utilisant ce programme, on a obtenu : In [ 3 4 ] : e r r e u r c(5 ,2)

Out[ 3 4 ] : 0 . 4 5 3 7 2 9 1 8 1 0 0 0 0 9 5 8 5

In [ 3 5 ] : e r r e u r c(50 ,2)

Out[ 3 5 ] : 0 . 1 4 8 2 1 5 5 8 9 4 6 8 1 6 6 7 4

In [ 3 6 ] : e r r e u r c(500 ,2)

Out[ 3 6 ] : 0 . 0 3 8 4 1 3 1 3 8 9 8 7 3 9 5 7 7 6

In [ 3 7 ] : e r r e u r(5 ,2)

Out[ 3 7 ] : 0 . 5 3 8 9 7 6 1 7 1 5 8 4 7 8 2 3 9

In [ 3 8 ] : e r r e u r(50 ,2)

Out[ 3 8 ] : 0 . 1 4 8 9 0 8 7 4 1 0 5 6 3 0 5 2 5

In [ 3 9 ] : e r r e u r(500 ,2)

Out[ 3 9 ] : 0 . 0 4 0 6 1 7 6 1 3 0 2 8 8 5 4 3 3 2

2 Intervalle de confiance

2.1 Objectif

Soient X une variable aléatoire admettant une espérance m et (X₁;X₂;· · ·;X_n) un n-échantillon de X. On a vu que X_n, la moyenne empirique de X, est un bon estimateur de m. On veut, dans cette partie, expliciter deux valeurs A et B délimitant un intervalle [A;B] dans lequel m est situé avec une probabilité fixée. A et B, contrairement à m qui est fixé (mais non connu), seront des variables aléatoires (puisqu’elles dépendent des résultats expérimentaux obtenus). Ce n’est pas le même problème que celui rencontré en Terminale quand on affirmait que P(m −1,96σ 6 X 6 m+ 1,96σ) ≈ 95% si X suit une loi normale de paramètre (m, σ²). Ici, m n’est pas connu et les bornes encadrant sont des variables aléatoires.

(9)

2.2 Th´ eor` eme central limite (Deuxi` eme forme)

Théorème central limite (Deuxième forme)

Soient m un réel et σ un réel strictement positif. Soit (X_n)_n∈N^? une suite de variables aléatoires de même loi, mutuellement indépendante admettant une moyenne m et un

´ecart-typeσ. Pour tout entier strictement positif n, on pose :

M_n=

(X₁+· · ·+X_n)

n −m

σ⁰

√n

avecσ⁰ = vu ut1

n Xn k=1

X_k− X₁+· · ·+X_n n

2

.

Pour tout (a, b) dans (R∪ {−∞,+∞})² tels que a < b, on a :

n−→lim+∞(P(a6M_n 6b)) =P (a6N 6b) avecN une variable aléatoire suivant une loi normale centrée réduite.

Th´eor`eme 9

* Remarque :

On utilise les notations du précédent théorème. On va utiliser cette deuxième forme lorsqu’on ne connaˆıt pas la variance des (X_n)_n_∈N^?. Typiquement, lorsqu’on fait une analyse statistique, on ne connaˆıt pas, a priori, à l’avance la variance. On le calcule donc au fur et à mesure des expériences, c’est ce qu’on a notéσ⁰. On l’appelle l’écart-type empirique de la suite (X_n)_n∈N^?.

2.3 Cons´ equence

Soient X une variable aléatoire et F sa fonction de répartition. On suppose F continue et strictement croissante. Pour toutp de ]0,1[, on appelle quantile d’ordre p de la loi de X l’unique réel a tel que :

F(a) =p.

D´efinition 10

, Exemple :

Voici la table de la loi normale centr´ee r´eduite :

(10)

BCPST 952 Variables aléatoires à densité Lycée du Parc

F) Table de la loi normale centrée réduite

On tabule ici les valeurs de la fonction de répartitionΦde la loi normale centrée réduiteN(0,1). Par dénition,

φ(x) = 1

√2π Z x

−∞

e⁻^t²^/2dt

Les décimales se lisent sur les lignes, et on ajoute les centièmes rangés en colonnes. Par exemple, la valeur de Φ(1,93) est donnée à l'intersection de la ligne 1,9 et de la colonne 0,03, et l'on peut lire Φ(1,93) = 0,9732, à 10⁻⁴ près. Au delà de la valeurx = 3,9, la valeur de Φ(x) est presque égale à 1 (toujours à10⁻⁴ près), elle n'est donc plus tabulée. Enn, pour les valeurs négatives de x, on utilise la relation Φ(−x) = 1−Φ(x)

x 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09

0.0 .5 .5039 .5079 .5119 .5159 .5199 .5239 .5279 .5318 .5358

0.1 .5398 .5438 .5478 .5517 .5557 .5596 .5636 .5675 .5714 .5753

0.2 .5793 .5832 .5871 .5910 .5948 .5987 .6026 .6064 .6103 .6141

0.3 .6179 .6217 .6255 .6293 .6331 .6368 .6406 .6443 .6480 .6517

0.4 .6554 .6591 .6628 .6664 .6700 .6736 .6772 .6808 .6844 .6879

0.5 .6915 .6950 .6985 .7019 .7054 .7088 .7123 .7157 .7190 .7224

0.6 .7257 .7291 .7324 .7357 .7389 .7422 .7454 .7486 .7517 .7549

0.7 .7580 .7611 .7642 .7673 .7703 .7734 .7764 .7793 .7823 .7852

0.8 .7881 .7910 .7939 .7967 .7995 .8023 .8051 .8078 .8106 .8133

0.9 .8159 .8186 .8212 .8238 .8264 .8289 .8315 .8340 .8365 .8389

1.0 .8413 .8438 .8461 .8485 .8508 .8531 .8554 .8577 .8599 .8621

1.1 .8643 .8665 .8686 .8708 .8729 .8749 .8770 .8790 .8810 .8830

1.2 8849 .8869 .8888 .8906 .8925 .8943 .8962 .8980 .8997 .9015

1.3 .9032 .9049 .9066 .9082 .9099 .9115 .9131 .9147 .9162 .9177

1.4 .9192 .9207 .9222 .9236 .9251 .9265 .9279 .9292 .9306 .9319

1.5 .9332 .9345 .9357 .9370 .9382 .9394 .9406 .9418 .9429 .9441

1.6 .9452 .9463 .9474 .9484 .9495 .9505 .9515 .9525 .9535 .9545

1.7 .9554 .9564 .9573 .9582 .9591 .9599 .9608 .9616 .9625 .9633

1.8 .9641 .9649 .9656 .9664 .9671 .9678 .9686 .9693 .9699 .9706

1.9 .9713 .9719 .9726 .9732 .9738 .9744 .9750 .9756 .9761 .9767

2.0 .9772 .9778 .9783 .9788 .9793 .9798 .9803 .9808 .9812 .9817

2.1 .9821 .9826 .9830 .9834 .9838 .9842 .9846 .9850 .9854 .9857

2.2 .9861 .9864 .9868 .9871 .9875 .9878 .9881 .9884 .9887 .9890

2.3 .9893 .9896 .9898 .9901 .9904 .9906 .9909 .9911 .9913 .9916

2.4 .9918 .9920 .9922 .9925 .9927 .9929 .9931 .9932 .9934 .9936

2.5 .9938 .9940 .9941 .9943 .9945 .9946 .9948 .9949 .9951 .9952

2.6 .9953 .9955 .9956 .9957 .9959 .9960 .9961 .9962 .9963 .9964

2.7 .9965 .9966 .9967 .9968 .9969 .9970 .9971 .9972 .9973 .9974

2.8 .9974 .9975 .9976 .9977 .9977 .9978 .9979 .9979 .9980 .9981

2.9 .9981 .9982 .9982 .9983 .9984 .9984 .9985 .9985 .9986 .9986

3.0 .9986 .9987 .9987 .9988 .9988 .9989 .9989 .9989 .9990 .9990

3.1 .9990 .9991 .9991 .9991 .9992 .9992 .9992 .9992 .9993 .9993

3.2 .9993 .9993 .9994 .9994 .9994 .9994 .9994 .9995 .9995 .9995

3.3 .9995 .9995 .9995 .9996 .9996 .9996 .9996 .9996 .9996 .9997

3.4 .9997 .9997 .9997 .9997 .9997 .9997 .9997 .9997 .9997 .9998

3.5 .9998 .9998 .9998 .9998 .9998 .9998 .9998 .9998 .9998 .9998

3.6 .9998 .9998 .9999 .9999 .9999 .9999 .9999 .9999 .9999 .9999

3.7 .9999 .9999 .9999 .9999 .9999 .9999 .9999 .9999 .9999 .9999

3.8 9999 .9999 .9999 .9999 .9999 .9999 .9999 .9999 .9999 .9999

3.9 .10000 .10000 .10000 .10000 .10000 .10000 .10000 .10000 .10000 .10000

2014-2015 Soit un réelx. Pour évaluer Φ(x) (avec Φ la fonction de rĆ. Courant epartition d’une variable al´page 11eatoire suivant une loi normale centrée réduite), on procède ainsi :

• Si xappartient à [0,4[, une très bonne approximation de Φ(x) se trouve à l’intersection de la ligne donnée par l’unité et la première décimale dexet de la colonne donnée par la deuxième décimale de x. Φ(1,83) vaut à peu près 0,9664.

• Si x est sup´erieur `a 4, on approxime Φ(x) par un.

• Si x est négatif, on utilise la relation liant Φ(x) et Φ(−x) (cf chapitre ”Variables à densité”).

(11)

En utilisant cette table, on trouve que le quantile d’ordre 0.9 vaut ..., celui d’ordre 0.95 vaut ..., celui d’ordre 0.975 vaut ... et enfin, celui d’ordre 0.995 vaut ...

Soient X une variable aléatoire admettant une espérance met une variance non nulle et (X₁;X₂;· · ·;X_n) unn-échantillon deX. Pour tout entier strictement positifn, on pose :

X_n = X₁+· · ·+X_n

n et S_n= vu ut1

n Xn k=1

X_k−X_n2

.

• Pour tout α de ]0,1[, on a alors :

n−→lim+∞

P

X_n−u₁₋^α

2

S_n

√n < m < X_n+u₁₋^α

2

S_n

√n

= 1−α avec u₁₋^α

2 le quantile d’ordre 1−^α₂ de la loi normale centr´ee r´eduite.

• On dit que, pour tout α de ]0,1[,

X_n−u₁₋^α

2

S_n

√n, X_n+u₁₋^α

2

S_n

√n

est un intervalle de confiance de m avec un niveau de confiance de 1−α.

Proposition 11

* Remarque :

On utilise les notations de la pr´ec´edente proposition.

1. Soit α un ´el´ement de ]0,1[. Dans la pratique, on se permettra de prendre pour intervalle de confiance de m avec un niveau de confiance de 1−α l’intervalle suivant :

X_n−u₁₋^α

2

S_n

√n, X_n+u₁₋^α

2

S_n

√n

lorsque n sera sup´erieur `a 30. Sin est trop petit, on utilisera d’autres lois (par exemple la loi de Student si les X_i suivent une loi normale).

2. On comprend queS_nest un indice de dispersion. Plus il est grand, plus l’intervalle de confiance

´

enonc´e est large (et donc peu pr´ecis).

3. On qualifie l’intervalle de confiance de sym´etrique car, si n est grand, on a : P

m < X_n−u₁₋^α

2

S_n

√n

=P

m > X_n+u₁₋^α

2

S_n

√n

= α 2.

M´ethode:

On nous donne un échantillon d’une variable aléatoire X et on nous demande un intervalle de confiance de m avec un niveau de confiance de 1−α (α élément donné de ]0,1[). On procède alors ainsi :

1. A partir des mesures, on calcule S_n(ω) et X_n(ω). (On utilise les notations de la pr´ec´edente proposition. )

(12)

2. On d´etermine le r´eel u tel que ϕ(u) = 1− α

2 en notant ϕ la fonction de répartition de la loi normale centrée réduite. Quelques valeurs classiques :

Niveau de confiance 80% 90% 95% 99%

Valeur de u₁₋^α

2 1,29 1,65 1,96 2,58 3. On a trouv´e notre intervalle, c’est

X_n(ω)−u₁₋^α

2

S_n(ω)

√n , X_n(ω) +u₁₋^α

2

S_n(ω)

√n

.

, Exemple :

Un boulanger souhaite savoir s’il réussit à fabriquer ses pains de 500g à vue ou s’il a encore besoin de peser sa pâte. Il faut donc un test sur sa production de 200 pains de la journée et obtient des moyennes et variances empiriques suivants :

M_n = 505g et S_n² = 1500g²

Il peut alors évaluer l’intervalle de confiance de niveau 95% adapté à cette situation. D’après ce qu’on vient de dire, il y a 95% de chance que le poids en gramme de son pain appartienne à l’intervalle

√200, M_n+u S_n

√200

avec u = 1,96 (valeur obtenue dans une table d’une loi normale centr´ee r´eduite). Notons I cette intervalle, on a donc :

I =

"

505−1,96×

√1500

√200 ; 505 + 1,96×

√1500

√200

#

= [505−5,37; 505 + 5,37]

= [499,63; 510,37]

6 Un peu de python:

Listing 3 – intervalleconfiance.py i m p o r t n u m p y as np

def e x p o(mu):

r e t u r n( -np.log(1 -np.r a n d o m.r a n d( ) ) /mu)

def E(n, mu):

s=0

s+=e x p o(mu)

(13)

r e t u r n(s/n)

def S(n, mu):

s=0

a=E(n, mu)

s+=(e x p o(mu) -a) * * 2 r e t u r n(np.s q r t(s/n))

def c o m p t e u r(n, mu, u):

c=0

for i in r a n g e( 5 0 0 ) :

a=E(n, mu) -u*S(n, mu)/np.s q r t(n) b=E(n, mu)+u*S(n, mu)/np.s q r t(n) if a<1/mu<b:

c+=1 r e t u r n(c/ 5 0 0 )

def t e s t(u):

r e t u r n([c o m p t e u r(3 , 5 , u) , c o m p t e u r(10 , 5 , u) , c o m p t e u r(50 , 5 , u) , c o m p t e u r(200 , 5 , u)])

En utilisant ce programme, on a obtenu : In [ 1 5 3 ] : t e s t( 1 . 2 9 )

Out[ 1 5 3 ] : [0.732 , 0.788 , 0.772 , 0 . 7 8 8 ]

In [ 1 5 4 ] : t e s t( 1 . 2 9 )

Out[ 1 5 4 ] : [0.734 , 0.806 , 0.81 , 0 . 8 5 2 ]

In [ 1 5 5 ] : t e s t( 1 . 6 5 )

Out[ 1 5 5 ] : [0.804 , 0.878 , 0.884 , 0 . 9 0 8 ]

In [ 1 5 6 ] : t e s t( 1 . 9 6 )

Out[ 1 5 6 ] : [0.856 , 0.896 , 0.924 , 0 . 9 5 4 ]

In [ 1 5 7 ] : t e s t( 2 . 5 8 )

Out[ 1 5 7 ] : [0.916 , 0.972 , 0.974 , 0 . 9 8 4 ] In [ 1 5 8 ] : t e s t(5)

Out[ 1 5 8 ] : [0.978 , 0.998 , 1.0 , 1 . 0 ]

(14)

Chapitre 12: Statistique inf´erentielle Test de conformit´e de la moyenne

3 Test de conformit´ e de la moyenne

3.1 Principe

On considère une population dans laquelle les individus possèdent un certain caractère X (X est une variable aléatoire) et dont la valeur de la moyenne m est inconnue.

• L’hypothèse selon laquelle m vaut une valeur fixé µs’appelle l’hypothèse nulle et est notée H₀. H₀ est l’hypothèse ”m=µ”.

• N’importe quelle autre hypothèse qui diffère de l’hypothèse H₀ s’appelle l’hy- pothèse alternative et est notéeH₁.H₁ est l’hypothèse ”m 6=µ”.

• Le risque de première espèce est la probabilité de rejeter l’hypothèse H₀ alors qu’elle est vraie, c’est donc P_(H₀_{est vraie)}(Rejeter H₀).

• Le risque de seconde espèce est la probabilité de accepter l’hypothèse H₀ alors qu’elle est fausse, c’est donc P_(H₀est fausse)(AccepterH₀).

D´efinition 12

Principe :

On va alors étudier un échantillon de la population et, à partir des résultats obtenus, rejeter ou non l’hypothèse formulée. L’objectif est de fournir une règle permettant, à partir des résultats obtenus sur l’échantillon, de faire un choix entre ces deux hypothèses. C’est l’hypothèseH₀qui est soumise au test et toute la démarche du test s’effectue en supposant cette hypothèse vraie. Nous allons donc établir des règles de décision qui vont nous conduire à accepter ou à rejeter l’hypothèse H₀ en minimisant les risques de première espèce et,si possible, de seconde espèce. On suit donc les étapes suivantes :

1. On dispose de valeurs observ´ees (x₁, . . . , x_n) d’un n-´echantillon de la variableX.

2. On énonce clairement les propriétés de base du modèle pour pouvoir travailler : par exemple,

”On suppose X a une esp´erance et qu’elle vaut µ”. En effectuant cette hypoth`ese, le n-

´

echantillon obtenu est la réalisation de (X₁;X₂;· · ·;X_n) qui sontn variable aléatoire de même loi queX (et donc en particulier d’espéranceµ) et indépendante. On énonce donc l’hypothèse nulle H₀ qui est l’hypothèse qui va être soumise au test. C’est par exemple ”m =µ”’.

3. On élabore un test numérique : cela signifie qu’on va expliciter une variable numérique T, fonction de (X₁, . . . , X_n), un intervalle (ou une partie) I de R, telles que, si on suppose H₀ vraie alors :

P(T ∈I)>1−α

avec α un élément de ]0,1[ fixé par l’énoncé, c’est le risque du test (1−α est appelé niveau de confiance du test). Typiquement, α vaut 5% ou 1%.

4. Grâce aux mesures, on évalue la valeur t queT prend. Deux possibilités se présentent :

• Soit t n’appartient pas `a I, on ”rejette” H₀. Le risque de se tromper est alors au plus de α car si H₀ est vraie alors P(T 6∈I)6α.

• Soit t appartient pas `a I : on ”accepte” H₀. Cela ne signifie pas pour autant que H₀ est vraie !

* Remarque :

On expose ici le principe des tests de conformité de la moyenne. On peut, bien sûr, en statistique, faire d’autres types de test. Au programme des BCPST2 ne figurent que les tests de conformité de la moyenne.

(15)

3.2 Test

Soient X une variable aléatoire admettant une espérance m inconnue et une variance non nulle et (X₁;X₂;· · ·;X_n) un n-échantillon deX. Pour tout entier strictement positif n, on pose :

X_n = X₁+· · ·+X_n

n et S_n= vu ut1

n Xn k=1

X_k−X_n2

.

Soitµ un réel. L’hypothèse nulle, H₀, est l’hypothèse ”m=µ”. L’hypothèse alternative, H₁, est l’hypothèse ”m6=µ”.

• Si H₀ est vraie et si n est sup´erieur `a 30 alors on a :

P







X_n−µ S_n

√n

> u₁₋^α

2





≈α

avec u₁₋^α

2 le quantile d’ordre 1−^α₂ de la loi normale centr´ee r´eduite.

• Soit ω un r´esultat obtenu. Si X_n(ω)−µ S_n(ω)

√n

appartient `a

−u₁₋^α

2, u₁₋^α

2

, on dit que

la moyenne de X vaut bien µet qu’ on accepteH₀. Sinon, on dit que la moyenne de X ne vaut pas, a priori,µ. On refuse H₀ et le risque de se tromper est deα.

Proposition 13

* Remarque :

On utilise les notations de la précédente proposition. On souhaite que la quantité

X_n(ω)−µ S_n(ω)

√n

soit petite quand on présent une valeur µ pour la moyenne de X. Si n est grand (supérieur à 30), on approximeP







X_n−µ S_n

√n

> u₁₋^α

2





parα. Ainsi, le risque de première espèce (refuserH₀ alors qu’elle est vraie) vaut approximativement α. Plus α va être grand, plus le test va être sélectif : on va avoir plus souvent tendance à refuser H₀ mais, lorsque celle-ci va être acceptée, elle aura plus de sens. On peut faire le parallèle avec un concours si on le souhaite !

M´ethode:

On nous donne un n-échantillon (avec n > 30) d’une variable aléatoire X, une valeur µ supposée pour la moyenne et un taux de risque α. On nous demande si la moyenne de X vaut bien µ. On procède alors ainsi :

(16)

2. A partir de la table de la loi normale centr´ee r´eduite, on explicite u₁₋^α

2 le quantile d’ordre 1− ^α₂ de la loi normale centr´ee r´eduite.

3. Si X_n(ω)−µ S_n(ω)

√n

appartient `a

−u₁₋^α

2, u₁₋^α

2

, on dit que la moyenne deXvaut bienµ, on accepte

H₀. Sinon, on dit que la moyenne de X ne vaut pas, a priori, µ. On refuseH₀ et le risque de se tromper est de α.

M´ethode:

On nous donne un n-échantillon (avec n > 30) d’une variable aléatoire X et une valeur µ, on nous demande quel est le risque α de supposer que la moyenne de X existe et vaut µ. On procède alors ainsi :

2. On cherche le plus petit r´eel u tel que X_n(ω)−µ S_n(ω)

√n

appartienne `a [−u, u].

3. A partir de la table de la loi normale centr´ee r´eduite, on cherche α tel que u₁₋^α

2 soit u.

X_n(ω)−µ S_n(ω)

√n

appartient alors `a

−u₁₋^α

2, u₁₋^α

2

, on accepte doncH₀etαest le risque de premi`ere

esp`ece.

, Exemple :

On reprend l’exemple du boulanger qui a fabriqu´e 200 pains et obtenu des moyennes et variances empiriques suivants :

M_n= 505g et S_n² = 1500g². On fait l’hypoth`ese que sa moyenne th´eorique est de 500 g.

• Si on fait un test à 5% de confiance, on a déjà calculé l’intervalle I adapté à ce taux de confiance, on avait obtenu :

I = [499,63; 510,37].

Comme 500 ∈ I, on ne peut pas conclure sur le fait qu’il soit raisonnable de penser que sa moyenne th´eorique soit bien de 500 g.

• Si on recommence avec un test à 10% de confiance, l’intervalleJ adapté à ce taux de confiance est :

J =

"

505−1,65×

√1500

√200 ; 505 + 1,65×

√1500

√200

#

= [500,5; 509,5]

Comme 500 6∈ J, on peut conclure (avec un risque de 10% de se tromper) qu’il n’est pas raisonnable de penser que sa moyenne th´eorique est de 500 g.

-) Exercice 1 :

On modélise la durée de vie d’un téléphone portable d’une certaine marque par une loi géométrique

(17)

surN de paramètre p. On cherche à déterminerp. On demande pour cela à 1000 personnes la durée en année durant laquelle ils ont utilisé leur dernier portable, voici ce qu’on a obtenu :

Ann´ees 0 1 2 3 4 5 6 7

Effectif 68 56 189 260 180 120 80 47

1. Déterminer un intervalle de confiance au risque 0,05 pour la durée moyenne d’utilisation du portable. Arrondir au millième.

2. D´eterminer un intervalle de confiance pourp.

3. Le constructeur affirme que ses t´el´ephones durent en moyenne 4 ans. Qu’en pensez-vous ?

(18)

Chapitre 12: Statistique inf´erentielle Exercices du td

4 Exercices du td

Exercices ` a chercher

. Exercice 1 :

Pour évaluer rapidement les résultats obtenus par ses 200 élèves, un professeur décide de corriger quelques copies tirées au hasard. Il admet que les notes suivent une loi normale de variance 4.

1. Le professeur corrige un ´echantillon de 32 copies et trouve une moyenne de 11. Quel est l’intervalle de confiance `a 95% de la moyenne des 200 copies ?

2. Combien de copies le professeur doit-il corriger s’il veut situer la moyenne dans un intervalle de confiance d’amplitude 2 avec un risque 5% ?

. Exercice 2 :

Contrairement aux idées re¸cues, l’épinard n’est pas l’aliment le plus riche en fer. La lentille, par exemple, en apporte davantage. Pour vérifier ces propos, on a procédé à des analyses de fer sur10

échantillons d’épinard et 10 échantillons de lentilles. Les résultats (teneur en fer en mg pour 100g de produit frais) sont indiqués dans le tableau suivant :

Echantillon´ 1 2 3 4 5 6 7 8 9 10

Epinard´ 2.64 2.75 2.82 2.72 2.66 2.59 2.83 2.7 2.67 2.62 Lentille 9.02 9.08 8.82 8.94 8.95 9.11 9.14 9.02 9.04 8.85

1. Calculer la teneur moyenne en fer, la valeur médiane et l’écart-type pour les épinards et les lentilles.

2. Déterminer un intervalle de confiance de à 95% pour la moyenne pour les épinards et les lentilles.

3. R´ealiser un graphique qui permet d’illustrer le propos initial.

Exercices ` a faire pendant la classe

- Exercice 3 :

On souhaite comparer les tailles d’une même type de plants de tomates effectués sur des sols de différentes natures.

On désigne par A, B, C, D les populations constituées par les plants sur le sol de type respectifs 1,2,3,4. Elles sont constituées chacune de plus de 10 000 plants. Pour tout entier naturel non nul i, on noteX_i la variable statistique :taille de l’individu (en mm) i à 5 mois après plantation.

1. Les données sur la populationAsont déjà connues. On sait que la moyenne et l’écart type de X_A (pour toute la population A) sont : µ_A = 570 et σ_A= 152. On mesure au hasard dans A un échantillon de 250 individus et on note M la moyenne de cette échantillon.

(a) Donner un intervalle de confiance deM de niveau de confiance 0,95.

(b) Quelle devrait être la taille minimale de l’échantillon à considérer pour que M soit une estimation de µ_A à 10mm près près avec une confiance de 0,99 ?

(19)

Chapitre 12: Statistique inf´erentielle Exercices du td

2. Dans la populationB, la taille moyenne empirique d’unéchantillon EB de 250 individus est m_B = 555.Peut-on dire a priori qu’il y a une différence significative entre les tailles moyennes des deux catégoriesA et B?

3. La taille moyenne µ_C dans la population C n’est pas connue. Pour l’estimer, on a choisi au hasard un ´echantillonEC. Le tableau suivant repr´esente la distibution statistique surEC de la taille en mm.

x 100−300 300−400 400−500 500−600 600−700 700−900

n_i 10 19 30 38 31 22

Donner une estimation de la taille moyenne µ_C de la population C avec la confiance 0,95%

et dire si on peut dire, avec une confiance de 95% s’il y a une diff´erence significative de taille entre les populations A etC.

4. Concernant le population D, quelqu’un de bien intentionné avait déjà fait les caluls avant nous. La personne en question a obtenu une moyenne m_D = 507, un écart-type s_D = 170 et un intervalle de confiance à 95% de la moyenne théorique µ_D : I_D = [480,534]. Peut-on affirmer qu’il y a une différence de taille moyenne entre les populations C etD?