Probabilit´es et observations ´economiques
C. Tuleau-Malot
Universit´e de Nice - Sophia Antipolis
Plan
1
Estimation par intervalle de confiance
Exemples de test
Il existe diff´erents tests :
Tests d’hypoth`ese : on va comparer la moyenne sur la population ` a une valeur de r´ef´erence
Tests de comparaison : on va comparer la moyenne de deux populations
Test d’ad´equation : on va regarder si l’on peut consid´erer que
notre variable suit une distribution pr´e-d´efinie
Exemples de test
Il existe diff´erents tests :
Tests d’hypoth`ese : on va comparer la moyenne sur la population ` a une valeur de r´ef´erence
Tests de comparaison : on va comparer la moyenne de deux populations
Test d’ad´equation : on va regarder si l’on peut consid´erer que notre variable suit une distribution pr´e-d´efinie
Test d’ind´ependance : on va voir si deux variables al´eatoires
sont ind´ependantes ou non
Strat´egie
Dans chacun des cas cit´es pr´ec´edemment, on va :
1
D´efinir les hypoth`eses H
0et H
aStrat´egie
Dans chacun des cas cit´es pr´ec´edemment, on va :
1
D´efinir les hypoth`eses H
0et H
a2
on va calculer une statistique de test (une variable al´eatoire)
que l’on peut enti`erement ´evaluer ` a partir d’observations et
dont on connaˆıt la loi sous l’hypoth`ese H
0Strat´egie
Dans chacun des cas cit´es pr´ec´edemment, on va :
1
D´efinir les hypoth`eses H
0et H
a2
on va calculer une statistique de test (une variable al´eatoire) que l’on peut enti`erement ´evaluer ` a partir d’observations et dont on connaˆıt la loi sous l’hypoth`ese H
03
si la statistique de test, calcul´ee sur l’´echantillon, prend une
valeur trop improbable, alors on rejette H
0Strat´egie (2)
H
0et H
ane jouent pas le mˆeme rˆ ole
H
0: hypoth`ese `a laquelle on souhaite accorder le b´en´efice du doute
on rejette H
0que si les observations penchent fortement en
faveur de H
aStrat´egie (2)
H
0et H
ane jouent pas le mˆeme rˆ ole
H
0: hypoth`ese `a laquelle on souhaite accorder le b´en´efice du doute
on rejette H
0que si les observations penchent fortement en
faveur de H
aStrat´egie (3)
Exemple :
Une entreprise cherche ` a introduire un nouveau produit A, et le fait tester ` a 150 acheteurs potentiels, en le comparant ` a un produit concurrent B. 80 disent pr´ef´erer le produit A. La question qui se pose est : “peut-on conclure que plus de la moiti´e des
consommateurs pr´ef`erent le produit A”.
L’entreprise d´esirant montrer que son produit est meilleur, il faut prendre :
H
0: “moins de la moiti´e des consommateurs pr´ef`erent le produit A”
H
aest en g´en´eral l’hypoth`ese que l’on veut d´emontrer.
Cadre
Dans un premier temps, nous nous limitons ` a des tests de
comparaison de la moyenne d’une population ou d’une proportion
dans une population, en faisant une comparaison ` a une valeur de
r´ef´erence.
Cadre
Dans un premier temps, nous nous limitons ` a des tests de
comparaison de la moyenne d’une population ou d’une proportion dans une population, en faisant une comparaison ` a une valeur de r´ef´erence.
Si on note µ la moyenne d’une population, il existe diff´erents tests :
H
0: µ ≤ µ
0et H
a: µ > µ
0(test unilat´eral sup´erieur)
H
0: µ ≥ µ
0et H
a: µ < µ
0(test unilat´eral inf´erieur)
H
0: µ = µ
0et H
a: µ 6 = µ
0(test bilat´eral)
Cadre (2)
Deux d´ecisions possibles :
on ne rejette pas l’hypoth`ese H
0on rejette l’hypoth`ese H
0Cadre (2)
Deux d´ecisions possibles :
on ne rejette pas l’hypoth`ese H
0on rejette l’hypoth`ese H
0Cela revient ` a d´efinir une r´egion de rejet, on savoir un sous-espace de R
no` u l’on d´ecide H
aPb : quand on prend une d´ecision, on peut se tromper. Deux sources d’erreur :
on rejette H
0alors que H
0est vrai : erreur de premi`ere esp`ece
on ne rejette pas H
0alors que H
aest vrai : erreur de
deuxi`eme esp`ece
Cadre (3)
Exemple :
erreur de premi`ere esp`ece : conclure que plus de la moiti´e des consommateurs pr´ef`erent le produit A alors que ce n’est pas vrai
erreur de deuxi`eme esp`ece : conclure que moins de la moiti´e
des consommateurs pr´ef`erent le produit A alors que ce n’est
pas vrai
d´efinition seuil
La probabilit´e de faire une erreur de premi`ere esp`ece est appel´ee seuil de signification du test
ce seuil est g´en´eralement not´e α
ce seuil est g´en´eralement fix´e arbitrairement au d´ebut du test
on ne contrˆ ole pas la probabilit´e de la seconde erreur!
Comparaison de la moyenne `a une norme
Deux cadres :
σ
2connu
σ
2inconnu
Comparaison de la moyenne `a une norme : σ 2 connu
Test bilat´eral : H
0: µ = µ
0H
a: µ 6 = µ
0Exemple :
Une chaˆıne de production remplit des barils de lessive de 5kg. On p`ese pr´ecis´ement 36 barils pour savoir si la chaˆıne est bien r´egl´ee, ` a savoir si la moyenne de remplissage est bien µ = 5kg .
Pour r´ealiser le test, on suppose que la variable al´eatoire X qui
n’est autre que le remplissage du baril en kg, suit une loi
N (µ; σ = 0.05). D’apr`es l’´enonc´e, on a n = 36.
Comparaison de la moyenne `a une norme : σ 2 connu (2)
Principe :
On ne connait pas µ mais on peut l’estimer
Comparaison de la moyenne `a une norme : σ 2 connu (2)
Principe :
On ne connait pas µ mais on peut l’estimer
estimateur : ¯ X
nComparaison de la moyenne `a une norme : σ 2 connu (2)
Principe :
On ne connait pas µ mais on peut l’estimer estimateur : ¯ X
nestimation : on calcule ¯ x
n` a partir des 36 observations et si ¯ x
nest trop ´eloign´e de µ
0on rejette H
0Comparaison de la moyenne `a une norme : σ 2 connu (2)
Principe :
On ne connait pas µ mais on peut l’estimer estimateur : ¯ X
nestimation : on calcule ¯ x
n` a partir des 36 observations et si ¯ x
nest trop ´eloign´e de µ
0on rejette H
0que veut dire trop loin?
Comparaison de la moyenne `a une norme : σ 2 connu (2)
Si l’on suppose H
0, ¯ X
nest une loi N (µ
0; σ = 0.05/ √
n)
Comparaison de la moyenne `a une norme : σ 2 connu (2)
Si l’on suppose H
0, ¯ X
nest une loi N (µ
0; σ = 0.05/ √
n)
si la valeur calcul´ee ¯ x
nest trop improbable au vu de la
distribution de ¯ X
n, on rejette H
0Comparaison de la moyenne `a une norme : σ 2 connu (2)
Si l’on suppose H
0, ¯ X
nest une loi N (µ
0; σ = 0.05/ √ n) si la valeur calcul´ee ¯ x
nest trop improbable au vu de la distribution de ¯ X
n, on rejette H
0sous H
0, ¯ X
n∼ N (µ
0; σ = 0.05/ √ n) soit Z
n= √
n
X¯n−µ0σ
∼ N (0; 1)
Comparaison de la moyenne `a une norme : σ 2 connu (2)
Si l’on suppose H
0, ¯ X
nest une loi N (µ
0; σ = 0.05/ √ n) si la valeur calcul´ee ¯ x
nest trop improbable au vu de la distribution de ¯ X
n, on rejette H
0sous H
0, ¯ X
n∼ N (µ
0; σ = 0.05/ √ n) soit Z
n= √
n
X¯n−µ0σ
∼ N (0; 1)
Z
nstatistique de test et z
nstatistique de test observ´ee (plus
| z
n| loin de 0 et plus on pr´ef`ere H
a)
Comparaison de la moyenne `a une norme : σ 2 connu (2)
M´ethode 1 :
On r´efl´echit ` a la r´egion de rejet :
Comparaison de la moyenne `a une norme : σ 2 connu (2)
M´ethode 1 :
On r´efl´echit ` a la r´egion de rejet : z
n∈ ] − ∞ ; − t[ ∪ ]t; + ∞ [
Comparaison de la moyenne `a une norme : σ 2 connu (2)
M´ethode 1 :
On r´efl´echit ` a la r´egion de rejet : z
n∈ ] − ∞ ; − t[ ∪ ]t; + ∞ [
Il faut trouver t de sorte de contrˆ oler l’erreur de premi`ere
esp`ece
Comparaison de la moyenne `a une norme : σ 2 connu (2)
M´ethode 1 :
On r´efl´echit ` a la r´egion de rejet : z
n∈ ] − ∞ ; − t[ ∪ ]t; + ∞ [ Il faut trouver t de sorte de contrˆ oler l’erreur de premi`ere esp`ece
t est le fractile d’ordre 1 − α/2 d’une loi normale
Comparaison de la moyenne `a une norme : σ 2 connu (2)
M´ethode 1 :
On r´efl´echit ` a la r´egion de rejet : Z
n∈ ] − ∞ ; − t[ ∪ ]t; + ∞ [ Il faut trouver t de sorte de contrˆ oler l’erreur de premi`ere esp`ece
t est le fractile d’ordre 1 − α/2 d’une loi normale
Exemple :
Comparaison de la moyenne `a une norme : σ 2 connu (2)
Et si on n’avait pas ´emis l’hypoth`ese de loi normale sur notre
variable d’int´erˆet X , est ce que cela aurait chang´e quelque chose?
Comparaison de la moyenne `a une norme : σ 2 connu (2)
Et si on n’avait pas ´emis l’hypoth`ese de loi normale sur notre variable d’int´erˆet X , est ce que cela aurait chang´e quelque chose?
NON
Comparaison de la moyenne `a une norme : σ 2 connu (2)
Et si on n’avait pas ´emis l’hypoth`ese de loi normale sur notre variable d’int´erˆet X , est ce que cela aurait chang´e quelque chose?
NON
En effet, grˆ ace au th´eor`eme central limit, on aurait que ¯ X
nsuit approximativement une loi N (µ
0; σ = 0.05/ √
n)
Comparaison de la moyenne `a une norme : σ 2 connu (2)
M´ethode 2 :
On calcule z
nComparaison de la moyenne `a une norme : σ 2 connu (2)
M´ethode 2 : On calcule z
non calcule P ( | Z
n| ≥ z
n) : cette quantit´e est appel´ee la
p-valeur
Comparaison de la moyenne `a une norme : σ 2 connu (2)
M´ethode 2 : On calcule z
non calcule P ( | Z
n| ≥ z
n) : cette quantit´e est appel´ee la p-valeur
si p-valeur < α : on d´ecide H
a, sinon on ne rejette pas H
0Comparaison de la moyenne `a une norme : σ 2 connu (2)
M´ethode 2 : On calcule z
non calcule P ( | Z
n| ≥ z
n: cette quantit´e est appel´ee la p-valeur si p-valeur < α) : on d´ecide H
a, sinon on ne rejette pas H
0Exemple : Pour z
n= 2.4, on lit p-valeur = 0.0164. Puisque
p − valeur < α on rejette H
0Comparaison de la moyenne `a une norme : σ 2 inconnu
On a toujours Z
n= √ n
X¯n−µ0σ
∼ N (0; 1).
Comparaison de la moyenne `a une norme : σ 2 inconnu
On a toujours Z
n= √ n
X¯n−µ0σ
∼ N (0; 1).
Mais Z
nd´epend d’un param`etre inconnu
Comparaison de la moyenne `a une norme : σ 2 inconnu
On a toujours Z
n= √ n
X¯n−µ0σ
∼ N (0; 1).
Mais Z
nd´epend d’un param`etre inconnu : σ
Comparaison de la moyenne `a une norme : σ 2 inconnu
On a toujours Z
n= √
n
X¯n−µσ 0∼ N (0; 1).
Mais Z
nd´epend d’un param`etre inconnu : σ
Donc, on ne peut pas utiliser Z
npour d´eterminer la zone de rejet
Comparaison de la moyenne `a une norme : σ 2 inconnu
On a toujours Z
n= √ n
X¯n−µ0σ
∼ N (0; 1).
Mais Z
nd´epend d’un param`etre inconnu : σ
Donc, on ne peut pas utiliser Z
npour d´eterminer la zone de rejet
On utilise la mˆeme astuce que dans la construction d’un intervalle
de confiance ` a variance inconnue
Comparaison de la moyenne `a une norme : σ 2 inconnu (2)
on estime σ
2par ˆ σ
n2=
n−11P
ni=1
(X
i− X ¯
n)
2Comparaison de la moyenne `a une norme : σ 2 inconnu (2)
on estime σ
2par ˆ σ
n2=
n−11P
ni=1
(X
i− X ¯
n)
2si on a l’hypoth`ese de normalit´e sur X , alors on utilise le fait que T
n= √
n
X¯nˆ−µ0σn
∼ T (n − 1)
Comparaison de la moyenne `a une norme : σ 2 inconnu (2)
on estime σ
2par ˆ σ
n2=
n−11P
ni=1
(X
i− X ¯
n)
2si on a l’hypoth`ese de normalit´e sur X , alors on utilise le fait que T
n= √
n
X¯nˆ−µ0σn
∼ T (n − 1)
sans hypoth`ese de normalit´e et avec n grand, alors on utilise le fait que T
n= √
n
X¯nˆ−µ0σn