Changement de groupe TD Changement de groupe TD
• Lebossé Olivier 8h00 : M105
• Charbonnier Guillaume ? 8h00 : M105
• Missoup Nadege 9h30 : DD407
• Neila Frédéric 9h30 : DD407
Comparaison de deux groupes
Comparaison de deux groupes
Comparaison de moyennes Comparaison de moyennes
• On sait comparer la moyenne d’un groupe à la moyenne d’une population.
• Maintenant, on veut comparer deux groupes entre eux :
• Exemple :
– licence APA : XAPA = 12, nombre d’étudiant NAPA=25 – Licence MS : XMS = 11, nombre d’étudiant NMS=36 – Au niveau national : APA = 0,8 , MS = 1,1
A-t-on 12≠S11 ?
Première difficulté Première difficulté
APA = moyenne nationale des APA
MS = moyenne nationale des MS
Problème : on ne connaît pas les moyennes nationales
• On ne peut donc pas comparer
– XAPA à APA
– XMS à MS
Solution Solution
Solution : H0 : les moyennes sont les mêmes
• On suppose que les moyennes nationales sont les mêmes
APA = MS
• On connaît donc la différence des moyennes :
APA – MS = 0
• Ensuite, on compare XAPA – XMS à APA – MS c’est-à-dire on compare XAPA – XMS à 0
Conclusion Conclusion
• On compare donc XAPA – XMS avec la distribution des différence des moyennes d’échantillonnage (DDEX)
Moyenne : DDEX = XAPA – XAPA = 0
Écart type :
• Puis on conclut avec la loi normale :
MS MS APA
DDEX APA
N )² (σ
N
)²
σ (σ
DDEX MS APA
σ
DDEX X
Z X
DDEX MS APA
σ
X
Z X
Exemple Exemple
• On compare donc 12 – 11 avec la distribution des différence des moyennes d’échantillonnage (DDEX)
Moyenne : DDEX = APA – MS = 0
Écart type :
• Puis on conclut avec la loi normale :
P = 0,006%
On rejette H0
36 0,24 25 1,1²
σDDEX 0,8²
0,2411 4,11 Z12
T de Student
T de Student
Deuxième problème (petit air de déjà vu) Deuxième problème (petit air de déjà vu)
Généralement, on connaît ni APA ni MS
• On remplace APA par sAPA et MS par sMS
• Si NAPA et NMS sont grands (>30) : pas de problème, APA et
MS sont presque égaux à sAPA et à sMS
• Si N est petit (N<30 ) : sAPA et sMS sont des sous estimations de APA et MS
– Donc le Z obtenu serait trop grand (par rapport à celui qu’on obtiendrait si on connaissait APA et MS)
Dans ce cas, on remplace Z par le T de Student
Variances combinées Variances combinées
Problème : le T de Student s’utilise si les variances sont égales
APA=
MSOn triche : si elles sont « raisonnablement » proches
APA
MSalors on les remplace par la variance commune, qui est la moyenne pondéré de (
s
APA)² et (s
MS)²1) (N
1)
(N (s )² (N 1) (s )² 1)
)² (N
(σ
APA MSMS MS
APA Com APA
Bilan Bilan
1) (N
1)
(N(s )² (N 1) (s )² 1)
)² (N
(σ APA MS
MS MS
APA Com APA
DDEX MS APAσ X TX
MS Com APA
DDEX Com
N )² (σ
N
)²
σ (σ
que l’on résume en
MS Com APA
MS APA
N1 N1
σ
X T X
2 N
N )² (N 1) (s )² (s
1) σ (N
MS APA
MS MS
GAPA Com APA
DDL DDL
• Le DDL de deux groupes est la somme des DDL des groupes
– DDL Groupe 1 = (Taille du groupe 1) - 1 – DDL Groupe 2 = (Taille du groupe 2) - 1
Le DDL de deux groupes = (Taille du groupe 1) + (Taille du groupe 2) - 2
Exemple Exemple
• Groupe A :
– 10, 12, 13, 9, 12 – Moyenne : 11,2 – Écart type : 1,47
• Groupe B :
– 8, 10, 14, 9, 10 – Moyenne : 10,2 – Écart type : 2,04
78 , 84 2,04² 1
² 47 , 1
4
Com
T observé=0,89 DDL=5+5-2 P=19,72%
On ne rejette pas H0
89 , 0 51 15
78 , 1
2 , 10 2
,
11
T
Récapitulatif (petit air de déjà vu, bis) Récapitulatif (petit air de déjà vu, bis)
• On connaît
APA et MS
On conclut grâce à la table de la loi normale
• On ne connaît pas
APA et MS
• NXAPA et NXMS sont grands (N>30)
On conclut grâce à la table de la loi normale
• On ne connaît pas
APA et MS
• NXAPA et NXMS sont grands (N<30)
On conclut grâce à la table du T de Student
MS MS APA
APA
MS APA
N )² (σ
N )² (σX X Z
MS MS APA
APA
MS APA
N )² (
N )²
( X X
Z s s
MS Com APA
MS APA
N1 N1
σ
X T X
F de Fisher
F de Fisher
Égalité des variances Égalité des variances
• Une des conditions pour utiliser T est l’égalité des variances sAPA sMS
• On va chercher à savoir si les variances sont significativement différentes ou non.
• Comment le détermine-t-on ? Grâce au F de Fisher.
F de Fisher : comme d’hab F de Fisher : comme d’hab
• H0 : les variances sont égales
• Données : les variances
• Test : F de Fisher
• Probabilité
• Conclusion
F observé F observé
• On divise la plus grande variance par la plus petite ou
MS2 APA2 Obs SS
F 2
APA MS2 Obs SS F
Probabilité sur table Probabilité sur table
• On lit F sur une table. La table est fonction des DDL des deux variances.
– Le DDL d’une variance est le nombre de personne du groupe moins 1
Dessous2 Dessus2 Obs SS
F
Risque 2,5%
1 2 3 4 5 6
1 647,80 799,50 864,20 899,60 921,80 …
2 38,51 39,00 39,17 39,25 39,30 …
3 17,44 16,04 15,44 15,10 14,88 …
4 12,22 10,65 9,98 9,60 9,36 …
5 10,01 8,43 7,76 7,39 7,15 …
6 … … … … … …
DDL de la variance du DESSUS
DDL de la variance du
DESSOUS
Probabilité Excel Probabilité Excel
• Loi.F(Fobs,DDL dessous,DDL dessus)
F théorique F théorique
• On lit F sur une table. La table est fonction du DDL de sAPA et du DDL de sMS
• Le DDL de sAPA est le nombre de personne du groupe moins 1
• Le DDL de sMS est le nombre de personne du groupe moins 1
Exemple Exemple
• Groupe A :
– 10, 12, 13, 9 – Moyenne : 11 – Variance : 2,5 – DDL=3
• Groupe B :
– 8, 10, 14, 9, 10 – Moyenne : 10,2 – Variance : 4,16 – DDL=4
2,5 1,7 FObs4,16
P=30,38%
On ne rejette pas H0
Les variances ne sont pas significativement différentes
Attention : pour le F, le seuil est 2,5%
Attention : pour le F, le seuil est 2,5%
• Formellement, si on teste l’égalité des variances s1 et s2 au risque 5%, on doit :
– vérifier que s1/s2 n’est pas trop grand (pas dans le top 2,5%) – vérifier que s1/s2 n’est pas trop petit (pas dans le down 2,5%)
• Or, on triche : au lieu de tester s1/s2,
– on teste s1/s2 si s1 est plus grand que s2 – on teste s2/s1 si s2 est plus grand que s1
• Donc, on économise le test avec les 2,5% les plus bas.
• Il faut simplement faire le test avec le top 2,5% pour être sur que les variances ne sont pas différentes au risque 5%