Test sur 2 moyennes
Plusieurs fréquences
aux tests (suite)
Khi-deux
Introduction aux tests (suite)
• Test sur la différence de 2 moyennes
• Test du khi-deux
• Comparaison de plusieurs fréquences
Association fréquences
2 caract.
qualitatifs
Analyse de variance
• Comparaison de plusieurs fréquences
• Test d'indépendance de deux caractères qualitatifs
• Introduction à l’analyse de variance
Test sur 2 moyennes
Plusieurs fréquences
aux tests (suite)
Khi-deux
Premier exemple de test sur 2 moyennes
27 18
25 22
18 24
7 26
48 19
39 33
2 échantillons indépendants
m 1 = 29,7
Test sur 2 moyennes
Association fréquences
2 caract.
qualitatifs
Analyse de variance
39 33
26 34
55 32
29 26
12 42
23 9
28 26
33 46
m 2 = 25,9
Avec Excel, la p-valeur est donnée par la fonction
TEST.STUDENT(matrice1,matrice2,uni /bilatéral,type)
avec type = 2 si on peut supposer que
les variances sont égales et 3 sinon
Test sur 2 moyennes
Plusieurs fréquences
aux tests (suite)
Khi-deux
Deuxième exemple de test sur 2 moyennes
2 échantillons dépendants ou appariés
avant après
Personne 1 3 2
Personne 2 2 2
Personne 3 2 2
Personne 4 4 5
Personne 5 2 4
Test sur 2 moyennes
Y-a-t-il
une différence entre avant
Association fréquences
2 caract.
qualitatifs
Analyse de variance
Personne 5 2 4
Personne 6 2 1
Personne 7 1 1
Personne 8 3 5
Personne 9 3 4
Personne 10 2 4
Personne 11 5 5
Personne 12 2 3
Personne 13 4 5
Personne 14 3 5
Personne 15 4 4
Avec Excel, la p-valeur est donnée par la fonction
TEST.STUDENT(matrice1,matrice2,uni /bilatéral,type)
avec type = 1 car les échantillons sont appariés
entre avant
et après ?
Test sur 2 moyennes
Plusieurs fréquences
aux tests (suite)
Khi-deux
Comparaison de plusieurs fréquences
3 acteurs sur un marché
A 30%
C 20%
Plusieurs fréquences
Khi-deux
Association fréquences
2 caract.
qualitatifs
Analyse de variance
C vient de réaliser une innovation importante et voudrait mesurer son effet sur le marché
A B C
48 98 54
Sur un échantillon de 200
consommateurs, on obtient les résultats suivants :
B 50%
fréquences
Test sur 2 moyennes
Plusieurs fréquences
aux tests (suite)
Khi-deux
Calcul des effectifs théoriques E th
0,3 0,5 0,2
Que devrait-on avoir «en théorie, » si la distribution n’a pas changé?
60 100 40
fréquences théoriques x nombre d'observations
A B C
48 98 54 200
Plusieurs fréquences
Khi-deux
Association fréquences
2 caract.
qualitatifs
Analyse de variance
Le hasard peut produire des écarts par rapport à la distribution théorique ?
Peut-il produire ces écarts là ? Ces écarts sont-il importants ? Comment les mesurer ?
Comment déterminer les écarts que le hasard peut produire ?
fréquences
Test sur 2 moyennes
Plusieurs fréquences
aux tests (suite)
Khi-deux
Une mesure des écarts : le Khi-deux
Khi2 c = Σ Σ Σ Σ (E th -E obs )
2
E th = 7,34
Plusieurs fréquences
Khi-deux
Association fréquences
2 caract.
qualitatifs
Analyse de variance
On va comparer cette quantité avec une valeur critique...
fréquences
Test sur 2 moyennes
Plusieurs fréquences
aux tests (suite)
Khi-deux
Détermination du Khi-deux critique
2 entrées dans la table (ou la fonction Excel) :
le seuil de signification du test
le nombre de degrés de liberté
α α α
α = 0,05
nombre de cases - 1
Plusieurs
= 2
fréquences
Khi-deux
Association fréquences
2 caract.
qualitatifs
Analyse de variance
Utilisation de la fonction LOI.KHIDEUX.INVERSE.DROITE (Excel 2010)
LOI.KHIDEUX.INVERSE.DROITE(0,05;2) donne : 5,99
fréquences
Test sur 2 moyennes
Plusieurs fréquences
aux tests (suite)
Khi-deux
Décision
Khi2 c > Khi2 crit
On refuse l'hypothèse de conservation des parts
Plusieurs fréquences
Khi-deux
Association fréquences
2 caract.
qualitatifs
Analyse de variance
On refuse l'hypothèse de conservation des parts et on a un risque d'erreur au plus égal à 5%
(Il y a moins de 5% de chance que l'écart soit du au hasard)
fréquences
Test sur 2 moyennes
Plusieurs fréquences
aux tests (suite)
Khi-deux
Variante méthodologique
A B C
48 98 54 60 100 40
Plusieurs fréquences
Khi-deux
Association fréquences
2 caract.
qualitatifs
Analyse de variance
La p-valeur est donnée directement par la fonction Excel
TEST.KHIDEUX ( ->Excel 2007) ou CHISQ.TEST (Excel 2010): Syntaxe :
=CHISQ.TEST(plage_réelle;plage_attendue) On trouve : p = 0,0255
60 100 40
fréquences
Test sur 2 moyennes
Plusieurs fréquences
aux tests (suite)
Khi-deux
Test d'indépendance de 2 caractères qualitatifs
Légère Blonde Brune Total
Féminin 28 32 10 70
Masculin 20 40 20 80
Total 48 72 30 150
Khi-deux
Association fréquences
2 caract.
qualitatifs
Analyse de variance
Question :
Y-a-t-il un lien entre le type de bière préféré et le sexe du buveur ?
Total 48 72 30 150
2 caract.
qualitatifs
Test sur 2 moyennes
Plusieurs fréquences
aux tests (suite)
Khi-deux
Calcul du Khi-deux
Légère Blonde Brune Total
Féminin 28 32 10 70
22,40
Masculin 20 40 20 80
33,60 14,00
Khi-deux
Association fréquences
2 caract.
qualitatifs
Analyse de variance
Eth =
Total ligne x Total colonne Grand total
Masculin 20 40 20 80
25,60 38,40 16,00
Total 48 72 30 150
Khi2 c = Σ Σ Σ Σ (E th -E obs )
2
E th = 4,91
2 caract.
qualitatifs
Test sur 2 moyennes
Plusieurs fréquences
aux tests (suite)
Khi-deux
Détermination du Khi-deux limite
Nombre de degrés de liberté
X X
2
Khi-deux
Association fréquences
2 caract.
qualitatifs
Analyse de variance
On trouve Khi crit avec la fonction EXCEL (Excel 2010) Khi2 crit = LOI.KHIDEUX.INVERSE.DROITE (0,05;2) = 5,99
l'hypothèse d'indépendance des caractères est acceptée
2 caract.
qualitatifs
Test sur 2 moyennes
Plusieurs fréquences
aux tests (suite)
Khi-deux
Variante méthodologique
28 32 10
20 40 20
22,40 33,60 14,00 25,60 38,40 16,00
Khi-deux
Association fréquences
2 caract.
qualitatifs
Analyse de variance
La p-valeur est donnée directement par la fonction CHISQ.TEST(plage_réelle;plage_attendue)
On trouve : p = 0,0856
2 caract.
qualitatifs
Test sur 2 moyennes
Plusieurs fréquences
aux tests (suite)
Khi-deux
Introduction à l’analyse de variance
A
75 72 87 77 84
B
94 87 80 86 80 67
C
90 86 92 75 79
Comparaison des moyennes de plus de 2 échantillons
Association fréquences
2 caract.
qualitatifs
Analyse de variance
82 84 81 78 97 85 81 95 81 72 89 84 73
67 86 82 86 82 72 77 87 68 80 76 68 86 74 86 90
94 95 85 86 92 92 85 87 86 92 85 93 89 83
m 1 = 82,056
m 2 = 80,667
m 3 = 87,684
Les écarts sont-ils significatifs ?
Analyse de
variance
Test sur 2 moyennes
Plusieurs fréquences
aux tests (suite)
Khi-deux
ANOVA : les hypothèses et les conditions
Hypothèses :
(H0) µ 1 = µ 2 = µ 3
(H1) µ i <>µ j pour au moins un couple (i,j)
Association fréquences
2 caract.
qualitatifs
Analyse de variance
Conditions :
- Les populations d'origine sont normalement distribuées - Les écart-types de ces populations sont égaux
Analyse de
variance
Test sur 2 moyennes
Plusieurs fréquences
aux tests (suite)
Khi-deux
ANOVA : calculs et décision
SUMMARY
Groups Count Sum Average Variance
A 18 1477 82,0556 50,7614
B 21 1694 80,6667 57,7333
C 19 1666 87,6842 27,3392
Anova: Single Factor
Association fréquences
2 caract.
qualitatifs