2. Comparer deux moyennes : test du t de Student

(1)

2. Comparer deux moyennes : test du t de Student

Soumis par Ã‰ric Raufaste

DerniÃ¨re mise Ã jour : 27-01-2013

Objectifs. Mettre l'Ã©tudiant en position de savoir quand et comment rÃ©aliser une comparaison de moyenne(s) Ã un ou deux groupes.

PrÃ©requis. Cours de L1;Â Approche intuitive de l'infÃ©rence statistique;Â HypothÃ¨se nulle ; Principe gÃ©nÃ©ral de la comparaison de moyennes.

RÃ©sumÃ©. On expose la technique gÃ©nÃ©rale des trois principaux cas de test t : comparaison d'un Ã©chantillon Ã une constante;

comparaisons de deux Ã©chantillons indÃ©pendants; comparaison de deux Ã©chantillons appariÃ©s.

Le cas du test t dans les analyses post-hoc est renvoyÃ© Ã l'article sur l'ANOVA.Â

Â

1. Comprendre le test de Student

Â 1.1. Dans quel cas appliquer un tel test ?

Objectif.Â Le test du t de Student s'applique lorsque l'objectif est soit de comparer deux moyennes entre elles, soit de comparer une moyenne contre une constante.

Type des informations disponibles : Les valeurs mesurÃ©es doivent

Ãªtre numÃ©riques, faute de quoi l'idÃ©e mÃªme de moyenne n'a pas de sens.

Distribution des observations : Les donnÃ©es doivent Ãªtre

normalement distribuÃ©es : l'histogramme doit Ãªtre symÃ©trique et ressembler peu ou prou Ã une courbe en cloche.

https://uohpsy2.univ-tlse2.fr/UOHPsy2 PropulsÃ© par Joomla! GÃ©nÃ©rÃ©: 11 May, 2022, 18:36

(2)

Condition d'indÃ©pendance : Les donnÃ©es doivent Ãªtre indÃ©pendantes (les donnÃ©es d'un sujet ne sont pas censÃ©es avoir influencÃ© les mesures faites sur un autre sujet).

Â

1.2. Qu'est-ce que la statistique t ?

1.2.1 Rappel sur la loi normale centrÃ©e rÃ©duite

Vous trouverez dans le cours de L1 une prÃ©sentation simple de la loi normale centrÃ©e rÃ©duite, accompagnÃ©e d'un gÃ©nÃ©rateur de simulations pour que vous puissiez faire des tests : Cliquez ici pour y accÃ©der.

Â 1.2.2 Notions d'Ã©chantillons virtuels et rÃ©els.

Avertissement : Ces deux notions sont propres au prÃ©sent cours et vous ne les trouverez sans doute nulle part ailleurs.

Nous les introduisons afin de permettre une vue gÃ©nÃ©rale du test t.

Nous appelons ici Ã©chantillon rÃ©el un ensemble de mesures directement rÃ©alisÃ©es sur une population. Par exemple une mesure d'intelligence prise sur un ensemble de participants Ã une Ã©tude.

Nous appelons Ã©chantillon virtuel l'Ã©chantillon des donnÃ©es composÃ© Ã partir des Ã©lÃ©ments Ã comparer. Ces Ã©lÃ©ments peuvent Ãªtre (1) un Ã©chantillon rÃ©el et une constante (cas de la comparaison d'une moyenne Ã une constante); (2) deux

Ã©chantillons rÃ©els de mesures indÃ©pendantes (c.-Ã .d. des mesures prises sur des individus diffÃ©rents et qui ne se sont pas influencÃ©s par ailleurs); (3) deux Ã©chantillons rÃ©els de mesures appariÃ©es (c.-Ã .d. des paires de mesures prises pour chaque individu, oÃ¹ la premiÃ¨re mesure va dans l'Ã©chantillon rÃ©el 1 tandis que la seconde mesure va dans l'Ã©chantillon rÃ©el 2).

1.2.3 Formule gÃ©nÃ©rale de la statistique t.

Dans toutes les formes du test de Student, la statistique calculÃ©e se nomme "t". Soient mv la moyenne d'un Ã©chantillon virtuel de taille nv et ESv son erreur-standard (on rappelle que l'erreur standard d'un Ã©chantillon s'obtient en divisant l'Ã©cart-type par la racine carrÃ©e de l'effectif), on a

{moslatex}$$t=\frac{m_v}{ES_v}=m_v \times \frac{\sqrt{n}}{s_v}$${/moslatex}

Cette formule s'applique dans le cas des trois tests t considÃ©rÃ©s dans cet article, test t pour Ã©chantillon unique, pour Ã©chantillons appariÃ©s et pour Ã©chantillons indÃ©pendants. Comment est-ce possible ? Tout simplement parce que

l'Ã©chantillon auquel nous faisons rÃ©fÃ©rence ici est un Ã©chantillon virtuel que nous construirons diffÃ©remment dans les trois cas. Nous verrons comment plus loin mais, pour l'instant, continuons l'analyse sur cet Ã©chantillon virtuel.

Pourquoi utiliser cette note t plutÃ´t que simplement une valeur centrÃ©e-rÃ©duite z dont la distribution est connue puisque

(3)

c'est celle de la loi normale centrÃ©e-rÃ©duite ? Eh bien, pour la raison suivante, qui se comprend par un raisonnement en deux points.

- parce que si la moyenne mv et l'Ã©cart-type sv de l'Ã©chantillon peuvent Ãªtre considÃ©rÃ©s comme des estimateurs des paramÃ¨tres "rÃ©els" de la population d'oÃ¹ est tirÃ© l'Ã©chantillon, Ã savoir sa moyenne Î¼ et son Ã©cart-type Ïƒ, ces estimateurs ne sont pas l'exacte rÃ©alitÃ© mais seulement une approximation de la rÃ©alitÃ©.

- Si cette approximation de la moyenne Î¼ par m peut Ãªtre considÃ©rÃ©e comme fiable (au sens oÃ¹ si l'on tirait un nombre infini d'Ã©chantillons, la moyenne des moyennes issues de tous ces tirages convergerait vers la "vraie" moyenne, celle de la population), ce n'est pas le cas pour l'Ã©cart-type s. En effet, ce dernier est biaisÃ© de faÃ§on systÃ©matique par rapport Ã l'Ã©cart-type Ïƒ de la population d'oÃ¹ est extrait l'Ã©chantillon, et la taille du biais dÃ©pend de la taille des Ã©chantillons que l'on prend : plus l'Ã©chantillon est petit et plus le biais est important. Il nous faut donc une loi qui corrige ce biais. Comme ce

biais dÃ©pend de la taille des Ã©chantillons, il faut que cette loi admette un paramÃ¨tre qui reprÃ©sente cette taille alors que la loi normale centrÃ©e-rÃ©duite ne dÃ©pend pas du tout de l'effectif.

Â

Mais alors, si l'on ne peut pas utiliser la loi normale...Â 1.3. Comment obtenir la valeur p associÃ©e ?

1.3.1. La loi du t

La variable t suit elle-mÃªme une loi, dite loi du t de Student que l'on a prÃ©sentÃ©e dans le cours de premiÃ¨re annÃ©e.

Simplement, on peut considÃ©rer que les valeurs de t constituent une loi normale amÃ©nagÃ©e pour corriger le biais induit par la petite taille de l'Ã©chantillon. Plus l'Ã©chantillon est grand et moins il y a de biais Ã corriger et donc plus la loi du t ressemble Ã la loi normale.

La loi normale dÃ©pend de la moyenne et de l'Ã©cart-type, mais dans la loi centrÃ©e-rÃ©duite, ces deux paramÃ¨tres sont fixÃ©s Ã 0 et 1 de sorte

que la loi normale centrÃ©e-rÃ©duite est entiÃ¨rement dÃ©terminÃ©e. La loi du t en est une sorte d'adaptation. Elle dÃ©pend d'un paramÃ¨tre supplÃ©mentaire, le nombre de degrÃ©s de libertÃ©, qui traduit l'ampleur de la correction qu'il faut apporter.

Si l'on connaÃ®t le nombre de degrÃ©s de libertÃ©, on peut alors dÃ©duire les valeurs p associÃ©es exactement selon les mÃªmes principes que l'on a utilisÃ©s pour la loi normale centrÃ©e rÃ©duite.

Il existe des tables du t (voir ici un exemple de table du t), que l'on peut utiliser lorsque l'on n'a pas de logiciel, mais on trouve maintenant des logiciels gratuits, Ã commencer par le tableau de la suite OpenOffice, permettant de calculer les

valeurs de p associÃ©es Ã t avec prÃ©cision. Vous trouverez ici des vidÃ©os de dÃ©monstration du calcul du test de student.Â 1.3.2. UnilatÃ©ral ou bilatÃ©ral ?

Comme la distribution du z, la distribution du t est symÃ©trique autour de 0. Par consÃ©quent, si l'on possÃ¨de une hypothÃ¨se thÃ©orique prÃ©cisant le sens de la diffÃ©rence attendue des moyennes que l'on compare (par exemple on s'attend Ã ce que la taille moyenne des garÃ§ons soit supÃ©rieure Ã la taille moyenne des filles d'une mÃªme classe d'Ã¢ge)

(4)

ET que les rÃ©sultats vont dans le sens attendu, alors on peut diviser la valeur p que donnait le test bilatÃ©ral par deux.

Ainsi, pour 50 degrÃ©s de libertÃ© une valeur de t=1.69 est associÃ©e Ã une valeur p de 0.0972. C'est supÃ©rieur au seuil conventionnel de 5% et donc on dira que ce n'est pas significatif (on pourra cependant parler de "tendance" car la valeur p est comprise entre .05 et .10.

Si l'on peut travailler en unilatÃ©ral, on divise cette valeur par 2, ce qui donne p=.049, ce qui cette fois est significatif. Bien Ã©videmment, lorsque vous rapportez vos rÃ©sultats, il faut prÃ©ciser que la valeur a Ã©tÃ© calculÃ©e en unilatÃ©ral.

1.4. Comment prÃ©senter les rÃ©sultats d'un test t ?

Nous nous basons ici sur les normes internationales en vigueur en psychologie, les normes de l'APA (American Psychological Association), 6e Ã©dition.

1.4.1. Les statistiques descriptives

Le test du t est avant tout une comparaison de moyennes, comparaison qui repose sur une ou des mesures de

dispersion. Il faut donc impÃ©rativement rapporter les donnÃ©es de statistiques descriptives, y compris la dispersion. Les dÃ©butants ont souvent tendance Ã l'oublier, tout Ã la joie de pouvoir rapporter un rÃ©sultat "significatif", mais les statistiques infÃ©rentielles ne sont que des informations de second ordre, des indicateurs sur la fiabilitÃ© des rÃ©sultats obtenus. Les informations de premier ordre, celles qui disent ce que l'on a vraiment observÃ©, ce sont les statistiques descriptives et non les statistiques infÃ©rentielles !

Ces statistiques descriptives peuvent Ãªtre prÃ©sentÃ©es dans le texte du compte-rendu ou bien, le plus souvent, dans une table.

Lorsque l'on compare des groupes de tailles diffÃ©rentes, il est courant de donner comme indice de dispersion non pas la variance ou l'Ã©cart-type, qui sont trÃ¨s sensibles Ã la taille de l'Ã©chantillon, mais l'erreur standard qui l'est moins. On l'a dit plus haut, l'erreur standard s'obtient en divisant l'Ã©cart-type par la racine carrÃ©e de la taille de l'Ã©chantillon. Par exemple si l'Ã©cart-type vaut 3.0 et qu'il y a 20 sujets, cela fait une erreur standard de 3/racine(20) = 0.67.

Â

1.4.2. Les statistiques infÃ©rentielles.

Comme la distribution du t dÃ©pend du nombre de degrÃ©s de libertÃ©, il convient de prÃ©ciser celui-ci lorsque vous rapportez vos rÃ©sultats. Cela donne une structure de la forme suivante :

Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â t(ddl)=n.nn, p=xxx.

(5)

-

ddl est le nombre de degrÃ©s de libertÃ©. Dans un test t, c'est le nombre de sujets de l'Ã©chantillon virtuel diminuÃ© de 1.

Nous verrons dans chacun des trois cas de test t comment calculer ce nombre.

-

la valeur n.nn peut se rapporter avec un signe ou non mais en tout les cas il est inutile de rapporter plus de deux

dÃ©cimales. Les logiciels donnent souvent des valeurs signÃ©es et avec plus de deux dÃ©cimales mais en pratique le signe du t est sans importance, et donner plus de deux dÃ©cimales est fonciÃ¨rement inutile.

Enfin la faÃ§on de rapporter les valeurs de p est tout Ã fait conventionnelle et ne dÃ©pend pas du type de test utilisÃ©1.Â

Â

Â 1. Selon les normes de publication en vigueur en psychologie scientifique, il est maintenant d'usage de rapporter, outre les valeurs de t et le p associÃ©, une variable reprÃ©sentant ce qu'on appelle la taille d'effet. Le calcul de cette derniÃ¨re dÃ©passe le cadre de ce cours aussi la laisserons-nous de cÃ´tÃ©.Â

Â

{mospagebreak heading=1. Comprendre le test de Student &title=2. Comparer un Ã©chantillon contre une constante}Â

Â

2. Comparer un Ã©chantillon contre une constante

PrÃ©alables spÃ©cifiques de cette version du test de Student :

1. Il faut soit avoir un

Ã©chantillon de donnÃ©es recueillies Ã raison d'une seule valeur par sujet, soit deux Ã©chantillons d'un mÃªme type de mesures (par exemple, un temps de rÃ©ponse dans les deux cas) recueillis Ã raison de deux donnÃ©es par sujet et sur

lesquelles on peut procÃ©der Ã une diffÃ©rence, laquelle sera comparÃ©e Ã une constante, gÃ©nÃ©ralement 0 mais pas nÃ©cessairement.

(6)

2. Les donnÃ©es de l'Ã©chantillon devraient idÃ©alement Ãªtre normalement distribuÃ©es. Cliquez ici pour accÃ©der Ã l'article expliquant comment vÃ©rifier si cette condition est rÃ©alisÃ©e.

3. Il faut disposer d'une hypothÃ¨se sur une valeur de rÃ©fÃ©rence. Par exemple si l'on connaÃ®t la valeur moyenne de la

variable mesurÃ©e dans la population de rÃ©fÃ©rence, comparer l'Ã©chantillon Ã cette valeur de rÃ©fÃ©rence permet de tester s'il est raisonable de considÃ©rer que notre Ã©chantillon provient bien de la population de rÃ©fÃ©rence.

4. L'hypothÃ¨se nulle est ici la suivante : m=c. Ou encore, ce qui revient au mÃªme, m-c=0. Par exemple, si l'on veut

tester une hypothÃ¨se selon laquelle l'intelligence gÃ©nÃ©rale augmente de gÃ©nÃ©ration en gÃ©nÃ©ration depuis qu'on la mesure (ce qu'on appelle "l'Effet Flynn"). Supposons qu'on dispose d'un test utilisÃ© il y a trente ans. On sait qu'Ã l'Ã©poque une performance donnÃ©e sur le test correspondait Ã l'Ã©poque Ã la valeur de QI=100. On fait passer le test Ã des jeunes actuels. On observe donc une nouvelle moyenne. On va alors comparer cette moyenne Ã la valeur de rÃ©fÃ©rence 100. Et si l'on trouve que le QI actuel est significativement supÃ©rieur Ã 100 tel que mesurÃ© sur cet outil utilisÃ© Ã l'Ã©poque, alors on pourra conclure que le QI a montÃ©.Â

Â

2.1. Obtenir la valeur de t

2.1.1. Pour les pressÃ©s : "En trÃ¨s bref"Â

Soit notre Ã©chantillon rÃ©el de taille n, de moyenne m et d'Ã©cart-type s, et soit c la constante Ã laquelle on veut le comparer.Â

Selon les informations dont on dispose, on applique la formule avec l'erreur standard ES,

Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â {moslatex}$$t=\frac{m}{ES}$${/moslatex}

ou, ce qui revient au mÃªme, celle avec l'effectif et l'Ã©cart-type d'Ã©chantillon,

Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â {moslatex}$$t=m\times\frac{\sqrt{n}}{s}$${/moslatex}

On prÃ©sente le rÃ©sultat en Ã©crivant t(ddl)=n.nn (pour la prÃ©sentation de la valeur p, voir l'article gÃ©nÃ©ral sur la norme APA de prÃ©sentation).

(7)

Voir aussi le lien de pratique avec les logiciels de statistiques :

Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â _Â InterprÃ©ter des rÃ©sultats de test t Ã Ã©chantillon uniqueÂ 2.1.2. Pour ceux qui aiment comprendre : D'oÃ¹ cela vient-il ?

Dans le test du t de Student, la statistique calculÃ©e est prÃ©cisÃ©ment la valeur t. Dans le cas de la comparaison d'un Ã©chantillon contre une constante, voyons quelle formule employer. CommenÃ§ons par rappeler la formule gÃ©nÃ©rale du t :

Soient mv la moyenne d'un Ã©chantillon virtuel de taille nv et ESv son erreur-standard,

on a

{moslatex}$$t=\frac{m_v}{ES_v}=\frac{m_v}{\frac{s_v}{\sqrt{n}}}=m_v \times \frac{\sqrt{n}}{s_v}$${/moslatex}

Ici notre Ã©chantillon virtuel a pour moyenne mv = (m-c) oÃ¹ m est la moyenne de l'Ã©chantillon rÃ©el et c la constante Ã comparer. Et on a aussi ESv = ES, oÃ¹ ES est l'erreur standard de l'Ã©chantillon rÃ©el.

DÃ©monstration. Ce dernier point rÃ©sulte des propriÃ©tÃ©s gÃ©nÃ©rales de la variance : si l'on construit une nouvelle variable entre faisant pour chaque sujet la diffÃ©rence entre la variable de dÃ©part et une constante, la variance de la variable

d'arrivÃ©e est la mÃªme que la variance de la variable de dÃ©part. Ce qui se comprend aisÃ©ment puisque la variance Ã©tant la dispersion de la variable, la nouvelle variable est tout aussi dispersÃ©e que la premiÃ¨re ! Les Ã©chantillons virtuels et rÃ©els ont aussi, dans ce cas, la mÃªme taille. Puisque la formule de l'erreur-standard ne dÃ©pend que de la variance et de l'effectif, les deux erreurs-standard sont donc Ã©gales. CQFD.

Application : De ce qui prÃ©cÃ¨de il suit queÂ

Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â

{moslatex}$$t=\frac{m}{ES}=\frac{m}{\frac{s}{\sqrt{n}}}=m\times \frac{\sqrt{n}}{s}$${/moslatex}

Â

2.2. Comment obtenir la valeur p associÃ©e ?

Il nous faut connaÃ®tre la valeur t bien sÃ»r et le nombre de degrÃ©s de libertÃ©s.

Ici l'Ã©chantillon virtuel a la mÃªme taille que l'Ã©chantillon rÃ©el, soit n individus. Le nombre de degrÃ©s de libertÃ©s est directement ddl=n-1.Â

(8)

Si elle n'est pas directement donnÃ©e par votre logiciel de statistique, la valeur p associÃ©e s'obtient

- soit en regardant dans une table du t de student en prenant comme entrÃ©e la valeur du t ainsi calculÃ©e et comme nombre de degrÃ©s de libertÃ©s la valeur n-1 oÃ¹ n est le nombre de mesures.

- Soit au moyen d'une formule de tableur sous Microsoft Office Excel ou OpenOffice Calc :

"=LOI.STUDENT.BILATERALE(t; ddl)"

Â

2.3. UnilatÃ©ral ou bilatÃ©ral ?

Par dÃ©faut, on travaillera en bilatÃ©ral et on se contentera de la valeur p prÃ©cÃ©demment obtenue.

Si toutefois on dispose d'une hypothÃ¨se orientÃ©e et que les statistiques descriptives vont dans le sens attendu (typiquement on s'attend Ã ce que m>c et c'est le cas au niveau descriptif, ou bien on s'attend Ã ce que m<c et c'est le cas au niveau descriptif), alors on peut travailler en unilatÃ©ral : Il suffit alors de prendre la valeur p prÃ©cÃ©demment obtenue et la diviser par 2 avant de dÃ©cider si le test est significatif ou non.

Â

2.4. Un exemple

Supposons que l'on ait une hypothÃ¨se thÃ©orique selon laquelle les astronautes en gÃ©nÃ©ral (qu'ils aient ou non marchÃ©

sur la lune) devraient avoir plus de 38 ans en moyenne.

Imaginons que la seule information dont nous disposions est l'Ã¢ge des

astronautes qui ont marchÃ© sur la lune au moment de leur sortie sur notre satelite. Nous obtenons le

tableau suivant :

Â Individu Â Age

Â 1 Â 38

Â 2 Â 39

(9)

Â 3 Â 39

Â 4 Â 37

Â 5 Â 47

Â 6 Â 39

Â 7 Â 39

Â 8 Â 41

Â 9 Â 41

Â 10 Â 36

Â 11 Â 38

Â 12 Â 37

Â Ã€ partir de ce tableau il est facile de calculer la moyenne et l'Ã©cart-type des Ã¢ges, soit

Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â {moslatex}$m=\frac{\sum_{i=1}^{12}x_i}{12}=39.25${/moslatex}

et

Â Â

{moslatex}$s=\sqrt{\frac{\sum_{i=1}^n(x_i-m)^2)}{n-1}}=\sqrt{\frac{\sum_{i=1}^{12}(x_i-39.25)^2)}{11}}=2.86${/moslatex}

Attention au fait que dans ce cas, le tableau reprÃ©sente un

Ã©chantillon de la population cible totale (les astronautes en gÃ©nÃ©ral) et l'on utilise la

formule de l'Ã©cart-type pour Ã©chantillon (on divise par n-1) et non de l'Ã©cart-type pour population (oÃ¹ l'on divise par n).

(10)

Nous obtenons

{moslatex}$t=(m-38)\times\frac{\sqrt{n}}{s}=(39.25-38)\times\frac{\sqrt{12}}{2.86}=1.514${/moslatex}Â

Â

Ensuite sous excel par exemple, en appliquant la formule =LOI.STUDENT.BILATERALE(t; ddl)" avec le t que l'on vient de calculer et ddl=12-1=11 degrÃ©s de libertÃ©s, on trouve p=0.15820928.

Pour un test du t, la question suivante Ã se poser concerne le

caractÃ¨re bilatÃ©ral ou non du test. Ici on a une hypothÃ¨se prÃ©cisant que la moyenne attendue doit Ãªtre supÃ©rieure Ã 38. C'est bien le cas

puisque la moyenne observÃ©e est 39.25. Nous sommes donc fondÃ©s Ã travailler en unilatÃ©ral et

nous divisons simplement la valeur p prÃ©cÃ©dente par 2, ce qui donne 0.08508. Finalement on peut rapporter le rÃ©sultat infÃ©rentiel, conformÃ©ment aux normes :

Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â t(11)=1.51, p=.079 en unilatÃ©ral, ce qui n'est pas significatif mais indique nÃ©anmoins une tendance.

Â

{mospagebreak title=3. Deux Ã©chantillons indÃ©pendants}Â Â Â

3. Comparer deux Ã©chantillons indÃ©pendants.

Puisque l'on a deux groupes de sujets, on a aussi deux moyennes m1 et m2. L'hypothÃ¨se nulle revient Ã poser que

m1=m2. Un test significatif indiquera que le hasard n'explique pas les diffÃ©rences de moyennes et donc qu'en rÃ©alitÃ© on a probablement m1â‰ m2.

1. Il faut soit avoir deux Ã©chantillons de donnÃ©es recueillies sur deux groupes de sujets diffÃ©rents.

(11)

2. Les donnÃ©es devraient idÃ©alement Ãªtre normalement distribuÃ©es.

Cliquez ici pour voir comment tester la normalitÃ© de la distribution.

3. Les variances des Ã©chantillons rÃ©els devraient idÃ©alement Ãªtre homogÃ¨nes. Sous SPSS ou Statistica par exemple, le

"test de Levene" ne doit pas Ãªtre significatif. Toutefois cette condition n'est pas rÃ©dhibitoire car les logiciels donnent alors

des valeurs de p corrigÃ©es, selon des mÃ©thodes que nous ne dÃ©taillerons pas ici. Il suffit de vÃ©rifier l'homogÃ©nÃ©itÃ©. Sous SPSS par exemple, si le test de Levene est significatif, on prendra alors la valeur de p calculÃ©e pour les variances non

homogÃ¨nes.

3.1. Calculer la valeur de t

3.1.1. Pour les pressÃ©s : "En bref"

Liens de pratique avec un logiciel de statistiques :

Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â _Â obtenir des rÃ©sultats de test t Ã deux Ã©chantillons indÃ©pendants Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â sous Excel (voir une vidÃ©o).

Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â sous SPSS (voir une vidÃ©o)

Â Â Â Â Â Â Â Â Â Â _Â InterprÃ©ter des rÃ©sultats de test t Ã deux Ã©chantillons indÃ©pendants.Â

Soient deux Ã©chantillons rÃ©els, respectivement d'effectifs, moyennes et Ã©carts-types n1,Â m1, s1, etÂ n2, m2, s2.Â

On commence par calculer l'erreur standard ESv de l'Ã©chantillon virtuel constituÃ© par les deux Ã©chantillons indÃ©pendants :

Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â {moslatex}$$ES_v=\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}$${/moslatex}

Et ensuite le t est donnÃ© par la formule

Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â {moslatex}$$t=\frac{(m_1-m_2)}{ES_v}$${/moslatex}

(12)

Â

On prÃ©sente le rÃ©sultat en Ã©crivant t(ddl)=n.nn (pour la prÃ©sentation de la valeur p, voir l'article gÃ©nÃ©ral sur la norme APA de prÃ©sentation).

Â

3.1.2. Pour ceux qui aiment comprendre : D'oÃ¹ cela vient-il ?

Dans le test du t de Student, la statistique calculÃ©e est prÃ©cisÃ©ment la valeur t.

Dans le cas de la comparaison de deux Ã©chantillons indÃ©pendants, voyons quelle formule employer. CommenÃ§ons par rappeler la formule gÃ©nÃ©rale du t :

Soient mv la moyenne d'un Ã©chantillon virtuel de taille nv et ESv son erreur-standard,

on a

{moslatex}$$t=\frac{m_v}{ES_v}$${/moslatex}

Â

Ici notre Ã©chantillon virtuel est composÃ© des deux Ã©chantillons indÃ©pendants rÃ©els. Sa moyenneÂ est mv = (m1-m2) oÃ¹Â m1 et m2 sont les moyennes des deux Ã©chantillons rÃ©els.

Le calcul de ESv l'erreur standard de l'Ã©chantillon virtuel est moins naturel. En effet, ces deux Ã©chantillons Ã©tant

indÃ©pendants, ils renvoient Ã des effectifs de taille potentiellement diffÃ©rentes et l'erreur standard de deux Ã©chantillons de tailles diffÃ©rentes ne s'obtient malheureusement pas en faisant simplement la moyenne des erreurs-standards. L'Ã©cart- type de l'Ã©chantillon virtuel issu de deux Ã©chantillons de tailles n1 et n2, de moyennes m1 et m2, et d'Ã©carts-types s1 et s2Â peut s'obtenir de la faÃ§on suivante :Â

(13)

Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â

{moslatex}$$s_v^2=\frac{(n_1-1)s_1^2+(n_2-1)s_2^2}{n_1+n_2-2}$${/moslatex}

On produit alors l'ES standard de l'Ã©chantillon virtuel par la formule

{moslatex}$$ES_v=s_v\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}$${/moslatex}

Finalement, il ne reste plus qu'Ã calculer t :

Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â {moslatex}$$t=\frac{m_v}{ES_v}$${/moslatex}

Â

Il nous faut connaÃ®tre la valeur t et le ddl nombre de degrÃ©s de libertÃ©s.

Ici l'Ã©chantillon virtuel a le mÃªme nombre de degrÃ©s de libertÃ©s que l'ensemble des degrÃ©s de libertÃ©s des Ã©chantillons dont il est composÃ©. Soit (n1-1) pour le premier groupe et (n2-1) pour le deuxiÃ¨me groupe, ce qui nous donne au total

ddlv=n1+n2-2.

- soit en regardant dans une table du t de student en prenant comme entrÃ©e la valeur du t ainsi calculÃ©e et comme nombre de degrÃ©s de libertÃ©s la valeur n-1 oÃ¹ n est le nombre de mesures.

Â

(14)

Si toutefois on dispose d'une hypothÃ¨se orientÃ©e et que les statistiques descriptives vont dans le sens attendu (typiquement on s'attend Ã ce

que m1>m2 et c'est le cas au niveau descriptif, ou bien on s'attend Ã ce que m1<m2 et c'est le cas au niveau descriptif), alors on peut travailler en unilatÃ©ral : il suffit alors de prendre la valeur p prÃ©cÃ©demment obtenue et de la diviser par 2 avant de dÃ©cider si le test est significatif ou non.

2.4. Un exemple

Supposons que l'on ait une hypothÃ¨se thÃ©orique (fictive) selon laquelle les premiers astronautes envoyÃ©s devraient avoir plus de 38 ans en moyenne mais que ceux envoyÃ©s aprÃ¨s une certaine date sont plus jeunes. Imaginons que la seule information dont nous disposions est l'Ã¢ge des

astronautes au moment de leur sortie sur notre satelite, et supposons encore que 6 de ces astronautes appartiennent au premier groupe, et les 6 autres au deuxiÃ¨me groupe. Nous obtenons le tableau suivant :

Â Individu Â Groupe Age

Â Â Â Â 1 Â Â Â Â 1

Â 32

Â Â Â Â 2 Â Â Â Â 1 Â 38

Â Â Â Â 3 Â Â Â Â 1 Â 36

Â Â Â 4 Â Â Â Â 1 Â 37

Â Â Â Â 5 Â Â Â Â 1 Â 42

Â Â Â Â 6 Â Â Â Â 1 Â 26

(15)

Â Â Â Â 7 Â Â Â Â 2 Â 39

Â Â Â Â 8 Â Â Â Â 2 Â 35

Â Â Â Â 9 Â Â Â Â 2 Â 33

Â Â Â 10 Â Â Â Â 2 Â 34

Â Â Â 11 Â Â Â Â 2 Â 37

Â Â Â 12 Â Â Â Â 2 Â 36

Â Ã€ partir de ce tableau il est facile de calculer la moyenne et l'Ã©cart-type des Ã¢ges pour chacun des deux groupes, soit

Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â {moslatex}$m_1=\frac{\sum_{i=1}^{6}x_i}{6}=40.17${/moslatex}

Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â {moslatex}$m_2=\frac{\sum_{i=7}^{12}x_i}{6}=33.50${/moslatex}

et

Â Â

{moslatex}$s_1=\sqrt{\frac{\sum_{i=1}^6(x_i-m_1)^2)}{n_1-1}}=\sqrt{\frac{\sum_{i=1}^{6}(x_i- 40.17)^2)}{5}}=3.82${/moslatex}

Â Â

{moslatex}$s_2=\sqrt{\frac{\sum_{i=7}^{12}(x_i-m_2)^2)}{n_2-1}}=\sqrt{\frac{\sum_{i=7}^{12}(x_i- 33.50)^2)}{5}}=4.14${/moslatex}

(16)

Attention au fait que dans ce cas, le tableau reprÃ©sente un Ã©chantillon de la population totale des astronautes et l'on utilise la

formule de l'Ã©cart-type pour Ã©chantillon (on divise par n-1) et non de l'Ã©cart-type pour population (oÃ¹ l'on divise par n).

L'Ã©cart-type de l'Ã©chantillon virtuel issu de deux Ã©chantillons de tailles n1 et n2, de moyennes m1 et m2, et d'Ã©carts-types s1 et s2Â peut s'obtenir de la faÃ§on suivante :Â

{moslatex}$$s_v^2=\frac{(n_1-1)s_1^2+(n_2-1)s_2^2}{n_1+n_2-2}=\frac{5\times 3.82^2+5\times4.14^2}{10}=15.83$${/moslatex}

{moslatex}$$ES_v=\sqrt{s_v^2\times(\frac{1}{n_1}+\frac{1}{n_2})}=\sqrt{15.83^2\times(\frac{1}{6}+\frac{1}{6})}=9.14$${/m oslatex}

Finalement, il ne reste plus qu'Ã calculer t :

Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â

{moslatex}$$t=\frac{m_v}{ES_v}=\frac{(40.17-33.50)}{9.14}=0.729$${/moslatex}

Â

Ensuite sous Excel par exemple, en appliquant la formule =LOI.STUDENT.BILATERALE(t; ddl)" avec le t que l'on vient de calculer et ddl=6+6-2=10 degrÃ©s de libertÃ©s, on trouve p=0.48255927.

Pour un test du t, la question suivante Ã se poser concernerait le

caractÃ¨re bilatÃ©ral ou non du test. Ici de toute faÃ§on, mÃªme si on divisait par deux la valeur de p, on serait encore trÃ¨s largement au dessus du seuil de signification donc ce n'est pas la peine d'aller plus loin : le test n'est pas significatif et l'on ne peut pas conclure qu'il existe une diffÃ©rence entre les groupes.

(17)

Â Â

Â

L'hypothÃ¨se nulle est ici la suivante : m1=m2. Ou encore, ce qui revient au mÃªme, m1-m2=0.

Par

exemple, si l'on a fait une comparaison avant-aprÃ¨s, en faisant la

diffÃ©rence des deux valeurs obtenues pour chaque sujet, on obtient une nouvelle variable qu'il suffit de comparer, par un test Ã un Ã©chantillon vu prÃ©cÃ©demment, contre la valeur de rÃ©fÃ©rence 0.

la diffÃ©rence en termes de progression : si la moyenne est significativement supÃ©rieure Ã 0 il y aura eu augmentation, si la moyenne est significativement infÃ©rieure Ã 0 il y aura eu diminution.

Enfin, si la diffÃ©rence n'est ni significativement supÃ©rieure ni significativement infÃ©rieure Ã zÃ©ro, on ne peut pas dire qu'il y a un effet avant-aprÃ¨s.Â

1. Il faut avoir deux

Ã©chantillons d'un mÃªme type de mesure (par exemple, un temps de rÃ©ponse dans les deux cas) recueillis Ã raison de deux donnÃ©es par individu statistique et sur lesquelles on peut procÃ©der Ã une diffÃ©rence.

2. Les donnÃ©es de l'Ã©chantillon devraient idÃ©alement Ãªtre normalement distribuÃ©es. Cliquez ici pour accÃ©der Ã l'article expliquant comment vÃ©rifier si cette condition est rÃ©alisÃ©e.

Â

2.1. Obtenir la valeur de t

(18)

Ã€ partir des deux Ã©chantillons de donnÃ©es appariÃ©es, on construit la variable de diffÃ©rence en calculant pour chaque ligne i, la valeur xi = xi1-xi2. Cela nous donne un Ã©chantillon rÃ©el de taille n (ici n couples de donnÃ©es), de moyenne m et

Selon les informations dont on dispose, on applique la formule avec l'erreur standard ES,

Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â {moslatex}$$t=\frac{m}{ES}$${/moslatex}

Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â {moslatex}$$t=m\times\frac{\sqrt{n}}{s}$${/moslatex}

Â On prÃ©sente le rÃ©sultat en Ã©crivant t(ddl)=n.nn (pour la prÃ©sentation de la valeur p, voir l'article gÃ©nÃ©ral sur la norme APA de prÃ©sentation).

Â

Ici l'Ã©chantillon virtuel a la mÃªme taille que l'Ã©chantillon rÃ©el, soit n individus. Le nombre de degrÃ©s de libertÃ© est directement ddl=n-1.Â

- soit en regardant dans une table du t de student en prenant comme entrÃ©e la valeur du t ainsi calculÃ©e et comme nombre de degrÃ©s de libertÃ© la valeur n-1 oÃ¹ n est le nombre de mesures.

(19)

Â

Si toutefois on dispose d'une hypothÃ¨se orientÃ©e et que les statistiques descriptives vont dans le sens attendu (typiquement on s'attend Ã ce

que m>0 et c'est le cas au niveau descriptif, ou bien on s'attend Ã ce que m<0 et c'est le cas au niveau descriptif), alors on peut travailler en unilatÃ©ral : il suffit alors de prendre la valeur p prÃ©cÃ©demment obtenue et la diviser par 2 avant de dÃ©cider si le test est significatif ou non.

Â

2.4. Un exemple

Dans une expÃ©rience sur le risque liÃ© Ã l'alcool, on a demandÃ© Ã chacun des 31 participants d'Ã©valuer le risque associÃ© Ã une situation de conduite sur une Ã©chelle de 1 Ã 5.

1 5 4

1 4 3

(20)

1 4 3

1 5 4

1 4 3

1 5 4

1 4 3

1 5 4

2 5 3

1 5 4

(21)

1 4 3

1 5 4

2 4 2

1 5 4

1 3 2

2 5 3

1 5 4

1 3 2

1 5 4

1 3 2

(22)

1 4 3

Â

En premiÃ¨re approximation, on a constatÃ© que la moyenne de la situation sans alcool est deÂ 1.10 alors que la colonne 2 est en moyenne Ã 4.52. Descriptivement on pourrait donc dire que les participants jugent la situation 2 plus risquÃ©e que la situation 1... mais est-ce vrai statistiquement ?

La troisiÃ¨me colonne a Ã©tÃ© obtenue en faisant la diffÃ©rence de la colonne 2 (avec alcool) et de la colonne 1 (sans alcool).Â Nous allons travailler Ã partir de cette colonne.

Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â {moslatex}$m=\frac{\sum_{i=1}^{31}x_i}{31}=3.42${/moslatex}

Pour ceux qui se rappellent que la moyenne des diffÃ©rences est Ã©gale Ã la diffÃ©rence des moyennes (les effectifs Ã©tant ici Ã©gaux), cette moyenne est sans surprise puisque 5.52 - 1.10 = 3.42.

Â Â Â Â Â Â Â Â Â Â Â

{moslatex}$s=\sqrt{\frac{\sum_{i=1}^n(x_i)^2)}{n-1}}=\sqrt{\frac{\sum_{i=1}^{31}(x_i-3.42)^2)}{30}}=0.72${/moslatex}

Nous obtenons

Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â

{moslatex}$t=m\times\frac{\sqrt{n}}{s}=3.42\times\frac{\sqrt{31}}{0.72}=26.4${/moslatex}Â

Ensuite sous Excel par exemple, en appliquant la formule =LOI.STUDENT.BILATERALE(t; ddl)" avec le t que l'on vient

de calculer et ddl=31-1=30 degrÃ©s de libertÃ©s, on trouve p=2.4x10-22, ce qui est quasiment Ã©gal Ã zÃ©ro. Autrement dit, ce n'est mÃªme pas la peine de se poser la question de la latÃ©ralitÃ© : de toute faÃ§on le test est trÃ¨s nettement significatif.

(23)

Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â t(30)=26.4, p<.001, ce qui est significatif : on peut donc conclure que la sitation 2 est jugÃ©e plus risquÃ©e par les participants que la situation 1.

Â