• Aucun résultat trouvé

A PROPOS DU TEST F

N/A
N/A
Protected

Academic year: 2022

Partager "A PROPOS DU TEST F "

Copied!
3
0
0

Texte intégral

(1)

ENFA - Bulletin du GRES n°3 –juin 1996 page 19 Contact : Conf PY-MATH@educagri.fr

A PROPOS DU TEST F

Première partie

L'objet de ce premier article est d'apporter quelques précisions sur le test F de comparaison de deux variances.

Les bases théoriques de ce test ont été établies par R.A. FISHER (1920). La notation F a été donnée par G. W. SNEDECOR en l'honneur de ce dernier.

QUELQUES RAPPELS ET NOTATIONS

Dans la suite, on se place dans le cas de deux populations normales notées P1 et P2, et on prélève dans chaque population un échantillon aléatoire (chaque élément est prélevé au hasard) et simple (les éléments sont prélevés indépendamment les uns des autres) ; en abrégé un échantillon aléatoire et simple est noté EAS.

On prélève un échantillon, de taille n1, provenant de la population P1 et on prélève un échantillon, de taille n2, provenant de la population P2.

On suppose de plus que les échantillons ont été prélevés indépendamment les uns des autres ; on dit alors que le plan d'échantillonnage est un plan d'échantillonnage aléatoire simple et indépendant (en abrégé plan EASI).

Les notations utilisées sont celles définies dans le bulletin N°1 page 14.

LA PROBLEMATIQUE DU TEST F

On note σ12 la variance de la population P1 et σ22 la variance de la population P2.

Ces deux variances existent, mais sont inconnues. On suppose que les moyennes de ces deux populations sont inconnues.

Le problème est donc de comparer σ12 et σ22, à partir des données obtenues sur les deux échantillons.

Pour cela, on calcule, à partir de ces données, la variance de chacun des deux échantillons; elles sont notées respectivement s12 et s22.

Si on note S12 ( respectivement S22 ) la variable aléatoire qui à chaque échantillon issu de la population P1 (respectivement P2) de taille n1 ( respectivement n2 ) la variance de cet échantillon, alors, on sait que la distribution de probabilité de la variable aléatoire n S1 12

1

σ2 (respectivement

n S2 22

22

σ ) est une distribution du χ2 à n1 - 1 degrés de liberté (respectivement n2-1 degrés de liberté)

; cela est lié au caractère EAS de chacun des échantillons.

(2)

ENFA - Bulletin du GRES n°3 –juin 1996 page 20 Contact : Conf PY-MATH@educagri.fr

De plus ces deux variables aléatoires sont indépendantes, cela est du au fait que les echantillons ont été prélevés indépendament l’un de l’autre (le I de EASI).

Par suite, la variable aléatoire F égale à

n S n

n S n

1 12

1 1

2 2 22

2 2

2

1

1

( )

( )

− σ σ

est distribuée selon une loi de FISHER-

SNEDECOR à n1-1 et n2-1 degrés de liberté.

Sous l’hypothèse «σ12 = σ22» est vraie, alors F s'écrit

n S n

n S n

1 12 1

2 22 2

1

1

( )

( )

soit aussi

S S 12

22 ; ce dernier rapport peut être interprété comme le rapport des deux estimateurs de σ12 et σ22 .

De plus, sous cette hypothèse, ce rapport ne doit pas être trop différent de 1 ; soit plus grand que 1, soit plus petit que 1.

Par nature, le test F d'égalité de deux variances est un test bilatéral.

La variable de décision sera la variable F. On calcule Fobs , Fobs = n s n

n s n

1 12 1

2 22 2

1

1

( )

( )

.

Pour un risque α choisi, on rejette l’hypothèse ( d'égalités des deux variances ) si Fobs ≤ Fα

2

ou si Fobs ≥ F

1 2

α . Fα

2

et F

1 α2 sont lus dans les tables de la distribution de FISHER-SNEDECOR à k1 et k2 degrés de liberté ; k1 est le nombre de degrés de liberté du numérateur etk2 est le nombre de degrés de liberté du dénominateur. Ici on a k1 = n1-1 et k2 = n2-1

REMARQUES COMPLEMENTAIRES :

1°) Historiquement, les tables des distributions F n'ont été établies que pour des valeurs supérieures à 1. Par suite, dans la pratique, on calcule le Fobs en prenant pour numérateur la plus grande des deux quantités

n s n

1 12

1 1

( − ) et n s n

1 22

1 1

( − ) et l'autre pour dénominateur.

Dans ce cas, on rejette l’hypothèse d'égalité des deux variances si Fobs ≥ F

1 2

α.

Il convient donc d'être très attentif aux tables utilisées (certaines étant qualifiées d'unilatérales, d'autres de bilatérales, d'autres ne portant aucune mention). De même, lors de l'utilisation d'un logiciel il faudra être attentif à la valeur renvoyée (EXCEL en particulier).

(3)

ENFA - Bulletin du GRES n°3 –juin 1996 page 21 Contact : Conf PY-MATH@educagri.fr

Des compléments, sur cette première remarque, seront publiés ultérieurement.

2°) Quelques simplifications d'écriture : on peut remarquer que Fobs peut aussi s'écrire Fobs = s s

12 22 . De plus, dans le cas où n1 = n2 l'écriture du Fobs se simplifie, Fobs =

s s 1 2 2 2

3°) Ce test de comparaison de deux variances ne doit pas être confondu avec le test F utilisé en analyse de la variance qui lui est un test unilatéral.

4°) Prenons un exemple, supposons que n1 = 9, n2 = 7 et que s12 = 280 et s22 = 54. On a alors Fobs

= 5. Pour un risque choisi de 0,05, dans la table à 8 et 6 degrés de liberté le F théorique (F0,975) est de 5,60. On est conduit à ne pas rejeter l'hypothèse d'égalité des variances des deux populations.

Si comme on le voit parfois, on avait choisit le F0.95, qui est de 4,15, on aurait rejeté l'hypothèse d'égalité.

REFENCES :

[1] DAGNELIE P.

Théorie et méthodes statistiques P.A. de Gembloux 1973 T2 p 50 et 51 [2] SNEDECOR G. W. et COCHRAN W. G.

Méthodes statistiques 1971 p 128 à 130

Références

Documents relatifs

Donner un vecteur directeur de la droite (BC)b. Le point I est le milieu du

Dans chaque cas, pose une question permettant d'éliminer l'un des deux polygones. Les 2 polygones

def : peut être exprimée en valeur par rapport au poids vif des animaux, c’est-à-dire en g/j ou /Kg de poids vif, cette expression permet de comparer les résultats entre espèce

Lors d’une séance de travaux pratiques, les élèves découvrent des flacons de liquides sans étiquette et un métal de couleur gris.. Ils doivent identifier les espèces chimiques

Dans la suite, on se place dans le cas de deux populations normales notées P1 et P2, et on prélève dans chaque population un échantillon aléatoire (chaque élément est prélevé

[r]

Une psudo solution est un antécédent de la projection orthogonale du second membre sur l'image de l'application.. L'équation admet donc toujours

Master Sciences et Technologies, Mention Mathématiques ou Informatique Spécialité Cryptologie et Sécurité Informatique. UE M1MA7W01 : Arithmétique Responsable