ENFA - Bulletin du GRES n°10 – octobre 2000 page
0
Contact : Conf [email protected]
EDITORIAL
Constitution du G.R.E.S. au Octobre 2000
ANGELIQUE Françoise LEGTA de NANCY
ARNAL Florent LEGTA de ST-LO-THERE
BUENO Pierre LEGTA de BOURG en BRESSE
DESESQUELLES René LEGTA d’AMIENS
FAGES Jean ENFA TOULOUSE
GAUMET Jean-Pascal LEGTA LE ROBILLARD
PARNAUDEAU Jean-Marie LEGTA de VENOURS
PAVY Jacques LEGTA LE ROBILLARD
QUET Guillaume LEGTA d’AUBENAS
RIOU Alexis LEGTA QUIMPER BREHOULOU
URDAMPILLETTA Vincent LEGTA de SURGERES
VARLOT Chantal LEGTA de CHALONS SUR MARNE
Françoise ANGELIQUE
Une de plus, il s'agit de la rentrée scolaire bien sûr, avec son lot de nouveautés. Mais pour nous, enseignants de mathématiques des lycées agricoles, quoi de neuf depuis le numéro 9 ?
* Les bulletins du GRES et de PY-MATH sont maintenant accessibles sur le "net" à l'adresse suivante :
http://enfa.mip.educagri.fr/enfadraf/gres/default.htm
Pour l'instant, les différents articles sont téléchargeables au format .pdf. Nous espérons, dans les semaines qui viennent, offrir la possibilité de les télécharger au format Word.
* L'action 4 de Pygmalion a accepté de gérer un nouveau groupe de réflexion : le GREI, Groupe de Réflexion sur l'Enseignement de l'Informatique. Ce groupe a les mêmes objectifs que le GRES et PY-MATH concernant l'enseignement de l'Informatique. Ce groupe a un site internet à l'adresse suivante
http://enfa.mip.educagri.fr/grei/
* L'opération Pygmalion devrait, dans le cadre des décisions consécutives à la réflexion globale menée dans PROSPEA, pour l'année 2002, se poursuivre selon des dispositions encore inconnues. Pour l'année civile 2001, en principe, la DGER devrait fournir aux actions en place et qui souhaitent poursuivre leurs travaux, des moyens pour fonctionner. On peut donc espérer que le GRES ainsi que PY-MATH continueront à réfléchir et à vous proposer un bulletin
"régulier".
* La nouveauté la plus spectaculaire de cette rentrée scolaire est, sans conteste, la mise en œuvre des nouveaux programmes dans les classes de seconde générale et technologique. Le nouveau programme de mathématiques contient une partie de Statistique en très nette évolution par rapport au passé (pour ne pas écrire révolution). L'esprit de ces programmes (bien développé dans les documents d'accompagnement que l'on peut consulter sur le site du CNDP :
http://www.cndp.fr/lycee/maths/) ainsi que les contenus marquent une volonté énergique dedévelopper l'apprentissage de la Statistique dans les lycées. Les programmes de 1
èreS et 1
èreES poursuivent dans cette voie. Pour ce qui nous concerne, de nouveaux programmes pour les filières technologiques sont en préparation, nous espérons qu'ils tiendront compte de ce nouvel esprit pour la partie Statistique et Probabilités. De toute évidence, la réflexion mise en place en seconde sur l'échantillonnage, poursuivie en 1
èreet terminale, rendra nos élèves plus réceptifs et mieux préparés pour suivre le programme de Statistique des filières BTSA. Il est clair que ces programmes de BTSA devront être repensés pour la rentrée 2003-2004. Par chance ces échéances laissent du temps pour réfléchir, consulter les enseignants, les professionnels et même assez de temps pour tester des programmes expérimentaux avant la mise en place des programmes définitifs. Nous espérons que la DGER va profiter de cette occasion.
Pour certains d'entre vous, les bulletins du GRES sont une référence voire un modèle ; nous en sommes très heureux mais la responsabilité est lourde et nous savons bien que ce que nous publions n'est pas parfait, c'est pourquoi nous aimerions recevoir vos remarques ou suggestions (nous l'avons déjà dit ?….) et c'est pourquoi il est peut-être bon de parler ici des méthodes de travail de notre groupe.
Chaque article est proposé par un membre du groupe (parfois deux), il est ensuite relu, discuté,
corrigé voire remanié par l'ensemble du groupe. Certains articles donnent lieu à des débats
assez vifs car tout n'est pas toujours simple et différents points de vue peuvent s'affronter (mais,
ENFA - Bulletin du GRES n°10 – octobre 2000 page
2
Contact : Conf [email protected]
rassurez-vous, l'humour, le respect mutuel et la convivialité font que ça n'entame pas l'amitié qui nous lie).
A titre d'exemple, citons l'article "Comparaisons de deux moyennes" qui a été publié dans le bulletin 9. La question était de savoir si on publiait l'organigramme qui l'accompagnait. Des arguments d'ordre pédagogique se sont opposés, les arguments contre étaient principalement ceux-ci :
•
Nous ne devons pas seulement dresser nos élèves pour qu'ils sachent résoudre des exercices types, nous devons les éveiller à une compréhension plus profonde de ce qu'est la statistique inférentielle et les préparer à l'utiliser en expérimentation ou en contrôle qualité.
•
Un autre argument concerne la place accordée aux "grands échantillons" et le fatidique
"n>30" comme si à 31 tout basculait ! Cette frontière s'est justifiée longtemps par les limites matérielles des tables de statistique, elle ne se justifie plus vraiment aujourd'hui.
En faisant cela on utilise une loi approchée sans avoir aucune idée de la qualité de l'approximation ! (Et, à propos de grands échantillons, est-il judicieux, avec les moyens de calcul actuels, de grouper les données en classes, sauf pour des besoins graphiques ou un test de normalité, alors que cela modifie les paramètres ?)
La décision a pourtant été prise à la majorité de le publier. La raison en était que, sur un chapitre un peu difficile, il constituait une aide précieuse aux étudiants en clarifiant le problème. Il est adapté aux programmes et aux sujets d'examen dans leur forme actuelle.
Ce qu'il est important de retenir de ce débat est qu'il faut éviter d'appliquer aveuglément une règle, il faut rester vigilant et toujours chercher le pourquoi des choses. Il est clair que cet organigramme doit rester attaché à l'article qui le précède.
Et vous, avez-vous une opinion ? N'oubliez pas que nous attendons toujours vos réactions, propositions ou questions adressées à Jean Fages à l'ENFA ou à n'importe quel membre du groupe.
Je vous souhaite une bonne lecture de ce numéro 10 et une très bonne année scolaire.
≈≈≈≈≈≈≈≈≈≈
ANALYSE DE VARIANCE A UN FACTEUR
L’analyse de variance est une méthode statistique qui permet de comparer les moyennes de plusieurs populations, supposées normales et de même variance, à partir d’échantillons aléatoires simples, indépendants deux à deux, extraits de ces populations. Pour comparer des moyennes on fait une analyse de variance, cela peut paraître paradoxal. Mais nous allons voir qu’il s’agit bien, en fait, de comparaison de variances. Faisons sa connaissance à partir d’un exercice extrait des annales de BTS (PA 1993).
Enoncé : A la mi-mai, 32 ruches élevées dans des conditions identiques et donc de force très comparable, sont réparties en 4 lots de 8 ruches chacun sur les pâturages d’un même versant de montagne mais à des altitudes différentes. La production de miel récolté à la fin de juillet, exprimée en kg, se distribue comme suit :
altitude rucher 1 rucher 2 rucher 3 rucher 4
1480 m 1700 m 1850 m 1960 m
ruches 1 12 11 12 8 2 17 15 7 12 3 13 14 13 14 4 15 19 14 9 5 10 16 11 11 6 15 12 10 11 7 11 10 14 6 8 14 8 9 11 A l’aide d’une analyse de variance, en supposant remplies les conditions, que l’on rappellera, commenter l’effet de l’altitude sur la production de miel cette année là.
Il s’agit bien d’une analyse de variance à un facteur, le facteur étudié est ici l’altitude. Ce facteur a 4 modalités, chaque modalité a le même nombre d’observations. On dit que le plan est équilibré.
1) Notations :
On désigne par x
ijle rendement de la j
ièmeruche du i
ièmerucher.
x
ile rendement moyen du i
ièmerucher.
x le rendement moyen de l’ensemble des 4 ruchers.
Un calcul rapide permet d’obtenir :
x
1=13,375 ; x
2=13,125 ; x
3=11,25 ; x
4=10,25 ; x =12,00.
Pourquoi les 32 ruches n’ont-elles pas toutes le même rendement x ?
L’égalité (1) suivante est évidente : x
ij- x = ( x
i- x ) + ( x
ij- x
i)
ENFA - Bulletin du GRES n°10 – octobre 2000 page 4
La différence ( x
i- x ) est explicable par la différence d'altitude, tandis que la différence ( x
ij-
x
i) ne s’explique pas par l’altitude. Elle est due à d’autres facteurs non identifiables que l'homogénéité de l'ensemble des 32 ruches nous autorise à appeler aléatoires. On l’appelle résidu ou écart résiduel.
Exemple : pour la 4
ièmeruche placée à l’altitude 1850 m, dont le rendement est 14 kg :
14,00 - 12,00 = (11,25 - 12,00) + ( 14,00 - 11,25) 14,00 -12,00 = (- 0,75) + (2,75).
Une baisse de rendement de 0,75 kg est due à l’altitude et un gain de 2,75 kg pour une raison indéterminée.
2) Décomposition de la variabilité :
En élevant chaque terme de l’égalité (1) au carré, puis en sommant sur i et j, on obtient :
) x x )(
x x ( 2
) x x ( )
x x ( )
x x
(
ij i8 1 j
i 4
1 i 8 2
1 j
i ij 4
1 i 8 2
1 j
i 4
1 i 8 2
1 j
ij 4
1 i
−
− +
− +
−
=
− ∑ ∑ ∑ ∑ ∑ ∑
∑
∑
= = = = = = = =La somme des doubles produits étant nulle, on en déduit :
8 21 j
i ij 4
1 i 4
1 i
2 i 8 2
1 j
ij 4
1 i
) x x ( )
x x ( 8 )
x x
( ∑ ∑ ∑
∑
∑
= = = = =− +
−
=
−
On désigne par somme totale des carrés des écarts la quantité
2 81 j
ij 4
1 i
) x x
∑ (
∑
= =−
par somme des carrés des écarts factoriels (ou écarts inter)
i 2 41 i
) x x (
8 −
∑
=et par somme des carrés des écarts résiduels (ou écarts intra)
2 81 j
i ij 4
1 i
) x x
∑ (
∑
= =−
D’où la décomposition de la variabilité : SCE
totale= SCE
inter+ SCE
intraPassons aux calculs pour l’exemple ci-dessus :
♦ 8 2
1 j
ij 4
1 i
) x x
∑ (
∑
= =− = 268,00. Soit SCE
totale= 268,00.
Ce résultat s’obtient facilement à l’aide de la calculatrice. Il suffit, en mode statistique à une variable, de saisir les 32 données, de sortir la variance de cette série puis de multiplier cette variance par 32.
♦ 4 i 2
1 i
) x x (
8 −
∑
== 54,25. Soit SCE
inter= 54,25.
Il s’agit en fait de la somme des carrés des écarts de la série suivante :
altitude 1 2 3 4
moyenne 13,375 13,125 11,25 10,25
effectif 8 8 8 8
On voit bien que seul le facteur altitude intervient, les variations à l’intérieur de chaque modalité sont éliminées.
♦
Par différence, on obtient :
8 21 j
i ij 4
1 i
) x x
∑ (
∑
= =− = 268,00 - 54,25 = 213,75. Soit SCE
intra= 213,75.
3) Degrés de liberté
A chacune de ces variabilités, on attribue un nombre de degrés de liberté (ddl).
ddl
totalddl
interddl
intranombre d’observations - 1 nombre de traitements - 1 ddl
total -ddl
inter32 - 1 = 31 4 - 1 = 3 31 - 3 = 28
4) Carrés moyens ou variances :
On définit les variances ou carrés moyens en divisant la somme des carrés des écarts par le nombre de degrés de liberté. On obtient ainsi :
♦
18 , 08 .
3 25 , 54 ddl
CM SCE
inter inter
inter
= = =
♦
7 , 63
28 75 , 213 ddl
CM SCE
intra intra
intra
= = =
5) Principe de l’analyse de variance :
On veut savoir si le rendement est différent selon l’altitude. Les 4 échantillons dont on dispose sont extraits de 4 populations dont les moyennes respectives sont µ
1, µ
2, µ
3et µ
4.
L’hypothèse initiale est donc H
0« µ
1= µ
2= µ
3= µ
4» ce qui signifie que le facteur altitude n’a pas d’influence sur le rendement.
Elle est opposée à l’hypothèse alternative H
1« au moins deux des moyennes sont différentes », c’est-à-dire, l’altitude influence le rendement.
Pour tester ces hypothèses, il suffit de comparer la variance inter à la variance intra. Si la
variance inter est supérieure à la variance intra, cela signifie que les variations entre les
traitements sont plus importantes que les variations à l’intérieur d’un traitement, il y a donc un
effet traitement. Il s’agit donc d’un test de Fisher-Snedecor nécessairement unilatéral.
ENFA - Bulletin du GRES n°10 – octobre 2000 page 6
♦
Modèle : Sous H
o,
intra inter
CM
CM est une observation de la variable aléatoire F distribuée selon la loi de Fisher Snedecor à (ddl
inter; ddl
intra) degrés de liberté. Ici, F est distribuée selon la loi de Fisher-Snedecor à (3 ; 28 ) degrés de liberté.
♦
Règle de décision : Le risque α choisi est 0,05.
Dans la table de Fisher-Snedecor, on lit 2,92 < f
0,95 ; 3 ; 28< 2,99 , ou par interpolation, f
0,95 ; 3 ; 28≈ 2,95.
Si f
obs> 2,95, on rejette H
oau seuil de risque 0,05.
♦
Décision : Pour les échantillons observés, 2 , 37 63
, 7
08 ,
f
obs= 18 = , et 2,37 < 2,95.
(on a même f
obs< 2,92. L’interpolation linéaire était superflue).
Au risque α de 0,05, on ne rejette pas H
o.♦
Conclusion : Au vu de ces échantillons, on considère qu’il n’y a pas de différence significative au niveau du rendement entre les quatre altitudes.
_______________________
Remarques :
Pour réaliser cette analyse de variance, on a supposé :
•
que le rendement dans les quatre populations était réparti selon une loi normale, ce qui ne pose guère de problème (on peut le vérifier graphiquement par l'histogramme des résidus ou par un test de normalité sur les résidus mais cela aurait peu de sens avec seulement 32 valeurs).
•
que les quatre populations ont même variance. Cela suppose que l’altitude fait éventuellement varier le rendement moyen et pas la variance. La variance commune est estimée par la variance résiduelle ou variance intra définie ci-dessus.
•
que les échantillons sont aléatoires et simples, indépendants deux à deux. (L'indépendance des échantillons est-elle ici vérifiée ? Cela est discutable s’il s'agit de la répartition d'un ensemble de 32 ruches, le fait qu'une ruche appartienne à l'un des échantillons implique qu'elle n'appartient pas aux autres. A moins qu’elles n’aient été choisies au hasard parmi un plus grand nombre de ruches…).
Autre remarque :
L’analyse de variance est une méthode robuste à la non normalité des populations et à l’inégalité des variances si tous les échantillons sont de même taille (c’est le cas ici).
Si les conditions ne sont pas satisfaites, on peut essayer de s’en rapprocher en effectuant un
changement de variable.
La plupart des logiciels qui réalisent cette analyse proposent les résultats essentiels sous forme d’un tableau. Ce tableau donne les sommes des carrés des écarts, les degrés de liberté, les variances, le F observé et selon les cas
•
soit le F théorique, pour comparaison comme ci-dessus,
•
soit la probabilité que F soit supérieur au F observé, si Ho est vraie. Dans ce cas, on rejette Ho lorsque cette probabilité est inférieure au seuil de risque α .
Voici le tableau proposé par EXCEL :
(L’analyse de variance est disponible dans l’Utilitaire d’analyse, lui-même situé dans les macros complémentaires).
Analyse de variance : un Facteur RAPPORT DÉTAILLÉ
Groupes Nombre d'échantillons Somme Moyenne Variance
rucher 1 8 107 13,375 5,41
rucher 2 8 105 13,125 12,7
rucher 3 8 90 11,25 6,21
rucher 4 8 82 10,25 5,44
ANALYSE DE VARIANCE Source des
variations
Somme des carrés
Degré de liberté
Moyenne des
carrés F Probabilité
Valeur critique
pour F
Entre Groupes 54,25 3 18,083 2,369 0,0920 2,947
A l'intérieur des groupes
213,75 28 7,634
Total 268 31 Une présentation semblable des résultats est obtenue avec STATITCF.
Quelques commentaires pour compléter l’exposé.
•
Pour calculer les trois SCE et on peut aussi construire le tableau suivant, facile à réaliser avec une calculatrice :
Rucher 1 Rucher 2 Rucher 3 Rucher 4 Totaux
n
i8 8 8 8 32
∑
j
x
ij107 105 90 82 384
∑
j ij2
x 1469 1467 1056 884 4876
s
2n 37,875 88,875 43,5 43,5 213,75
ENFA - Bulletin du GRES n°10 – octobre 2000 page 8
La SCE
intraest égale à ∑
i 2 i i
s
n où s
idésigne l’écart type du i
ièmeéchantillon.
∑ =
i 2 i
i
s 213 , 75
n .
La SCE
totaleest égale ici à 268
32
² 4876 384
n x x
2
i j ij
i j 2
ij
⎟ ⎟ = − =
⎠
⎞
⎜ ⎜
⎝
⎛
−
∑∑
∑∑ .
La SCE
interse calcule avec la formule donnée précédemment, ou par différence.
•
Le nombre de degrés de liberté de la SCE résiduelle (ou intra) peut être justifié facilement.
En effet, en terme de variable aléatoire, la SCE résiduelle est égale à ∑
i 2 i i
S
n qui est, au facteur
2
1
σ près, la somme de variables aléatoires de loi de χ² indépendantes. (voir dans le bulletin du GRES n°7 l’article intitulé « résumé sur les lois ») :
On démontre que :
σ
2E
R. C .
S suit la loi de χ
2à (n – p) ddl et que,
si µ
1= µ
2= …= µ
p, alors
σ
2E
F. C .
S suit la loi de χ
2à (p – 1) ddl.
De plus, on démontre que ces deux variables aléatoires sont indépendantes. Il en résulte (après simplification par σ ²) que, si les p moyennes sont égales , la variable aléatoire
F
S C E p S C E
n p
C M C M
F
R
F R
= −
−
= . .
( )
. .
( )
. .
1 suit la loi de Fisher-Snedecor à (p-1) et (n-p) degrés de
liberté.
Pour vous entraîner : (Extrait des annales de BTS, 1996, option P A)
Vingt génisses sont réparties en quatre échantillons de cinq génisses chacun. Chaque échantillon correspond à un des quatre régimes R
1, R
2, R
3, R
4suivi par les génisses. Les gains de poids vif exprimés en kg des vingt génisses entre la naissance et la fin de l’hiver sont répertoriés dans le tableau suivant :
R
1104 72 86 79 81
R
289 104 93 84 85
R
377 77 61 58 62
R
468 75 56 77 72
On suppose que les populations dont sont extraits ces échantillons, sont normales et de même
variance. A l’aide d’une analyse de variance, tester l’hypothèse « les gains de poids vif sont
identiques pour les quatre régimes ».
Eléments de correction : Rapport détaillé :
Groupes Nombre d’échantillons
Somme Moyenne Variance
R
15 422 84,4 145,3
R
25 455 91 65,5
R
35 335 67 85,5
R
45 348 69,6 69,3
Analyse de variance : Source des
variations
Somme des carrés
Degrés de liberté
Moyenne des
carrés F Probabilité
Valeur critique pour F
inter 2007,6 3 669,2 7,32 0,0026 3,24
intra 1462,4 16 91,4 totale 3470 19
Interprétation des résultats :
7,32 > 3,24 ( ou 0,0026 < 0,05). On rejette H
odonc on conclut à une différence significative entre les gains de poids vif selon le régime.
Comme 0,0026 < 0,01, cette différence est hautement significative (H
orejetée au seuil de risque de 1%).
≈≈≈≈≈≈≈≈≈≈
TESTS D'HYPOTHESES : COMPARAISON AVEC PREUVE PAR 9 ET RAISONNEMENT PAR L’ABSURDE
Preuve par 9 d’une multiplication :
Tout le monde connaît cette technique qui permettait, avant le déferlement des calculatrices, de se rassurer un peu sur la non fausseté d'un calcul effectué à la main.
Dès l'école primaire, les maîtres apprenaient les limites de ce procédé qui, lorsqu'il décèle une erreur, est infaillible mais qui, lorsqu'il n'en décèle pas, ne donne aucune assurance sur l'exactitude du calcul comme l'illustre l'exemple qui suit :
2325×725 = 1 775 625 2325×725 = 1 685 625
résultat faux résultat exact
Donc cette technique est surtout utile lorsqu’on pressent que le résultat est faux et elle nous donnera satisfaction lorsqu’elle nous signalera une erreur d’opération ; si elle ne nous signale pas d'erreur, on peut simplement assurer : "on n'est pas certain que le calcul est faux" ce qui ne constitue pas une conclusion très positive.
Raisonnement par l’absurde :
Ce type de raisonnement mathématique consiste à rajouter aux hypothèses d’un problème une nouvelle hypothèse (qui est la négation de la propriété que l’on veut démontrer), puis à l’aide de déductions successives, mettant évidemment en œuvre cette nouvelle hypothèse, il s’agit d’aboutir à une contradiction soit avec des hypothèses du problème, soit avec un axiome ou un théorème établi. Bien entendu si l’on n’arrive pas à une contradiction, le raisonnement a échoué et l’on ne peut rien dire quant à l’hypothèse rajoutée.
Remarque : La preuve par 9 est un exemple de raisonnement par l’absurde, en effet :
supposons que le résultat 1 675 625 est exact alors on doit avoir (si R(a) désigne le reste de la division euclidienne de a par 9) :
R(1 675 625) = R(R(2325) ×R(725)) or R(1 675 625) = 5 et R(R(2325) ×R(725)) = 6 donc contradiction d’où l’on déduit que la supposition est fausse et donc que le résultat 1 675 625 n’est pas exact.
3
5
6 6
3
5
6 6
Test statistique :
Un test statistique est une technique qui permet de tester une hypothèse, appelée hypothèse nulle, H
0(dont on souhaite se convaincre qu’elle est fausse) contre une hypothèse H
1, appelée hypothèse alternative.
H
1est, dans le contexte de l’expérience, la négation de H
0. Prenons l’exemple d’un test sur la moyenne.
On considère un échantillon aléatoire simple de 25 individus issu d’une population dans laquelle le caractère étudié est une variable aléatoire X qui a comme loi de probabilité la loi normale d’écart type 2 et de moyenne inconnue µ.
Les mesures du caractère effectuées sur les individus de l’échantillon conduisent à une moyenne x de 43,85.
Peut-on, au vu de cet échantillon, affirmer, au risque 5% de se tromper, que la moyenne µ du caractère dans la population est supérieure à 43 ?
* Choix des hypothèses :
H
0: la moyenne µ dans la population est égale à 43.
H
1: la moyenne µ dans la population est supérieure à 43.
* Choix de la statistique :
Nous savons que la variable aléatoire X (moyenne échantillonnale de taille 25) a comme loi de probabilité la loi normale N(µ; 2
25 ).
* Risque
α :L’énoncé nous demande une conclusion au risque 5%, donc α = 0,05.
Le test est unilatéral à droite au vu de l’hypothèse alternative H
1.
* Règle de décision :
Supposons vraie l’hypothèse H
0,donc µ = 43, la variable X a donc comme loi de probabilité la loi normale N(43;0,4). On trouve (avec EXCEL par exemple) que pour la loi N(43;0,4), P( X >43,66)= 0,05.
D’où la règle de décision suivante correspondant au risque 5% indiqué dans l’énoncé : - si la valeur observée de X sur l’échantillon est supérieure à 43,66, les résultats observés nous permettent de refuser, avec un risque d’erreur de 5%, l’hypothèse H
0et d’affirmer, au risque 5%, que la moyenne de la population est supérieure à 43.
- si la valeur observée de X sur l’échantillon est inférieure ou égale à 43,66, les résultats observés ne nous permettent pas de refuser l’hypothèse H
0donc nous ne pouvons pas affirmer que la moyenne de la population est supérieure à 43,
* Conclusion :
La moyenne constatée sur l’échantillon, 43,85, étant supérieure à 43,66 nous pouvons conclure
:
"au vu de l’échantillon et avec un risque d’erreur de 5%, nous rejetons l’hypothèse nulle et affirmons, avec un risque de se tromper de 5%, que la moyenne dans la population est supérieure à 43."
Le risque réel, avec la valeur constatée, est de 1,7%.
Remarques :
1) Nous avons écrit plus haut que : "H
1est, dans le contexte de l’expérience, la négation de H
0", or il peut paraître surprenant de prendre pour H
0: µ = 43, par rapport à H
1: µ > 43, logiquement, on préférerait H
0: µ ≤ 43.
On peut cependant remarquer que la valeur critique, au seuil de 5%, déterminée avec µ = 43, c'est à dire 43,66, est évidemment supérieure à la valeur critique déterminée avec toute autre valeur de µ inférieure à 43. Donc si l'on est amené, avec la valeur constatée sur l'échantillon, à refuser l'hypothèse nulle : H
0: µ = 43 avec un risque de 5%, alors on refuserait nécessairement toute hypothèse du type H
0: µ < 43 avec un risque inférieur à 5%.
2) Un tel test statistique peut être interprété comme une preuve par 9 "probabiliste" ou encore comme un raisonnement par l’absurde "probabiliste".
Dans les trois cas, on engage un raisonnement, ou des calculs, en supposant vraie une propriété dont on souhaite se convaincre qu’elle est fausse au profit de la négation de cette propriété.
Dans le cas de la preuve par 9, H
0est : le résultat trouvé est exact,
tandis que H
1est : le résultat trouvé est faux.
Dans le cas du raisonnement par l’absurde, avec un exemple de géométrie : H
0est : la droite Δ est parallèle à D
2, tandis que H
1est : les droites Δ et D
2sont sécantes (Pour démontrer par exemple que si deux droites sont parallèles alors toute droite qui coupe l'une coupe l'autre).
Dans le cas du test,
H
0est : µ = 43, tandis que H
1est : µ > 43.
La particularité des tests statistiques est que la contradiction n’est pas certaine elle n’est que probabiliste. En supposant H
0vraie, on va, après des calculs, aboutir à un résultat numérique peu ou très peu probable lorsque H
0est vraie (dans l'exemple précédent l'événement peu probable sous H
0est : " X
≥43 , 85 " dont la probabilité est d'environ 0,017); on va conclure, avec un certain risque, que cet événement (peu ou très peu probable lorsque H
0est vraie) s’étant réalisé, c’est que H
0doit être remise en cause au profit de H
1qui accorde à cet événement une probabilité plus grande. Ce raisonnement revient à prendre le risque (dit de première espèce) de déclarer impossible un événement de faible ou très faible probabilité.
Dans les trois cas, on peut dire que le raisonnement n’aboutit que si l’on arrive à une contradiction. Si ce n'est pas le cas, pour la preuve par 9, on ne sait pas si le résultat est exact, pour le raisonnement par l’absurde, on n’a rien démontré et dans le cas du test statistique, on peut s'estimer déçu car on doit imaginer que, dans notre exemple, l'expérience ayant motivé le test avait sans doute pour but d’améliorer la moyenne. Est-ce à dire alors que H
0est vraie ?, pas
µ < 43 43 43,66
0,05
< 0,05
du tout, souvenons-nous de la preuve par 9 : ne pas pouvoir conclure que le résultat est faux n’implique pas que le résultat est exact donc notre conclusion sera modeste, on pourra dire :
"il n’y a aucune raison (au vu des éléments que l’on a et dans les conditions imposées) de rejeter l’hypothèse H
0"
ceci est évidemment beaucoup moins fort que d’accepter l’hypothèse H
0. 3) Que signifie réellement ce risque de 5 % ? :
Tout d’abord ce risque ne concerne que le cas où l’on refuse l’hypothèse H
0. Lorsqu’on n’a pas de raison, au vu des résultats de l’échantillon, de refuser H
0, on a également un risque de se tromper, c’est le risque (dit de 2
èmeespèce) de ne pas refuser H
0alors que H
0est fausse. Le calcul de ce risque, désigné par β, nécessite de connaître l’hypothèse H
1de manière plus précise (voir bulletins du GRES n° 4 et 5 "Courbes d'efficacité").
Ce 5% signifie, par exemple, que si l’on a une population pour laquelle H
0est vraie et si l’on prélève dans cette population un grand nombre d’échantillons, en appliquant à chacun d’eux la règle de décision adoptée, pour approximativement 5% des échantillons on sera amené à refuser, et donc à tort, l’hypothèse H
0.
Mais comme, dans la pratique, nous prélevons un seul échantillon, le 5% n’a rien à voir avec cet échantillon ; en fait, ce 5% est à attribuer à la méthode utilisée et non au résultat de la méthode. En réalité ce serait plus rassurant (mais certainement plus onéreux !) de prélever un grand nombre d’échantillons et de ne refuser l’hypothèse H
0que dans le cas où la proportion de refus serait supérieure ou très supérieure à 5%.
De toute façon, une fois qu’une conclusion est prononcée, cette conclusion, quelle qu’elle soit,
est vraie ou fausse et en principe on ne le saura jamais.
EXERCICE CORRIGE
Enoncé :
On considère deux populations Normales A et B de moyennes respectives µ
Aet µ
Binconnues.
Les écarts types des populations sont connus et sont tous deux égaux à 4.
Les hypothèses sont H
0: “ µ
A= µ
B” et H
1: “ µ
A= µ
B+ 5 ”.
Pour tester ces hypothèses, on prélève
•
dans la population A, un échantillon aléatoire simple de taille 9. On note X
Ala moyenne aléatoire d’un tel échantillon et x
Ala moyenne observée sur cet échantillon
•
dans la population B, un échantillon aléatoire simple de taille 16. On note X
Bla moyenne aléatoire d’un tel échantillon et x
Bla moyenne observée sur cet échantillon.
On retient la règle de décision suivante :
si x
A- x
B< 3 ,on décide H
0et si x
A- x
B≥ 3 , on décide H
1.
1) Préciser la loi de probabilité de chacune des variables aléatoires X
Aet X
B. 2) En déduire la loi de probabilité de la variable X
A- X
Ben justifiant votre réponse.
3) Représenter sur un même schéma les lois de probabilité de la variable X
A- X
Bsous l’hypothèse H
0puis sous l’hypothèse H
1.
4) Calculer le risque de première espèce α relatif à la règle de décision retenue.
5) Calculer le risque de seconde espèce β relatif à la règle de décision retenue.
6) Illustrer ces deux risques par les surfaces qu’ils représentent sur le schéma précédent.
________________________
Correction :
1) Les populations mères A et B sont Normales ; la variable X
Aest donc distribuée selon la
loi normale )
; n ( N
A A A
μ σ soit ici la loi )
3
; 4 (
N μ
A. De même la variable X
Best distribuée selon la loi )
; n ( N
B B B
μ σ soit ici la loi N ( μ
B; 1 ) .
2) Les variables X
Aet X
Bsont normales et indépendantes, la variable X
A- X
Best donc normale.
Son espérance est telle que :
E( X
A- X
B) = E( X
A)-E ( X
B) d’où E( X
A- X
B) = µ
A-µ
B.
Comme les variables X
Aet X
Bsont indépendantes, on a :
V( X
A- X
B) = V( X
A)+V( X
B) d’où V( X
A- X
B) =
9 1 25 3
4
22
=
⎥⎦ +
⎢⎣ ⎤
⎡ .
La variable aléatoire X
A- X
Best donc distribuée selon la loi ) 3
; 5 (
N μ
A− μ
B.
3) Sous l’hypothèse H
0, la variable X
A- X
Best de loi ) 3
; 5 0 ( N
Sous l’hypothèse H
1, la variable X
A- X
Best de loi ) 3
; 5 5 ( N .
4) Le risque α est égal à la probabilité de rejeter H
0alors que H
0est vraie. Calculons, sous H
0, la probabilité de décider H
1:
Puisque sous H
0, la variable X
A- X
Best de loi ) 3
; 5 0 ( N , on pose
3 5
X U X
A−
B= , U est donc de loi N(0;1).
α = P(
X
A- X
B≥ 3 ) ; α = P(
3 5
X X
A−
B≥
3 5
3 ) ; α = P( U ≥ 1,8 ) ;
α = 1 - P( U < 1,8 ) ; α = 1 - 0,9641 ; donc α = 0,0359.
Le risque de première espèce associé à cette règle de décision vaut à 0,0359 (ou 3,6 % ).
5) Le risque β est égal à la probabilité de décider H
0alors que H
1est vraie : Sous H
1, la variable X
A- X
Best de loi )
3
; 5
5
(
N .
On pose
3 5
5 X U X
A−
B−
= , U est de loi N(0;1).
β = P(
X
A- X
B< 3 ) ; β = P(
3 5
5 X X
A−
B−
< 3 5 5 3
− ) ; β = P( U < - 1,2 )
β = 1 - P( U < 1,2 ) ; β = 1 - 0,8849 ; donc β = 0,1151.
Le risque de seconde espèce associé à la règle de décision vaut 0,1151 (ou 11,5 % ).
6) Représentation graphique des risques.
≈≈≈≈≈≈≈≈≈≈
CONFORMITÉ D’UNE PROPORTION, QUELLE DÉMARCHE ?
Exercice :
Une machine est considérée opérationnelle si sa fabrication ne contient pas plus de 6% de pièces défectueuses.
On prélève au hasard dans cette fabrication un échantillon de 200 pièces. La fabrication étant supposée de grande taille, on admet que cet échantillon est un échantillon aléatoire simple. Il contient 17 pièces défectueuses.
Est-il possible, au seuil de risque 0,05, de conclure que la machine n’est pas opérationnelle ?
La démarche usuelle de résolution de ce type d’exercice, consiste à choisir, dans le cadre d’une approximation de la loi de probabilité de la variable aléatoire d’échantillonnage proportion, la variable normale centrée réduite comme variable de décision. C’est ce que nous allons traiter dans une première partie. Dans une deuxième partie nous résoudrons l’exercice sans effectuer cette approximation. Enfin, dans une dernière partie, nous présenterons une variante de la démarche usuelle.
Notons p la proportion de pièces défectueuses de la fabrication. Ce nombre p est une valeur certaine mais inconnue.
PREMIERE PARTIE
Afin de répondre à la question posée dans l’énoncé ci-dessus, mettons en œuvre un test relativement à cette proportion p.
•
Formulation des hypothèses du test :
H
1: "la machine n’est pas opérationnelle" (hypothèse déduite de la question posée), H
0 : "la machine est opérationnelle".c’est-à-dire H
1: p > 0,06 ; H
0 : p = 0,06 1.
•
Nature du test : D’après la formulation de H
1le test est unilatéral à droite.
18 Variable aléatoire d’échantillonnage :
Le test porte sur la proportion p de pièces défectueuses de la fabrication. La variable aléatoire d’échantillonnage utilisée ici est la variable aléatoire F qui, pour chaque échantillon aléatoire simple de taille 200, extrait de la fabrication, prend pour valeur la proportion de pièces de cet échantillon qui sont défectueuses.
F est une variable aléatoire discrète.
•
Variable de décision sous H
0:
Sous l’hypothèse H
0, la variable aléatoire nF est de loi binomiale B(n ; p
0) avec n = 200 et p
0= 0,06.
E(nF) = n p
0et V(nF) = n p
0(1 − p
0) , d’où E(F) = p
0et V(F) = p p n
0
( 1 −
0) c’est-à-dire : E(F) = 0,06 et V(F) = 0,000282.
n est assez grand pour admettre que la loi de probabilité de la variable aléatoire nF peut être approchée par une loi normale. Sous l’hypothèse H
0, cette loi est la loi normale N(n p
0;
n p
0( 1 − p
0) ). Il en résulte que la variable aléatoire U, définie par
000282 ,
0
06 , 0 )
1 ( )
1
(
0 00 0
0
0
−
− =
= −
−
= − F
n p p
p F p
np np
U nF , est
approximativement de loi normale centrée réduite N(0 ; 1). Choisissons U pour variable de décision.
•
Schéma de décision :
Il s’agit de représenter graphiquement le seuil de signification du test et la région de rejet de H
0et de déterminer la valeur critique pour U.
Seuil de signification : α = 0,05 P(U > 1,64) > 0,05
P(U > 1,65) < 0,05
La valeur critique pour U est donc
1,65. 0 1,65 U
⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯+⎯⎯⎯⎯
non rejet de H
0rejet de H
0•
Règle de décision :
Relativement à la variable aléatoire U, la région de rejet de l’hypothèse H
0au seuil de risque 0,05 est [1,65 ; +∞[.
α
•
Décision :
La proportion de pièces défectueuses dans l’échantillon prélevé est 0,085. Pour cette proportion, U prend la valeur 1,49. Cette valeur n’appartient pas à la région de rejet de H
0. Au seuil de risque 0,05, au vu des 200 observations, on ne rejette pas H
0.
Compte tenu de la taille de l’échantillon, la proportion observée n’est pas significativement supérieure à 0,06.
Au seuil de risque 0,05, au vu des 200 observations, on ne peut pas conclure que la machine n’est pas opérationnelle.
DEUXIEME PARTIE
Qu’en est-il si l’on n’effectue pas d’approximation de la loi de probabilité de la variable aléatoire nF ?
Reprenons en partie la démarche précédente.
•
Hypothèses du test : H
1: p > 0,06 ; H
0 : p = 0,06.•
Nature du test : unilatéral à droite.
•
Variable aléatoire d’échantillonnage :
La variable aléatoire d’échantillonnage est la variable aléatoire F définie dans la première partie.
•
Variable de décision sous H
0: Notons X la variable aléatoire nF.
Sous l’hypothèse H
0, la variable aléatoire X est de loi binomiale B(n ; p
0) avec n = 200 et p
0= 0,06.
→
Choisissons X pour variable de décision.
•
Valeur critique :
Le seuil de signification du test est α = 0,05. Le test est unilatéral à droite. Déterminons le plus petit nombre entier naturel k tel que P(X ≥ k) ≤ 0,05.
Ce nombre, que nous notons k
c, est donc le plus petit nombre entier naturel k tel que P(X < k)
≥ 0,95 c’est-à-dire tel que P(X ≤ k−1) ≥ 0,95.
* Usage du tableur Excel 5 pour déterminer k
c:
Méthode 1 : n 200
← L2C2p 0,06
← L3C2Détermination par k−1 P(X ≤ k−1)
balayage : 17 0,9429
18 0,9672
20
Méthode 2 : n 200
← L2C2p 0,06
← L3C21 − α 0,95
← L4C2Détermination directe : k−1 18
Formule : CRITERE.LOI.BINOMIALE(L2C2;L3C2;L4C2) On obtient donc k
c= 19. C’est la valeur critique pour la variable aléatoire X.
•
Règle de décision :
Relativement à la variable aléatoire X, la région de rejet de l’hypothèse H
0au seuil de risque 0,05 est [19 ; 200].
•
Décision :
L’échantillon prélevé contient 17 pièces défectueuses, valeur qui n’appartient pas à la région de rejet de H
0.
Au seuil de risque 0,05, au vu des 200 observations, on ne rejette pas H
0.
Compte tenu de la taille de l’échantillon, la proportion observée n’est pas significativement supérieure à 0,06.
Au seuil de risque 0,05, au vu des 200 observations, on ne peut pas conclure que la machine n’est pas opérationnelle.
Remarque :
Ce test est appelé test binomial. Il n’est pas explicitement au programme du module D11 de la filière B.T.S.A..
TROISIEME PARTIE
La variante apportée à la démarche usuelle, présentée dans la première partie, consiste à effectuer la correction de continuité lors de l’approximation (numérique) de la loi de probabilité de la variable aléatoire discrète nF par la loi normale N(n p
0; n p
0( 1 − p
0) ) avec n p
0= 12 et n p
0( 1 − p
0) = 11 28 , .
Notons X la variable aléatoire nF.
Soit Z une variable aléatoire de loi normale N(12 ; 11 28 , ). Il en résulte que la variable aléatoire U définie par U Z
= − 12
11 28 , est de loi normale centrée réduite.
•
Valeur critique pour X :
Dans la première partie, on a établi que la valeur critique pour U est 1,65.
Qu’en est-il pour la variable binomiale X ?
Le seuil de signification du test est α = 0,05. Le test est unilatéral à droite. Donc, la valeur critique k c pour la variable aléatoire X est le plus petit nombre entier naturel non nul k, tel que P(X ≥ k) ≤ 0,05.
En appliquant la correction de continuité lors de l’approximation de la loi de probabilité de X, on a P( X ≥ k ) ≈ P( Z > − k 0 5 , ) .
Donc la valeur critique k c est le plus petit nombre entier naturel non nul k tel que P( Z > − k 0 5 , ) ≤ 0 05 , c’est-à-dire tel que P( U k )
> − − 0 5 12 ≤
11 28 , 0 05
, , .
La fonction de répartition de U est strictement croissante, donc k c est le plus petit nombre entier naturel non nul k tel que k − −
0 5 12 >
11 28 , 1 65
, , soit k > 18,04.
D’où k c = 19. La valeur critique pour X est 19.
•
Règle de décision :
Relativement à la variable aléatoire X, la région de rejet de l’hypothèse H
0au seuil de risque 0,05 est [19 ; 200].
•
Décision :
Elle est identique à celle prise dans la deuxième partie.
Conclusion
Pour comparer ces trois démarches, on peut, par exemple, exprimer la région de rejet de l’hypothèse H
0relativement à la variable aléatoire binomiale nF :
Démarche Région de rejet de H
01) Approximation de la loi de nF sans correction de continuité.
2) Pas d’approximation de la loi de nF.
3) Approximation de la loi de nF avec correction de continuité.
[18 ; 200]
[19 ; 200]
[19 ; 200]
Par contre, si l’on choisit p
0= 0,05 alors p p n
0 ( 1 − 0 )
= 0,0154 à 10
−4près. Dans ce cas, la région de rejet de H
0est la même pour les trois démarches, à savoir [16 ; 200].
En poursuivant la simulation à l’aide d’un tableur, on observe que pour certaines valeurs de p
0, la région de rejet de H
0est la même pour les trois démarches et que pour d’autres valeurs de p
0, la région de rejet de H
0déterminée par la première démarche contient celle qui est déterminée par les deux autres démarches.
Alors, quelle attitude adopter face à nos étudiants dans le cadre d’un test de conformité d’une
22 Le test binomial, qui permet rigoureusement de déterminer la région de rejet de l’hypothèse H
0, n’est pas explicitement au programme du module D11. Toutefois, nous pensons qu’il peut être présenté aux étudiants lors d’une séance de travaux dirigés avec l’outil informatique (usage d’un tableur) ou la calculatrice (avec loi binomiale intégrée), d’autant plus que la démarche mise en œuvre ici est conforme à la méthodologie exposée dans les recommandations pédagogiques.
≈≈≈≈≈≈≈≈≈≈
LE COIN FORMATION
Théorème de FISHER : distribution de
²
² nS
σ dans le cas où la variable parente est normale.
I. Résultats préliminaires :
Soient
• X une variable aléatoire réelle,• (X1
, X
2, …,X
n) un échantillon aléatoire simple de X de taille n, X
net S
n2respectivement sa moyenne et sa variance empiriques.
SCE
n= ∑ ( )
= n
−
i
n
i
X
X
1
2
la somme des carrés des écarts à la moyenne empirique
• (X1
, X
2, …,X
n+1) l’échantillon aléatoire simple de X de taille n+1, X
n+1et
2 +1
S
nrespectivement sa moyenne et sa variance empiriques.
SCE
n+1= ∑
+( )
=1
−
+1
2 1 n
i
n
i
X
X la somme des carrés des écarts à la moyenne
1. Relation entre X
net X
n+1(n+1) X
n+1= ∑
+= 1
1 n
i
X
i=
11
= +
∑
n+
ni
i
X
X
d’où (n+1) X
n+1= n X
n+ X
n+12. Relation entre SCE
n+1et SCE
n.
D’après le théorème de KOENIG on a : SCE
n+1=
211
1
2
1
++
=
+
∑
n−
ni
i
( n ) X
X
SCE
n+1=
2
1
1 2
1 2
1 1 1
∑
= + +⎥⎦ ⎤
⎢⎣ ⎡ +
+ +
−
n
+
i
n n n
i
( n X X )
) n n ( X X
=
11
2 1 2
2
1 2 1
1 1
1
+= +
− +
− + + +
∑
n−
n ni
n n
i
X X
n X n
n ) ( n X
² X n
=
11
2 1 2
2
1 2 1
1 1
= +
− +
++ + +
−
− +
∑
n n ni
n n
i
X X
n X n
n X n n
n ) n ( X n
=
11
2 1 2
2 2
1 2 1
1
+= +
− +
+ + + +
∑
n−
n ni
n n
n
i
X X
n X n
n
X n
n
X n
n
X
D’après KOENIG : SCE
n=
21 2
n n
i
i
n X
X −
∑
=d’où
SCE
n+1= SCE
n+ (
1 2 1)
2
2
1 −
++
++ X
nX
nX
nX
nn
n
= SCE
n+ (
1)
21 −
++ X
nX
nn
n
= SCE
n+
2 1 2
1
1 ⎟
⎠
⎜ ⎞
⎝
⎛ + + + −
+
n+n
X
n
X ...
X X n
n
= SCE
n+ (
1 2 1)
21 1
−
++ +
+ X + X ... X
nnX
n)
n ( n
D’où SCE
n+1= SCE
n+
2 1 2
1
1 ⎟ ⎟
⎠
⎞
⎜ ⎜
⎝
⎛
+
− + +
+
+) n ( n
nX X
...
X
X
n n(1)
II. Distribution d’échantillonnage de
² nS
nσ
2
. Théorème de FISHER
Soit
• X une variable aléatoire réelle de loi normale N(μ , σ ),
• (X1
, X
2, …, X
n) l’échantillon aléatoire simple de X de taille n,
•
S
n2sa variance empirique d’échantillon.
² nS
nσ
2
est distribuée selon la loi du chi-deux à n-1 degrés de liberté
1. Relation entre
² nS
nσ
2
et ² S ) n
(
nσ + 1
2+1.
En divisant les deux membres de la relation (1) par σ ² et en remarquant que SCE
n+1= (n+1)
2 +1
S
net SCE
n= n S
n2on obtient :
² S ) n
(
nσ + 1
2+1= ² nS
nσ
2
+
2 1 2
1