Université Paris 1 Panthéon-Sorbonne, UFR02,
Licence de Sciences Economiques, STATISTIQUE, Cours de Mme Pradel
Corrigé Partiel 13 juin 2000
Exercice 1
Y1, ...,Y36~i.i.d.Nßm; 6.25à ì Y~N m; 6.2536
1. Pß|NÝ0.1Þ|²1.960à=0.95 ì P Y?1.962.56 ²m ²Y+1.962.56 = 0.95 PßY?0. 816 7² m² Y+0. 816 7à= 0.95
2. Pour Y=11.26, l’intervalle de confiance à 95% pour m est 10.443 ²m ² 12.077.
3. On suppose queYFred~Nßm; 6.25àindépendant des 36 notes déjà observées. La meilleure prévision ponctuelle de YFred seraitmsi on le connaissait, c’est doncY. L’erreur de prévisionYFred?Ya pour loiN 0; 6.25 1+ 361 . Pß|NÝ0.1Þ|²2.326à=0.98 ì P Y?2.326D2.5 1+ 361 ²YFred ²Y+2.326D2.5 1+ 361 = 0.98 PßY?5.895² YFred ²Y+5.8952à= 0.98
Numériquement, l’intervalle de prévision à 98% pourYFred est 5.365 ²YFred ²17.155.
Exercice 2
Comparaison de deux échantillons normaux indépendants :X1, ...,X16~i.i.d.Nßm1;a12à et X17, ...,Y36~i.i.d.Nßm2;a22à.
1. Comparaison des variances=Test deáa12 = a22âcontre áa12 ® a22â.(test bilatéral)
t
Refus deáa12 = a22â si S12S22 > A ou S22
S12 >B où S12et S22 sont les variances empiriques des deux échantillons.
t
Sous Ho, S12
S22~FISHERÝ15; 19Þ et S2
2
S12~FISHERÝ19; 15Þ. En mettant 5% de probabilité de chaque côté, on lit dans la table de FISHER à 5% les valeurs de A et B : PßFISHERÝ15; 19Þ >2.23à= 5% et PßFISHERÝ19; 15Þ > 2.34à.
t
On observe s22s12 = 12.0835.811 = 2.079 <2.34 , donc les observations sont en dehors de la région critique
t
Conclusion : au seuil de 10%, on ne peut refuser l’hypothèse d’égalité des variances des notes dans les deux sections.2. Comparaison des moyennes : on suppose ici que les variances sont égales. La meilleure prévision de la variance commune est alors :S2 = 15S15+1912+19S22 . On testeám1 =m2âcontreám1 <m2â(test unilatéral).
t
Refus de ám1 =m2âsi Z= X2?X1S2Ý1/16+1/20Þ > A.
t
Sous Ho,Z~STUDENTÝ34Þ. La table de Student nous fournit (colonne 0.20) PßSTUDENTÝKÞ> 1.281à= 10% ., et doncA=1.28.Remarque : l’énoncé autorise l’utilisation de la loi Normale (student(K)), et le calcul exact, non disponible sur la table fournie, aurait donné A=1.307. On voit en fait que A=1.3 serait tout à fait exact.
t
On observes2 = 15D5.811+1934 D12.083 = 9.316 et z= 11.247?9.222s2Ý36/320Þ = 1.98
t
Conclusion : au seuil de 10%, on décide que les notes dans la section S2 ont une espérance mathématique supérieure à celle des notes dans la section S1.Exercice 3
1. Le modèle est linéaire, carEÝYiÞ = a1x1i+b1e1i+a2x2i+b2e2i est combinaison linéaire deÝa1,b1,a2,b2Þ, en posant de façon usuellee1i = 1 si i 5S1 et 0 sinon,e2i = 1 si i5S2 et 0 sinon,x1i =xie1i et x2i = xie2i.
Pour que le modèle soit de plus standard, il faut de plus quea12 =a22 , car l’absence d’autocorrélations est déjà acquise (les individus sont indépendants).
2. Comparaison de variances : on testeáa12 =a22âcontre áa12 ®a22â.
t
Refus deáa12 = a22â si S12
S22 > A ou S2
2
S12 >B oùS12 = SCR114 et S22 = SCR218 sont les variances résiduelles des deux régressions.
p. 1
Statistique : Eléments de réponses partiel juin 2000, p. 2
t
Sous Ho, S12
S22~FISHERÝ14; 18Þ et S2
2
S12~FISHERÝ18; 14Þ. En mettant 5% de probabilité de chaque côté, on lit dans la table de FISHER à 5% les valeurs de A et B : PßFISHERÝ14; 18Þ >2.29à= 5% et PßFISHERÝ18; 14Þ > 2.41à.
t
On observe s12 = 0.439414 = 0.0314 et s22 = 0.700818 = 0.0389s22
s12 = 0.7008/180.4394/14 = 1.24<2.41 , donc les observations sont en dehors de la région critique
t
Conclusion : au seuil de 10%, on peut accepter l’hypothèse d’égalité des variances des perturbations dans les deux sections.3. modèle contraint :
a. égalité des paramètres entre les deux sections :áa1 = a2,b1 = b2â.
b. Test de sous hypothèse linéaire=test simultané des deux contraintes. La SCR non contrainte est la somme des SCR des deux régressions partielles :SCR1+SCR2 avec 14+18 = 32 degrés de liberté, la régression sous contrainte étant celle effectuée sur toutes les données, donnant SCR.
t
refus de Ho siF= ÝSCRÝSCR1+SCR2Þ/32?SCR1?SCR2Þ/2 >A.t
Sous Ho,F~FISHERÝ2; 32Þ. On lit dans la table de FISHER à 5% la valeur de A : PßFISHERÝ2; 32Þ >3.30à= 5%t
On observeF= Ý1.1707?0.4394?0.7008Þ/2Ý0.4394+0.7008Þ/32 = 0.428< 3.3
t
Conclusion : au seuil de 5%, les observations ne permettent pas de déceler un changement des paramètres entre les deux sections.4. Régression (II) y = 0.788x+3.105e+åu, a. les variances covariances du couple åa,å
b sont données para2ÝXvXÞ?1, où X= x e : VarÝåaÞ =0.331a2 , Var å
b =0.00283a2,Cov åa,å
b = ?0.0293a2 On acceptera également la versionVarÝåaÞ = 0.00283a2 , Var å
b = 0.331a2,Cov åa,å
b = ?0.0293a2 qui correspond à l’interprétation X= e x , puisque les résultats numériques sont données en mettant la constante d’abord.
b. a2 = 36SCR?2 = 1.170734 = 0.0344
c. On en déduit : VarÝåaÞ =0.011397 , Var å
b = 9.74D10?5,Cov åa,å
b = ?0.00101 Variante acceptée : Var å
b = 0.011397 , VarÝåaÞ= 9.74D10?5,Cov åa,å
b = ?0.00101 5. Test deáa= 0â contreáa ®0â: test de student bilatéral.
t
refus de Ho si åaaa >A, oùaa = VarÝåaÞ.
t
Sous Ho, åaaa~STUDENTÝ34Þ. On choisit de faire un test de seuil 5%. On lit dans la table de Student (colonne 0.05) :PßSTUDENTÝ34Þ >2.0à= 5% .
t
On observe åaaa = 3.105
0.0114 = 29.1> 2... Variante acceptée : åa
aa = 3.105
0.0000974 = 314.6> 2.
t
Conclusion : au seuil de 5%, la note moyenne annuelle explique les variations de la note du bac.6. Prévision deYFred: la meilleure prévision sachant quexFred = 11 estå
Y =11åa+å
b, indépendante deYFred. L’erreur de prévisionYFred?å
Y ~Nß0,Và où V= a2+Ý11Þ2VarÝåaÞ+2D11Cov åa,å
b +Var å
b = a2Ý1+40.409Þest estimée par 41.409a2. Variante acceptée :
Ý11Þ2VarÝåaÞ+2D11Cov åa,å
b +Var å
b = a2Ý121D0.00283?11D0.0293+0.331Þ = 0.3511a2
YFred?å Y a241.41
~STUDENTÝ34Þ et Pß|STUDENTÝ34Þ|< 2.33à=98%
L’intervalle de prévision à 98% pourYFred est donc : P 11åa+å
b?2.33D a241.41 ²YFred ²11åa+å
b+2.33D a241.41 = 0.98 Sa réalisation est ici : 8.991 ²YFred ²14.555
Variante acceptée : 11.517 ²YFred ²12.029
Exercice 4
1. Test deáV= 1âcontreáV =2â, avecX1, ...,X4~i.i.d.POISSONÝVÞ
a. Le test le plus puissant parmi ceux de seuil 10% exactement est celui de région critique
>
i=1 4
Xi > A, car 2 >1 , où A est déterminé par :P
>
i=1 4
Xi >APV =1 = 0.10
Université Paris 1, Licence Sciences Economiques
Statistique : Eléments de réponses partiel juin 2000, p. 3
Or sous Ho,
>
i=1 4
Xi~POISSONÝ4Þ. Il n’existe pas de réel A qui corresponde exactement au seuil de 10% : on passe directement de 0.1106 à 0.0511, puisque la variable de Poisson prend des valeurs entières.
b. Le test le plus puissant sera celui de seuil maximal, parmi ceux de seuil inférieur à 10% On prendra donc la règle de refuseráV= 1âsi
>
i=1 4
Xi ³8 . c. Le seuil exact de ce test estP
>
i=1 4
Xi ³8 PV= 1 = 0.0511 d. La puissance de ce test estP
>
i=1 4
Xi ³8 PV= 2 = 0.5471, lu dans loi de Poisson de paramètre 2*4=8.
2. Le test ainsi défini ne dépend pas de la valeur deVdans l’alternative, tant que cette valeur reste supérieure à 1 : il est donc uniformément le plus puissant pouráV =1â contre áV> 1â.
3. On regarde dans la table entre les colonnesV= 4 et V= 8 :
PßZ³ 7P V= 1à =0.1106 PßZ³7 PV= 2à= 0.6867<1?0.1106= 0.8894 PßZ³ 6P V= 1à =0.2148 PßZ³7 PV= 2à= 0.8088>1?0.2148= 0.7852 Il faut donc prendreJ= 21.5% pour que la puissance enV= 2 soit supérieure à 1?J.
Université Paris 1, Licence Sciences Economiques