TP 5
Modèle linéaire multiple
Les données sont toujours en ligne à l’adresse suivante:
http://wintenberger.fr/ens.html
1 Efficacité de la police et taux de criminalité
Les données fournies donnent pourn= 9villesile taux de criminalitéci, le taux de chômageuiet la couverture policièrepi(données simulées). Un criminologue propose le modèle suivant:
ci =a0+a1ui+a2pi+εi. (1) 1.1 Estimer les paramètresa0,a1et a2grâce au logiciel R.
1.2 Tester la nullité des coefficientsa1et a2.
1.3 Commenter les valeurs des coefficientsR2 etR2.
1.4 Un autre criminologue nie l’impact du taux de chômage sur la criminalité et propose le modèle suivant:
ci=b0+b1pi+ε′i. (2) Estimer les coefficients de ce nouveau modèle.
1.6 Comparer l’impact estimé de la présence policière dans le modèle1et dans le modèle2. Proposer une explication. Discuter de la pertinence de chacun des deux modèles.
1.7 Le coefficientR2permet-il un choix entre les deux modèles? Le coefficient R2?
2 Le théorème de Frisch-Waugh (cas particulier)
On observe sur8 individus trois variablesy,xetz liées par le modèle suivant:
yi=a0+a1xi+a2zi+εi.
1
2.1 Estimer les coefficients du modèle.
2.2 Estimer les coefficients des deux modèle suivant:
yi=b0+b2zi+ε′i, yi=b1xi+ε′′i.
2.3 Comparerˆa0 avecˆb0,aˆ1 avecˆb1,ˆa2 avecˆb2.
2.4 Calculer la covariance dexet z, oucov(x, z), et la moyenne dex, oux.
Remarque: Ceci illustre un théorème du à Frisch et Waugh dont une partie du résultat est donnée ici. Si on estime le modèle (sous forme matricielle) Y =XA+ε, si les colonnesX0, ..., Xk de la matriceX se décomposent en deux groupes orthogonaux (non corrélés) l’un à l’autre, alors on obtient les mêmes coefficients en régressant séparémentY sur chacun de ces deux groupes, ou sur la matriceX complète.
2.5 Tester les hypothèsesa0= 0,a1= 0eta2= 0. Quel modèle serait le plus adapté aux données? En estimer les paramètres.
2