• Aucun résultat trouvé

« Analyse de rég ression appliquée », Deuxième édition, de Y. Dodge et V. Rousson, 2004, Dunod.

N/A
N/A
Protected

Academic year: 2022

Partager "« Analyse de rég ression appliquée », Deuxième édition, de Y. Dodge et V. Rousson, 2004, Dunod."

Copied!
20
0
0

Texte intégral

(1)

Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Compléments sur la rég ression linéaire simple Ano va et inférence sur les par amètres Myr iam Maum y-Ber trand et Mar ie Chion 1

1

IRMA, Univ ersité de Str asbourg Fr ance Master 1 2019-2020

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple

Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Ce chapitre s’appuie essentiellement sur deux livres :

1

« Analyse de rég ression appliquée », Deuxième édition, de Y. Dodge et V. Rousson, 2004, Dunod.

2

« Rég ression non linéaire et applications », de A. Antoniadis ,J .Berr uy er ,R. Car mona, 1999, Economica.

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Sommaire 1 Test et analyse de var iance de la rég ression 2 Distr ib ution des par amètres Modèle de rég ression linéaire simple Distr ib ution de la pente du modèle Distr ib ution de l’ordonnée à l’or igine 3 Tests et inter valles de confiance sur les par amètres Test sur la pente Inter valle de confiance pour la pente Test sur l’ordonnée à l’or igine Inter valle de confiance pour l’ordonnée à l’or igine 4 Distr ib ution et inter valle de confiance pour une valeur mo yenne ou une prévision 5 Ex emple

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Sommaire 1 Test et analyse de var iance de la rég ression 2 Distr ib ution des par amètres Modèle de rég ression linéaire simple Distr ib ution de la pente du modèle Distr ib ution de l’ordonnée à l’or igine 3 Tests et inter valles de confiance sur les par amètres Test sur la pente Inter valle de confiance pour la pente Test sur l’ordonnée à l’or igine Inter valle de confiance pour l’ordonnée à l’or igine 4 Distr ib ution et inter valle de confiance pour une valeur mo yenne ou une prévision 5 Ex emple

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple

(2)

Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Il existe plusieurs démarches pour tester la validité de la linéar ité d’une rég ression linéaire simple . Nous montrons l’équiv alence de ces différents tests . Conséquence :Cela re vient à faire le test du coefficient de corrélation linéaire ,appelé aussi le coefficient de Br av ais-P earson.

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple

Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Prob lème Nous souhaitons tester l’h ypothèse nulle : H 0 : ρ ( X , Y ) = 0 contre l’h ypothèse alter nativ e : H 1 : ρ ( X , Y ) 6 = 0 où ρ ( X , Y ) = Co v ( X , Y ) p Var [ X ] Var [ Y ] , av ec Co v ( X , Y ) = E [ XY ] − E [ X ] E [ Y ] = Co v ( Y , X ) .

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Solution La méthode que nous emplo yerons ici est : la méthode de l’ANO VA utilisée par les logiciels de statistique . Remarque ANO VA pour ANalysis Of VAr iance ou encore analyse de la var iance .

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Remarque Nous av ons étab li dans le cours précédent : Somme des Carrés Totale = Somme des Carrés Expliquée + Somme des Carrés Résiduelle ce qui s’écr it mathématiquement par : n X i = 1 ( Y i − Y n ) 2 = n X i = 1 ( b Y i − Y n ) 2 + n X i = 1 ( Y i − b Y i ) 2 . À chaque somme de carrés est associé son nombre de deg rés de liber té ( ddl ). Ces ddl sont présents dans le tab leau de l’ANO VA.

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple

(3)

Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Tab leau de l’ANO VA Source de var iation sc ddl cm expliquée sc reg

n X i = 1 (ˆ y i − y n ) 2 1 sc reg / 1 résiduelle sc res

n X i = 1 ( y i − ˆ y i ) 2 n − 2 sc res / ( n − 2 ) totale sc tot

n X i = 1 ( y i − y n ) 2 n − 1

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple

Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Remarques

1

Le coefficient de détermination R 2 = sc reg sc tot mesure le pourcentage d’e xplication du modèle par la rég ression linéaire .

2

Le rappor t cm res = sc res n − 2 est l’ estimation de la variance résiduelle .

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

À par tir du tab leau de l’ANO VA, nous eff ectuons le test de la linéarité de la régression en calculant la statistique de Fisher F qui suit une loi de Fisher F ( 1 , n − 2 ) . Cette var iab le aléatoire F se réalise en : F obs = SC reg / 1 SC res / ( n − 2 ) = ( n − 2 ) SC reg SC res ·

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Décision Si F obs > F 1 − α ( 1 , n − 2 ) , alors nous décidons de rejeter l’h ypothèse nulle H 0 et par conséquent d’accepter l’h ypothèse alter nativ e H 1 au risque α , c’est-à-dire qu’il existe une liaison linéaire significativ e entre X et Y . Si F obs < F 1 − α ( 1 , n − 2 ) , alors nous décidons de ne pas rejeter l’h ypothèse nulle H 0 et par conséquent de l’accepter ,c’est-à-dire nous concluons qu’il n’e xiste pas de liaison linéaire entre X et Y .

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple

(4)

Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Remarque En eff et, si l’h ypothèse nulle H 0 est vér ifiée alors cela implique que ρ ( X , Y ) = 0 c’est-à-dire Co v ( X , Y ) = 0. Donc il n’e xiste aucune liaison linéaire entre X et Y .

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Modèlederégressionlinéairesimple Distributiondelapentedumodèle Distributiondel’ordonnéeàl’origine

Sommaire 1 Test et analyse de var iance de la rég ression 2 Distr ib ution des par amètres Modèle de rég ression linéaire simple Distr ib ution de la pente du modèle Distr ib ution de l’ordonnée à l’or igine 3 Tests et inter valles de confiance sur les par amètres Test sur la pente Inter valle de confiance pour la pente Test sur l’ordonnée à l’or igine Inter valle de confiance pour l’ordonnée à l’or igine 4 Distr ib ution et inter valle de confiance pour une valeur mo yenne ou une prévision 5 Ex emple

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Modèlederégressionlinéairesimple Distributiondelapentedumodèle Distributiondel’ordonnéeàl’origine

Sommaire 1 Test et analyse de var iance de la rég ression 2 Distr ib ution des par amètres Modèle de rég ression linéaire simple Distr ib ution de la pente du modèle Distr ib ution de l’ordonnée à l’or igine 3 Tests et inter valles de confiance sur les par amètres Test sur la pente Inter valle de confiance pour la pente Test sur l’ordonnée à l’or igine Inter valle de confiance pour l’ordonnée à l’or igine 4 Distr ib ution et inter valle de confiance pour une valeur mo yenne ou une prévision 5 Ex emple

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Modèlederégressionlinéairesimple Distributiondelapentedumodèle Distributiondel’ordonnéeàl’origine

Modélisation Le modèle de rég ression linéaire simple est Y i = β 0 + β 1 x i + ε i où les ε i sont des var iab les aléatoires inobser vab les ,appelées les erreur s . Conséquence : Les var iab les Y i sont aléatoires . Première hypothèse : E [ ε i ] = 0. Conséquence : E [ Y i ] = β 0 + β 1 x i . D’autre par t, nous av ons : Var [ Y i ] = Var [ ε i ] .

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple

(5)

Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Modèlederégressionlinéairesimple Distributiondelapentedumodèle Distributiondel’ordonnéeàl’origine

Les trois hypothèses indispensab les pour constr uire la théor ie :

1

Les var iab les aléatoires ε i sont indépendantes .

2

Les var iab les aléatoires ε i sont nor malement distr ib uées .

3

La var iance des var iab les aléatoires ε i est égale à σ 2 (inconn ue) ne dépendant pas de x i . Nous av ons donc pour tout i = 1 ,. .. , n : Var [ ε i ] = Var [ Y i ] = σ 2 .

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Modèlederégressionlinéairesimple Distributiondelapentedumodèle Distributiondel’ordonnéeàl’origine

Résumons-nous Ces trois hypothèses sont équiv alentes à : les variab les aléatoires ε i sont indépendantes et identiquement distrib uées selon une loi normale de mo yenne nulle et de variance σ 2 . Nous notons : ε i i.i.d. ∼ N ( 0 ; σ 2 ) .

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Modèlederégressionlinéairesimple Distributiondelapentedumodèle Distributiondel’ordonnéeàl’origine

Conséquences impor tantes :

1

La nor malité des var iab les aléatoires ε i implique la nor malité des var iab les aléatoires Y i .

2

L’indépendance des var iab les aléatoires ε i implique l’indépendance des var iab les aléatoires Y i . En eff et, nous montrons en calculant que : Co v [ Y i , Y j ] = Co v [ β 0 + β 1 x i + ε i ,β 0 + β 1 x j + ε j ] = Co v [ ε i ,ε j ] = 0 .

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Modèlederégressionlinéairesimple Distributiondelapentedumodèle Distributiondel’ordonnéeàl’origine

Sommaire 1 Test et analyse de var iance de la rég ression 2 Distr ib ution des par amètres Modèle de rég ression linéaire simple Distr ib ution de la pente du modèle Distr ib ution de l’ordonnée à l’or igine 3 Tests et inter valles de confiance sur les par amètres Test sur la pente Inter valle de confiance pour la pente Test sur l’ordonnée à l’or igine Inter valle de confiance pour l’ordonnée à l’or igine 4 Distr ib ution et inter valle de confiance pour une valeur mo yenne ou une prévision 5 Ex emple

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple

(6)

Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Modèlederégressionlinéairesimple Distributiondelapentedumodèle Distributiondel’ordonnéeàl’origine

Nous av ons : b β 1 = P ( x i − x n ) Y i P ( x i − x n ) 2 , où x n = P x i n · Il en résulte que : b β 1 est une variab le aléatoire car b β 1 dépend des var iab les Y i qui sont des var iab les aléatoires . b β 1 est une fonction linéaire des variab les aléatoires Y i . Comme les var iab les aléatoires Y i par hypothèse sont nor malement distr ib uées ,alors b β 1 est normalement distrib uée .

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Modèlederégressionlinéairesimple Distributiondelapentedumodèle Distributiondel’ordonnéeàl’origine

Il reste donc à calculer ces deux valeurs pour car actér iser l’estimateur b β 1 :

1

E h b β 1 i

2

Var h b β 1 i .

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Modèlederégressionlinéairesimple Distributiondelapentedumodèle Distributiondel’ordonnéeàl’origine

P ar calcul, nous montrons que : E h b β 1 i = E P ( x i − x n ) Y i P ( x i − x n ) 2 = P ( x i − x n ) E [ Y i ] P ( x i − x n ) 2 = P ( x i − x n )( β 0 + β 1 x i ) P ( x i − x n ) 2 = β 0 P ( x i − x n ) + β 1 P ( x i − x n ) x i P ( x i − x n ) 2 = 0 + β 1 P ( x i − x n ) x i P ( x i − x n ) 2 ·

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Modèlederégressionlinéairesimple Distributiondelapentedumodèle Distributiondel’ordonnéeàl’origine

En eff et, nous montrons que : X ( x i − x n ) = 0 . De plus ,comme nous av ons : X ( x i − x n ) 2 = X ( x i − x n ) x i alors nous obtenons : E h b β 1 i = β 1 . Donc la var iab le aléatoire b β 1 est un estimateur sans biais du coefficient β 1 .

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple

(7)

Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Modèlederégressionlinéairesimple Distributiondelapentedumodèle Distributiondel’ordonnéeàl’origine

D’autre par t, nous calculons la var iance de b β 1 ainsi : Var h b β 1 i = Var P ( x i − x n ) Y i P ( x i − x n ) 2 = P ( x i − x n ) 2 Var [ Y i ] P ( x i − x n ) 2 2 = P ( x i − x n ) 2 σ 2 P ( x i − x n ) 2 2 = σ 2 P ( x i − x n ) 2 , ce qui achèv e la car actér isation de b β 1 .

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Modèlederégressionlinéairesimple Distributiondelapentedumodèle Distributiondel’ordonnéeàl’origine

Sommaire 1 Test et analyse de var iance de la rég ression 2 Distr ib ution des par amètres Modèle de rég ression linéaire simple Distr ib ution de la pente du modèle Distr ib ution de l’ordonnée à l’or igine 3 Tests et inter valles de confiance sur les par amètres Test sur la pente Inter valle de confiance pour la pente Test sur l’ordonnée à l’or igine Inter valle de confiance pour l’ordonnée à l’or igine 4 Distr ib ution et inter valle de confiance pour une valeur mo yenne ou une prévision 5 Ex emple

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Modèlederégressionlinéairesimple Distributiondelapentedumodèle Distributiondel’ordonnéeàl’origine

Nous av ons : b β 0 = Y n − b β 1 x n où x n = P x i n et Y n = P Y i n · b β 0 est une variab le aléatoire car b β 0 dépend de b β 1 qui est une var iab le aléatoire . b β 0 est une fonction linéaire de b β 1 . Comme b β 1 est nor malement distr ib uée ,alors b β 0 est normalement distrib uée .

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Modèlederégressionlinéairesimple Distributiondelapentedumodèle Distributiondel’ordonnéeàl’origine

Il reste donc à calculer ces deux valeurs pour car actér iser l’estimateur b β 0 :

1

E h b β 0 i

2

Var h b β 0 i .

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple

(8)

Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Modèlederégressionlinéairesimple Distributiondelapentedumodèle Distributiondel’ordonnéeàl’origine

P ar calcul, nous montrons que : E h b β 0 i = E h Y n − b β 1 x n i = E Y n − x n E h b β 1 i = E Y n − x n β 1 , car nous venons de démontrer que b β 1 est un estimateur sans biais du coefficient β 1 . Il reste à calculer la valeur : E Y n .

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Modèlederégressionlinéairesimple Distributiondelapentedumodèle Distributiondel’ordonnéeàl’origine

Or nous av ons : E Y n = E P Y i n

= P E [ Y i ] n = P ( β 0 + β 1 x i ) n = n β 0 + β 1 P x i n = β 0 + x n β 1 .

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Modèlederégressionlinéairesimple Distributiondelapentedumodèle Distributiondel’ordonnéeàl’origine

Nous obtenons donc : E h b β 0 i = E Y n − x n β 1 = ( β 0 + x n β 1 ) − x n β 1 = β 0 . Donc la var iab le aléatoire b β 0 est un estimateur sans biais du coefficient β 0 .

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Modèlederégressionlinéairesimple Distributiondelapentedumodèle Distributiondel’ordonnéeàl’origine

D’autre par t, nous calculons la var iance de b β 0 ainsi : Var h b β 0 i = Var h Y n − b β 1 x n i = Var Y n + x 2 n Var h b β 1 i − 2 x n Co v h Y n , b β 1 i . Il reste donc à calculer la valeur : Co v h Y n , b β 1 i .

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple

(9)

Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Modèlederégressionlinéairesimple Distributiondelapentedumodèle Distributiondel’ordonnéeàl’origine

P ar les calculs ,nous montrons que : Co v h Y n , b β 1 i = Co v P Y i n , P ( x j − x n ) Y j P ( x i − x n ) 2 = P i P j ( x j − x n ) Co v [ Y i , Y j ] n P ( x i − x n ) 2 = P i ( x i − x n ) Var [ Y i ] n P ( x i − x n ) 2 = σ 2 P i ( x i − x n ) n P ( x i − x n ) 2 = 0 .

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Modèlederégressionlinéairesimple Distributiondelapentedumodèle Distributiondel’ordonnéeàl’origine

Comme nous av ons que Var Y n = σ 2 n , nous obtenons ,alors : Var h b β 0 i = Var Y n + x 2 n Var h b β 1 i = σ 2 n + x 2 n σ 2 P ( x i − x n ) 2 = σ 2 P ( x i − x n ) 2 + nx 2 n n P ( x i − x n ) 2 ·

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Modèlederégressionlinéairesimple Distributiondelapentedumodèle Distributiondel’ordonnéeàl’origine

En rappelant que : X ( x i − x n ) 2 = X x 2 i − nx 2 n , nous av ons finalement : Var h b β 0 i = σ 2 P x 2 i n P ( x i − x n ) 2 ·

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple

Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Testsurlapente Intervalledeconfiancepourlapente Testsurl’ordonnéeàl’origine Intervalledeconfiancepourl’ordonnéeàl’origine

Sommaire 1 Test et analyse de var iance de la rég ression 2 Distr ib ution des par amètres Modèle de rég ression linéaire simple Distr ib ution de la pente du modèle Distr ib ution de l’ordonnée à l’or igine 3 Tests et inter valles de confiance sur les par amètres Test sur la pente Inter valle de confiance pour la pente Test sur l’ordonnée à l’or igine Inter valle de confiance pour l’ordonnée à l’or igine 4 Distr ib ution et inter valle de confiance pour une valeur mo yenne ou une prévision 5 Ex emple

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple

(10)

Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Testsurlapente Intervalledeconfiancepourlapente Testsurl’ordonnéeàl’origine Intervalledeconfiancepourl’ordonnéeàl’origine

Sommaire 1 Test et analyse de var iance de la rég ression 2 Distr ib ution des par amètres Modèle de rég ression linéaire simple Distr ib ution de la pente du modèle Distr ib ution de l’ordonnée à l’or igine 3 Tests et inter valles de confiance sur les par amètres Test sur la pente Inter valle de confiance pour la pente Test sur l’ordonnée à l’or igine Inter valle de confiance pour l’ordonnée à l’or igine 4 Distr ib ution et inter valle de confiance pour une valeur mo yenne ou une prévision 5 Ex emple

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Testsurlapente Intervalledeconfiancepourlapente Testsurl’ordonnéeàl’origine Intervalledeconfiancepourl’ordonnéeàl’origine

Nous rappelons que : b β 1 ∼ N ( β 1 ; σ 2 ( b β 1 )) où σ 2 ( b β 1 ) = σ 2 P ( x i − x n ) 2 · Nous obtenons alors : b β 1 − β 1 σ ( b β 1 ) ∼ N ( 0 ; 1 ) .

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Testsurlapente Intervalledeconfiancepourlapente Testsurl’ordonnéeàl’origine Intervalledeconfiancepourl’ordonnéeàl’origine

Prob lème Nous ne connaissons pas le par amètre σ 2 ,c’est-à-dire la var iance des var iab les aléatoires ε i . Que pouv ons-nous faire alors pour résoudre ce prob lème ? Solution Estimer ce par amètre !

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Testsurlapente Intervalledeconfiancepourlapente Testsurl’ordonnéeàl’origine Intervalledeconfiancepourl’ordonnéeàl’origine

Nous estimons d’abord σ 2 par CM res l’estimateur sans biais de σ 2 : CM res = || ε || 2 n − 2 = P ( Y i − b Y i ) 2 n − 2 · Nous estimons ensuite σ 2 ( b β 1 ) par : s 2 ( b β 1 ) = CM res P ( x i − x n ) 2 · Nous montrons alors que : b β 1 − β 1 / s ( b β 1 ) ∼ T n − 2 , où T n − 2 désigne une v.a. de Student av ec ( n − 2 ) ddl .

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple

(11)

Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Testsurlapente Intervalledeconfiancepourlapente Testsurl’ordonnéeàl’origine Intervalledeconfiancepourl’ordonnéeàl’origine

Nous souhaitons tester l’h ypothèse nulle : H 0 : β 1 = 0 contre l’h ypothèse alter nativ e : H 1 : β 1 6 = 0 . Nous utilisons alors la statistique de Student suiv ante : t obs = b β 1 s ( b β 1 ) pour décider de l’acceptation ou du rejet de H 0 .

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Testsurlapente Intervalledeconfiancepourlapente Testsurl’ordonnéeàl’origine Intervalledeconfiancepourl’ordonnéeàl’origine

Décision Nous décidons de rejeter l’h ypothèse nulle H 0 et donc d’accepter l’h ypothèse alter nativ e H 1 au seuil de signification α si | t obs | > t n − 2 ; 1 − α/ 2 où la valeur cr itique t n − 2 ; 1 − α/ 2 est le ( 1 − α / 2 ) -quantile d’une loi de Student av ec ( n − 2 ) ddl . Dans ce cas ,nous disons que la relation linéaire entre X et Y est significativ e au seuil α .

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Testsurlapente Intervalledeconfiancepourlapente Testsurl’ordonnéeàl’origine Intervalledeconfiancepourl’ordonnéeàl’origine

Décision -Suite et fin Nous décidons d’accepter l’h ypothèse nulle H 0 au seuil de signification α si | t obs | < t n − 2 ; 1 − α/ 2 où la valeur t n − 2 ; 1 − α/ 2 est le ( 1 − α / 2 ) -quantile d’une loi de Student av ec ( n − 2 ) ddl . Dans ce cas , Y ne dépend pas linéairement de X .Le modèle de vient alors : Y i = β 0 + ε i Le modèle proposé b Y i = b β 0 + b β 1 x i est inadéquat. Nous testons alors un nouv eau modèle .

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Testsurlapente Intervalledeconfiancepourlapente Testsurl’ordonnéeàl’origine Intervalledeconfiancepourl’ordonnéeàl’origine

Sommaire 1 Test et analyse de var iance de la rég ression 2 Distr ib ution des par amètres Modèle de rég ression linéaire simple Distr ib ution de la pente du modèle Distr ib ution de l’ordonnée à l’or igine 3 Tests et inter valles de confiance sur les par amètres Test sur la pente Inter valle de confiance pour la pente Test sur l’ordonnée à l’or igine Inter valle de confiance pour l’ordonnée à l’or igine 4 Distr ib ution et inter valle de confiance pour une valeur mo yenne ou une prévision 5 Ex emple

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple

(12)

Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Testsurlapente Intervalledeconfiancepourlapente Testsurl’ordonnéeàl’origine Intervalledeconfiancepourl’ordonnéeàl’origine

IC pour β 1 Un inter valle de confiance au niv eau ( 1 − α ) pour le coefficient inconn u β 1 est défini par i b β 1 − t n − 2 ; 1 − α/ 2 × s ( b β 1 ) ; b β 1 + t n − 2 ; 1 − α/ 2 × s ( b β 1 ) h . Cet inter valle de confiance est constr uit pour que , ( 1 − α ) % de ses réalisations contiennent la vr aie valeur inconn ue du coefficient β 1 .

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Testsurlapente Intervalledeconfiancepourlapente Testsurl’ordonnéeàl’origine Intervalledeconfiancepourl’ordonnéeàl’origine

Sommaire 1 Test et analyse de var iance de la rég ression 2 Distr ib ution des par amètres Modèle de rég ression linéaire simple Distr ib ution de la pente du modèle Distr ib ution de l’ordonnée à l’or igine 3 Tests et inter valles de confiance sur les par amètres Test sur la pente Inter valle de confiance pour la pente Test sur l’ordonnée à l’or igine Inter valle de confiance pour l’ordonnée à l’or igine 4 Distr ib ution et inter valle de confiance pour une valeur mo yenne ou une prévision 5 Ex emple

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Testsurlapente Intervalledeconfiancepourlapente Testsurl’ordonnéeàl’origine Intervalledeconfiancepourl’ordonnéeàl’origine

Nous rappelons que : b β 0 ∼ N ( β 0 ; σ 2 ( b β 0 )) où σ 2 ( b β 0 ) = σ 2 P x 2 i n P ( x i − x n ) 2 · Nous obtenons alors : b β 0 − β 0 σ ( b β 0 ) ∼ N ( 0 ; 1 ) .

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Testsurlapente Intervalledeconfiancepourlapente Testsurl’ordonnéeàl’origine Intervalledeconfiancepourl’ordonnéeàl’origine

Prob lème Nous ne connaissons pas le par amètre σ 2 ,c’est-à-dire la var iance des var iab les aléatoires ε i . Que pouv ons-nous faire alors pour résoudre ce prob lème ? Solution Estimer ce par amètre !

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple

(13)

Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Testsurlapente Intervalledeconfiancepourlapente Testsurl’ordonnéeàl’origine Intervalledeconfiancepourl’ordonnéeàl’origine

Nous estimons d’abord σ 2 par CM res l’estimateur sans biais de σ 2 : CM res = || ε || 2 n − 2 = P ( Y i − b Y i ) 2 n − 2 · Nous estimons ensuite σ 2 ( b β 0 ) par : s 2 ( b β 0 ) = CM res P x 2 i n P ( x i − x n ) 2 · Nous montrons alors que : b β 0 − β 0 / s ( b β 0 ) ∼ T n − 2 où T n − 2 désigne une v.a. de Student av ec ( n − 2 ) ddl .

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Testsurlapente Intervalledeconfiancepourlapente Testsurl’ordonnéeàl’origine Intervalledeconfiancepourl’ordonnéeàl’origine

Nous souhaitons tester l’h ypothèse nulle H 0 : β 0 = 0 contre l’h ypothèse alter nativ e H 1 : β 0 6 = 0 . Nous utilisons la statistique de Student suiv ante : t obs = b β 0 s ( b β 0 ) pour décider de l’acceptation ou du rejet de l’h ypothèse nulle H 0 .

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Testsurlapente Intervalledeconfiancepourlapente Testsurl’ordonnéeàl’origine Intervalledeconfiancepourl’ordonnéeàl’origine

Décision Nous décidons de refuser l’h ypothèse nulle H 0 et d’accepter l’h ypothèse alter nativ e H 1 au seuil de signification α si : | t obs | > t n − 2 ; 1 − α/ 2 où la valeur cr itique t n − 2 ; 1 − α/ 2 est le ( 1 − α / 2 ) -quantile d’une loi de Student av ec ( n − 2 ) ddl. Dans ce cas ,le coefficient β 0 du modèle est dit significatif au seuil α .

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Testsurlapente Intervalledeconfiancepourlapente Testsurl’ordonnéeàl’origine Intervalledeconfiancepourl’ordonnéeàl’origine

Décision -Suite et fin Nous décidons de ne pas refuser et donc d’accepter l’h ypothèse nulle H 0 au seuil de signification α si | t obs | < t n − 2 ; 1 − α/ 2 où la valeur cr itique t n − 2 ; 1 − α/ 2 est le ( 1 − α / 2 ) -quantile d’une loi de Student av ec ( n − 2 ) ddl . Dans ce cas ,l’ordonnée de la droite de rég ression passe par l’or igine : Y i = β 1 x i + ε i .

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple

(14)

Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Testsurlapente Intervalledeconfiancepourlapente Testsurl’ordonnéeàl’origine Intervalledeconfiancepourl’ordonnéeàl’origine

Sommaire 1 Test et analyse de var iance de la rég ression 2 Distr ib ution des par amètres Modèle de rég ression linéaire simple Distr ib ution de la pente du modèle Distr ib ution de l’ordonnée à l’or igine 3 Tests et inter valles de confiance sur les par amètres Test sur la pente Inter valle de confiance pour la pente Test sur l’ordonnée à l’or igine Inter valle de confiance pour l’ordonnée à l’or igine 4 Distr ib ution et inter valle de confiance pour une valeur mo yenne ou une prévision 5 Ex emple

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Testsurlapente Intervalledeconfiancepourlapente Testsurl’ordonnéeàl’origine Intervalledeconfiancepourl’ordonnéeàl’origine

IC pour β 0 Un inter valle de confiance au niv eau ( 1 − α ) pour le coefficient inconn u β 0 est défini par : i b β 0 − t n − 2 ; 1 − α/ 2 × s ( b β 0 ) ; b β 0 + t n − 2 ; 1 − α/ 2 × s ( b β 0 ) h . Cet inter valle de confiance est constr uit pour que , ( 1 − α ) % de ses réalisations contiennent la vr aie valeur inconn ue du coefficient β 0 .

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Sommaire 1 Test et analyse de var iance de la rég ression 2 Distr ib ution des par amètres Modèle de rég ression linéaire simple Distr ib ution de la pente du modèle Distr ib ution de l’ordonnée à l’or igine 3 Tests et inter valles de confiance sur les par amètres Test sur la pente Inter valle de confiance pour la pente Test sur l’ordonnée à l’or igine Inter valle de confiance pour l’ordonnée à l’or igine 4 Distr ib ution et inter valle de confiance pour une valeur mo yenne ou une prévision 5 Ex emple

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple

Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Nous allons voir comment trouv er un inter valle de confiance pour la valeur mo yenne µ Y ( x ) = β 0 + β 1 x , c’est-à-dire pour l’ordonnée du point d’abscisse x se trouv ant sur la droite de rég ression.

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple

(15)

Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

L’estimateur de β 0 + β 1 x est donné par la droite des moindre carrés : b Y ( x ) = b β 0 + b β 1 x , où b Y ( x ) ∼ N β 0 + β 1 x ; σ 2 b Y ( x ) où σ 2 b Y ( x ) = σ 2 1 n + ( x − ¯ x ) 2 P ( x i − ¯x ) 2 · Ce qui peut s’écr ire aussi : b Y ( x ) − µ Y ( x ) σ b Y ( x ) ∼ N ( 0 ; 1 ) .

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple

Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Prob lème La var iance σ 2 est inconn ue . Solution Nous estimons d’abord σ 2 par l’estimateur CM res . Nous estimons ensuite σ 2 b Y ( x ) par : s 2 b Y ( x ) = CM res 1 n + ( x − x n ) 2 P ( x i − x n ) 2 · Ainsi nous obtenons : b Y ( x ) − µ Y ( x ) s b Y ( x ) ∼ T n − 2 .

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Inter valle de confiance de la valeur mo yenne Il est possib le de constr uire une inter valle de confiance de la valeur mo yenne de Y sachant que X = x 0 .L ’estimation ponctuelle pour cette valeur de x 0 est alors égale à b y ( x 0 ) = b β 0 + b β 1 x 0 . L’inter valle de confiance de la valeur mo yenne pr ise par la var iab le Y lorsque X = x 0 est égal à

b b b b y ( x ) − t × s y ( x ) ; y ( x ) + t × s y ( x ) . 0 0 0 0 n − 2 ; 1 − α/ 2 n − 2 ; 1 − α/ 2 Cet inter valle de confiance est constr uit pour que , ( 1 − α ) % de ses réalisations contiennent la vr aie valeur mo yenne inconn ue µ ( x ) . Y 0

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Inter valle de prédiction d’une valeur individuelle L’ajustement affine peut ser vir à prév oir une valeur attendue pour la var iab le Y quand nous fixons X = x 0 .L ’estimation ponctuelle de cette valeur est alors égale à b y ( x 0 ) = b β 0 + b β 1 x 0 . Un inter valle de prévision au niv eau ( 1 − α ) pour la var iab le Y sachant que X = x 0 est défini par : b y ( x 0 ) − t n − 2 ; 1 − α/ 2 q cm res + s 2 b y ( x 0 ) ; b y ( x 0 ) + t n − 2 ; 1 − α/ 2 q cm res + s 2 b y ( x 0 ) .

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple

(16)

Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Inter valle de prédiction d’une valeur individuelle (suite) Cet inter valle de prévision est constr uit pour que ( 1 − α ) % de ses réalisations contiennent la vr aie valeur individuelle inconn ue Y ( x 0 ) . Précaution d’emploi L’utilisation d’une valeur estimée b y ( x 0 ) n’est justifiée que si R 2 est proche de 1.

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple

Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Sommaire 1 Test et analyse de var iance de la rég ression 2 Distr ib ution des par amètres Modèle de rég ression linéaire simple Distr ib ution de la pente du modèle Distr ib ution de l’ordonnée à l’or igine 3 Tests et inter valles de confiance sur les par amètres Test sur la pente Inter valle de confiance pour la pente Test sur l’ordonnée à l’or igine Inter valle de confiance pour l’ordonnée à l’or igine 4 Distr ib ution et inter valle de confiance pour une valeur mo yenne ou une prévision 5 Ex emple

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Ex emple :le tab leau de données .D’après Bir kes et Dodge (1993) P ays Taux d’ur- Taux de banisation natalité x i y i Canada 55 , 0 16 , 2 Costa Rica 27 , 3 30 , 5 Cuba 33 , 3 16 , 9 E.U . 56 , 5 16 , 0 El Salv ador 11 , 5 40 , 2 Guatemala 14 , 2 38 , 4 Haïti 13 , 9 41 , 3

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Suite des données P ays Taux d’ur- Taux de banisation natalité x i y i Hondur as 19 , 0 43 , 9 Jamaïque 33 , 1 28 , 3 Me xique 43 , 2 33 , 9 Nicar agua 28 , 5 44 , 2 Tr inité-et-T obago 6 , 8 24 , 6 P anama 37 , 7 28 , 0 Rép .Dom. 37 , 1 33 , 1

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple

(17)

Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Nuage de points

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple

Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Analyse :calcul du coefficient de corrélation linéaire Nous souhaitons modéliser la relation entre le taux de natalité et le taux d’urbanisation. La première question à se poser est :« existe-t-il une relation linéaire entre les deux var iab les ? » Pour y répondre ,calculons le coefficient de corrélation linéaire de Br av ais-P earson à l’aide de R . > cor(natalite,urbanisation) [1] -0.6211854 Comment inter prétons-nous cette valeur ? Il semb ler ait qu’il puisse exister une relation linéaire entre les deux var iab les .Il reste donc à réaliser le test du coefficient de corrélation linéaire .

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Suite de l’analyse :test de corrélation linéaire Mais pour cela, il faut sa voir si le couple ( X , Y ) suit une loi nor male biv ar iée .Utilisons R . > exemple<-data.frame(urbanisation,natalite) > transpose<-t(exemple) > mshapiro.test(transpose) Shapiro-Wilk normality test data: Z W = 0.927, p-value = 0.2771 La p -v aleur ( p -v alue = 0,2771) étant supér ieure à α = 5 % ,nous décidons de ne pas rejeter et donc d’accepter l’h ypothèse nulle H 0 au seuil α = 5 % .La fonction mshapiro.test() nécessite l’installation du pac kage mvnormtest .

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Suite de l’analyse :test de corrélation linéaire Maintenant que l’h ypothèse fondamentale est vér ifiée ,nous pouv ons réaliser le test de corrélation linéaire . > cor.test(urbanisation,natalite) Pearson’s product-moment correlation data: urbanisation and natalite t = -2.7459, df = 12, p-value = 0.01774 alternative hypothesis: true correlation is not equal to 0 95 percent confidence interval: -0.8662568 -0.1351496 sample estimates: cor -0.6211854

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple

(18)

Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Suite et fin de l’analyse :test de corrélation linéaire La p -v aleur ( p -v alue = 0,01774) étant infér ieure à α = 5 % ,nous décidons de rejeter l’h ypothèse nulle H 0 et donc d’accepter l’h ypothèse alter nativ e H 1 au seuil de signification α = 5 % .Il existe donc une relation linéaire entre les deux var iab les . Maintenant, déter minons les coefficients de la droite les moindres carrés av ec R et traçons-la. > modele<-lm(natalite ∼ urbanisation) > coef(modele) (Intercept) urbanisation 42.9905457 -0.3988675 > abline(coef(modele),col="red")

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple

Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Nuage des points et droite des MCO

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Calcul des résidus Pour réaliser les tests sur la pente et sur l’ordonnée ,il faut vér ifier la nor malité des résidus .Nous allons les calculer av ec R . > residus<-residuals(modele) et les placer dans le tab leau des données .

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Tab leau de données av ec résidus P ays Taux d’ur- Taux de Valeurs Rési- banisation natalité estimées dus x i y i ˆ y i e i Canada 55 , 0 16 , 2 21 , 05 − 4 , 85 Costa Rica 27 , 3 30 , 5 32 , 10 − 1 , 60 Cuba 33 , 3 16 , 9 29 , 71 − 12 , 81 E.U . 56 , 5 16 , 0 20 , 45 − 4 , 45 El Salv ador 11 , 5 40 , 2 38 , 40 1 , 80 Guatemala 14 , 2 38 , 4 37 , 33 1 , 07 Haïti 13 , 9 41 , 3 37 , 45 3 , 85

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple

(19)

Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Suite des données av ec résidus P ays Taux d’ur- Taux de Valeurs Rési- banisation natalité estimées dus x i y i ˆ y i e i Hondur as 19 , 0 43 , 9 35 , 41 8 , 49 Jamaïque 33 , 1 28 , 3 29 , 79 − 1 , 49 Me xique 43 , 2 33 , 9 25 , 76 8 , 14 Nicar agua 28 , 5 44 , 2 31 , 62 12 , 58 Tr inité-et-T obago 6 , 8 24 , 6 40 , 28 − 15 , 68 P anama 37 , 7 28 , 0 27 , 95 0 , 05 Rép .Dom. 37 , 1 33 , 1 28 , 19 4 , 91

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple

Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Nor malité des résidus Réalisons donc le test de nor malité, le test de Shapiro-Wilk av ec R . > shapiro.test(residus) Shapiro-Wilk normality test data: residus W = 0.9635, p-value = 0.7797 La p -v aleur ( p -v alue = 0,7797) étant supér ieure à α = 5 % ,nous décidons de ne pas rejeter et donc d’accepter l’h ypothèse alter nativ e H 0 au seuil de signification α = 5 % .

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Test sur la pente β 1 . Nous testons H 0 : β 1 = 0 contre H 1 : β 1 6 = 0 . Nous calculons t obs = b β 1 s ( b β 1 ) = − 0 , 3989 0 , 1453 = − 2 , 746 . Or la valeur cr itique est égale à pour un seuil α = 0 , 05 : t ( 12 ; 0 , 975 ) = 2 , 178813 .

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Décision Comme | t obs | > t n − 2 ; 1 − α/ 2 , nous décidons de refuser l’h ypothèse nulle H 0 et par conséquent d’accepter l’h ypothèse alter nativ e H 1 ,au seuil de signification α = 5 % . En conc lusion : La relation linéaire entre le taux de natalité et le taux d’urbanisation est significativ e.

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple

(20)

Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

IC pour β 1 Un inter valle de confiance pour le coefficient inconn u β 1 au niv eau ( 1 − α ) = 0 , 95 s’obtient en calculant : b β 1 ± t n − 2 ; 1 − α/ 2 × s ( b β 1 ) = − 0 , 3989 ± 2 , 178813 × 0 , 1453 . Nous av ons donc après simplification et appro ximation : ] − 0 , 716 ; − 0 , 082 [ qui contient la vr aie valeur du coefficient inconn u β 1 av ec une probabilité de 0 , 95. Nous remarquons que 0 n’est pas compr is dans cet inter valle .

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple

Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Test sur l’ordonnée β 0 H 0 : β 0 = 0 contre H 1 : β 0 6 = 0 . Nous calculons t obs = b β 0 s ( b β 0 ) = 42 , 9905 4 , 8454 = 8 , 872 . Or la valeur cr itique est égale à pour un seuil α = 0 , 05 : t 0 , 975 ; 12 = 2 , 178813 .

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

Décision Comme | t obs | > t n − 2 ; 1 − α/ 2 , nous décidons de refuser l’h ypothèse nulle H 0 et par conséquent d’accepter l’h ypothèse alter nativ e H 1 . En conc lusion : La droite de rég ression ne passe pas par l’or igine .

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple Testetanalysedevariancedelarégression Distributiondesparamètres Testsetintervallesdeconfiancesurlesparamètres LoietICd’unevaleurmoyenneoud’uneprévision Exemple

IC pour β 0 Un inter valle de confiance pour le coefficient inconn u β 0 au niv eau ( 1 − α ) = 0 , 95 s’obtient en calculant : b β 0 ± t n − 2 ; 1 − α/ 2 , × s ( b β 0 ) = 42 , 9905 ± 2 , 178813 × 4 , 8454 . Nous av ons donc après simplification et appro ximation : ] 32 , 433 ; 53 , 548 [ qui contient la vr aie valeur du coefficient inconn u β 0 av ec une probabilité de 0 , 95. Nous remarquons que 0 n’est pas compr is dans l’inter valle .

MyriamMaumy-BertrandetMarieChionComplémentssurlarégressionlinéairesimple

Références

Documents relatifs

Le 29 Septembre 2006, Johnny et Georges, en tant que porte parole du groupe sont allés à la Maison de la Charente-Maritime à La Rochelle assistés à la jour- née du GRRT

Le but de ce travail est de caractériser le phénotype de patients qui portent des mutations dans l’un de ces gènes, ainsi qu’une mutation dans le gène ALPL afin de mieux

Elle a donné des infos sur les réservations dans les gîtes et autres hébergements touristiques… Elle a aussi interviewé des acteurs de terrain pour partager le vécu des

Les thèmes traités sont notamment l’importance à long terme des déterminants de la santé à l’œuvre pendant la petite enfance, et les effets de la pauvreté, des drogues,

Lien explicite Oui Lien agglutinant existant Lien reliant existant Non Lien agglutinant potentiel Lien reliant existant Regardez le beau lapin-canard 1 de la Figure

Les EIP fournis devraient être adaptés à la taille de l’employée ou de l’employé et être conçus pour apporter un confort et une protection raisonnables contre les

La présente Norme internationale spécifie des méthodes de mesurage et établit des normes pour l’émission lumineuse, l’angle utile, l’indicateur de charge, le temps de recharge

Ouvrir les applications Windows® depuis le menu Démarrer Positionnez le pointeur de votre souris sur l'application, puis cliquez pour l'ouvrir.. Utilisez les touches