Devoir Maison 9 - R´egression lin´eaire
A rendre pour le 19 Janvier
1 Pr´ eliminaires
Exercice 1 : Dans un rep`ere orthonorm´e (O;I;J) du plan, la droite Dest la repr´esentation graphique de la fonction affine f :x7→0,4x−2,9
a) Montrer que le pointA(9; 0,7) appartient `aD? b) Le point B(2 015; 800) appartient-il `a D?
c) Peut-on trouver une valeur du r´eeltpour laquelle le point C(4;t) appartient `a la droiteD? Si oui, peut-on en trouver un autre ?
d) Peut-on trouver une valeur du r´eel u pour laquelle le point D(u;4) appartient `a la droiteD? Si oui, peut-on en trouver un autre ?
Exercice 2 : SoitDla droite d’´equationy=ax+b. A quelle condition le pointM(xM;yM) appartient-il `a D?
Exercice 3 : SoitM(xM;yM) etN(xN;yN), avec xM 6=xN. On note y=ax+b l’´equation de la droite (MN). L’objectif de cette question est de trouver a et b, connaissant les coordonn´ees des deux points M et N.
a) Montrer queaetb sont solutions du syst`eme d’´equation suivant :
yM =axM +b (1)
yN =axN +b (2)
b) R´esoudre le syst`eme. Montrer que l’on aa= xyM−yN
M−xN et b= yNxxM−yMxN
M−xN . Laquelle de ces deux valeurs repr´esente le coefficient directeur de (MN) ? ´Etait-ce pr´evisible sans calculs ? Dans quel cas b= 0 ?
c) Application : soient M(1,2) et N(3;4). Calculer l’´equation de la droite (MN).
c) (*) Pourquoi a-t-on suppos´exM 6=xN ? Que se passe-t-il sixM =xN, et quelle est l’´equation correspondante ?
2 Position du probl` eme
On dispose de 3 pointsM1(x1;y1),M2(x2;y2) et M3(x3;y3). On veut tracer et trouver l’´equation d’une droiteDqui passe par ces trois points.
Question 2.1. A quelle condition (g´eom´etrique) sur M1, M2 et M3 la droite D va-t-elle passer exactement par ces trois points ? Traduire cette condition avec des vecteurs.
En g´en´eral, Dne passera pas par les trois points. On va donc faire en sorte pour qu’elle passe `a peu pr`es par les trois points. On appelley=ax+b l’´equation de la droiteD.
Question 2.2. A quelle condition a-t-on y1=ax1+b ?
En g´en´eral, y16=ax1+b; on introduite1tel que y1=ax1+b+e1;e1est l’erreur que l’on fait lorsque l’on dit que les 3 points forment une droite (sie1= 0, alorsM1 est bien sur la droiteD; sinon on fait une erreur en mod´elisant les trois points M1, M2 etM3par une droite).
De mˆeme, on introduite2 ete3 tel quey2=ax2+b+e2 ety2=ax2+b+e2.
3 R´ esolution du probl` eme
D´efinition 1. La droiteDqui passe ”le mieux” est la droite des moindres carr´es, c’est `a dire celle qui minimise l’expression :
S=e21+e22+e23 (3)
Onadmetque S est minimal si et seulement si les deux ´equations suivantes sont v´erifi´ees :
x1e1+x2e2+x3e3= 0 (4)
e1+e2+e3= 0 (5)
Dans la suite, on cherche les valeurs deaet debpour lesquelles S est minimales (c’est `a dire pour lesquelles les deux ´equations pr´ec´edentes sont v´erifi´ees).
Question 3.1. (*) Montrer que l’on ab= 13(y1+y2+y3)−a13(x1+x2+x3).
On note pour all´eger les expressionsx¯= 13(x1+x2+x3)ety¯= 13(y1+y2+y3). Que repr´esentent ces deux expressions ? Question 3.2. Montrer que l’´equationy=ax+bdevient y−y¯=a(x−x).¯
Question 3.3. (**) Montrer quea= (x1−¯x)(y(x1−¯y)+(x2−¯x)(y2−¯y)+(x3−¯x)(y3−¯y)
1−¯x)2+(x3−¯x)2+(x3−¯x)2
Exemple SoientM1(0; 0)M2(1; 2) etM3(2; 3,9). Calculer l’´equation de la droiteDqui passe le ”mieux” par les trois points.
V´erifier `a la calculatrice si vous trouvez la mˆeme chose (`a priori oui). V´erifiez parmi les trois pointsM1,M2etM3lesquelles appartiennent `a la droiteD. Cela pose-t-il probl`eme si aucun des points n’appartient `a la droite ?
1
4 Analyse du r´ esultat
L’objectif de cette partie est de trouver un crit`ere simple pour pouvoir dire si la droiteDpasse presque par les pointsM1, M2et M3 ou non.
Question 4.1. En partant de(y1−y) =¯ a(x1−x) +¯ e1, montrer en mettant au carr´e les termes de droite et de gauche, que l’on a :
(y1−y)¯ 2=a2(x1−x)¯ 2+e21 (6)
On justifiera proprement que le double produit s’annule bien.
Question 4.2. Ecrire une ´´ equation similaire pour les pointsM2 etM3. D´efinition 2. On d´efinit les trois quantit´es suivantes :
Total sum of squares SST = (y1−y)¯ 2+ (y2−y)¯ 2+ (y3−y)¯2 (7) Regression sum of squares SSR=a2(x1−x)¯ 2+a2(x3−x)¯ 2+a2(x3−x)¯ 2 (8)
Error sum of squares SSE=e21+e22+e23 (9)
Question 4.3. Montrer que SCT = SSR + SSE.
D´efinition 3. On appelle le coefficient de r´egression lin´eaire (ou coefficient de corr´elation), la quantit´e :
r2= SSR
SST (10)
Question 4.4. (*) Quelles sont les valeurs pouvant ˆetre prises par r (ou r2) ? Montrer que le cas r2 = 1 correspond `a SSE=0. Dans ce cas, que peut-on dire g´eom´etriquement sur les trois points ? De mani`ere g´en´erale, `a quelle condition la droite passe-t-elle presque par les trois points ?
5 G´ en´ eralisation
Question 5.1. (**) G´en´eraliser les r´esultats pour n points M1(x1;y1);. . .;Mn(xn;yn).
2