2 Position du probl` eme

(1)

Devoir Maison 9 - R´egression lin´eaire

A rendre pour le 19 Janvier

1 Pr´ eliminaires

Exercice 1 : Dans un repère orthonormé (O;I;J) du plan, la droite Dest la représentation graphique de la fonction affine f :x7→0,4x−2,9

a) Montrer que le pointA(9; 0,7) appartient `aD? b) Le point B(2 015; 800) appartient-il `a D?

c) Peut-on trouver une valeur du r´eeltpour laquelle le point C(4;t) appartient `a la droiteD? Si oui, peut-on en trouver un autre ?

d) Peut-on trouver une valeur du r´eel u pour laquelle le point D(u;4) appartient `a la droiteD? Si oui, peut-on en trouver un autre ?

Exercice 2 : SoitDla droite d’´equationy=ax+b. A quelle condition le pointM(xM;yM) appartient-il `a D?

Exercice 3 : SoitM(xM;yM) etN(xN;yN), avec xM 6=xN. On note y=ax+b l’´equation de la droite (MN). L’objectif de cette question est de trouver a et b, connaissant les coordonn´ees des deux points M et N.

a) Montrer queaetb sont solutions du syst`eme d’´equation suivant :

yM =axM +b (1)

y_N =ax_N +b (2)

b) R´esoudre le syst`eme. Montrer que l’on aa= _x^y^M^−y^N

M−xN et b= ^y^N^x_x^M^−y^M^x^N

M−xN . Laquelle de ces deux valeurs représente le coefficient directeur de (MN) ? Était-ce prévisible sans calculs ? Dans quel cas b= 0 ?

c) Application : soient M(1,2) et N(3;4). Calculer l’´equation de la droite (MN).

c) (*) Pourquoi a-t-on suppos´exM 6=xN ? Que se passe-t-il sixM =xN, et quelle est l’´equation correspondante ?

2 Position du probl` eme

On dispose de 3 pointsM₁(x₁;y₁),M₂(x₂;y₂) et M₃(x₃;y₃). On veut tracer et trouver l’´equation d’une droiteDqui passe par ces trois points.

Question 2.1. A quelle condition (g´eom´etrique) sur M1, M2 et M3 la droite D va-t-elle passer exactement par ces trois points ? Traduire cette condition avec des vecteurs.

En général, Dne passera pas par les trois points. On va donc faire en sorte pour qu’elle passe à peu près par les trois points. On appelley=ax+b l’équation de la droiteD.

Question 2.2. A quelle condition a-t-on y1=ax1+b ?

En général, y₁6=ax₁+b; on introduite₁tel que y₁=ax₁+b+e₁;e₁est l’erreur que l’on fait lorsque l’on dit que les 3 points forment une droite (sie₁= 0, alorsM₁ est bien sur la droiteD; sinon on fait une erreur en modélisant les trois points M₁, M₂ etM₃par une droite).

De mˆeme, on introduite₂ ete₃ tel quey₂=ax₂+b+e₂ ety₂=ax₂+b+e₂.

3 R´ esolution du probl` eme

Définition 1. La droiteDqui passe ”le mieux” est la droite des moindres carrés, c’est à dire celle qui minimise l’expression :

S=e²₁+e²₂+e²₃ (3)

Onadmetque S est minimal si et seulement si les deux équations suivantes sont vérifiées :

x₁e₁+x₂e₂+x₃e₃= 0 (4)

e1+e2+e3= 0 (5)

Dans la suite, on cherche les valeurs deaet debpour lesquelles S est minimales (c’est à dire pour lesquelles les deux équations précédentes sont vérifiées).

Question 3.1. (*) Montrer que l’on ab= ¹₃(y1+y2+y3)−a¹₃(x1+x2+x3).

On note pour alléger les expressionsx¯= ¹₃(x1+x2+x3)ety¯= ¹₃(y1+y2+y3). Que représentent ces deux expressions ? Question 3.2. Montrer que l’équationy=ax+bdevient y−y¯=a(x−x).¯

Question 3.3. (**) Montrer quea= ^(x¹^−¯^x)(y_(x¹^−¯^y)+(x²^−¯^x)(y²^−¯^y)+(x³^−¯^x)(y³^−¯^y)

1−¯x)²+(x3−¯x)²+(x3−¯x)²

Exemple SoientM₁(0; 0)M₂(1; 2) etM₃(2; 3,9). Calculer l’´equation de la droiteDqui passe le ”mieux” par les trois points.

Vérifier à la calculatrice si vous trouvez la même chose (à priori oui). Vérifiez parmi les trois pointsM₁,M₂etM₃lesquelles appartiennent à la droiteD. Cela pose-t-il problème si aucun des points n’appartient à la droite ?

1

(2)

4 Analyse du r´ esultat

L’objectif de cette partie est de trouver un crit`ere simple pour pouvoir dire si la droiteDpasse presque par les pointsM1, M₂et M₃ ou non.

Question 4.1. En partant de(y₁−y) =¯ a(x₁−x) +¯ e₁, montrer en mettant au carr´e les termes de droite et de gauche, que l’on a :

(y₁−y)¯ ²=a²(x₁−x)¯ ²+e²₁ (6)

On justifiera proprement que le double produit s’annule bien.

Question 4.2. Ecrire une ´´ equation similaire pour les pointsM2 etM3. Définition 2. On définit les trois quantités suivantes :

Total sum of squares SST = (y1−y)¯ ²+ (y2−y)¯ ²+ (y3−y)¯² (7) Regression sum of squares SSR=a²(x1−x)¯ ²+a²(x3−x)¯ ²+a²(x3−x)¯ ² (8)

Error sum of squares SSE=e²₁+e²₂+e²₃ (9)

Question 4.3. Montrer que SCT = SSR + SSE.

Définition 3. On appelle le coefficient de régression linéaire (ou coefficient de corrélation), la quantité :

r²= SSR

SST (10)

Question 4.4. (*) Quelles sont les valeurs pouvant être prises par r (ou r²) ? Montrer que le cas r² = 1 correspond à SSE=0. Dans ce cas, que peut-on dire géométriquement sur les trois points ? De manière générale, à quelle condition la droite passe-t-elle presque par les trois points ?

5 G´ en´ eralisation

Question 5.1. (**) Généraliser les résultats pour n points M₁(x₁;y₁);. . .;M_n(x_n;y_n).

2