• Aucun résultat trouvé

2 Position du probl` eme

N/A
N/A
Protected

Academic year: 2022

Partager "2 Position du probl` eme"

Copied!
4
0
0

Texte intégral

(1)

Devoir Maison 9 - R´egression lin´eaire - Correction

1 Pr´ eliminaires

Exercice 1 : Dans un rep`ere orthonorm´e (O;I;J) du plan, la droite Dest la repr´esentation graphique de la fonction affine f :x7→0,4x−2,9

a) Montrer que le pointA(9; 0,7) appartient `aD.

b) Le point B(2 015; 800) appartient-il `a D?

c) Peut-on trouver une valeur du r´eeltpour laquelle le point C(4;t) appartient `a la droiteD? Si oui, peut-on en trouver un autre ?

d) Peut-on trouver une valeur du r´eel u pour laquelle le point D(u;4) appartient `a la droiteD? Si oui, peut-on en trouver un autre ?

Proof. a) f(9)=0,7 doncA∈ D.

b)f(20156= 800 donc B n’appartient pas `aD.

c)

C(4;t)∈ D ⇐⇒ f(4) =t (1)

⇐⇒ 0,4×4−2,9 =t (2)

⇐⇒ 1,6−2,9 =t (3)

⇐⇒ t=−1,3 (4)

Donc t=-1,3 est la seule possibilit´e pour laquelle C(4;t) soit surD.

d)

D(u; 4)∈ D ⇐⇒ f(u) = 4 (5)

⇐⇒ 0,4u−2,9 = 4 (6)

⇐⇒ 0,4u= 6,9 (7)

⇐⇒ u= 6,9 0,4 = 69

4 (8)

Doncu=694 est la seule possibilit´e pour que D(u;4) soit surD.

Exercice 2 : SoitDla droite d’´equationy=ax+b. A quelle condition le pointM(xM;yM) appartient-il `a D? Proof.

M(xM;yM)∈ D ⇐⇒ yM =f(xM) ⇐⇒ yM =axM+b (9)

Exercice 3 : SoitM(xM;yM) etN(xN;yN), avec xM 6=xN. On note y=ax+b l’´equation de la droite (MN). L’objectif de cette question est de trouver a et b, connaissant les coordonn´ees des deux points M et N.

a) Montrer queaetb sont solutions du syst`eme d’´equation suivant :

yM =axM +b (10)

yN =axN +b (11)

b) R´esoudre le syst`eme. Montrer que l’on aa= xyM−yN

M−xN et b= yNxxM−yMxN

M−xN . Laquelle de ces deux valeurs repr´esente le coefficient directeur de (MN) ? ´Etait-ce pr´evisible sans calculs ? Dans quel cas b= 0 ?

c) Application : soient M(1,2) et N(3;4). Calculer l’´equation de la droite (MN).

c) (*) Pourquoi a-t-on suppos´exM 6=xN ? Que se passe-t-il sixM =xN, et quelle est l’´equation correspondante ? Proof. a) L’´equation de la droite (MN) esty=ax+b. On sait queM(xM;yM) est sur la droite (MN), donc ses coordonn´ees v´erifient

yM =axM +b (12)

De mˆeme,N(xN;yN) est sur (MN), donc ses coordonn´ees v´erifient :

yN =axN +b (13)

Donc les deux ´equations 12 et 13 donnent le syst`eme que l’on voulait obtenir.

b) On donne la solution, donc une mani`ere de proc´eder est de v´erifier que les valeurs a et b donn´ees par l’´enonc´e conviennent.

Une autre mani`ere est de r´esoudre le syst`eme.

1

(2)

En retranchant 12 `a 13, on obtient :

yM−yN =axM +b−(axN+b) (14)

⇐⇒yM−yN =a(xM −xN) (15)

⇐⇒a= yM −yN

xM −xN

(16) On remarque queaa la forme du taux de variation entre les points M et N.

Pour obtenirb, on remplace dans une des deux ´equations du d´ebut (par exemple 10) la nouvelle valeur de a que l’on vient de trouver.

Ainsi :

yM = yM −yN

xM −xN

xM+b (17)

⇐⇒b=yM− yM−yN

xM−xNxM (18)

⇐⇒b=yM(xM −xN)−(yM−yN)xM

xM −xN

(19)

⇐⇒b=yMxM −yMxN −yMxM+yNxM

xM −xN (20)

⇐⇒b=yNxM −yMxN xM −xN

(21) On ab= 0 si la droite est lin´eaire, c’est `a dire passe par O(0;0).

c) Dans cet application num´erique, on trouvea= 2−41−3 = −2−2 = 1 etb= 4×1−2×31−3 = 4−6−2 = 1, donc la droite (MN) a pour

´

equation y=x+1.

d) On a suppos´e quexM 6=xN, car sinon les points M et N auraient mˆeme abscisse. Dans ce cas, la droite (MN) serait verticale, et n’est pas repr´esentable par une fonction (car pour un mˆemex, il existerait plusieurs images (une infinit´e mˆeme!), ce qui n’est pas possible avec notre d´efinition d’une fonction).

2 Position du probl` eme

On dispose de 3 pointsM1(x1;y1),M2(x2;y2) et M3(x3;y3). On veut tracer et trouver l’´equation d’une droiteDqui passe par ces trois points.

Question 2.1. A quelle condition (g´eom´etrique) sur M1, M2 et M3 la droite D va-t-elle passer exactement par ces trois points ? Traduire cette condition avec des vecteurs.

Proof. Dpasse exactement par les 3 points si les points sont align´es, ou encore si les vecteurs−−−−→

M1M2et−−−−→

M2M3sont colin´eaires.

En g´en´eral, Dne passera pas par les trois points. On va donc faire en sorte pour qu’elle passe `a peu pr`es par les trois points. On appelley=ax+b l’´equation de la droiteD.

Question 2.2. A quelle condition a-t-on y1=ax1+b ? Proof. y1=ax1+b ⇐⇒ M1∈ D.

En g´en´eral, y16=ax1+b; on introduite1tel que y1=ax1+b+e1;e1est l’erreur que l’on fait lorsque l’on dit que les 3 points forment une droite (sie1= 0, alorsM1 est bien sur la droiteD; sinon on fait une erreur en mod´elisant les trois points M1, M2 etM3par une droite).

De mˆeme, on introduite2 ete3 tel quey2=ax2+b+e2 ety2=ax2+b+e2.

3 R´ esolution du probl` eme

D´efinition 1. La droiteDqui passe ”le mieux” est la droite des moindres carr´es, c’est `a dire celle qui minimise l’expression :

S=e21+e22+e23 (22)

Onadmetque S est minimal si et seulement si les deux ´equations suivantes sont v´erifi´ees :

x1e1+x2e2+x3e3= 0 (23)

e1+e2+e3= 0 (24)

Dans la suite, on cherche les valeurs deaet debpour lesquelles S est minimales (c’est `a dire pour lesquelles les deux ´equations pr´ec´edentes sont v´erifi´ees).

2

(3)

Question 3.1. (*) Montrer que l’on ab= 13(y1+y2+y3)−a13(x1+x2+x3).

On note pour all´eger les expressionsx¯= 13(x1+x2+x3)ety¯= 13(y1+y2+y3). Que repr´esentent ces deux expressions ? Proof. On part de l’´equation 24, que l’on r´e´ecrit en rempla¸cant lesei par leur valeur (ei=yi−axi−b). Cela donne :

(24) e1+e2+e3= 0 ⇐⇒y1−ax1−b+y2−ax2−b+y3−ax3−b= 0 (25)

⇐⇒y1+y2+y3−a(x1+x2+x3)−3b= 0 (26)

⇐⇒b= 1

3(y1+y2+y3)−a1

3(x1+x2+x3) (27)

⇐⇒b= ¯y−a¯x (28)

Cette formule pourbest finalement assez simple (et on peut la g´en´eraliser facilement pour n points). On peut l’interpr´eter en disant que la droite des moindres carr´e passe par le point moyen de coordonn´ee (¯x; ¯y).

Question 3.2. Montrer que l’´equationy=ax+bdevient y−y¯=a(x−x).¯

Proof. Commeb= ¯y−a¯x, l’´equationy=ax+bdevienty=ax+ ¯y−a¯x, c’est `a direy−y¯=a(x−¯x).

Question 3.3. (**) Montrer quea= (x1−¯x)(y(x1−¯y)+(x2−¯x)(y2−¯y)+(x3−¯x)(y3−¯y)

1−¯x)2+(x3−¯x)2+(x3−¯x)2

Proof. Assez calculatoire, en partie du au fait que vous n’avez pas les bonnes notations `a votre disposition pour simplifier les expressions.

On r´e´ecrit les deux ´equations 23 et 24 en rempla¸cant b par sa valeur. Puis on joue avec les ´equations (on multiplie 24 par ¯xpuis on retranche 23) pour obtenir la valeur de a.

x1e1 + x2e2 + x3e3 = 0

e1 + e2 + e3 = 0 (29)

⇐⇒

x1(y1−ax1−y¯+a¯x) + x2(y2−ax2−y¯+a¯x) + x3(y3−ax3−y¯+a¯x) = 0

y1−ax1−b + y2−ax2−b + y3−ax3−b = 0 (30)

⇐⇒

(

x1(y1−y) +¯ x2(y2−y) +¯ x3(y3−y)¯ −a

x1(x1−x) +¯ x2(x2−x) +¯ x3(x3−¯x)

= 0

y1+y2+y3−a(x1+x2+x3)−3(¯y−a¯x) = 0 (31)

⇐⇒

x1(y1−y) +¯ x2(y2−y) +¯ x3(y3−y)¯ −a

x1(x1−x) +¯ x2(x2−x) +¯ x3(x3−x)¯

= 0

(y1−y)¯ −a(x1−x)¯ +

(y2−y)¯ −a(x2−x)¯ +

(y3−y)¯ −a(x3−x)¯

= 0

(32)

⇐⇒

x1(y1−y) +¯ x2(y2−y) +¯ x3(y3−y)¯ −a

x1(x1−x) +¯ x2(x2−x) +¯ x3(x3−x)¯

= 0

(y1−y) + (y¯ 2−y) + (y¯ 3−y)¯

−a

(x1−x) + (x¯ 2−x) + (x¯ 3−x)¯

= 0

(33)

⇐⇒

x1(y1−y) +¯ x2(y2−y) +¯ x3(y3−y)¯ −a

x1(x1−x) +¯ x2(x2−x) +¯ x3(x3−x)¯

= 0 (y1−y)¯¯ x+ (y2−y)¯¯x+ (y3−y)¯¯ x−a

(x1−x) + (x¯ 2−x) + (x¯ 3−x)¯

¯

x= 0 (34)

(35) On a presque fini : on soustrait membre `a membre les deux derni`eres ´equations. Cela donne :

(y1−y)(x¯ 1−x) + (y¯ 2−y)(x¯ 2−x) + (y¯ 3−y)(x¯ 3−x)¯ −a

(x1−¯x)2+ (x2−x)¯ 2+ (x3−x)¯ 2

x−¯ = 0 (36)

⇐⇒a= (x1−x)(y¯ 1−y) + (x¯ 2−x)(y¯ 2−y) + (x¯ 3−x)(y¯ 3−y)¯

(x1−x)¯ 2+ (x3−x)¯ 2+ (x3−x)¯ 2 (37)

On trouve bien le r´esultat de l’´enonc´e (ouf !).

Exemple SoientM1(0; 0)M2(1; 2) etM3(2; 3,9). Calculer l’´equation de la droiteDqui passe le ”mieux” par les trois points.

V´erifier `a la calculatrice si vous trouvez la mˆeme chose (`a priori oui). V´erifiez parmi les trois pointsM1,M2etM3lesquelles appartiennent `a la droiteD. Cela pose-t-il probl`eme si aucun des points n’appartient `a la droite ?

Proof. Il ´etait possible de traiter cet exemple sans avoir fait les questions pr´ec´edentes.

3

(4)

4 Analyse du r´ esultat

L’objectif de cette partie est de trouver un crit`ere simple pour pouvoir dire si la droiteDpasse presque par les pointsM1, M2et M3 ou non.

Question 4.1. En partant de(y1−y) =¯ a(x1−x) +¯ e1, montrer en mettant au carr´e les termes de droite et de gauche, que l’on a :

(y1−y)¯ 2=a2(x1−x)¯ 2+e21 (38)

On justifiera proprement que le double produit s’annule bien.

Proof. On fait ce que dit l’´enonc´e, et on met au carr´e l’expression.

y1−y¯2

=

a(x1−x) +¯ e12

(39)

⇐⇒

y1−y¯2

=a2(x1−x)¯ 2+e21+ 2a(x1−x)e¯ 1 (40)

⇐⇒

y1−y¯2

=a2(x1−x)¯ 2+e21+ 2a(x1−x)(y¯ 1−ax1−b) (41)

⇐⇒

y1−y¯2

=a2(x1−x)¯ 2+e21+ 2a(x1−x)(y¯ 1−ax1−y¯−a¯x) (42) (43) On veut faire annuler le double produit (le dernier terme de l’´equation 42 ). On remarque que celui-ci est un produit de terme; il sera nul si un de ces terme est nul.

Dans 2a(x1−x)(y¯ 1−ax1−y¯−a¯x), a n’est `a priori pas nul (sauf gros cas particulier), (x1−x) non plus. Il reste¯ (y1−ax1−y¯−a¯x). Ce terme peut encore s’´ecrire comme (y1−y¯−a(x1−x)). On reconnaˆıt l’´¯ equation de la question 3.2 ! Remarque Il y avait une erreur dans l’´enonc´e. Le double produit en g´en´eral ne s’annule pas. Il faut en fait sommer sur les trois points pour avoir un terme qui s’annule. En effet, on obtiendrait le terme :

2a

(x1−x)(y¯ 1−ax1−y¯−a¯x) + (x2−x)(y¯ 2−ax2−y¯−a¯x) + (x3−¯x)(y3−ax3−y¯−a¯x)

(44) On reconnaˆıt le terme de l’´equation 36.

Donc dans ce cas, l’´equation que l’on cherchait est : (y1−y)¯ 2+ (y2−y)¯2+ (y3−y)¯ 2=a2

(x1−x)¯ 2+ (x2−x)¯ 2+ (x3−x)¯ 2

+e21+e22+e23= 0 (45) Question 4.2. Ecrire une ´´ equation similaire pour les pointsM2 etM3.

Proof. Voir la remarque pr´ec´edente

D´efinition 2. On d´efinit les trois quantit´es suivantes :

Total sum of squares SST = (y1−y)¯ 2+ (y2−y)¯ 2+ (y3−y)¯2 (46) Regression sum of squares SSR=a2(x1−x)¯ 2+a2(x3−x)¯ 2+a2(x3−x)¯ 2 (47)

Error sum of squares SSE=e21+e22+e23 (48)

Question 4.3. Montrer que SST = SSR + SSE.

Proof. C’est l’´equation 45 ´ecrite de mani`ere condens´ee.

D´efinition 3. On appelle le coefficient de r´egression lin´eaire (ou coefficient de corr´elation), la quantit´e : r2= SSR

SST (49)

Question 4.4. (*) Quelles sont les valeurs pouvant ˆetre prises par r (ou r2) ? Montrer que le cas r2 = 1 correspond `a SSE=0. Dans ce cas, que peut-on dire g´eom´etriquement sur les trois points ? De mani`ere g´en´erale, `a quelle condition la droite passe-t-elle presque par les trois points ?

Proof. r2 est compris entre 0 et 1, doncrest compris entre -1 et 1.

Le casr2= 1 correspond `a une corr´elation parfaite, c’est `a dire aux trois pointsM1, M2 etM3 align´es sur la droite des moindres carr´e (qui passe donc par ces trois points). Plusr2 s’´eloigne de 1, plus la droite est une mauvaise approximation.

En pratique, lorsque l’on fait une r´egression lin´eaire, on doit avoirr2 de l’ordre de 0,9999 (au moins trois ou quatre 9);

en dessous c’est pas terrible, et soit la mesure exp´erimentale des points a mal ´et´e faite, soit les points ne correspondent pas

`

a une droite, et il faut chercher autre chose.

5 G´ en´ eralisation

Question 5.1. (**) G´en´eraliser les r´esultats pour n points M1(x1;y1);. . .;Mn(xn;yn).

4

Références

Documents relatifs

Obligatoires : copies s´epar´ees pour chaque partie ; num´erotation des copies de 1/n `a n/n ; votre nom sur chaque copie ; num´erotation des questions ; r´esolution dans l’ordre

Pour des raisons techniques, si, un jour donn´ e, on utilise le hangar H, le lendemain on r´ eutilisera ce mˆ eme hangar avec une probabilit´ e de 0, 5 et si, un jour donn´ e,

Universit´ e Paris-Dauphine et Institut Tunis-Dauphine L3 Math´ ematiques appliqu´ ees, 2012-2013.. Partiel de

Notons β le vecteur des param` etres de r´ egression ` a estimer dans le cadre d’un mod` ele d’analyse de la variance ` a un facteur et β b son estimateur?. Proposer des simulations

Pour pouvoir d´ eterminer la concentration du Glucose ` a partir de la mesure de l’absorbance, on effectue une calibration pr´ eliminaire: une courbe d’´ etalonnage du dosage

Pour pouvoir d´ eterminer la concentration du Glucose ` a partir de la mesure de l’absorbance, on effectue une calibration pr´ eliminaire: une courbe d’´ etalonnage du dosage

Les ´ echantillons pr´ elev´ es seront dilu´ es afin de rester dans la zone de lin´ earit´ e du spectrophotom` etre, zone pour laquelle la densit´ e optique est proportionnelle ` a

Les ´ echantillons pr´ elev´ es seront dilu´ es afin de rester dans la zone de lin´ earit´ e du spectrophotom` etre, zone pour laquelle la densit´ e optique est proportionnelle ` a