• Aucun résultat trouvé

Régression linéaire

N/A
N/A
Protected

Academic year: 2022

Partager "Régression linéaire"

Copied!
2
0
0

Texte intégral

(1)

e i π = -1

BCPST1 Fénelon Nicolas Clatin 2009

certains droits réservés ne peut pas être vendu OUTILS MATHÉMATIQUES

fiche 5

Régression linéaire

5.1 Position du problème.

Supposons qu’une certaine grandeur physiquey varie avec une autre grandeurxselon une loi affine :

y=a x+b (1)

On souhaite vérifier expérimentalement cette loi, et déterminer les valeurs expérimentales de a et b. Pour cela, on mesureypour différentes valeur de la grandeurx, ce qui revient à obtenir un tableau de la forme :

x1 x2 . . . xN y1 y2 . . . yN

On peut vérifier que y varie de façon affine avec x en reportant sur un graphique les couples de points (x1, y1);. . .; (xN, yN). Sur l’exemple ci-dessous, on « voit » que les points sont raisonnablement bien alignés, les écarts étant dus aux incertitudes de mesures (imprécision du matériel et surtout de l’expérimentateur).

x y

5.2 La régression linéaire.

Pour déterminer a et b, il faut tracer « la » droite qui passe par l’ensemble de ces points expérimentaux ; or ils ne sont pas parfaitement alignés. La régression linéaire est un algorithme qui permet de trouver la meilleure droite à partir de ces points. En pratique, il suffit de rentrer dans sa calculatrice les couples de points (x1, y1);. . .; (xN, yN). Le programme (implanté par défaut dans toutes les machines modernes) donne trois nombres :

• le coefficient directeura0 de la meilleure droite trouvée,

• l’ordonnée à l’origineb0 de la meilleure droite trouvée,

• le coefficient de corrélation R, ou son carréR2.

Les valeurs de a0 et b0 constituent des valeurs expérimentales des paramètres a et b du modèle (1). Il appartient ensuite à l’expérimentateur de discuter de la validité de ces valeurs. Le coefficient de corrélation donne une indication sur l’alignement des points expérimentaux :plus|R| ouR2 sont proches de 1, mieux les points sont alignés. Le coefficient de corrélation donne donc une indication sur la validité du modèle (1) : y varie-t-elle bien de façon affine avecx? (Le signe deRn’a aucune importance, il est le même que celui dea.)

(2)

e i π = -1

BCPST1 Fénelon Nicolas Clatin 2009

certains droits réservés ne peut pas être vendu

Certains droits réservés: http://creativecommons.org/licenses/by-nc-sa/2.0/fr/

Disponible gratuitement: http://campus.claroline.com/claroline/course/index.php?cid=NC04

5.3 Les pièges de la régression linéaire.

La régression linéaire est un algorithme purement mathématique qui donne « bêtement » une réponse. Pour toute collection de points, le programme détermine une droite. C’est à l’expérimentateur d’être critique vis-à-vis de la réponse.Un bon alignement des points correspond à une valeur de |R| très proche de 1, par exemple 0,99 ou plus.

Ainsi, les points suivants ne sont pas du tout alignés (ça ressemble plutôt à une parabole). Néanmoins, la régression linéaire détermine une droite (en pointillé) ; maisR= 0,6, ce qui loin de1.

x y

Un mauvais coefficient de corrélation ne signifie pas que les points ne soient pas bien alignés. Par exemple, il arrive fréquemment qu’il y ait un point abérrant (erreur de mesure, usuellement l’expérimentateur avait la tête en l’air...). La machine donne au point abérrant le même poids que les autres, ce qui fait diminuerR. Si on met le point abérrant de côté,Rest nettement meilleur.

x y

x y

point abérrant

R = 0,98 R = 0,999

D’autre part, moins les points expérimentaux sont nombreux, moins significative est la régression linéaire.

Le cas extrême est celui de3 points, dont un est abérrant ; on l’impression que ce n’est pas du tout aligné, et on ne peut rien conclure car on ne sait généralement pas qu’un point est aberrant (on ne fait généralement pas exprès de rater une mesure !).

Inversement, si |R| est très proche de 1, il ne faut pas conclure que la loi affine soit vérifiée. Ainsi dans l’exemple suivant, les points sont en fait distribués sur une parabole très aplatie, ce qui fait que la droite trouvée par l’algorithme est effectivement très proche de chaque point. Le cerveau de l’expérimentateur est bien plus performant que la calculatrice, et « voit bien » queyne varie pas de façon affine avecx.La régression linéaire n’a pas de validité si elle n’est pas associée à un graphique.

x y

R = 0,98

BCPST1 – Nicolas Clatin – septembre 2009 – Outils mathématiques 5 – page 2

Références

Documents relatifs

En effet, s’il y avait deux points (ou plus) dans un carré, alors ces points seraient du même côté de la ligne rouge, donc tous les deux dans A ou dans B, et à une

d/ Déterminer algébriquement le couple des coordonnées du point d’intersection K entre (D)et(∆)..

[r]

[r]

2- Ajoute deux points alignés avec les autres.. 3- Trouve des points alignés et complète

En 1846, Auguste Bravais publia dans les Mémoires de l'Institut de France une commu- nication intitulée : « Analyse mathématique sur les probabili- tés des erreurs de situation d'un

Pour pouvoir obtenir des procédures de décision qui permettent d’accorder la même confiance à toutes les décisions, il faudra accepter parmi l’ensemble des décisions

On reprend les données Eval-Cours.stw. On veut estimer la variable Qual-Glob en utilisant comme prédicteurs les 5 autres variables. Déterminer l'équation