• Aucun résultat trouvé

Chap2 Regression linéaire et VC (Partie III)

N/A
N/A
Protected

Academic year: 2022

Partager "Chap2 Regression linéaire et VC (Partie III)"

Copied!
17
0
0

Texte intégral

(1)

Master 2 Recherche SES-IES Analyse de données

Ana Karina Fermin

Université Paris Nanterre

http://fermin.perso.math.cnrs.fr/

(2)

1 Régression linéaire simple

2 Modèles

3 Sélection de modèles

(3)

Modèle de régression

On dispose den observations(x1,y1),(x2,y2), . . . ,(xn,yn) du couple(X,Y). On suppose que

yi =f?(xi) +εi pour tout i =1, . . . ,n

les xi son des valeurs connues non aléatoires f? est une fonction inconnue

εi sont des réalisations inconnues d’une variable aléatoire.

Pour chaque individui, la variable aléatoireεi représente l’erreur commise. Généralement pour étudier le modèle "le statisticien"

formule des hypothèses sur la loi des erreursεi.

Fermin Régression linéaire Chap. Régression 3 / 17

(4)

Objectif

On souhaite “expliquer” une variableY à partir deX.

Nous allons chercher une fonctionf telle que Y ≈f(X).

Pour définir≈il faut donner un critère quantifiant la qualité de l’ajustement de la fonctionf aux données:

(Y −f(X))2

La vraie fonctionf? minimise en moyenne cette erreur... mais elle est inconnue!

(5)

En pratique

On va choisirf dans une classe de fonctionsS.

On va minimiser une erreur moyennesur les données:

fb=argmin

f∈S

1 n

n

X

i=1

(f(xi)−yi)2

La régression linéaire correspond àS ={x7→xtβ}.

Attention:

Il faut choisir S (le modèle) fb6=f?

On est même pas sûr que (Y −fb(X))2 (ou (f?(X)−fb(X)2) soit petit en moyenne...

Fermin Régression linéaire Chap. Régression 5 / 17

(6)

Exemple : Pollution l’ozone X : température à midi

Y : concentration maximale en ozone

mesurés en un lieu donné et une journée donnée pendantn jours.

40 80 120 160

15 20 25 30

T12

maxO3

(7)

Régression polynomiale

f est choisie dans une classe des fonctions S polynomiales Modèles obtenus par des polynôme du degré 3, 4, 5, 6 et 7 Pb : Choisir "le bon" degré !

40 80 120 160

15 20 25 30

T12

maxO3

Modèle polynomial: fβ(Xi) =Pd l=0βlXli Linéaire enβ!

IciX0i = (1,Xi, . . . ,Xdi)t

Problème d’estimation de MC facile!

Fermin Régression linéaire Chap. Régression 7 / 17

(8)

Exemple Jouet

Nous commencerons avec un exemple artificiel ! Nous voulons estimer les valeurs de

f?(x) =1−x+2x2−0.8x3+0.6x4−x5

(9)

Modélisation

Design fixé : xk =k/n, with 16k 6n

Nous observons les valeurs def? dansxk contaminées par un bruit Gaussien

Yk =f?(k/n) +k

Ici, k sont des réalisations i.i.d. centrées d’une v.a.

Gaussienne of variance σ2.

Fermin Régression linéaire Chap. Régression 9 / 17

(10)

Quel degré?

(11)

Compromis Biais-Variance

Cadre général:

F : Famille de toutes les fonctions Meilleur solution dansF: f Sous-FamilleS ⊂ F de functions Meilleure solution dansS: fS

EstiméeS: fbS obtenue par moindre carré.

Erreur d’approximation et erreur d’estimation (Biais/Variance)

kfbS−f?k2= kfS−f?k2

| {z }

Erreur d’approximation

+ kfbS−fSk2

| {z }

Erreur d’estimation

L’erreur d’approximation peut être grande si le modèleS n’est pas adapté.

L’erreur d’estimation est grande lorsque le modèle est complexe.

Fermin Régression linéaire Chap. Régression 11 / 17

(12)
(13)

Quel degré?

Fermin Régression linéaire Chap. Régression 13 / 17

(14)

Sur-Apprentissage

(15)

Validation croisée

Idée très simple: conserve une partie pour vérifier l’erreur.

Suffisent pour éviter un sur-apprentissage!

Cross Validation

Utiliser VV−1n observations pour apprendre et V1n pour vérifier!

Variantes Classiques : Leave One Out,

V-fold validation croisée.

Souvent on choisi: V =5 ouV =10!

Fermin Régression linéaire Chap. Régression 15 / 17

(16)

Sur-apprentissage / sous-apprentissage

Différents comportements pour des complexités de modèles différentes

Compromis Bias-variance ⇐⇒ eviter sur-app. andsous-app.

(17)

fb

mb : régression avec un polynôme de degré 4

Fermin Régression linéaire Chap. Régression 17 / 17

Références

Documents relatifs

Cet exemple utilisé par DUBBELMAN [7] paraît idéal pour illustrer l'avantage des résidus BLUF dans certains cas. En effet la puissance du test utilisant ces résidus est grande

[r]

[r]

Ajuster un modèle pour expliquer Y en fonction de X Prédire les valeurs de Y pour de nouvelles valeurs de X.. Bibliographie : Pierre-André Cornillon,

Ajuster un modèle pour prédire Y en fonction de X Prédire les valeurs de Y pour de nouvelles valeurs de X....

[r]

[r]

[r]