• Aucun résultat trouvé

5.2 Validation de modèle

5.2.5 Approche par régression linéaire

Idée générale

FIG. 5.18 – Principe de la méthode

Le principe de la méthode développée ici est de «déplier» la surface, c’est-à-dire de considérer les nouveaux points de R3(Figure5.18) :

yi   αi βi di  

et d’étudier la surface que forment les yi. Si les points xi ne sont pas bruités et que l’ajustement du

148 CHAPITRE 5. SÉLECTION ET VALIDATION DE MODÈLE

En particulier, si l’on ajuste un modèle du type d = P(α,β) où P est un polynôme, les coefficients

du polynôme P sont tous nuls (dans le cas idéal que nous venons de décrire). Dans le cas où les points de départ sont bruités, les coefficients trouvés ne sont plus tout à fait nuls, mais on peut tester l’hypothèse de cette nullité du point de vue statistique.

L’avantage est ici que l’ajustement d’une telle surface entre dans le cadre d’une régression linéaire (même si le polynôme P n’est pas linéaire), et donc que l’on peut utiliser les outils classiques de régression et d’analyse de variance pour le test de nullité des coefficients.

Etude de modèles emboîtés en régression linéaire

Le modèle de régression linéaire classique (non-contraint) s’écrit

Y = X b + u, avec u ∼

N

(0,σ2IN)

où Y ∈ RN, X ∈

M

N,p(R), b ∈ Rpet u ∈ RN. Comme cela a été dit au5.1, la solution du problème de

moindres carrés s’écrit :

ˆb = (XTX )−1XTY

On considère maintenant une contrainte affine sur les coefficients de b :

Cb = c

où C ∈

M

r,p(R), b ∈ Rp, et c ∈ Rravec 0 < r < p, et où C est de plein rang lignes. Ce type de contrainte

est intéressante en ce qu’elle fournit un cadre assez général pour définir des modèles emboîtés. La solution du problème de moindres carrés contraint par la condition affine sur b s’écrit [Del01, p.42] :

ˆ

b0= ˆb + (XTX )−1CT[C(XTX )−1CT]−1(c −C ˆb) Dans notre cas, on a :

X =   f(α1,β1)T · · · f(αNN)T   et Y =   d1 · · · dN  

La régression consiste ensuite à calculer la surface d = f (α,β) polynomiale de moindres carrés (an-

nexeC).

Test sur les coefficients estimés

Le test que l’on souhaite effectuer sur les coefficients du polynôme obtenu est essentiellement un test de nullité de tout ou partie des coefficients. On souhaite donc tester l’hypothèse H0: Cb = c contre l’hypothèse alternative Ha: Cb 6= c [ER93, p.132,136]. Sous l’hypothèse H0, la statistique F de Fisher suit une loi connue :

F =k ˆY − ˆY0k 2

r ˆσ2 ∼ Fr,N−p

où ˆY = X ˆb est la prédiction sous l’hypothèse Ha(modèle non-contraint), ˆY0= X ˆb0 la prédiction sous l’hypothèse H0 (modèle contraint), ˆσ2 est l’estimation de la variance σ2 sous Ha, F.,. est la loi de

5.2. VALIDATION DE MODÈLE 149

La statistique F de Fisher s’écrit également (par Pythagore) :

F = k ˆY − ˆY0k 2/r k ˆuk2/(N − p) = (k ˆu0k2− k ˆuk2)/r k ˆuk2/(N − p) (5.5) où ˆu = Y − ˆY et ˆu0= Y − ˆY0. Remarque

La condition sur r, p, N s’écrit : 0 < r < p < N. En effet, si N = p, on ne peut pas tester la qualité de l’ajustement puisque le modèle peut parfaitement ajuster les données. Application au test de nullité de coefficients

Supposons que l’on souhaite tester la nullité de r coefficients bi, i appartenant à un sous-ensemble

I de {1, . . . , p}. On prend alors comme matrice C la matrice obtenue en retranchant à la matrice identité

Iples lignes ne correspondant pas aux éléments i de I, et comme vecteur c le vecteur nul de Rr.

Pour nos applications, si l’on approche Y par une fonction polynomiale, on veut tester si tous les coefficients sauf le terme constant sont nuls. Dans ce cas, r = p − 1.

Le concept de p-valeur

Au lieu de donner un niveau de testsαet de rendre une valeur booléenne, lorsque l’on connaît la loi de la statistique, on peut rendre la p-valeur : c’est le niveau à partir duquel la décision change. Plus précisément, la p-valeur du test est la probabilité, si H0est la bonne hypothèse, d’avoir observé une valeur pour X qui dépasse le x observé. Au niveau décisionnel, on rejette donc H0lorsque la p-valeur est faible [Car00, p.28]. Le calcul de la p-valeur est le suivant :

Q(x) = P(X ≥ x) = 1 − F(x)

où F est la fonction de répartition de la variable X .

En l’occurrence, la fonction de répartition d’une loi de Fisher-Snedecor s’écrit :

Fn1,n2(x) = 1 − I n2

n2+n1x(n2/2, n1/2)

définie pour n1, n2> 0 et x ≥ 0, où I.(., .) est la fonction beta incomplète (cf. fonction betai dans

[PTVF92b, §6.4.11, p.229]). Ix(a, b) = Bx(a, b) B(a, b) = 1 B(a, b) Z x 0 ta−1(1 − t)b−1dt (pour a, b < 0 et 0 ≤ x ≤ 1) où B(z, w) = Z 1 0 tz−1(1 − t)w−1dt =Γ(z)γ(w) Γ(z + w) où Γ(z) = Z 0 tz−1e−tdt

150 CHAPITRE 5. SÉLECTION ET VALIDATION DE MODÈLE

Retour à notre cas

Lorsque l’on veut tester s’il y a une «tendance», c’est-à-dire une dépendance entre d et (α,β), on

prend pour hypothèses :

H0: surface d = f (α,β) polynomiale où tous les termes sont nuls sauf le terme constant. La surface des moindres carrés est donc dans ce cas simplement égale au polynôme constant égal à la moyenne des di.

Ha: surface d = f (α,β) polynomiale non contrainte. On ajuste un polynôme z = P(x, y) sur les points

yi= (α,β, d)T, par une méthode de moindres carrés linéaire (annexeC).

On évalue ensuite : F =(N − p) (p − 1)N i=1[P(αii) − P0(αii)]2 ∑N i=1[di− P(αii)]2 (5.6) et la p-valeur retournée par le test est égale à :

P = 1 − fp−1,N−p(F)

où fp−1,N−p(.) est le quantile de la loi de Fisher Fp−1,N−p. Dans ce test, on choisit P0(αii) = ¯d

(fonction constante égale à la moyenne des résidus).

On peut remarquer que le problème s’exprime ici comme un problème de sélection de modèle (parmi les surfaces de régression), telle que celui traité au §5.1. Le test présenté ici fait intervenir les mêmes quantités que le test de sélection présenté au5.1(ceci est visible dans l’équation5.5), mais est plus général et présente l’avantage de fournir une valeur de probabilité.

Une question cruciale dans ce test réside dans le choix du polynôme, et en particulier du nombre de paramètres p et de son degré. Or, ceci dépend a priori de la complexité du relief formé par les résidus. Un degré de polynôme donné peut s’avérer suffisant ou même trop élevé avec certaines situations et pas assez dans d’autres cas. La complexité de la surface formée par les résidus dépend à la fois du modèle et du nuage de points. Il est donc délicat de choisir un polynôme adéquat. Ce point est lié à la qualité d’approximation, problème abordé dans les limitations ci dessous.

Résultats

Reprenons l’exemple de la figure5.10, page137. Les figures5.19et5.20montrent respectivement pour la scène «SynthCone1» et la scène «SynthCyl2», les résidus issus de l’ajustement d’un cylindre, et la surface polynomiale ajustée sur les résidus en fonction des paramètres de position (avec un polynôme de degré 4 × 4).

Les valeurs de F et les P-valeurs correspondantes sont reportées dans le tableau suivant : SynthCyl2 SynthCone1

N 1332 1332

F 0.47 308.9

P-valeur 0.948 10−30

Ainsi, sur cet exemple, on voit que le test distingue très clairement la situation où le modèle est satisfaisant de celle ou il ne l’est pas.

5.2. VALIDATION DE MODÈLE 151

FIG. 5.19 – Ajustement de cylindre sur la scène «SynthCone1» et surface de régression des résidus.

FIG. 5.20 – Ajustement de cylindre sur la scène «SynthCyl2» et surface de régression des résidus.

Limitations

Il se pose un problème d’approximation de la surface de régression. Une surface z = f (x, y) poly- nomiale ne s’adapte pas à tous les types de reliefs. Par exemple, sur l’exemple de la figure5.21, le relief est tel que la surface de régression est restée plane. La conséquence est que le dénominateur du ratio est très grand, et donc que la p-valeur rendue est très proche de 1, ce qui indique que le modèle est satisfaisant (ce qui n’est pas le cas !). Il en est de même pour l’exemple des figures 5.22et5.23,

FIG. 5.21 – Ajustement de cône sur la scène «angle» et surface de régression des résidus.

présentant une partie de tuyauterie avec une bride (voir chapitre3). Ces exemples illustrent des si- tuations où le relief des résidus en fonction de la position est trop complexe pour le type de surface polynomiale ajusté et n’est donc pas bien approché. A l’inverse, il existe également des situations de sur-ajustement, où la surface n’approche pas bien les résidus car le degré du polynôme est trop élevé. Une autre limitation est liée à des problèmes de topologie : la méthode présentée suppose implici- tement que l’espace de paramètres construit permet de «déplier» la surface correctement. Or, ce n’est pas tout le temps le cas : par exemple, si le nuage est un ensemble de points répartis tout autour d’une sphère et si l’on ajuste un cylindre sur ce nuage, la projection des points dans l’espace de paramètres

152 CHAPITRE 5. SÉLECTION ET VALIDATION DE MODÈLE

FIG. 5.22 – Scène «bride1» comportant une portion de tuyau avec une bride, vue de face et de côté

FIG. 5.23 – Ajustement de cylindre sur la scène «bride1» et surface de régression des résidus.

ne peut pas être topologiquement correcte (Figure5.24). En effet, on observe un repliement de sur- face. Ainsi, on n’obtient pas vraiment un relief puisque plusieurs altitudes sont présentes à la même

FIG. 5.24 – Problème de topologie. Sphère ajustée sur des points se trouvant sur un cylindre (à gauche), résidus en fonction des paramètres des deux angles des coordonnées sphériques (au centre), surface de régression ajustée sur les résidus dans cet espace (à droite).

position. Remarquons que les méthodes développées dans [BJ88] et [Fit97] ne s’affranchissent pas non plus de ce problème.

Aussi avons-nous tenté de développer une méthode qui s’affranchisse de ces deux limitations : c’est l’objet de la section suivante.