• Aucun résultat trouvé

3. Mod´ elisation num´ erique directe et inverse 31

3.2.2 M´ ethode des moindres carr´ es

3.2.2.4 Estimation des incertitudes

Dans le cas surd´etermin´e, on peut relier la variance de l’erreur a posteriori aux r´esidus, en faisant quelques approximations. Pla¸cons-nous dans le cas lin´eaire et donnons le mˆeme poids `a toutes les observations. Les incertitudes dans le cas non-lin´eaire sont calcul´ees sur la derni`ere it´eration. Le cas pond´er´e se d´eduit par changement de variables.

D´efinissons tout d’abord la matrice H comme :

(3.44) H = A(A>A)−1A>= AAinv.

Comme H2 = H>= H, H est un projecteur orthogonal sur un sous-espace de dimension

n (< p). Comme Aˆx = Hb, la concentration du mod`ele apr`es inversion est la projection des observations sur ce sous-espace tandis que le vecteur des r´esidus est la projection sur le sous-espace compl´ementaire, de dimension p − n. Quelques transformations alg´ebriques simples donnent :

HA = A(A>A)−1A>A = A (3.45)

AinvA>inv = (A>A)−1A>A(A>A)−1 = (A>A)−1. (3.46)

Les incertitudes sur x r´esultant des incertitudes sur les observations (b) et le mod`ele (A) doivent maintenant ˆetre ´evalu´ees. Dans la m´ethode des moindres carr´es ordinaires, la variance d’erreur a priori, h(Ax − b)(Ax − b)>i (o`u le symbole h i repr´esente l’esp´erance d’une grandeur), est consid´er´ee comme une matrice diagonale constante :

h(Ax − b)(Ax − b)>i = σ2Ip. La variance de l’erreur faite par l’estimateur ˆx est :

Vxx = h(x − ˆx)(x − ˆx)>i

= h(AinvAx − Ainvb)(AinvAx − Ainvb)>i = Ainvh(Ax − b)(Ax − b)>iAinv>

= σ2AinvAinv>. (3.47)

σ2 est reli´e `a la moyenne du carr´e des r´esidus vη de la mani`ere suivante : vη = h(Aˆx − b)>(Aˆx − b)i

= h(Hb − b)>(Hb − b)i

Or, d’apr`es l’´equation (3.45), HA − A = 0. De plus, Ip− H est un projecteur orthogonal sur un espace de dimension p − n, d’o`u (Ip− H)>(Ip− H) = Ip− H. On a donc :

vη = h(Ax − b)>(Ip− H)(Ax − b)i = σ2p − n

p .

(3.48)

Alors, en utilisant les ´equations (3.46), (3.47) and (3.48), nous pouvons calculer Vxx :

(3.49) Vxx = p

p − nvη(A

>A)−1.

Les termes diagonaux de Vxx sont les carr´es des incertitudes sur x tandis que les autres termes sont les covariances, qui indiquent les corr´elations a posteriori entre les inconnues. Une corr´elation a posteriori ´elev´ee entre deux inconnues signifie que leurs effets sur les sorties du mod`ele se ressemblent. Elle est g´en´eralement associ´ee `a des erreurs a posteriori ´

elev´ees pour les deux inconnues, qui ne peuvent alors pas ˆetre contraintes en mˆeme temps. On constate que plus le mod`ele reproduit bien les observations (vη faible) mais ´egalement plus il y a d’observations (car les coefficients de (A>A)−1 tendent `a diminuer), plus l’incertitude sur ˆx est faible. Dans le cas o`u n = p, la formule de l’incertitude a posteriori est inapplicable puisqu’elle implique une division de 0 (vη) par 0 (p − n). Cette formule est d’autant moins applicable dans le cas sous-d´etermin´e, mais elle est adapt´ee quand p est tr`es sup´erieure `a n et que les r´esidus se confondent presque avec les erreurs a priori.

Les hypoth`eses du th´eor`eme de Gauss-Markov doivent absolument ˆetre v´erifi´ees pour pouvoir se fier `a ces estimations de l’incertitude. La violation de chacune de ces hypoth`eses rajoute une forme d’erreur suppl´ementaire et rend l’interpr´etation de Vxx plus difficile.

Si l’esp´erance de l’erreur a priori n’est pas nulle, cela induit un biais important. Si, par exemple, dans un cas lin´eaire, toutes les observations sont biais´ees et donnent des r´esultats deux fois sup´erieures `a la r´ealit´e, les inconnues seront aussi multipli´ees par deux, sans aucun effet sur les r´esidus et donc sur l’estimation de l’erreur a posteriori. Toutefois, dans les deux probl`emes qui nous int´eressent, l’erreur sur les observations est rarement sup´erieure `a 10% et n’a aucune raison d’ˆetre syst´ematiquement de mˆeme signe. Le mˆeme probl`eme se pose pour le mod`ele. Dans le cas du mod`ele de 228Ra, la conservation de la masse limite la possibilit´e d’un tel biais : un flux donn´e de 228Ra correspond, `a l’´etat stationnaire, `a une quantit´e donn´ee de 228Ra dans l’oc´ean. Si le mod`ele a trop de 228Ra a un endroit, il en manquera ailleurs. Il n’en va pas de mˆeme pour le mod`ele de 234Th, car n’importe quel biais sur le champ de particules ou sur leur vitesse entraˆıne un biais dans l’estimation des coefficients de partage que la m´ethode inverse ne peut ni estimer ni corriger.

Si la variance de l’erreur a priori n’est pas constante, alors certaines observations souf-frant de fortes incertitudes peuvent faire d´evier la solution. Les observations de 228Ra

respectent particuli`erement peu cette condition, comme vu pr´ec´edemment. Si la variance en chaque point est connue ou si l’on dispose au moins d’une meilleure approximation qu’une variance constante, alors il est possible de pond´erer les observations pour se rap-procher de l’hypoth`ese d’homosc´edasticit´e. Comme les r´esidus sont une projection des erreurs a priori, la structure des premiers contient une information sur celle des derniers et permet d’identifier certaines violations de l’homosc´edasticit´e. Ainsi, c’est parce que les r´esidus du mod`ele de 228Ra ´etaient plus ´elev´es l`a o`u les activit´es ´etaient ´elev´ees qu’il a ´

et´e d´ecid´e de recourir `a des fonctions de coˆut pond´er´ees.

Si les erreurs a priori sont corr´el´ees, cela signifie que certaines observations (ou leurs ´

equivalents dans le mod`ele) sont redondantes avec d’autres, et contiennent donc moins

d’information qu’on ne le suppose en n´egligeant les corr´elations. Par exemple, les erreurs faites par le mod`ele en deux points d’observation tr`es proches dans le temps et l’espace sont tr`es corr´el´ees : le mod`ele aura une activit´e trop forte ou trop faible dans toute la r´egion. Cela signifie qu’il est impossible, comme on s’en doute, de contraindre les inconnues en prenant une infinit´e de mesures au mˆeme endroit ! Quand la structure des r´esidus dans une r´egion ne ressemble pas `a du bruit mais que les points proches ont des r´esidus de mˆeme signe, on peut suspecter qu’il y a une corr´elation a priori, et donc que les incertitudes a posteriori sont sous-´evalu´ees.