• Aucun résultat trouvé

Outils mathématiques du diagnostic

Dans le document The DART-Europe E-theses Portal (Page 119-124)

Problème inverse

4.4 Outils mathématiques du diagnostic

Dans cette section, nous allons présenter trois outils précieux qui permettent de diagnostiquer la qualité de l’identification. Ils permettent d’une part de dénombrer les coefficients identifiables, d’autre part d’évaluer la stabilité du système et la qualité de la résolution. Ces trois outils sont respectivement : le rang, le conditionnement et le résidu.

4.4.1 Rang

Notre problème inverse consiste à résoudre le système linéaire avec si possible autant d’équations que d’inconnues. Il est à noter que la solution ne peut pas être unique lorsqu’il n’y a pas assez d’équations.

Ceci signifie que le problème est mal posé. Par contre, le nombre d’équations, ou d’informations n’est pas simplement relié au nombre de mesures ou nombre d’équations, parce qu’une mesure peut probablement être considérée comme la combinaison des autres, cette mesure n’est donc pas une information utile pour la résolution. Pour les systèmes linéaires comme dans notre cas, le rang du système représente le nombre de degrés de liberté, c’est-à-dire le nombre d’informations utiles.

Le rang d’un système linéaire est le rang de sa matrice d’observation A, qui est aussi le nombre maximal de vecteurs lignes (ou colonnes) linéairement indépendants. Il peut être déterminé via la méthode de Gauss-Jordan [AM87]. Pour conclure, si le rang de la matrice Aest inférieur au nombre d’inconnues Nmax2 + 2Nmax(avecNmaxl’ordre maximal du développement), le problème est donc sous-déterminé. il possède alors plusieurs solutions possibles. Cet outil permet de vérifier le deuxième critère d’un problème bien posé : l’unicité. On peut l’appliquer de deux façons : soit il nous permet de vérifier que les mesures sont toutes indépendantes, soit à partir d’une série de mesures, il nous permet de déterminer le nombre d’inconnues identifiables.

4.4.2 Conditionnement

Le troisième critère d’un problème bien posé est la stabilité. Cela peut être estimée par un outil mathématique qui s’appelle le conditionnement, qui est notamment introduit comme un indicateur de la sensibilité de la solution aux perturbations des données [Tak13] [Gra14]. Un exemple sera donné par la suite pour rendre cette notion plus intuitive.

Reprenons notre système linéaire à résoudre (4.12) et supposons que la matrice d’observationAsoit inversible. Le problème peut être facilement résolu en calculant :

Q=A−1B (4.13)

On suppose maintenant que le systèmeAet la donnée B sont soumises à des perturbations ∆Aet

B. La perturbation ∆Qrésultante satisfait l’équation :

(A+ ∆A)(Q+ ∆Q) =B+ ∆B (4.14)

Après le développement, on obtient :

A·Q+ ∆A·Q+A·∆Q+ ∆A·∆Q=B+ ∆B (4.15) Supposons que le terme du deuxième ordre ∆A·∆Qsoit négligeable, on a donc :

A·∆Q= ∆B−∆A·Q

⇒ ∆Q=A−1(∆B−∆A·Q) (4.16)

Soitk.k2 le norme Euclidienne ou sa norme matricielle induite, définie comme : kAk2=sup{kA·xk:x∈Kn avec kxk2= 1}

=σmax(A) (4.17)

avecKl’ensemble des réels ou complexes.σ(A) représente le vecteur des valeurs singulières deA. Ainsi, calculer la norme euclidienne d’une matrice revient à chercher sa valeur singulière maximale. Puisque A est inversible,B6= 0 implique queQ6= 0, on a donc :

k∆Qk2 kQk2

≤kA−1k2·

k∆Ak2+k∆Bk2 kQk2

(4.18) OrB=A·QimpliquekBk2≤kAk2· kQk2, on a donc :

1 kQk2

≤kAk2

kBk2 (4.19)

En combinant les équations (4.18) et (4.19), on peut obtenir : k∆Qk2

kQk2 ≤kAk2· kA−1k2·

k∆Ak2

kAk2 +k∆Bk2

kBk2

(4.20) Cette équation relie l’erreur relative de la solution et les erreurs relatives des deux entrées : le modèle Aet la donnéeB. Autrement dit, le facteurkAk2· kA−1k2représente l’amplification des perturbations

Aet ∆BsurA etB, en normes relatives. Ce facteur est donc défini comme le conditionnement de la matrice :

cond(A) =kAk2· kA−1k2=σmax(A)

σmin(A) (4.21)

L’importance de ce coefficient est évident. Quand il est trop grand, d’une part cela signifie que la valeur de sortie du système (les coefficients harmoniques) pourrait énormément varier avec un petit changement dans les arguments d’entrée (tels que les mesures). D’autre part, cela signifie que parmi toutes les mesures, certaines ne portent aucune information dans les calculs. Dans ces cas, le système n’est donc pas stable et le problème n’est pas bien posé. Quelques propriétés générales du conditionnement sont données ci-dessous :

Pour n’importe quelle matriceAinversible, on a : 1. cond(A)≥1

2. cond(αA) =cond(A) pour toutα∈R, α6= 0

3. cond(A−1) =cond(A)

4. SoientA, Bdeux matrices inversibles de la même dimension, alors cond(A·B)≤cond(Acond(B)

En fait, le conditionnement nous permet non seulement de vérifier si le système est stable, mais aussi de choisir les meilleurs points de mesures. Ceci sera détaillé après.

4.4.3 Notions de statistiques

Une expression chinoise connue dit : "梦想总是美好的, 现实总是残酷的 (L’idéal est beau, la réalité est toujours cruelle)". En fait, aucune information expérimentale est certaine. Afin d’analyser ces mesures incertaines, les notions de statistiques doivent être introduites. La statistique est l’étude des variations observables, elle constitue également l’ensemble des méthodes permettant de réunir les données chiffrées sur les grands ensembles, puis à les analyser et les interpréter [Jou13], [Bac10]. Des études approfondies en statistiques ont été faites depuis longtemps et l’objectif de cette section est juste rappeler les notions essentielles en statistiques qui sont utiles dans ce travail, telles que la moyenne, l’écart-type, l’intervalle de confiance , etc.

4.4.3.1 Moyenne et écart-type

Supposons queN mesures indépendantes sont effectuées sur une variable quantitativexet on observe : x1, x2, x3, ..., xN. La moyenne de cette série de mesures, plus précisément, la moyenne arithmétique de cette série de mesure est notée parx. Elle est définie comme :

x= x1+x2+x3+...+xN

Il existe aussi d’autres types de moyennes, telles que la moyenne quadratique et la moyenne géomé-trique, qui ne seront pas discutées dans ce document. Ainsi, dans ce document, la « moyenne » représente la moyenne arithmétique.

La variance de la variable quantitativex, noté parV ar(x), est définie comme la moyenne des carrés des écarts à la moyenne :

Un autre type d’estimateur couramment utilisé pour la variance est :

V ar(x) = 1

Le facteur (N −1) vient du fait que la formule utilisexet qu’il n’est pas possible d’estimer l’écart-type d’une distribution à partir d’une seule mesure. En probabilités, il est commun de relier la moyenne (appelé aussi l’espérance mathématique) et la variance avec la fonction de masse, qui donne la probabilité d’un résultat élémentaire d’une expérience. On a :

f(x) représente la fonction de masse de la variablex. Il faut noter qu’elle se distingue de la densité

de probabilité en ceci que les densités de probabilité ne sont définies que pour des variables aléatoires absolument continues, et que c’est leur intégrale sur un domaine qui a valeur de probabilité.

L’écart-type de la variablex, noté parσx, est défini comme la racine carrée de sa variance : σx=p

V ar(x) (4.26)

Pourquoi la moyenne et l’écart-type sont-ils deux outils extrêmement intéressants dans ces travaux ? Comme déjà expliqué plus haut, les mesures ne sont pas toujours identiques d’une fois à l’autre, même si les conditions de mesures semblent identiques. Pour prendre en compte cette incertitude, on écrit :

xi=xe+δx (4.27)

avec :

xi : valeur observée ;

xe: valeur exacte (inconnue) ;

δx: incertitude de mesure.

En pratique, la valeur exacte d’une grandeur n’est pas connue. Il est habituel de prendre la moyenne x comme estimation de xe. Ainsi, la valeur de xse trouve « probablement » dans l’intervalle allant de xδxà x+δx. L’écriture traditionnelle rapportant la mesure d’une grandeur physiquexest :

x=x±δx (4.28)

L’incertitudeδx sera par la suite reliée à l’écart-typeσx.

4.4.3.2 Loi normale et intervalle de confiance

[Gup12] dit que « In a metrology laboratory, measurements are carried out assuming that measuring instruments are unbiased ; hence all measured values derived from the observations of the measuring instrument belong to a normal distribution »1. Le théorème de la limite centrale montre que toute somme de variables aléatoires indépendantes et identiquement distribuées tend vers une certaine variable aléatoire ; sous la condition que le nombre d’échantillons est suffisamment important, la loi de probabilité associée converge vers une loi normale, appelée aussi la loi gaussienne.

Intuitivement, la loi normale est la loi de base permettant d’interpréter statistiquement les résultats obtenus à partir des mesures. Dans ce travail, on fera souvent l’hypothèse que toutes les variables à mesurer possèdent une loi normale.

La Figure 4.5 donne la densité de probabilité de la loi normale. Évidement, sa répartition dépend de l’espérancexet l’écart-typeσ.

En effet, la densité de probabilité de la loi normale est donnée par :

f(x) = 1

√2πσ2exp

−(xx)2 2σ2

(4.29) Lorsquexetσ2= 1, on parle de loi normale standard. L’intérêt principal de la loi normale est qu’elle permet une formulation matricielle simple dans la résolution du problème, qui permet de largement réduire les calculs. Il permet d’extraire des renseignements significatifs sur les hypothèses, mesures et paramètres estimés. En outre, la loi normale nous permet de déterminer les « intervalles de confiance ».

1. Dans un laboratoire de métrologie, les mesures sont effectuées en supposant que les instruments de mesure ne sont pas biaisés ; par conséquent, toutes les valeurs mesurées dérivées des observations de l’instrument de mesure appartiennent à une distribution normale

−2 −1 0 1 2 3 4 5 6 0

0.1 0.2 0.3 0.4

x= 0, σ= 1

x= 2, σ= 2

Figure

4.5 – Densité de probabilité de la loi normale

Un « intervalle de confiance » est un type d’estimation d’intervalle qui est calculé à partir des données observées. Les intervalles de confiance consistent en une gamme de valeurs (intervalle) qui agissent comme de bonnes estimations du paramètre observé. Le niveau de confiance représente la probabilité que l’inter-valle contienne la valeur réelle. En effet, l’interl’inter-valle calculé à partir d’un échantillon particulier n’inclut pas nécessairement la valeur réelle du paramètre. Comme les données observées sont des échantillons aléatoires autour de la valeur réelle, l’intervalle de confiance obtenu à partir des données est également aléatoire. Concernant la loi normale dans notre cas, on utilise souvent 3 intervalles caractéristiques, pré-sentés sur la Figure 4.6.

0 . 1 0 . 2

Densité de probabilité 68%

x x + σ x + 2 σ x + 3 σ xσ

x − 2 σ x − 3 σ

95%

95% 99 . 7%

99 . 7%

Figure

4.6 – Intervalles de confiance de la loi normale

On a :

P(xσxx+σ) = 0.68 ;

P(x−2σxx+ 2σ) = 0.95 ;

P(x−3σxx+ 3σ) = 0.997 ;

Ces intervalles de confiance nous permettent aussi de formuler la règle de décision pour une nouvelle mesure, qui suit la même loi que les précédentes. Si la mesure est dans l’intervalle de confiance, elle peut être considérée comme raisonnable, sinon elle doit être discutée ou même rejetée.

4.4.4 Résidu

Un autre indicateur de qualité de la résolution du problème inverse linéaire est le résidu, qui représente la différence entre les valeurs estimées et les observations. Comme déjà mentionné, toutes les mesures possèdent une incertitude. Dans ce travail, on suppose que les distributions de ces incertitudes sont symétriques, plus précisément suivent une loi normale et chaque mesure est indépendante des autres.

Pour notre problème, défini par l’équation (4.12), le résiduRest défini comme :

R=BA·Qb (4.30)

avec Qb les coefficients harmoniques calculés via la résolution du problème inverse. Dans le cas idéal et avec un nombre de mesures infini, la moyenne du résiduR est égale à zéro.

Le résidu est un outil très important dans ces travaux pour deux raisons principales. D’un côté, il nous permet d’optimiser le modèle. La moyenne ou l’écart-type du résidu peuvent être calculés, caractérisant la qualité de résolution du problème. Si la moyenne est très loin de zéro ou l’écart-type trop grand, ceci montre que le modèle est mal choisi, il faut probablement augmenter l’ordre du développement. Les détails pour choisir un ordre optimal du développement seront présentés dans la section suivante. D’autre part, cet outil nous permet de détecter les mesures aberrantes. Si le résidu d’une mesure est beaucoup plus important que les autres, on peut en déduire que cette mesure est très probablement aberrante et qu’elle doit être rejetée.

Dans le document The DART-Europe E-theses Portal (Page 119-124)

Documents relatifs