• Aucun résultat trouvé

l’intervalle [b, c] représente le noyau et l’intervalle [a, d] le support. Pour la distribution triangulaire

b = c et le noyau est réduit à un point (le mode). La somme de deux distributions de possibilité

π1 = (a, b, c, d) et π2 = (a, b, c, d) donne une distribution de possibilité (a + a, b+ b, c+ c, d+ d). D’une manière plus générale, la convolution sup-min possibiliste généralise le calcul par intervalles appliqué à chaque α–coupe des distributions de possibilité. Un point important à signaler est que le produit de convolution probabiliste est souvent appliqué à des variables aléatoires indépendantes. Le principe d’extension de Zadeh s’applique lui à des variables dites non interactives, ce qui d’une cer-taine manière correspond à considérer une forme de dépendance totale entre les variables. Le calcul possibiliste est donc plus pessimiste que le calcul probabiliste avec indépendance des variables, mais en conséquence aussi plus sûr dans les cas où l’indépendance n’est pas vérifiée.

4.6 Fusion d’informations en géophysique

Pour la plupart des observations géophysiques, l’imprécision et l’insuffisance des données néces-sitent des méthodes de fusion afin de répondre à la demande de résolution du modèle, ou d’améliorer la précision d’estimation d’une manière générale. Dans ce domaine, la modélisation permet une expli-cation des processus physiques avec l’aide d’une relation dérivée analytiquement ou numériquement entre le signal observé et les caractéristiques de la source. A partir des signaux observés, les carac-téristiques des sources en dessous de la surface de la Terre peuvent être déduites une fois que cette relation est déterminée. Ce genre de problème est appelé un problème inverse. Résoudre un problème inverse est appelé inversion (Tarantola and Valette, 1982 ; Tarantola, 2005). La fusion d’informations est souvent réalisée lors de l’inversion. Si l’on définit le vecteur de données R, et le vecteur du modèle

U, le model direct correspondant est écrit :

R = g(U ) (4.12)

où g est un opérateur qui relie le vecteur du modèle et le vecteur de données de façon explicite. De manière générale, dans l’inversion, une fonction de coût est défini pour quantifier la dispersion entre les observations et les prédictions du modèle. Un algorithme d’inversion recherche le modèle qui minimise la fonction de coût dans l’espace du modèle qui peut être délimité par les limites des paramètres du modèle. La solution pour un problème linéaire est normalement obtenue par les méthodes des moindres carrés, alors que la solution pour un problème non linéaire est généralement plus complexe et elle est déterminée en fonction du problème étudié.

4.6.1 Inversion linéaire

Quand g dans l’équation (4.12) constitue des équations linéaires, la relation peut s’écrire sous forme matricielle :

R = P U (4.13)

où P correspond à une matrice n × m qui relie le vecteur de données R (dimension : n) et le vecteur du modèle U (dimension : m).

Méthode des moindres carrés

La méthode des moindres carrés, qui consiste à obtenir un estimateur sans biais à variance mini-male, est une méthode très utilisée pour résoudre un problème inverse linéaire. Dans cette méthode, on cherche un modèle de telle sorte que l’erreur quadratique qui représente l’écart entre les obser-vations des données et le modèle soit minimale. Les solutions données par la méthode des moindres carrés ordinaire (OLS) (Rao, 1973 ; Davidson et al., 1993) et la méthode des moindres carrés généra-lisée (GLS) (Tarantola, 2005 ; Cornillon and Matzner-Lober, 2007) sont données dans les équations (4.14) et (4.15) respectivement. Dans la méthode OLS, la contribution de différents jeux de données est uniforme. De ce fait, elle s’adapte plus à la situation dans laquelle les fiabilités des données sont comparables entre elles. Dans la méthode GLS, les fiabilités variables d’un jeu de données à l’autre sont prises en compte et les différents jeux de données sont pondérés par leur incertitude associée dans l’inversion.

U = (PTP)−1PTR (4.14)

U = (PTΣ−1

R P)−1PTΣ−1

R R (4.15)

où ΣR est la matrice de variance-covariance de l’erreur de R.

Gestion de l’incertitude

Sur le principe de la propagation de l’incertitude dans le cas linéaire (cf. section 4.4.2), nous obtenons la matrice de variance-covariance de l’estimation de U avec les méthodes OLS et GLS respectivement dans les équations (4.16) et (4.17).

ΣU = (PTP)−1PTΣRP(PTP)−1 (4.16)

ΣU = (PTΣ−1R P)−1 (4.17)

4.6.2 Inversion non linéaire

En géophysique, des problèmes d’inversion non linéaire apparaissent notamment lors de l’estima-tion des paramètres d’un modèle géophysique tel qu’un modèle d’une faille activée lors d’un séisme, d’une chambre magmatique qui cause une éruption volcanique, etc. Dans ce cas, g dans l’équation (4.12) correspond à l’expression mathématique du modèle, ce qui constitue souvent un ensemble d’équations différentielles et/ou intégrales complexe.

4.6 Fusion d’informations en géophysique 51 Méthode

De façon générale, il y a 2 types de modèles directs : les modèles analytiques et les modèles nu-mériques. Un modèle analytique est un modèle mathématique, qui repose sur une mise en équation et sur la résolution exacte de problèmes physiques simplifiés. Contrairement au modèle analytique, un modèle numérique est un modèle approchant mieux le problème physique étudié grâce à l’outil informatique (cf. chapitre 3). Pour effectuer l’inversion non linéaire de ces modèles, il y a 2 grands types d’algorithmes dans la littérature : l’un est basé sur le calcul de la dérivée (l’approche variation-nelle) et l’autre est basé sur des méthodes de Monte Carlo (l’approche stochastique). Les méthodes basées sur le calcul de dérivée sont couramment utilisés lorsque la relation entre le modèle et les données sont simples. Toutefois, lorsque la complexité de cette relation augmente, les méthodes de Monte Carlo sont préférées.

Gestion de l’incertitude

Dans l’inversion non linéaire, à cause de la complexité et la non linéarité de la modélisation, l’incertitude ne peut pas être toujours propagée directement à travers les équations, et le cadre de la gestion de l’incertitude proposé par le GUM ne peut pas être toujours appliqué. Dans ce cas, les méthodes de Monte Carlo, dans lesquelles la non linéarité du modèle est prise en compte, fournissent une approche alternative pour déterminer les inceritudes (Efron and Tibshirani., 1994).

Les méthodes de Monte Carlo sont utilisées lorsque le problème est trop complexe pour qu’une résolution par voie purement mathématique soit envisageable ou le problème est trop volumineux (en particulier, contient un trop grand nombre de variables) pour que les techniques d’approximation numérique puissent conduire à un résultat précis dans un temps acceptable. Elles désignent toutes les méthodes visant à calculer une valeur numérique en utilisant des procédés aléatoires, c’est-à-dire des techniques probabilistes. Elles correspondent à un processus numérique plutôt qu’un processus analy-tique, d’où la nécessité d’une implémantaion informatique (Cox and Harris, 2006). Concrètement, les méthodes de Monte Carlo représentent une technique d’échantillonnage qui fournit une implémenta-tion de la propagaimplémenta-tion des distribuimplémenta-tions. Dans ces méthodes, chaque mesure indépendante en entrée est caractérisée par une distribution de probabilité. L’échantillonnage à partir de ces distributions est effectué par un générateur de nombre aléatoire. Puis, les distributions de probabilité des mesures en entrée sont propagées à travers le modèle pour obtenir les distributions des paramètres du modèle en sortie ou les distributions conjointes des sorties multivariées (Figure 4.3). Les distributions des paramètres du modèle en sortie sont fondamentales pour déterminer un ou tous les paramètres sta-tistiques associés aux paramètres estimés, par exemple, la moyenne, la valeur médiane, la variance ou un intervalle de confiance. De plus, l’effet de la corrélation entre les différents paramètres du modèle en sortie peut être observé à partir des distributions conjointes. La qualité de toutes ces informations dépend de la qualité du modèle et des mesures en entrée, ainsi que du nombre de tirages effectué (Cox and Harris, 2006).

Dans de nombreux travaux, les méthodes de Monte Carlo sont appliquées à l’estimation des paramètres des modèles géophysiques (Wright et al., 2004 ; Funning et al., 2005 ; Fukushima et al., 2005 ; Sudhaus and Jónsson, 2009 ; Atzori et al., 2009). Dans ces travaux, un grand nombre (entre 100 et 2500) de réalisations de bruits synthétiques, à partir desquelles se construisent les distributions des mesures en entrée, ont été effectuées. Ces bruits ont été simulés d’une manière aléatoire en fonction des caractéristiques prédéfinies et puis ajoutés aux mesures originales. Ensuite, autant nombre d’inversion

Figure 4.3. Illustration de la propagation de distribution par les méthodes de Monte Carlo. sont réalisées en utilisant ces mesures bruitées et les distributions des paramètres du modèle sont obtenues.