HAL Id: inria-00494690
https://hal.inria.fr/inria-00494690
Submitted on 24 Jun 2010HAL is a multi-disciplinary open access
archive for the deposit and dissemination of sci-entific research documents, whether they are pub-lished or not. The documents may come from
L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de
Méthodes non linéaires pour des problèmes statistiques
inverses
Pierre Barbillon, Gilles Celeux, Agnès Grimaud, Yannick Lefebvre, Etienne de
Rocquigny
To cite this version:
Pierre Barbillon, Gilles Celeux, Agnès Grimaud, Yannick Lefebvre, Etienne de Rocquigny. Méthodes non linéaires pour des problèmes statistiques inverses. 42èmes Journées de Statistique, 2010, Marseille, France, France. �inria-00494690�
M´
ethodes non lin´
eaires pour des probl`
emes
statistiques inverses
Pierre Barbillon1 & Gilles Celeux1 & Agn`es Grimaud2 & Yannick Lefebvre3 & Etienne
De Rocquigny4
1 Universit´e Paris-sud 11, Laboratoire de Math´ematiques d’Orsay, Orsay Cedex, F-91405
INRIA Saclay, projet select
2 Institut de Math´ematiques de Luminy Case 907 163 Avenue de Luminy 13288
Marseille cedex 9
3 Schlumberger, 1 Cour du Triangle, 92936 La Defense Cedex 4 Ecole Centrale Paris, Grande Voie des Vignes, 92290 Chˆatenay Malabry
R´
esum´
e
Dans le cadre du traitement des incertitudes ´etudi´e ici, la variabilit´e intrins`eque des entr´ees d’un mod`ele physique est mod´elis´ee par une loi de probabilit´e multivari´ee. L’objectif est d’identifier cette loi de probabilit´e `a partir d’observations des sorties du mod`ele. Afin de se limiter `a un nombre d’appels raisonnable au code de calcul (souvent coˆuteux) du mod`ele physique dans l’algorithme d’inversion, une m´ethodologie d’approximation non lin´eaire faisant intervenir le krigeage et un algorithme EM stochastique est pr´esent´ee. Elle est compar´ee `a une m´ethode utilisant une approximation lin´eaire it´erative sur la base de jeux de donn´ees simul´ees provenant d’un mod`ele de crues simplifi´e mais r´ealiste. Les cas o`u cette approche non lin´eaire est pr´ef´erable seront mis en lumi`ere.
Mots cl´es : Mod´elisation des incertitudes, Approximation non lin´eaire, Krigeage, Algo-rithme stochastique.
Abstract
In the uncertainty treatment framework considered in this paper, the intrinsic variability of the inputs of a physical simulation model is modelled by a multivariate probability distribution. The objective is to identify this probability distribution - the dispersion of which is independent of the sample size since intrinsic variability is at stake - based on observation of some model outputs. Moreover, in order to limit to a reasonable level the number of (usually burdensome) physical model runs inside the inversion algorithm, a non linear approximation methodology making use of Kriging and stochastic EM algorithm is presented. It is compared with iterated linear approximation on the basis of numerical experiments on simulated data sets coming from a simplified but realistic modelling of a
dyke overflow. Situations where this non linear approach is to be preferred to linearisation are highlighted.
Key words : Uncertainty Modelling, Non linear Approximation, Kriging, Stochastic Algorithm.
R´
esum´
e long
Le mod`ele consid´er´e s’´ecrit :
Yi = H(Xi, di) + Ui, 1 ≤ i ≤ n (1)
o`u
• (Yi) ∈ Rp, 1 ≤ i ≤ n, sont des vecteurs des donn´ees observ´ees,
• H est une fonction connue de R(q+q2)
dans Rp. Elle est de type “boˆıte-noire”,
c’est-`a-dire que nous ne disposons pas d’une formulation explicite de H. On peut l’´evaluer en tout point par un code de calcul num´erique exact mais cette ´evaluation est coˆuteuse. H doit ˆetre suppos´ee injective afin de rendre le mod`ele (1) identifiable. • (Xi) ∈ Rq, 1 ≤ i ≤ n, d´esignent des vecteurs al´eatoires non observ´es, suppos´es
ind´ependants et identiquement distribu´es (i.i.d.) de loi normale N (µ, C).
• (di), 1 ≤ i ≤ n, sont des variables observ´ees li´ees aux conditions exp´erimentales, de
dimension q2.
• (Ui), 1 ≤ i ≤ n, sont des variables al´eatoires qui repr´esentent les erreurs de
mesure. Elles sont suppos´ees i.i.d. de distribution N (0, R), R ne doit pas ˆetre n´ecessairement suppos´e connu. Les variables al´eatoires (Xi) et (Ui) sont suppos´ees
ˆetre ind´ependantes.
Notre but est d’estimer les param`etres (µ, C, R) `a partir des observations (Yi, di), i =
1, . . . , n. Les (Xi)1≤i≤n n’´etant pas observ´es, cette structure de donn´ees manquantes
m`ene `a utiliser en g´en´eral des algorithmes faisant appel un grand nombre de fois au mod`ele physique H. Mais comme nous l’avons pr´ecis´e, H demande un temps de calcul important. Pour traiter ce probl`eme, Celeux et al. (2009) ont propos´e de lin´eariser la fonction H autour d’un point x0 et d’employer un algorithme ECME pour estimer les
param`etres (µ, C), R doit ˆetre fix´e. Du fait de la lin´earisation du mod`ele, la mise `a jour des param`etres courants dans l’algorithme ECME est explicite. Ils proposent d’it´erer la proc´edure de lin´earisation afin d’am´eliorer la pr´ecision de l’algorithme et d’´eviter une trop grande d´ependance vis `a vis du point x0 choisi.
r´esultats satisfaisants. Par contre si H pr´esente un comportement hautement non lin´eaire, il est risqu´e d’utiliser cet algorithme. C’est pourquoi dans (Barbillon et al., 2009), nous proposons une m´ethode d’approximation de H par krigeage que nous int´egrons dans un algorithme EM stochastique (SEM).
Nous pr´esentons la (k + 1)`eme it´eration de l’algorithme SEM qui comporte trois ´etapes :
• ´Etape E : calcul de la densit´e conditionnelle p(.|Y ; θ(k)) de X(k), o`u θ(k)est la valeur
courante du param`etre θ.
• ´Etape S (Stochastique) : restauration des donn´ees manquantes; des donn´ees compl´etes Z(k)= (Y, X(k)) sont g´en´er´ees en simulant X(k)suivant la loi conditionnelle p(.|Y ; θ(k)).
• ´Etape M : L’estimateur mis `a jour θ(k+1) est l’estimateur du maximum de vraisem-blance calcul´e sur les Z(k).
Cet algorithme g´en`ere une chaˆıne de Markov irr´eductible dont la loi stationnaire est con-centr´ee autour des valeurs de l’estimateur du maximum de vraisemblance de θ (Nielssen, 2000). Une p´eriode de chauffe de longueur ℓ est n´ecessaire afin d’atteindre le r´egime stationnaire de la chaˆıne, ensuite la moyenne 1
L−ℓ
PL
k=ℓ+1θ(k) est calcul´ee avec L assez
grand pour obtenir un estimateur de θ. Pour le mod`ele (1), l’´etape de simulation de SEM est probl`ematique puisque la loi conditionnelle (X|Y, θ) n’est pas explicite. Un al-gorithme type MCMC (Markov Chain Monte Carlo) est n´ecessaire pour r´ealiser l’´etape S. Pour la restauration de chacun des Xi (1 ≤ i ≤ n), m it´erations d’un algorithme de
Metropolis-Hasting sont utilis´ees. Ainsi, `a l’it´eration k, l’´etape S s’´ecrit : Pour 1 ≤ i ≤ n, • Soit Xi,0 = Xi(k−1).
• Pour s = 1, ..., m
1. Simuler ˜Xi,s suivant la loi de proposition qθk(Xi,s−1, .).
2. Xi,s= ˜Xi,s avec probabilit´e
α(Xi,s−1, ˜Xi,s) = min 1,
p( ˜Xi,s|Yi; θ(k))qθk( ˜Xi,s, Xi,s−1)
p(Xi,s−1|Yi; θ(k))qθk(Xi,s−1, ˜Xi,s)
!
et Xi,s = Xi,s−1 avec probabilit´e 1 − α(Xi,s−1, ˜Xi,s).
• Xi(k)= Xi,m.
Le calcul du taux d’acceptation α(., .) dans une it´eration d’un algorithme de Metropolis-Hasting demande un appel `a H. Si on suppose que m it´erations permettent d’atteindre la distribution stationnaire de la chaˆıne, l’´etape S dans une it´eration de l’algorithme SEM engendrerait alors n × m appels `a H. Au total H serait calcul´ee L × n × m fois, ce qui
n’est pas envisageable puisque H est une fonction coˆuteuse. C’est pourquoi nous pro-posons comme alternative de remplacer H par une approximation non lin´eaire obtenue par krigeage (Cressie, 1990). Le krigeage permet `a partir d’un nombre fix´e d’´evaluations de H sur un plan d’exp´erience num´erique D = {x1, . . . , xNmax} de fournir une
approxi-mation de H, not´ee ˆH sur un domaine E choisi pr´ealablement. Ainsi nous n’effectuerons en tout et pour tout que Nmax appels au code de calcul de H. Le choix de E le
do-maine d’approximation est sensible puisqu’il doit ˆetre assez grand pour contenir avec grande probabilit´e la variable al´eatoire X et pas trop ´etal´e dans la mesure o`u la qualit´e de l’approximation d´epend de la concentration des points de D dans E. Apr`es s’ˆetre assur´e par validation crois´ee de la qualit´e de l’approximation, nous rempla¸cons dans les calculs des taux d’acceptation tout appel `a H coˆuteux par un appel `a ˆH d’´evaluation quasi instantan´ee.
Nous comparons ensuite les m´ethodes ECME avec lin´earisations it´er´ees et SEM avec approximation par krigeage sur un mod`ele hydrodynamique simplifi´e mais r´ealiste. Ce mod`ele est li´e au risque de d´epassement d’une digue durant une crue. Les deux variables observ´ees (le vecteur Y ) sont la hauteur de la rivi`ere au niveau de la digue et sa vitesse. La condition observ´ee (d) est le d´ebit de la rivi`ere en amont et on cherche `a estimer les param`etres des lois des variables non observ´ees (vecteur X), le coefficient de friction du lit de la rivi`ere et la cˆote de fond de la rivi`ere au niveau de la digue. Les deux m´ethodes fournissent des estimations satisfaisantes. La m´ethode employant un algorithme ECME avec des lin´earisations it´er´ees est performante ici puisque la fonction H correspondant au mod`ele peut ˆetre assez finement approch´ee localement par une fonction lin´eaire.
Nous proposons aussi un exemple qui met en d´efaut cette m´ethode. Sur cet exemple, seule l’approche non lin´eaire utilisant l’algorithme SEM et une approximation par krigeage donne des estimateurs raisonnables car elle est plus flexible.
Bibliographie
[1] Barbillon, P., Celeux, G., Grimaud, A., Lefebvre, Y. and De Rocquigny, E. (2009). Non linear methods for inverse statistical problems. Rapport de recherche INRIA. [2] Celeux, G., Grimaud, A., Lefebvre, Y. and De Rocquigny, E. (2009). Identifying variability in multivariate systems through linearised inverse methods. Inverse Problems In Science & Engineering, to appear.
[3] Cressie, N. (1990). The origins of kriging. Mathematical Geology, 22(2): 239-252. [4] Koehler, J.R. and Owen, A.B. (1996). Computer experiments. Handbook of Statistics Vol 13, pp. 261-308, Elsevier Science, New York.
[5] Nielsen, S. F. (2000). The stochastic EM algorithm: estimation and asymptotic results Bernoulli 6, 457-489.