• Aucun résultat trouvé

Méthodes non linéaires pour des problèmes statistiques inverses

N/A
N/A
Protected

Academic year: 2021

Partager "Méthodes non linéaires pour des problèmes statistiques inverses"

Copied!
6
0
0

Texte intégral

(1)

HAL Id: inria-00494690

https://hal.inria.fr/inria-00494690

Submitted on 24 Jun 2010

HAL is a multi-disciplinary open access

archive for the deposit and dissemination of sci-entific research documents, whether they are pub-lished or not. The documents may come from

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de

Méthodes non linéaires pour des problèmes statistiques

inverses

Pierre Barbillon, Gilles Celeux, Agnès Grimaud, Yannick Lefebvre, Etienne de

Rocquigny

To cite this version:

Pierre Barbillon, Gilles Celeux, Agnès Grimaud, Yannick Lefebvre, Etienne de Rocquigny. Méthodes non linéaires pour des problèmes statistiques inverses. 42èmes Journées de Statistique, 2010, Marseille, France, France. �inria-00494690�

(2)

ethodes non lin´

eaires pour des probl`

emes

statistiques inverses

Pierre Barbillon1 & Gilles Celeux1 & Agn`es Grimaud2 & Yannick Lefebvre3 & Etienne

De Rocquigny4

1 Universit´e Paris-sud 11, Laboratoire de Math´ematiques d’Orsay, Orsay Cedex, F-91405

INRIA Saclay, projet select

2 Institut de Math´ematiques de Luminy Case 907 163 Avenue de Luminy 13288

Marseille cedex 9

3 Schlumberger, 1 Cour du Triangle, 92936 La Defense Cedex 4 Ecole Centrale Paris, Grande Voie des Vignes, 92290 Chˆatenay Malabry

esum´

e

Dans le cadre du traitement des incertitudes ´etudi´e ici, la variabilit´e intrins`eque des entr´ees d’un mod`ele physique est mod´elis´ee par une loi de probabilit´e multivari´ee. L’objectif est d’identifier cette loi de probabilit´e `a partir d’observations des sorties du mod`ele. Afin de se limiter `a un nombre d’appels raisonnable au code de calcul (souvent coˆuteux) du mod`ele physique dans l’algorithme d’inversion, une m´ethodologie d’approximation non lin´eaire faisant intervenir le krigeage et un algorithme EM stochastique est pr´esent´ee. Elle est compar´ee `a une m´ethode utilisant une approximation lin´eaire it´erative sur la base de jeux de donn´ees simul´ees provenant d’un mod`ele de crues simplifi´e mais r´ealiste. Les cas o`u cette approche non lin´eaire est pr´ef´erable seront mis en lumi`ere.

Mots cl´es : Mod´elisation des incertitudes, Approximation non lin´eaire, Krigeage, Algo-rithme stochastique.

Abstract

In the uncertainty treatment framework considered in this paper, the intrinsic variability of the inputs of a physical simulation model is modelled by a multivariate probability distribution. The objective is to identify this probability distribution - the dispersion of which is independent of the sample size since intrinsic variability is at stake - based on observation of some model outputs. Moreover, in order to limit to a reasonable level the number of (usually burdensome) physical model runs inside the inversion algorithm, a non linear approximation methodology making use of Kriging and stochastic EM algorithm is presented. It is compared with iterated linear approximation on the basis of numerical experiments on simulated data sets coming from a simplified but realistic modelling of a

(3)

dyke overflow. Situations where this non linear approach is to be preferred to linearisation are highlighted.

Key words : Uncertainty Modelling, Non linear Approximation, Kriging, Stochastic Algorithm.

esum´

e long

Le mod`ele consid´er´e s’´ecrit :

Yi = H(Xi, di) + Ui, 1 ≤ i ≤ n (1)

o`u

• (Yi) ∈ Rp, 1 ≤ i ≤ n, sont des vecteurs des donn´ees observ´ees,

• H est une fonction connue de R(q+q2)

dans Rp. Elle est de type “boˆıte-noire”,

c’est-`a-dire que nous ne disposons pas d’une formulation explicite de H. On peut l’´evaluer en tout point par un code de calcul num´erique exact mais cette ´evaluation est coˆuteuse. H doit ˆetre suppos´ee injective afin de rendre le mod`ele (1) identifiable. • (Xi) ∈ Rq, 1 ≤ i ≤ n, d´esignent des vecteurs al´eatoires non observ´es, suppos´es

ind´ependants et identiquement distribu´es (i.i.d.) de loi normale N (µ, C).

• (di), 1 ≤ i ≤ n, sont des variables observ´ees li´ees aux conditions exp´erimentales, de

dimension q2.

• (Ui), 1 ≤ i ≤ n, sont des variables al´eatoires qui repr´esentent les erreurs de

mesure. Elles sont suppos´ees i.i.d. de distribution N (0, R), R ne doit pas ˆetre n´ecessairement suppos´e connu. Les variables al´eatoires (Xi) et (Ui) sont suppos´ees

ˆetre ind´ependantes.

Notre but est d’estimer les param`etres (µ, C, R) `a partir des observations (Yi, di), i =

1, . . . , n. Les (Xi)1≤i≤n n’´etant pas observ´es, cette structure de donn´ees manquantes

m`ene `a utiliser en g´en´eral des algorithmes faisant appel un grand nombre de fois au mod`ele physique H. Mais comme nous l’avons pr´ecis´e, H demande un temps de calcul important. Pour traiter ce probl`eme, Celeux et al. (2009) ont propos´e de lin´eariser la fonction H autour d’un point x0 et d’employer un algorithme ECME pour estimer les

param`etres (µ, C), R doit ˆetre fix´e. Du fait de la lin´earisation du mod`ele, la mise `a jour des param`etres courants dans l’algorithme ECME est explicite. Ils proposent d’it´erer la proc´edure de lin´earisation afin d’am´eliorer la pr´ecision de l’algorithme et d’´eviter une trop grande d´ependance vis `a vis du point x0 choisi.

(4)

r´esultats satisfaisants. Par contre si H pr´esente un comportement hautement non lin´eaire, il est risqu´e d’utiliser cet algorithme. C’est pourquoi dans (Barbillon et al., 2009), nous proposons une m´ethode d’approximation de H par krigeage que nous int´egrons dans un algorithme EM stochastique (SEM).

Nous pr´esentons la (k + 1)`eme it´eration de l’algorithme SEM qui comporte trois ´etapes :

• ´Etape E : calcul de la densit´e conditionnelle p(.|Y ; θ(k)) de X(k), o`u θ(k)est la valeur

courante du param`etre θ.

• ´Etape S (Stochastique) : restauration des donn´ees manquantes; des donn´ees compl´etes Z(k)= (Y, X(k)) sont g´en´er´ees en simulant X(k)suivant la loi conditionnelle p(.|Y ; θ(k)).

• ´Etape M : L’estimateur mis `a jour θ(k+1) est l’estimateur du maximum de vraisem-blance calcul´e sur les Z(k).

Cet algorithme g´en`ere une chaˆıne de Markov irr´eductible dont la loi stationnaire est con-centr´ee autour des valeurs de l’estimateur du maximum de vraisemblance de θ (Nielssen, 2000). Une p´eriode de chauffe de longueur ℓ est n´ecessaire afin d’atteindre le r´egime stationnaire de la chaˆıne, ensuite la moyenne 1

L−ℓ

PL

k=ℓ+1θ(k) est calcul´ee avec L assez

grand pour obtenir un estimateur de θ. Pour le mod`ele (1), l’´etape de simulation de SEM est probl`ematique puisque la loi conditionnelle (X|Y, θ) n’est pas explicite. Un al-gorithme type MCMC (Markov Chain Monte Carlo) est n´ecessaire pour r´ealiser l’´etape S. Pour la restauration de chacun des Xi (1 ≤ i ≤ n), m it´erations d’un algorithme de

Metropolis-Hasting sont utilis´ees. Ainsi, `a l’it´eration k, l’´etape S s’´ecrit : Pour 1 ≤ i ≤ n, • Soit Xi,0 = Xi(k−1).

• Pour s = 1, ..., m

1. Simuler ˜Xi,s suivant la loi de proposition qθk(Xi,s−1, .).

2. Xi,s= ˜Xi,s avec probabilit´e

α(Xi,s−1, ˜Xi,s) = min 1,

p( ˜Xi,s|Yi; θ(k))qθk( ˜Xi,s, Xi,s−1)

p(Xi,s−1|Yi; θ(k))qθk(Xi,s−1, ˜Xi,s)

!

et Xi,s = Xi,s−1 avec probabilit´e 1 − α(Xi,s−1, ˜Xi,s).

• Xi(k)= Xi,m.

Le calcul du taux d’acceptation α(., .) dans une it´eration d’un algorithme de Metropolis-Hasting demande un appel `a H. Si on suppose que m it´erations permettent d’atteindre la distribution stationnaire de la chaˆıne, l’´etape S dans une it´eration de l’algorithme SEM engendrerait alors n × m appels `a H. Au total H serait calcul´ee L × n × m fois, ce qui

(5)

n’est pas envisageable puisque H est une fonction coˆuteuse. C’est pourquoi nous pro-posons comme alternative de remplacer H par une approximation non lin´eaire obtenue par krigeage (Cressie, 1990). Le krigeage permet `a partir d’un nombre fix´e d’´evaluations de H sur un plan d’exp´erience num´erique D = {x1, . . . , xNmax} de fournir une

approxi-mation de H, not´ee ˆH sur un domaine E choisi pr´ealablement. Ainsi nous n’effectuerons en tout et pour tout que Nmax appels au code de calcul de H. Le choix de E le

do-maine d’approximation est sensible puisqu’il doit ˆetre assez grand pour contenir avec grande probabilit´e la variable al´eatoire X et pas trop ´etal´e dans la mesure o`u la qualit´e de l’approximation d´epend de la concentration des points de D dans E. Apr`es s’ˆetre assur´e par validation crois´ee de la qualit´e de l’approximation, nous rempla¸cons dans les calculs des taux d’acceptation tout appel `a H coˆuteux par un appel `a ˆH d’´evaluation quasi instantan´ee.

Nous comparons ensuite les m´ethodes ECME avec lin´earisations it´er´ees et SEM avec approximation par krigeage sur un mod`ele hydrodynamique simplifi´e mais r´ealiste. Ce mod`ele est li´e au risque de d´epassement d’une digue durant une crue. Les deux variables observ´ees (le vecteur Y ) sont la hauteur de la rivi`ere au niveau de la digue et sa vitesse. La condition observ´ee (d) est le d´ebit de la rivi`ere en amont et on cherche `a estimer les param`etres des lois des variables non observ´ees (vecteur X), le coefficient de friction du lit de la rivi`ere et la cˆote de fond de la rivi`ere au niveau de la digue. Les deux m´ethodes fournissent des estimations satisfaisantes. La m´ethode employant un algorithme ECME avec des lin´earisations it´er´ees est performante ici puisque la fonction H correspondant au mod`ele peut ˆetre assez finement approch´ee localement par une fonction lin´eaire.

Nous proposons aussi un exemple qui met en d´efaut cette m´ethode. Sur cet exemple, seule l’approche non lin´eaire utilisant l’algorithme SEM et une approximation par krigeage donne des estimateurs raisonnables car elle est plus flexible.

(6)

Bibliographie

[1] Barbillon, P., Celeux, G., Grimaud, A., Lefebvre, Y. and De Rocquigny, E. (2009). Non linear methods for inverse statistical problems. Rapport de recherche INRIA. [2] Celeux, G., Grimaud, A., Lefebvre, Y. and De Rocquigny, E. (2009). Identifying variability in multivariate systems through linearised inverse methods. Inverse Problems In Science & Engineering, to appear.

[3] Cressie, N. (1990). The origins of kriging. Mathematical Geology, 22(2): 239-252. [4] Koehler, J.R. and Owen, A.B. (1996). Computer experiments. Handbook of Statistics Vol 13, pp. 261-308, Elsevier Science, New York.

[5] Nielsen, S. F. (2000). The stochastic EM algorithm: estimation and asymptotic results Bernoulli 6, 457-489.

Références

Documents relatifs

Pour les sommes de type II, on doit faire la diff´erence entre la somme des carr´es relative aux erreurs dans le mod`ele avec les seuls effets de F 2 et la mˆeme somme dans le

L’estimation sur petits domaines et le traite- ment de la non-r´ eponse sont des exemples de domaines de recherche dans lesquels l’approche mod` ele a jou´ e un rˆ ole important

centr´ ees de variance σ 2 0 (mais ce ne sont pas n´ ecessairement

e) On suppose que β a pour loi a priori, la loi de Bernoulli de param` etre 0.5... 2p, sont des variables i.i.d., gaussienes de variance

En d´ eduire une g´ en´ eralisation du th´ eor` eme de Gauss-Markov au cas de l’esti- mation par moindres carr´ es g´ en´ eralis´ es ainsi que l’optimalit´ e de l’estimateur

Ecrire une fonction qui prend en argument un entier N , deux r´ eels a et b et une fonction f et qui renvoie un vecteur de type vector contenant la solution num´ erique du syst`

Cette ´ equation signifie que pour que la convection transporte de la chaleur il faut que les variation lat´ erales de v z et de δT soient corr´ el´ ees et, pour le flux soit vers

Universit´ e Paris Dauphine Syst` emes diff´ erentiels L3 math´ ematiques, 2012-2013 Devoir : analyse qualitative de la comp´ etition entre deux herbivores.. Traiter les parties I,