Maximum de vraisemblance pour le mod`ele Candy

L’application présentée au paragraphe précédent montre l’influence des pa-ramètres d’interaction sur le résultat final. Dans cette partie, nous regardons le problème suivant : une structure est formée par des objets en interaction que nous supposons gouvernés par un processus ponctuel marqué. Nous

sou-0 20 40 60 80 100 120

Figure 7.3 – Résultats obtenus pour les trois catalogues : A (en haut), B (au milieu) et C (en bas). A gauche, le ”meilleur” résultat est superposé aux données. A droite on a superposé tous les résultats obtenus avec les jeux de paramètres du Tableau 7.1. Le premier jeu de paramètres est représenté en rouge, le second en bleu et le troisième en vert.

haitons estimer les param`etres d’interaction entre objets.

Nous présentons ici les résultat obtenus sur l’estimation des paramètres d’in-teraction du modèle Candy [T3, T7].

Le domaine d’observation est une partie compacteW ⊂R² de volume stric-tement positif 0< ν(W) <∞. Un segment est un objet de centre w dans W et de caractéristiques m = (l, θ), longueur et orientation, dans l’espace de probabilité M = [l_min, l_max]×[0, π). La distribution des marques ν_M est la loi uniforme surM. Soit x={(w₁, m₁), . . . ,(w_n, m_n)} une configuration finie de segments. Le modèle Candy est défini par la densité de probabilité par rapport à la mesure de référence poissonienne (2.4)

p(x) = p(∅)Qn

i=1exph

li−lmax

lmax

× γ₀ⁿ⁰^(x)γ₁ⁿ¹^(x)γ₂ⁿ²^(x)γ_rⁿ^r^(x)γ_oⁿô^(x) (7.10) oùp(∅) est la constante de normalisation, et oùγ₂, γ₁, γ₀ >0 etγ_r, γ_o ∈(0,1) sont les paramètres d’interaction du modèle. Les statistiques exhaustives du modèle n₂(x), n₁(x), n₀(x), n_r(x), n_o(x) sont respectivement le nombre de segments connectés aux deux extrémités, le nombre de segments connectés

a une seule extrémité, le nombre de segments non connectés, le nombre de paires de segments en répulsion et le nombre de paires de segments non alignés. Tous les détails concernant la définition des interactions et les pro-priétés du modèle Candy se trouvent dans [T7].

Pour ce problème d’estimation, on suppose les paramètres l_min, l_max, r_a et τ connus. Cette hypothèse peut être débattue, car l’estimation des pa-ramètres de portée des interactions est un problème encore ouvert. Dans ce contexte cependant, il n’est pas déraisonnable d’imaginer ces paramètres estimés par des techniques de statistique exploratoire ou bien d’analyse d’image [90, 141, 180].

Les modèles Candy et Bisous, comme la plupart des modèles avec lesquels nous avons travaillé, font partie de la famille exponentielle (6.2). La dy-namique de simulation de ces modèles est construite à partir d’une chaˆıne de Markov irréductible, Harris récurrente et ergodique géométrique. Par conséquent, le cadre d’estimation de paramètres par maximum de vraisem-blance peut être appliqué.

Ecrivons la densit´e de probabilit´e (7.10) sous la forme p(x|θ) = expht(x), θih(x)

Z(θ)

o`ut(x) est le vecteur de statistiques canoniques exhaustives t(x) = (n₂(x), n₁(x), n₀(x), n_r(x), n_o(x)), θle vecteur de param`etres

θ= (logγ₂,logγ₁,logγ₀,logγ_r,logγ_o)^T eth(x) =Qn

i=1exph

li−lmax

lmax

La procédure de maximisation nécessite les valeurs observées det(x) et une valeur initiale de θ₀. La logvraisemblance étant convexe, l’optimisation est en principe indépendante des conditions initiales. De plus, la simulation du modèle se fait à l’aide d’une chaˆıne de Markov qui possède de bonnes pro-priétés de convergence. En conséquence, les approximations Monte Carlo approchent très bien les valeurs théoriques et un théorème de la limite cen-trale permet d’évaluer les erreurs d’estimation. Cependant, les évaluations numériques par échantillonnage pondéré de la logvraisemblance et du gra-dient ne sont pas numériquement stables. En effet, ces calculs passent par l’évaluation d’expressions du type

expht(X), θ_k−θ_k+1i.

Si la distance entre la nouvelle et l’ancienne valeur des param`etres est trop grande, alors les valeurs num´eriques de (7.2) peuvent exploser.

La solution à ce problème est de rééchantillonner le modèle. En itérant cette procédure, on peut arriver suffisamment près de l’estimateur du maxi-mum de vraisemblance et alors le calculer par une méthode directe ou de type Newton-Raphson. La méthode itérative que nous présentons est une méthode de gradient à pas optimal [57, T3, 179, T7].

Algorithme 12 Méthode itérative avec gradient à pas optimal pour l’ap-proximation du MLE

1. Initialiser θ₁ et k= 1.

2. Générer m échantillons de la loip(x|θ_k) et calculer ∇l_m(θ_k).

3. Pour chaque composante des paramètresi={1, . . . ,5}et chaque com-posante du gradient △i, calculer les intervalles I_kⁱ = [θ_kⁱ −α△i, θⁱ_k+ α△i], α >0étant un paramètre scalaire de précision.

4. Maximiser la logvraisemblance dans chaque intervalleI_kⁱ par la m´ethode de la section dor´ee pour obtenir une nouvelle valeur θ_k+1.

5. Si k θ_k+1−ω_k k> τ₁, alors poser k =k+ 1 et aller au pas 2; τ₁ est une valeur seuil pr´efix´ee.

Valeurs initiales M´ethode du gradient Monte Carlo MLE logγ₀ⁱ =−9.5 \

logγ₀⁰ =−8.37 log\γ₀ⁿ =−8.32 logγ₁ⁱ =−4.0 log\γ_s⁰ =−2.74 log\γ₁ⁿ =−2.73

logγ₂ⁱ = 1.5 \

logγ_d⁰ = 2.46 log\γ₂ⁿ= 2.47 logγ_oⁱ =−3.5 log\γ_o⁰ =−2.13 log\γ_oⁿ =−2.17 logγ_rⁱ =−3.5 log\γ_r⁰ =−2.42 log\γ_rⁿ =−2.42

Table7.2 – Estimation des param`etres pour les donn´ees de la Figure 7.4.

Ecart-type asymptotique Ecart-type Monte Carlo

0.51 0.002

0.23 0.003

0.17 0.001

0.30 0.002

0.31 0.005

Table7.3 – Erreurs d’estimation.

6. Sik ∇l_m(θ_k+1)− ∇l_m(θ_k)k> τ₂, alors poserk=k+ 1 et aller au pas 3, sinon arrêter l’algorithme ;τ₂ est une valeur seuil préfixée.

La Figure 7.4 montre une réalisation du modèle Candy, ses paramètres d’interaction et les valeurs observées des statistiques exhaustives. L’Algo-rithme 12 a été implémenté en prenant comme données les statistiques ob-servées de la Figure 7.4 et comme paramètres initiauxθ₁ceux du Tableau 7.2 (première colonne). L’algorithme a tourné pendant 1000 itérations et il a uti-lisé α = 10⁻³, τ1 = 3.0 et τ2 = 10⁻⁶. Le résultat obtenu est le vecteur de paramètres θ₀ qui figure dans la colonne du milieu du Tableau 7.2. La log-vraisemblance l_n(θ) a été calculée à partir des n= 2×10⁴ simulations du modèle Candy selon la loi p(x|θ0). Des profils de la logvraisemblance sont montrés Figure 7.5. Le maximum de l_n(θ) est affiché en troisième colonne du Tableau 7.2.

L’écart-type asymptotique de l’estimateur du maximum de vraisemblance par rapport aux paramètres du modèle (inconnus en pratique) et l’erreur standard Monte-Carlo de l’approximation du maximum de vraisemblance par rapport au vrai maximum de vraisemblance sont donnés au Tableau 7.3.

0 50 100 150 200 250

050100150200250

Param`etres du mod`ele logγ₀ =−8.5

logγ₁ =−3 logγ₂ = 2.5 logγ_o=−2.5 logγ_r=−2.5

Statistiques exhaustives n₀ = 4

n₁ = 34 n₂ = 63 n_o = 12 n_r = 9

Figure7.4 – Réalisation du modèle Candy (en haut), ses paramètres d’in-teraction (tableau au milieu) et les valeurs observées des statistiques exhaus-tives (tableau du bas).

−11 −10.5 −10 −9.5 −9 −8.5 −8 −7.5 −7

Figure 7.5 – Approximation Monte Carlo de la logvraisemblance en fonc-tion des composantes individuelles, les autres composantes de logˆγ⁰ ´etant fix´ees.

7.3 Approche bay´ esienne pour la d´ etection des

Dans le document Modélisation probabiliste et inférence statistique pour l’analyse des données spatialisées (Page 162-169)