• Aucun résultat trouvé

6 .1 Introduction à la détection statistique en présence de paramètres non-linéaires

Il est proposé en préambule de “prendre un peu de recul” en mettant en exergue la difficulté d’application de la théorie de la détection statistiques présentée dans la

section 2.4 et dans l’annexe A, lorsque le modèle de représentation des données est

6.1.1 Motivations et difficultés

Dans le chapitre3, une modélisation réaliste du contenu structuré des images n’a pas

été évoquée. Les tests proposés sont intéressants d’un point de vue théorique,

néan-moins pour une application pratique, une estimation bθkde θk s’avère nécessaire. Une

application pratique a été proposée dans la section 3.4en utilisant une modélisation

linéaire (3.38) des segments issus des images et les résultats obtenus dans [23,96,160] avec cette approche sont encourageants.

En pratique, l’utilisation du modèle non-linéaire du contenu des images naturelles (5.10)

- (5.11) est nécessaire afin de conserver un paramétrage parcimonieux et donc in fine

de préserver la puissance du test qui en découle. Il est rappelé que les segments

zk, k∈ {1, . . . , K}sont modélisés par :

zk=Q1(yk) =Q1(θk+ξk) avec : ξk∼ N (0,Σk)

avec (5.9) - (5.10) :

θk =Hck+F(ηk)uk=G(ηk)vk, (6.1)

et G(ηk) =H|F(ηk) et vk =ck, ukT.

Le modèle de θk est donc composé d’une partie linéaire Hck, représentant la partie Il est à souligner que l’application

F(ηk)n’est pas linéaire par rap-port au paramètre ηk (sans quoi le formalisme matricielle est pré-féré).

continue de la scène et d’une partie non-linéaire F(ηk)ureprésentant les éventuelles discontinuités présentes dans le k-ième segment.

La présence, dans le modèle des observations, de paramètres de nuisance interve-nant de façon non-linéaire peut a priori être traitée par une application directe de la

théorie de la décision statistique décrite dans l’annexe A, au coût d’éventuelles

adap-tations. Le test du RVG demeure notamment utilisable. Dans le cadre du problème de détection d’informations cachées considéré, le RVG est rigoureusement donné, voir définition2.10, par : logΛrvg(Z) = sup R1>R?k∈ΘkQ R1 θk(Z) sup R0≤R?k∈ΘkQ R0 θk(Z), où Θk = Im G(ηk)

RL représente l’espace du paramètre θk ∈ Θk, QθRk(Z) repré-sente la loi de distribution des pixels du k-ième segment après insertion avec un taux

R et R? correspond au taux à partir duquel il est souhaitable de détecter les

informa-tions cachées.

Similairement le test “type RVG“ proposé dans (3.40) - (3.41) peut être aisément adapté au modèle non-linéaire du contenu :

logΛrvg(Z) = sup θk∈ΘkQ R1 θk(Z) sup θk∈ΘkQ R0 θk(Z).

En pratique, le RVG ”exact” revient à estimer simultanément par maximum de

vrai-semblance le paramètre θk etle taux d’insertion R, alors que, dans le RVG proposé, la

maximisation par rapport au taux d’insertion R n’est pas considérée (voir remarques3.5

et 3.6).

Cependant, l’application du test du RVG, et plus généralement de la théorie de la détection et de l’estimation statistique, peut être rendue complexe en pratique par la présence de paramètres non-linéaires. De manière générale les difficultés suivantes apparaissent lorsque le modèle des observations est non-linéaire :

1. D’un point de vue théorique, l’inférence de l’anomalie qu’il est souhaitable de dé-tecter sur l’estimation du paramètre de nuisance θkdoit être prise en compte [115,

2. Le calcul des performances du test statistique qui en découle est rendu complexe ; dans le cas du RVG par exemple l’impact sur les propriétés statistiques du test de la procédure d’estimation par maximum de vraisemblance n’est pas toujours évident à “mesurer”.

3. D’un point de vue pratique, le problème d’optimisation sous-jacent au calcul

du maximum de vraisemblance est beaucoup plus complexe dans le cas d’un modèle non-linéaire que dans le cas d’un modèle linéaire.

Dans le cadre des travaux présentés, les “anomalies” qu’il est souhaitable de détec-ter sont les modifications engendrées par l’insertion d’informations dans les LSB des pixels d’une image ; en outre le cas d’intérêt suppose que le taux d’insertion R est

faible. L’inférence de la modification de±1 d’une proportion réduite de pixels d’une

image avec le contenu θkn’est donc pas considéré. Le problème consistant à expliciter

les propriétés statistiques du détecteur proposé, fil conducteur des présents travaux, est le centre de gravité des sections6.3.2et6.4.

Enfin, la résolution numérique du problème d’optimisation sous-jacent à l’estimation

du paramètre de nuisance θk, ou de manière analogue du paramètre non-linéaire ηk,

est brièvement abordé ci-dessous dans la section6.1.2.

6.1.2 Méthodes numériques d’estimation du paramètre non-linéaire

de nuisance

Dans un souci de clarté, il est supposé que les observations zk sont des valeurs

réelles, décrites par (6.1) :

zk=G(ηk) +ξk,

où l’application G : RpRL est connue, η ∈ Ω ⊂ Rp et ξRN est un vecteur

aléatoire dont la distribution statistique est supposée connue. Le problème qu’il est souhaitable de résoudre est celui de l’estimation numérique de ηkà partir de zk. Sans perte de généralité, il est possible de considérer la famille de distribution paramétrique

P = Pη|ηΩ et de décrire z comme la réalisation d’un vecteur aléatoire de

distri-bution Pη, admettant la densité fη, ce qui est noté de manière abusive z∼Pη. Dans un

cadre non-Bayésien (lorsque la distribution a priori du paramètre ηkn’est pas connue)

l’estimationbηkde ηkest usuellement obtenue par maximum de vraisemblance :

b

η=arg max

η∈ fη

(zN). (6.2)

Dans le cadre des travaux présentés dans ce manuscrit, il est considéré (voir section4.3) que les variables aléatoires ξn, n∈ {1, . . . , L}sont statistiquement indépendantes.

L’es-timation de η par maximum de vraisemblance est alors donnée, voir définitionA.22,

par : b η=arg max η∈ N

n=1 fη(zn). (6.3)

L’estimation par maximum de vraisemblance est donc, formellement, un problème

d’optimisation (recherche d’un maximum global) sous la contrainte η ∈ Ω qui peut

être traité avec les méthodes usuelles d’optimisation. La résolution des équations (6.2)

et (6.3) peut s’avérer délicate selon la nature de la fonction G, selon l’espace des

contrainte et selon la densité de probabilité fveta.

Dans le cas où le bruit ξ est i.i.d. et est distribué suivant une loi Gaussienne, le vecteur des observations zN est alors décrit statistiquement par zN ∼ N G(η), σ2IL. L’estimation par maximum de vraisemblance est alors donné par résolution du pro-blème de moindres carrés non-linéaires suivant :

Ce résultat est analogue à la re-marqueA.3. b η=arg min η∈ kzNh(η)k 2 2. (6.4)

La minimisation du critère quadratique (6.4) a longuement été étudiée dans la littéra-ture et de nombreuses méthodes d’optimisation convexe ont été proposées.

Remarque 6.1. De manière générale, l’existence et l’unicité de solutions pour les problèmes (6.2) - (6.4) ne sont pas assurées. Il est néanmoins possible de montrer que sous certaines conditions de régularité, aisément vérifiables dans le cas du modèle non-linéaire étudié, que l’estimationbη

de η existe et est unique.

Pour procéder à la résolution des problèmes d’optimisation (6.2) - (6.4), de nombreux algorithmes existent [162]. De manière générale, il est possible d’utiliser des méthodes déterministes, tels que la descente de gradient, le gradient conjugué, le GNC ou le

Quasi-Newton, ou des méthodes stochastiques tels que le recuit simulé [163] ou la

descente stochastique de gradient. Qu’ils soient déterministes ou stochastiques, ces al-gorithmes font appel à des procédés répétés itérativement jusqu’à la vérification d’un

critère d’arrêt et, en général, demandent une valeur initiale η0du paramètre à estimer.

La résolution d’un problème de moindres carrés non-linéaires est donc d’un coût cal-culatoire nettement plus important qu’une simple minimisation au sens des moindres carrés linéaires. En outre, la convergence vers un extremum global des méthodes dé-terministes n’est, dans le cas général, pas garantie, notamment en présence d’extrema locaux, comparativement aux méthodes stochastiques qui, en revanche, présentent un coût calculatoire bien plus important.

Dans le cadre des travaux présentés dans ce manuscrit, l’estimation des paramètres non-linéaires de nuisance décrivant les discontinuités dans chacune des lignes d’une image ne peut se faire en utilisant les méthodes d’optimisation brièvement décrites ci-dessus. En effet, compte-tenu des contraintes de temps d’analyse d’une image (qui doit être réduit au maximum) et du nombre très élevé de discontinuités présentes dans l’en-semble d’une image, il ne peut être envisagé une résolution directe des équations (6.2)

- (6.4). En outre, le principal problème abordé dans ce manuscrit concerne la

descrip-tion précise des performances du test statistique en vue de la détecdescrip-tion d’informadescrip-tions cachées dans une image. Les propriétés statistiques du test dépendent de l’estimation du paramètre de nuisance que représente le contenu structuré d’une image. Or, il n’est pas possible d’expliciter les performances statistiques de l’estimation du contenu au moyen d’algorithmes d’optimisation, ce qui compromet la possibilité de calculer ana-lytiquement les performances du test.

Pour ces raisons, l’estimation directe des paramètres de nuisance ηkintervenant de

fa-çon non-linéaire est à proscrire dans le cadre des travaux présentés dans ce manuscrit.