• Aucun résultat trouvé

5 .3 Discussions sur quelques modèles alternatifs des images

L’originalité de l’approche présentée pour modéliser les images naturelles réside dans la prise en compte des phénomènes physiques permettant la formation d’une image optique incidente sur le photo-détecteur. Cette approche des images permet de

proposer un modèle local paramétrique et non-linéaire des images naturelles (5.10)

-(5.11). Le lecteur attentif comprendra que le modèle proposé n’a pas vocation à l’opti-malité, en un quelconque sens, mais de permettre la conception d’un test pour détecter des informations cachées tout en respectant la contrainte sur la probabilité de fausse

alarme. Dans ce cadre applicatif, la présente section5.3 souligne l’intérêt du modèle

proposé au travers d’une brève description des inconvénients que présente l’utilisa-tion de quelques modèles usuels du contenu des images ; compte-tenu du nombre de

modèles d’images rencontrés dans la littérature, cette section 5.3 n’a pas vocation à

présenter un état de l’art exhaustif.

5.3.1 Approximation par transformation en ondelettes

Le problème de l’approximation par reconstruction partielle de transformée en on-delettes, proche de la méthodologie proposée, peut se résumer ainsi ; soit une fonction f ∈ L2[0; 1] inconnue dont les échantillons s(ti), du signal s = {si}N−1i=0 , sont donnés par la relation :

si= f(ti) +σξi (5.12)

où, pour tout i∈ {0,· · ·, N−1}, ti=i/Net les{ξi}N−1

i=0 , représentant le bruit présent dans le signal s, sont les réalisations de variables aléatoires indépendantes et identique-ment distribuées suivant une loi de probabilité Gaussienne, ce qui est noté par abus de langage, ξ∼ N (0, IN).

L’approche proposée dans [149,150,151] consiste a obtenir une estimation ˆf de f en

projetant s sur une base orthonormale d’ondelettes discrétisées à la résolution 2j,

re-présentée par une matrice unitaire W2j, voir [152,153] pour une présentation formelle de la transformation en ondelettes continues. Le résultat de cette projection est un vecteur noté c = {ci}i=0N−1, de coefficients de transformée en ondelettes, qui peut être représenté par :

d=W2jf et σe=σW2jξ.

Comme tenu du fait que la matrice W2j est orthonormale, le vecteur e est, comme

ξ, un vecteur dont les composantes sont des variables aléatoires indépendantes et

identiquement distribuées suivant une loi de probabilité Gaussienne [149,150], ce qui est noté par abus de langage, e∼ N (0, IN).

En notant ˆd = {δλ(ci)}i=0N−1une approximation quelconque du vecteur de coefficients

c, il est immédiat de montrer qu’en vertu de l’orthonormalité de W2j, l’approximation

ˆf de f qui découle de l’utilisation de ˆd est donnée par : La fonction δ appliqué

indépen-damment aux composantes du vecteur c de coefficients est vo-lontairement pas précisé présente-ment.

ˆf=WT2jˆd.

L’erreur quadratique moyenne (EQM), également appelée risque, issue de l’approxi-mation de f par ˆf est définie par :

RN,σ(ˆf, f) =N−1kfˆfk22=N−1kdˆdk22. (5.13)

La seconde égalité de (5.13) est immédiate à démontrer, en vertu du théorème de

Plan-cherel, en utilisant ici encore l’orthonormalité de la matrice W2j.

Dans la suite de cette section, la fonction d’approximation des coefficients δλ

considé-rée est la fonction de shrinkage par seuillage doux, très appréciée pour ses propriétés de lissage et d’adaptativité [150,151], formellement définie par :

δλ(ci) =

(

x−signe(x)λ si |x| ≥λ

0 si |x| <λ. (5.14)

L’intérêt de cette fonction de seuillage doux (5.14) réside dans l’obtention de

résul-tats sur l’erreur d’approximation en terme de majoration du risque (5.13) . Le seuil

universel est par exemple issu d’une analyse de la contribution du bruit e dans les coefficients de la transformée en ondelettes discrètes c. Dans le cadre du signal défini par5.12, la contribution du bruit est e∼ N (0, IN)ce qui permet de montrer (voir [153, chap.9]) que : lim N→∞Pλu(N) −σln ln N ln N max  {|en|}N−1n=0λu(N)  =1. où λu(N) =σ

2 ln N est le seuil dit universel. Autrement dit, le maximum en valeur absolue de la contribution du bruit dans les coefficients de transformée en ondelettes discrètes max{|en|}N−1

n=0



a une grande probabilité d’être proche, mais inférieur, au

seuil universel λu(N) lorsque N → ∞. Le théorème 5.3, d’après [149, théorème 1],

offre en conséquente une majoration du risque (ou de l’EQM) d’approximation de f par ˆf par seuillage doux associé au seuil universel :

Théorème 5.3(Majoration du risque Rλu(N) [149]). Suivant le modèle (5.12), soit donné l’approximation ˆf de f donné par W2jδλu(N)(c)où δλu(N) représente la fonction de seuillage doux associée au seuil universel λu(N), alors :

Rλu(N)(ˆf, f) ≤ (1+2 ln N) N−1σ2+R0(f), où R0(f=∑N−1

n=0 min(d2i; e2).

Un résultat similaire au théo-rème 5.3 existe dans le cas du seuil dit minimax Le lecteur in-téressé peut consulter [149].

Deux autres résultats intéressants ont été obtenus pour le problème dit de

débrui-tage de la fonction f ou du signal f, formellement défini dans [150] ; ce problème

consiste a obtenir une valeur approchée ˆf de f (et donc une approximation ˆf de f) sous les deux contraintes suivantes :

1- l’erreur quadratique moyenne issue de l’approximation de f par ˆf est optimale (en

un certain sens qui reste à définir) ;

2- l’approximation ˆf de la fonction f est, avec une grande probabilité, au moins aussi

régulière que f .

Plus formellement, considérant que la fonction f ∈ F ∈ L2(R)oùF est un espace de

fonctions régulières (espaces de Besov par exemple), la première contrainte sur l’opti-malité de l’approximation est vérifiée par le théorème5.4, d’après [150, théorème 1.2].

Théorème 5.4(approximation quasi minimax de f [150]). Suivant le modèle (5.12), soit donné l’approximation ˆf de f donné par W2jδλu(N)(c) où δλu(N) représente la fonction de seuillage doux associée au seuil universel λu(N), alors il existe une constante C1=C1(F, φ) >

0 telle que :

La notation C1 = C1(F, φ) indique ici le fait que cette constante dépendant uniquement de l’ondelette φ et de l’espace de fonctions considérée F mais ne dépend pas de f ni de N=2j. sup f ∈F Rλu(N)(ˆf, f) ≤C1ln N inf ˆf sup f ∈F Rλu(N)(ˆf, f)

De manière analogue, la seconde contrainte sur la régularité de l’approximation

obtenue est formellement définie et vérifiée par le théorème 5.5, d’après [150,

théo-rème 1.1].

Théorème 5.5 (Régularité de l’approximation ˆf [150]). Suivant le modèle (5.12), soit l’approximation ˆf de la fonction f basée sur le seuillage doux associé au seuil universel :

W2jδλu(N)(c). Alors, il existe une suite πn → 1 lorsque N = 2j → ∞ et une constante

La méthode d’interpolation per-mettant l’obtention de ˆf découle de la définition même de la défi-nition de transformation en on-delettes continues et est détaillées dans [150, sec.V].

C2=C2(F, φ) >0 telles que :

Ici encore C2 = C2(F, φ) > 0 indique que C2dépend de φ et de Fmais ne dépend pas de f ni de N=2j. PhkˆfnkF ≤C1kfkFiπn def. =Phmax{|en|}N−1 n=0  ≤2 ln Ni.

Si ces résultats sont incontestablement intéressants, il faut noter toutefois que par rapport au modèle proposé, l’approximation par transformation en ondelettes ne tient nullement compte de la structure particulière des images naturelles (le modèle des ondelettes se voulant le plus générique possible). En outre, le problème de la détermi-nation du seuil, longuement discuté dans [149,150,151], semble d’autant plus difficile dans le cadre des travaux présentés puisque le but est in fine de pouvoir concevoir un test dont les performances statistiques sont connues. Dans ce cadre l’utilisation de fonction de seuillage complexifie grandement le problème.

5.3.2 Apprentissage de dictionnaire parcimonieux

Comme cela a été évoqué dans la section5.3.1, la décomposition en ondelettes est

parcimonieuse au sens de la norme`2, i. e. l’énergie du signal est concentrée dans un

nombre limité de coefficients issus de la transformée en ondelettes. La transformée en

ondelettes est rendue parcimonieuse au sens de la norme`0 par l’application d’une

fonction de seuillage (5.14), voir également [154] pour une discussion sur les fonctions de seuillage.

L’apprentissage de dictionnaire est une approche non-paramétrique alternative pour l’approximation d’un signal inconnu. L’originalité de cette méthodologie réside dans le fait que c’est la base de représentation elle-même qui est adaptée au signal en vue

d’obtenir une représentation parcimonieuse au sens de la norme`0. Plus précisément,

Les termes de dictionnaire est d’atome utilisés dans le domaine peuvent être resp. interprétés, du point de vue algébrique, comme une famille génératrice et un vec-teur de cette famille.

l’obtention du dictionnaire D0permettant une représentation exacte la plus

parcimo-nieuse du signal θRN(au sens de la norme`0) est formellement donnée, de manière

générale, par la résolution de l’équation (5.15) : inf

x∈RN{kxk0/ θ=D0x}, (5.15)

oùk · k0représente la norme `0 définie par :kxk0 =∑N

n=1x0n =∑N

n=11R(xn)avec la

De manière informelle la norme `0 consiste à compter le nombre de composantes non-nulles ce qui justifie sont intérêt dans la

De manière analogue, la contrainte de représentation exacte peut être relaxée ;

l’ob-tention de la base D0,e ∈ MN,N de représentation à e-près la plus parcimonieuse du

signal θRNest donnée par la résolution de l’équation (5.16) : inf x∈RN n kxk0/ θD0,ex 2e o . (5.16)

La principale difficulté à la détermination de la base de représentation la plus par-cimonieuse d’un signal, est de nature calculatoire ; il est en effet possible de démon-trer [155] que la résolution de l’une des équations (5.15) et (5.16) est un problème NP-difficile.

De nombreuses méthodes disponibles dans la littérature permettent une résolution approchée des équations (5.15) et (5.16). Ces algorithmes utilisent un dictionnaire

D prédéfini pour construire le dictionnaire ˆD0 en sélectionnant séquentiellement les

atomes parmi ceux de D. Les algorithmes de Matching Pursuit (MP) [156] et Orthogonal

Matching Pursuit (OMP) [157] sont de cette catégorie, la sélection des atomes implique

de manière itérative un produit scalaire entre le signal et les atomes et, usuellement, la résolution de problème de moindres carrés.

La méthode de Basis pursuit (BP) [158] propose de rendre le problème convexe en

sub-stituant la norme`1à la norme`0; le problème peut alors être considéré comme une

minimisation au sens des moindres carrés avec un terme de régularisation`1.

Certains algorithmes disponibles dans la littérature, notamment le K-SVD [159],

au-torisent une modification des atomes du dictionnaire fonctionnant, de façon générale, en deux étapes répétées itérativement : sélection puis mise-à-jour des atomes du dic-tionnaire. Par ailleurs, la sélection des atomes du dictionnaire permet d’envisager la représentation par une dictionnaire sur-complet overcomplete dictionary. Le principe consiste alors à utiliser un dictionnaire contenant un nombre d’atomes supérieur au nombre d’échantillons du signal analysé ; la sélection des atomes permettant dans tous les cas l’obtention in fine d’une représention parcimonieuse.

Conclusions du chapitre :

Dans la lignée directe du chapitre4précédent, ce chapitre est dévolu à la modélisation

des images naturelles en utilisant les propriétés physiques du système d’acquisition et de la scène imagée. Contrairement aux modèle d’images “adaptatifs“ usuellement rencontrés dans la littérature, l’originalité du modèle proposé réside dans son fonde-ment physique qui le rend, par nature, adapté aux propriétés que présente les images naturelles ; ces dernières présentent notamment un contenu structuré caractérisé par la présence de discontinuités convoluées par le système optique d’acquisition qui agit localement comme un filtre.

Sans perdre de vue le cadre applicatif de la détection d’informations cachées, il est proposé de modéliser les images suivant une dimension. Cette approche permet de décrire localement le contenu d’une image en utilisant un nombre limité de paramètres. Compte tenu de la nature continue par morceaux de la scène imagée, ce modèle local paramétrique est non-linéaire vis-à-vis des paramètres décrivant physiquement les discontinuités. Enfin, l’utilisation de ce modèle ouvre la voie à la conception d’un

test dont les performances statistiques sont explicitement données dans le chapitre6

suivant, ce qui permet in fine de respecter une contrainte sur la probabilité de fausses-alarmes.

5.4 Annexes du chapitre 5 : démonstrations des théorèmes5.1