• Aucun résultat trouvé

végétation avec le système SAR polarimétrique interférométrique

3.2 Recherche d’invariants pour réduire la complexité de la description du problème

3.2.1 Etude quantitative de la précision des estimations

Lorsque nous avons commencé à travailler sur ce sujet, de nombreuses études avaient déjà démontré sur des acquisitions aéroportées ou satellitaires la faisabilité d’estimer la hauteur de végétation avec le système PolInSAR [119,64,12,108,25,17], mais à notre connaissance, il n’y avait pas eu d’analyse de la précision avec laquelle on pouvait espérer réaliser ces estimations. Plutôt que de proposer un nouvel estimateur, notre première contribution [87] a donc consisté à quantifier la précision d’estimation de la hauteur de végétation avec le système PolInSAR dans le cadre du modèle RVoG considéré. Afin d’être indépendant du choix de l’estimateur du moment qu’il n’est pas biaisé, nous avons utilisé la borne de Cramer Rao (BCR) comme valeur de référence de la précision des estimations. Ce choix peut paraître optimiste car la BCR est une borne qui n’est pas toujours atteignable [121]. Néanmoins, comme cela sera discuté plus loin, nous avons observé que la précision donnée par la BCR semblait être atteinte par un estimateur.

Soit χ = {k1, k2, ..., kN} un échantillon de N mesures indépendantes issues d’une zone homogène (c’est-à-dire que les mesures sont identiquement distribuées) d’une image PolInSAR pouvant être décrite par le modèle RVoG. Cet échantillon est supposé distribué suivant une loi complexe Gaussienne circulaire et sa matrice de covariance est supposée être paramétrée comme indiqué Eq. (3.16). Le vecteur des paramètres inconnus est :

où (tvol,n)n=1,..9 (respectivement (tgro,n)n=1,..9) sont les 9 paramètres réels qui interviennent dans la paramétrisation des matrices Tvol (resp. Tgro). Soit bθi(χ)un estimateur de θi, supposé non-biaisé, c’est-à-dire : hbθi(χ)i = θi, où hi représente l’espérance statistique sur les différentes réalisations de l’échantillon χ. La précision de l’estimateur décrite par sa variance

var(bθi(χ)) = h(bθi(χ) − hbθi(χ)i)2i, (3.23) est bornée par la borne de Cramer Rao (BCR) :

var(bθi(χ)) ≥ BCR(θi). (3.24)

La borne de Cramer-Rao BCR(θi)est égal au ièmeterme diagonal de l’inverse de la matrice de Fisher IF. On rappelle [26] que le terme i, j de la matrice de Fisher est défini par :

[IF]ij= −h

2

∂θi∂θjlog P (χ, θ)i, (3.25)

où P (χ, θ) représente la densité de probabilité de l’échantillon χ quand le paramètre est θ. Dans le cas d’une loi normale centrée, le calcul de la matrice de Fisher est particulièrement simple puisqu’il suffit d’utiliser la formule de Slepian-Bang [106] :

[IF]ij = Ntr  Υ−1∂Υ ∂θi Υ−1∂Υ ∂θj  . (3.26)

La BCR est très utilisée en traitement du signal (voir par exemple [45]) car elle permet de déterminer une borne inférieure des performances d’estimation en ne tenant compte que de l’information contenue dans les données et donc sans être influencé par le choix d’un estimateur particulier. En plus, comme le montrent les formules précédentes, son calcul est particulièrement simple dans le cas gaussien. Au contraire, pour un estimateur donné bθi(χ)le calcul de sa variance n’est pas toujours facile et la plupart du temps il faut effectuer une simulation Monte Carlo pour estimer sa moyenne et sa variance.

Lorsqu’un estimateur bθ(χ) = {bθ1(χ), ...bθ20(χ)}non biaisé, de matrice de covariance

Σ = hbθ(χ) − hbθ(χ)i bθ(χ) − hbθ(χ)i

i, (3.27)

vérifie ∀a ∈ R20

aΣa = aI−1F a, (3.28)

alors cet estimateur est dit efficace. Il atteint les performances optimales qui sont alors décrites par la BCR. Néanmoins, rappelons que la BCR n’est pas toujours atteignable et qu’il existe un nombre important de travaux qui s’intéressent aux calculs d’autres bornes qui peuvent être plus grandes que la BCR [115,121]. Enfin, rappelons que le terme anti-diagonal de la matrice I−1F a aussi une interprétation. Il est égal à la covariance des estimateurs efficaces :

I−1

F



ij =cov(bθi(χ), bθj(χ)), (3.29) où

cov(bθi(χ), bθj(χ)) = h(bθi(χ) − hbθi(χ)i)(bθj(χ) − hbθj(χ)i)i. (3.30) Pour vérifier que la BCR était représentative de la précision des estimateurs, nous avons comparé par simulation Monte Carlo la valeur de la BCR sur la hauteur de végétation à la variance de l’estimateur proposé dans [64]. A cette époque, alors que le nombre d’estimateurs proposés continuait d’augmenter, nous avons constaté que l’estimateur proposé dès 2001 était efficace

lorsque la taille d’échantillon correspondait approximativement à une précision sur l’estimation de la hauteur de végétation de l’ordre du mètre [87]. Une illustration de ces performances est

Moyenne empirique de l’estimateur de hv [m]

Valeur vraie de hv [m]

Ecart type empirique de l’estimateur de hv [m]

BCR1/2(hv) [m]

Figure 3.8 – Résultat d’une simulation Monte Carlo illustrant les performances de l’estimateur proposé dans [64] sur un exemple dont les caractéristiques sont décrites dans le ta-bleau3.1. Dans la simulation Monte Carlo, le nombre de réalisations des échantillons

χ est égal à 100.

présentée Fig.3.8. Pour une taille d’échantillon de 200, le biais est faible, l’écart type est plus petit que le mètre, et surtout est du même ordre de grandeur que la racine carrée de la BCR. Une telle étude reproduite sur de nombreux exemples nous a convaincus que la recherche d’un nouvel estimateur n’était pas la priorité.

hv, zg [m] σv[m−1] Tgro 1000 Tvol[m−1] 31.4, 1 0.046 68 −0.65 + i −6 − 14i −0.65 − i 23 −3.6 − 0.26i −6 + 14i −3.6 + 0.26i 61 ! 100 −7 30 − 5i −7 76 −8 + 1i 30 + 5i −8 − i 120 !

Table 3.1 – Paramètres du volume et du sol pour l’exemple considéré Fig.3.8. Les matrices de polarisation du sol et du volume sont données dans la base lexicographique (définie par SHH,√

2SHV, SV V). Les paramètres du RADAR sont kz = 0.09 [m−1] et β =

π/4.

En complément à ces études par simulation Monte Carlo, nous avons aussi analysé en détail deux jeux de données réelles acquis en bande P par l’ONERA de Salon de Provence. Comme montré Fig.3.1, ces deux jeux de données correspondent à des végétations très différentes. La forêt de Nezer est tempérée et bien entretenue avec des parcelles régulières délimitées par des chemins. La forêt de Paracou est tropicale et donc très chahutée, en plus la topographie y varie beaucoup, ce qui rend difficile la sélection de grandes zones homogènes. En étudiant les don-nées de Nezer, dans [88] on a pu observer que les valeurs de BCR de hauteur de végétation et de hauteur de sol étaient du même ordre de grandeur que les variances empiriques de l’estimateur. Cette analyse, qui a nécessité d’avoir de grandes zones homogènes pour pouvoir estimer la va-riance des estimateurs a ainsi permis de vérifier l’intérêt du modèle RVoG et du calcul de la BCR pour l’analyse de la précision des estimations sur données réelles. De plus, un autre résultat qui a permis de vérifier que le modèle RVoG est adéquat à l’analyse des données réelles est l’analyse de robustesse de l’estimateur effectuée dans [2]. Lors de cette étude, nous avons considéré plu-sieurs écarts au modèle et nous avons vérifié que l’estimateur proposé dans [12] était robuste à ces écarts.

Etant donnés ces résultats, la question qui nous motivait n’était donc ni de trouver un nouvel estimateur, ni de proposer un nouveau modèle pour décrire nos données. En revanche, ce qui nous a interrogés est que nous observions une grande variation des valeurs de BCR de hv notée

BCR(hv)en fonction des situations physiques considérées. Cette variation est illustrée Fig.3.9 où l’on a présenté deux exemples représentatifs de ceux observés dans [2]. Pour l’exemple 1, la précision sur l’estimation de la hauteur de végétation obtenue pour une taille d’échantillon de 100 pixels varie peu en fonction de hv, on reste avec une précision meilleure que le mètre pour

hv et zg. Par contre, pour l’exemple 2, la précision sur l’estimation de la hauteur de végétation change d’un facteur 10 quand la hauteur de végétation hv passe de 23 mètres à 26 mètres. Le principal problème soulevé lors de ces travaux était donc de comprendre pourquoi pour certains jeux de paramètres, une centaine de mesures permet d’avoir une estimation de la hauteur de végétation de l’ordre du mètre et pourquoi pour d’autres jeux de paramètres, il faut plus de 104

mesures indépendantes pour avoir une précision sur l’estimation de la hauteur de végétation de l’ordre du mètre. Etant donné l’objectif d’envoyer un satellite pour effectuer ces estimations et les résolutions associées à ces missions [49], l’enjeu est très important.

!"#$# !"#%#

!"# $"#

B C R [m 2 ]p ou r N = 100 B C R [m 2 ]p ou r N = 100 hv [m] hv [m]

a) Ex 1 b) Ex 2

BCR(h

v

)

BCR(h

v

)

BCR(z

g

)

BCR(z

g

)

!"#%&'()*'#+# $"#%&'()*'#,#

Figure 3.9 – Deux exemples analysés dans [2] montrant la variété des situations possibles pour les valeurs de BCR en fonction des jeux de paramètres. Que ce soit pour l’exemple 1 en (a) ou l’exemple 2 en (b), chacune des courbes montre l’évolution de la BCR des hauteurs de végétation et de sol lorsque la valeur du paramètre hv du modèle RVoG change alors que les autres paramètres du modèle restent constants.

D’un point de vue méthodologique, la principale difficulté pour appréhender cette diversité de situations est que le modèle RVoG fait intervenir 20 paramètres réels inconnus et que sonder un espace à 20 dimensions avec simplement 10 valeurs par dimension nécessite 1020simulations, ce qui n’est pas réalisable. Ainsi, même si la BCR nous permet d’analyser la précision dans toutes les situations physiques envisageables, à ce stade, il est difficile d’essayer de prédire la précision que l’on pourra obtenir car d’une part, on ne connait pas a priori les valeurs des paramètres inconnus, et d’autre part parmi ces 20 paramètres inconnus, on ne sait pas lesquels sont importants pour avoir une bonne précision sur l’estimation de la hauteur de végétation.

3.2.2 Réduction de la complexité de la description du