• Aucun résultat trouvé

noeud intermédiaire (coût 2)

8.4 Changement d’échelle et perte d’information

8.4.2 Indices de structure et agrégation

8.4.2.2 Applications de l'indice d'entropie en hydrologie

Vieux et Farajalla utilisent la dimension fractale pour déterminer si la représentation spatiale des données peut enrichir un modèle (en précisant à quelle résolution) ou si leur moyenne suffit [Vieux, 1993], [Vieux et Farajalla, 1994] et [Farajalla et Vieux, 1995]. Comme le soulignent ces auteurs, « l’important dans un modèle distribué est qu’il saisisse la variabilité spatiale essentielle de chaque paramètre affectant le processus hydrologique » et non d’affiner au maximum la résolution, ce qui gaspille de la mémoire et augmente les temps de calcul. Le problème est donc de déterminer la résolution minimale qui permette de représenter la variabilité spatiale [Farajalla et Vieux, 1995].

Dimension fractale

Classiquement, la longueur d’une courbe est sensée pouvoir être calculée à partir d’une approximation polygonale c’est-à-dire par la construction de segments de droites reliant des points appartenant à la courbe [Hubert, 1994] (cf. Figure 13). Mais, pour de nombreux objets du monde réel, la mesure de la longueur dépend du nombre de points échantillonnés sur la courbe ou, autrement dit, de l’échelle d’observation. En effet, la variabilité spatiale des données se retrouve à différentes échelles et l’augmentation de résolution ne fait apparaître qu’une nouvelle variabilité [Hubert, 1994]. De tels objets sont qualifiés de fractals. Mandelbrot est à l’origine de cette théorie.

L’exemple le plus célèbre est celui de la longueur d’une côte. La mesure de cette longueur dépend de l’échelle d’observation : plus l’échelle est importante, plus la longueur est élevée. En réalité, la longueur tend vers l’infini.

Figure 13 : Approximation polygonale d’un arc de courbe (d’après [Hubert, 1994])

Le principe de la théorie Mandelbrot, [Mandelbrot, 1975], est le suivant :

Soit : ε un segment constant de courbe fractale, ou unité de « pavage », (le terme de pavage est employé pour signifier une discrétisation régulière de l'espace, le terme tesselation régulière est son synonyme).

L(ε) la longueur mesurée de la courbe fractale à partir de l’unité de pavage alors : L(ε) tend vers l’infini, quand ε tend vers 0

Le tracé de Ln(L(ε)) en fonction de Ln(ε) donne une droite de pente (1 - d), d étant nommé « dimension fractale »

donc :

L(ε) µ ε1 - d

(µ signifie proportionnel à)

et si : p(ε) est le nombre de pavages de la courbe alors :

L(ε) = p(ε) * ε

soit :

p(ε) µ ε-d et p(ε) * εd = k

avec k : constante

en exprimant cette constante par rapport à une longueur ε0, nous avons :

p(ε) = (ε0 / ε)d⇒ d = Ln p

((

))

Ln ( )ε ε ε0

(ε0 / ε) exprime le rapport de la résolution initiale à la résolution finale

La dimension fractale d définie par Mandelbrot [Hubert, 1994] exprime le niveau de variation présent à toute échelle dans une donnée (autosimilarité). Lorsque d est entière, elle correspond à la dimension euclidienne (0 pour un point, 1 pour une courbe, 2 pour une surface, 3 pour un volume). Mais, la dimension d est justement rarement entière dans le monde réel et est comprise entre 1 et 2 pour des objets linéaires, 2 et 3 pour des objets surfaciques ou 3 et 4 pour des objets volumiques.

La dimension fractale des périmètres de types de végétation a d’ailleurs été utilisée pour caractériser la nature anthropique ou naturelle du paysage [Milne, 1988] : plus le paysage est anthropisé plus la valeur de la dimension fractale se rapproche de la valeur euclidienne (en l’occurrence 1 pour un périmètre de tache de végétation).

L’autosimilarité, c’est-à-dire la constance de la dimension fractale quelle que soit l’échelle, est rarement vérifiée dans la nature. Elle peut difficilement être utilisée pour reproduire la forme d’un objet à une autre échelle (contrairement aux exemples théoriques du flocon de von Koch ou de la poussière de Cantor). La dimension fractale est cependant intéressante pour caractériser la perte de variabilité spatiale des données lors d’un changement d’échelle. Burrough remarque que la dimension fractale de la topographie augmente avec l’altitude, et explique cela par la sédimentation qui domine en plaine et qui empâte le paysage contrairement à la montagne où les processus d’érosion dominent [Burrough, 1986]. Mais, les différences de dimension fractale entre un champ de valeurs contrastées (la montagne) et un champ de valeurs uniformes (la plaine) indiquent aussi une perte d’information plus importante lors du changement d’échelle en montagne qu’en plaine, tout le problème étant alors de quantifier cette perte, comme cela est présenté plus loin.

Le coefficient de Hurst, que nous nommons « Hurst », caractérise l’écart entre la dimension euclidienne D et la dimension fractale d [Voss, 1988] :

d = D + (1 - Hurst) avec : 0 ≤ Hurst ≤ 1

Vieux fait l’hypothèse que l’entropie est déterminée par la résolution spatiale c’est-à- dire par l’unité de pavage de l’espace [Vieux, 1993] : ε

p(ε) µ ε-d p(ε) µ εHurst p(ε) = k * εHurst

d’où :

Ln(p(ε)) = Ln(k) + (Hurst * Ln(ε)) ⇒ Hurst = ∆Ln(p(ε)) / ∆Ln(ε)

pour un champ présentant une probabilité égale en toute localisation (par exemple, un plan incliné ou un champ de valeurs totalement aléatoire) et pour une unité de pavage ε, l’entropie de Shannon est maximale [Vieux, 1993] :

H’(ε) = Ln(p(ε)) donc :

Hurst = ∆H’(ε) / ∆Ln(ε)

Dans ce cas, le coefficient de Hurst, correspond au taux avec lequel l’indice de Shannon H’ change au fur et à mesure de l’agrégation. Ce coefficient de Hurst est utilisé par Vieux et Farajalla comme une mesure de la variation de la contiguïté de valeurs similaires [Vieux, 1993], [Vieux et Farajalla, 1994] et [Farajalla et Vieux, 1995]. Mais, paradoxalement, ils l’appliquent à des champs ne présentant pas une valeur d’indice de Shannon maximale. Le taux de variation de l’indice de Shannon en fonction de la résolution spatiale ne correspond pourtant pas au coefficient de Hurst si H’(ε) < Ln(p(ε)). Néanmoins, cet indice peut être intéressant pour décrire l’évolution de la perte d’information comme le prouvent les études de ces auteurs et comme cela est présenté dans une application sur le bassin versant du Renaison.

1,5 pour une courbe, il est inutile d’affiner l’échelle puisque la variabilité est identique à toute échelle.

Le taux de variation de l’indice de Shannon H’ au fur et à mesure de l’agrégation (assimilé au coefficient de Hurst) est appliqué par Vieux et Farajalla pour décider si la représentation de la distribution spatiale du coefficient de Manning (qui représente une rugosité du milieu à un écoulement) est nécessaire dans un modèle [Vieux et Farajalla, 1994]. Ce taux donne des valeurs proches de 0,5 ce qui indique une variabilité de type brownien et qui conduit à penser que la variabilité spatiale est indépendante du niveau de résolution. Les auteurs en déduisent qu'il est inutile d'accroitre la résolution et qu'il faut se contenter d'un indicateur global sans chercher à représenter la variabilité spatiale. L'emploi, lors de simulations, du coefficient de Manning distribué ou de sa moyenne donne des résultats similaires.

Le tracé de l’entropie en fonction de la résolution [Farajalla et Vieux, 1995] (cf. Figure 14) révèle un palier durant lequel l’entropie ne varie pas ou très peu, puis une rupture avec une décroissance forte de l’entropie en fonction de la résolution. Ceci se traduit au niveau du coefficient de Hurst dont la valeur reste relativement stable puis augmente au delà d’un seuil de résolution. Le tracé de cette courbe est indispensable pour savoir si une résolution donnée est acceptable : si aucun palier n’apparaît sur la courbe, alors les mailles sont trop grossières [Vieux, 1993].

Cette méthode de quantification de la perte d’information est importante pour les SIG car l’agrégation est un procédé employé dès qu’il est nécessaire de croiser deux couches cartographiques de résolution différente. Cette méthode est importante également pour la modélisation hydrologique : l’intérêt de cet indice d’entropie est de quantifier la dégradation de la qualité des données sans lancer systématiquement des simulations hydrologiques mais en utilisant l'analyse spatiale dans un SIG (cf. paragraphe 12.1.2.3, p. 160). Cette quantification permet finalement de connaître l'échelle adéquate et de choisir entre différentes méthodes d’agrégation.

0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 50m 100m 150m 200m 250m 300m 350m résolution entropie

Figure 14 : Indice d’entropie en fonction du niveau d’agrégation

L'intérêt de cette approche est testé pour deux types de données : des données quantitatives (altimétrie) et des données qualitatives (occupation du sol).

palier

résolution limite

8.4.3 Application de l'analyse de l'entropie à un Modèle Numérique de