• Aucun résultat trouvé

Extension 1 : distance moyenne de Fréchet et couples de points homologues

différentes... 67

II.2.1 Distance de Fréchet discrète partielle ... 67 II.2.2 Distance de Fréchet discrète entre deux lignes fermées ... 68 II.2.3 Distance de Fréchet discrète partielle entre une ligne ouverte et une ligne fermée... 72 II.2.4 Distance de Fréchet discrète partielle / partielle entre deux lignes ouvertes ... 73

II.3 Algorithme d’appariement ... 78

II.3.1 Recherche de la nature des lignes comparées... 79 II.3.2 Relations d’emprises entre les lignes... 79 II.3.3 Types d’appariement entre lignes... 81 II.3.3.1 Appariement simple « 1 – 1 » de deux lignes : ... 81 II.3.3.2 Appariement total/partiel « 1 – P » entre deux lignes ... 82 II.3.3.3 Appariement « partiel/partiel » (PP) et « deux partiel/partiel » (2PP) entre deux lignes ... 82 II.3.4 Méthode globale : appariement par fichier ... 86

II.4 Exemple d’applications de la méthode sur la comparaison de traits de côte ... 89

II.4.1 Présentation des données et de la zone d’étude ... 89 II.4.2 Méthode de comparaison des traits de côte ... 89 II.4.3 Résultats et perspectives... 90

II.5 Bilan sur les apports des extensions... 93

2

Le chapitre Précédent a montré que les éléments caractéristiques importants pour l’intégration de MNT étaient essentiellement linéaires. Il faut donc disposer de distances permettant de comparer, apparier puis intégrer ces éléments. L’algorithme retenu pour réaliser l’intégration de données terre/mer à l’issue de cet inventaire est celui basé sur la distance de Fréchet car elle est la mesure la plus appropriée pour comparer des éléments linéaires complexes (thalwegs crêtes, etc.) Celle-ci, introduite par [Fréchet, 1906], se base sur l’assimilation de toute ligne à une suite de points orientés équivalente à une fonction continue. Le résultat est une distance maximale entre les deux lignes comparées. La difficulté à utiliser ce calcul vient de sa complexité à programmer. [Eiter & Mannila, 1994] proposent une solution en développant une estimation de cette distance : la distance de Fréchet discrète.

Cette distance a pour intérêt de réaliser un appariement basé sur les points homologues des lignes comparées et non les points les plus proches. Cependant, telle qu’elle a été définie, elle est insuffisante pour répondre à toutes les attentes et contraintes d’un appariement de données géographiques. En effet l’algorithme de départ ne s’applique qu’à des lignes ouvertes, sensiblement de même taille et d’orientations identiques. Dans le cadre de l’appariement, il est nécessaire de l’adapter afin de pouvoir comparer des lignes d’emprises, de tailles, de natures et d’orientations différentes.

Dans le cas de données réelles, les lignes numérisées (1) peuvent présenter l’aspect de lignes « fermées » (polygones dont les points sont ordonnés) et (2) ne sont pas obligatoirement saisies dans le même sens. Il convient donc de déterminer avant toute chose la « nature » d’une ligne : si le premier point est identique au dernier, alors la ligne représente une ligne fermée. Ensuite il faut également s’assurer des orientations respectives des lignes entre elles. Il s’agit de vérifier que les suites ordonnées de points de chaque ligne ouverte sont bien dans le même sens et que les points de début et de fin sont homologues et non diamétralement opposés.

Les deux extensions développées dans ce chapitre se proposent donc de répondre aux différents problèmes posés lors de la comparaison de lignes en inventoriant les différents cas de figure rencontrés.

Les algorithmes détaillés par la suite expliquent comment utiliser au mieux ces distances lors des processus d’appariement de lignes. La première partie présente succinctement les lignes et les attributs qui sont utilisés dans les processus de comparaison et d’appariement.

La seconde partie détaille toutes les distances introduites pour la comparaison de lignes : - la distance moyenne tout d’abord, qui permet d’avoir une estimation de l’écart moyen

entre les lignes. Elle donne une information complémentaire à la distance maximale définie par Fréchet ;

- la distance de Fréchet partielle ensuite, définie par [Devogele, 2002] pour la comparaison de lignes de tailles variables ;

- la distance de Fréchet discrète entre deux lignes fermées ;

- la distance de Fréchet discrète partielle destinée à comparer des lignes de tailles variables et de natures différentes (ligne ouverte ou fermée) ;

- et enfin la distance de Fréchet discrète partielle calculée entre deux segments de lignes.

La troisième partie se base sur ces distances pour détailler les algorithmes d’appariement. La première section présente les étapes d’identification de la nature des lignes comparées. La seconde présente les différents types d’inclusion qu’il existe entre les emprises des lignes étudiées. Et la dernière section explique quel appariement est effectué selon les différents cas de figure identifiés et quelle distance est adaptée. Une dernière section réalise une synthèse en intégrant ces appariements simples dans un algorithme de traitement global de deux jeux de polylignes.

Finalement, la dernière partie sert de validation des algorithmes appliqués au cas de comparaison de lignes en présentant le résultat d’une étude sur le suivi du trait de côte. Cette étude s’est réalisée au moyen d’indicateurs visuels extraits d’images satellites et de la distance de Fréchet pour la quantification des déplacements entre une ligne de référence et une ligne numérisée à une date donnée.

II.1 Extension 1 : distance moyenne

de Fréchet et couples de points

homologues

La distance de Fréchet discrète (ddF) représente l’écartement maximal entre deux points

homologues des lignes comparées. Afin de compléter l’information fournie par cette mesure, d’autres distances, toutes dérivées de la ddF (voir Chapitre I), ont été introduites. La première

distance exposée dans cette section, la distance de Fréchet moyenne (daF), permet

l’évaluation de l’écartement moyen global entre les points homologues des lignes. Elle est la moyenne des distances euclidiennes entre couples de points issus du chemin minimum. Le « chemin minimum » est composé d’une suite de couples de points {(L1.1, L2.1),… (L1.n,

L2.m)} pour lesquels la distance d’écartement entre les points du couple est inférieure ou égale

à ddF. Les points ainsi retenus sont appelés points homologues.

Pour reprendre l’exemple du maître et de son chien introduit au chapitre II, plusieurs chemins possibles respectent la distance de Fréchet. Parmi ces chemins candidats, le « chemin minimum » constitue celui pour lequel le promeneur et son chien évoluent le plus proche possible l’un de l’autre à chacun de leur déplacement.

Pour calculer ce chemin, les deux matrices de distance et de Fréchet sont nécessaires ainsi que l’opérateur inférieur ou égal (<=) entre deux couples de réels. Cet opérateur se définit ainsi :

(a,b) et (c,d) ∈ℜ2

(a,b) <= (c,d) si a < c ou si a = c et b<=d

(1)

où « a » et « c » représentent les valeurs de cellules de la matrice de Fréchet (MF). De même « b » et « d » sont les valeurs des cellules de la matrice de distance (MD). L’opérateur inférieur ou égal (<=) va permettre de choisir le couple de points homologues parmi ceux possibles. Pour les lignes de la figure 29, les matrices de distance et de Fréchet ont été calculées dans le Erreur ! Source du renvoi introuvable.. A partir de ces matrices sont extraits les couples MF(i, j) et MD(i, j) replacés dans la cellule (i, j) du

tableau 6.

Le chemin minimum (CM) de la figure 30 est construit par « retour arrière »

(« backtracking ») à travers les matrices. Il débute donc par le couple de points final : (L1.n,

L2.m). Le couple suivant, (L1.i, L2.j), est recherché parmi trois couples candidats, (L1.i-1, L2.j-1),

(L1.i-1, L2.j) et (L1.i, L2.j-1), à l’aide de l’opérateur <= défini précédemment. La valeur de la MF

associée au couple de points considéré signifie que pour aller du couple de départ au couple considéré, la distance de Fréchet vaut MF. Le couple retenu parmi les trois possibles est celui qui permet d’utiliser le sous-chemin le plus petit possible.

Par exemple entre les trois couples (L1.7, L2.7), (L1.7, L2.6), (L1.8, L2. 6) de la figure 29, le couple

(L1.7, L2.7) n’est pas retenu car (MF7.7) > (MF6.7) et (MF6.8). Entre les deux autres couples, la

valeur de la distance de MF est égale ce qui signifie, si l’analogie du maître et de son chien est

reprise, que les deux chemins passant par ces couples utilisent une laisse de même longueur. Dans ce cas, le couple choisi est celui dont les points sont les plus proches (dans la matrice de distance MD) : (MD6.7) < (MD6.8). lignes 0 1 2 3 4 0 2 4 6 8 10 ligne1 ligne2

Figure 29 : Couple de lignes homologues.

Tableau 5 : Matrice de distance (euclidienne) et matrice de Fréchet des lignes de la figure 29

x1i 0.2 1.5 2.3 2.9 4.1 5.6 7.2 8.2 y1j 2 2.8 1.6 1.8 3.1 2.9 1.3 1.1 Matrice de Distance (MD) x2i y2j 1 2 3 4 5 6 7 8 0.3 1.6 1 0.41 1.70 2.00 2.61 4.09 5.46 6.91 7.92 3.2 3.4 2 3.31 1.80 2.01 1.63 0.95 2.45 4.52 5.50 3.8 1.8 3 3.61 2.51 1.51 0.90 1.33 2.11 3.44 4.46 5.2 3.1 4 5.12 3.71 3.26 2.64 1.10 0.45 2.69 3.61 6.5 2.8 5 6.35 5.00 4.37 3.74 2.42 0.91 1.66 2.40 7 0.8 6 6.91 5.85 4.77 4.22 3.70 2.52 0.54 1.24 8.9 0.6 7 8.81 7.72 6.68 6.12 5.41 4.02 1.84 0.86 Matrice de Fréchet (MF) 1 2 3 4 5 6 7 8 1 0.41 1.70 2.00 2.61 4.09 5.46 6.91 7.92 2 3.31 1.80 2.01 2.00 2.00 2.45 4.52 5.50 3 3.61 2.51 1.80 1.80 1.80 2.11 3.44 4.46 4 5.12 3.71 3.26 2.64 1.80 1.80 2.69 3.61 5 6.35 5.00 4.37 3.74 2.42 1.80 1.80 2.40 6 6.91 5.85 4.77 4.22 3.70 2.52 1.80 1.80 7 8.81 7.72 6.68 6.12 5.41 4.02 1.84 1.80

Le processus est itéré selon l’algorithme décrit figure 30 jusqu’au couple de départ C1,1. Le

chemin minimum obtenu est représenté dans le

tableau 6 sous forme de cellules grisées contenant les couples de réels. C’est une suite ordonnée de neuf couples (voir

tableau 6) : (CM) = {C1,1 (L1.1, L2.1), C2,2 (L1.2, L2.2), C3,3 (L1.3, L2.3), C3,4 (L1.4, L2.3), C4,5 (L1.5,

L2.4), C4,6 (L1.6, L2.4), C5,6 (L1.6, L2.5), C6,7 (L1.7, L2.6), C7,8 (L1.8, L2.7)}.

Cette programmation dynamique avec l’opérateur <= donne des résultats plus rapidement que dans celle proposée par [Devogele, 2002]. En effet dans [Devogele, 2002], l’ensemble des chemins possibles sont testés avant de choisir celui qui est le plus optimal, ce qui peut être très long pour des lignes comportant énormément de points. Avec la méthode par backtracking présentée ici, seules (N+M) comparaisons au maximum sont effectuées.

L2.1

L1.8

L2.7

L1.1

Figure 30 : Algorithme pour le calcul du chemin minimum.

Tableau 6 : Le « chemin minimum » des lignes (L1.1, L2.1) et (L1.n, L2.m) est défini en sélectionnant les

couples de réels en grisés.

1 0.41 0.41 1.70 1.70 2.00 2.00 2.61 2.61 4.09 4.09 5.46 5.46 6.91 6.91 7.92 7.92 2 3.31 3.31 1.80 1.80 2.01 2.01 2.00 1.63 2.00 0.95 2.45 2.45 4.52 4.52 5.50 5.50 3 3.61 3.61 2.51 2.51 1.80 1.51 1.80 0.90 1.80 1.33 2.11 2.11 3.44 3.44 4.46 4.46 4 5.12 5.12 3.71 3.71 3.26 3.26 2.64 2.64 1.80 1.10 1.80 0.45 2.69 2.69 3.61 3.61 5 6.35 6.35 5.00 5.00 4.37 4.37 3.74 3.74 2.42 2.42 1.80 0.91 1.80 1.66 2.40 2.40 6 6.91 6.91 5.85 5.85 4.77 4.77 4.22 4.22 3.70 3.70 2.52 2.52 1.80 0.54 1.80 1.24 7 8.81 8.81 7.72 7.72 6.68 6.68 6.12 6.12 5.41 5.41 4.02 4.02 1.84 1.84 1.80 0.86 1 2 3 4 5 6 7 8

La figure 31 montre les couples de (L1.i, L2.j) associés au chemin minimum. Les points issus

des couples sont considérés comme homologues. Cette figure montre qu’un point peut être associé à plusieurs points de l’autre ligne.

Figure 31 : Couples de points (L1. i, L2. j) du chemin minimum représentés par les lignes pointillées.

La distance de Fréchet moyenne est la moyenne des distances entre couples de points homologues issus du chemin minimum. Elle donne un indice de l’écartement global moyen des lignes alors que la distance de Fréchet fournit un écart maximal.

Soit k couples de points homologues (L1.i, L2.j) ∈ CM :

daF = k 1 ) , ( 1. 2.j k i L L d

avec (L1.i, L2.j) ∈ CM. (1)

Pour l’exemple (daF) vaut 0,9524. Une valeur forte de la distance de Fréchet (ddF) peut être

due :

- soit à un « accident » local important des points d’une des deux lignes (cas (a) figure 32). Dans ce cas la valeur de la (daF) est bien meilleure ;

- soit à un mauvais calage général d’une ligne sur l’autre (cas (b) figure 32). La valeur de la (daF) est alors très proche de celle de la (ddF).

Figure 32 : Cas pour lesquels à distances moyennes égales, les distances de Fréchet maximales correspondantes sont très différentes.

Il est à noter qu’un ré échantillonnage des lignes réduit l’imprécision de la discrétisation sur la valeur de cette distance.

Tableau 7 : Evolution des valeurs de ddF et daF selon le taux de ré échantillonnage des lignes de la figure 29

Sans 1 0.1 0.01 0.001

ddF 1.8028 1.2260 1.2015 1.2012 1.2012

daF 0.9524 0.5843 0.5116 0.5030 0.4997

Le tableau 7 montre la variation des valeurs selon l’échantillonnage effectué. L’architecture des jeux de données de départ ne gère pas le positionnement des points ni leur espacement : l’appariement est alors calculé entre les points constitutifs des lignes mais la longueur des segments comparés est très approximative. Sans ré échantillonnage, la mesure obtenue ne donne pas une valeur « fiable » de la distance maximale réelle entre les segments mais seulement une estimation de l’écartement entre les extrémités des segments.

Pour obtenir une valeur daF de précision centimétrique, il faut effectuer un échantillonnage

avec un pas de l’ordre de quelques centimètres. Ceci s’explique par la corrélation de la distance de Fréchet discrète et de la longueur des segments (« LongMaxSeg », [Eiter & Mannila, 1994]) à partir desquels elle est calculée (voir Chapitre II).

II.2 Extension 2 : distance de Fréchet

Documents relatifs