Comment le registre répond-il à une requête de généralisation ?

C.13. Composant registre

C.13.3. Comment le registre répond-il à une requête de généralisation ?

Une requête au registre de généralisation de CollaGen est un triplet (espace géographique, saut d’échelle, étape courante (sélection, etc.)). La réponse attendue est une liste de processus dont la description est appariée par un appariement de type plug-in à l’espace géographique et ordonnée par pertinence décroissante. Comme dans (Sycara et el, 2002), la méthode proposée pour déterminer la réponse est une séquence de filtrage des services du registre. La séquence des filtrages successifs appliqués est présentée en Figure C-60 : le registre filtre d’abord par les pré-conditions des descriptions formelles des processus, en tenant compte du type d’espace puis de la compatibilité de la gamme d’échelle, il filtre par les post-conditions des descriptions formelles, et enfin il filtre en fonction des succès et échecs rencontrés précédemment dans le processus collaboratif. Seul le filtrage par les pré-conditions élimine des processus de la liste, les deux filtrages suivants se contentent de réordonner la liste par pertinence.

Figure C-60. La séquence des filtrages effectués par le registre pour répondre à une requête de généralisation.

L’étape de pondération est en pointillés car elle n’est pas systématique (il faut que des succès ou échecs soient déjà stockés).

Filtrage par type d’espace

Le filtrage par les types d’espace décrits dans les pré-conditions réalise dans un premier temps des appariements plug-in : si les pré-conditions sont équivalentes ou plus générales que l’espace géographique sujet de la requête, le processus est conservé. Pour analyser les espaces, le composant se réfère aux relations taxonomiques décrites dans l’ontologie : dans l’ontologie l’espace thématique réseau routier « est un » espace thématique de type réseau donc, si le sujet de la requête est l’espace réseau routier (les espaces thématiques n’ont qu’une instance), tous les processus qui possèdent une pré-condition réseau routier ou une pré-condition espace thématique de type réseau sont conservés par le filtrage de type d’espace.

Le registre réalise dans un deuxième temps un appariement relâché par le type d’espace à partir des descriptions générales des espaces. Nous avons vu qu’une pré-condition pouvait aussi être, plutôt qu’un type d’espace, un espace quelconque dont les caractéristiques générales en termes de densité d’objets, hiérarchisation des objets, homogénéité thématique, thème dominant et thème secondaire sont précisées. Par exemple, « ce processus est adapté aux espaces territoriaux peu denses dont le thème dominant est le bâti et le thème secondaire le routier ». Dans ce cas d’un espace quelconque, le registre mesure ces caractéristiques dans l’espace sujet de la requête et réalise un appariement relâché si au moins la moitié des caractéristiques correspond. Un appariement relâché à l’issue de ce filtrage est ensuite toujours mis en queue de liste par les autres filtrages, car assez imprécis. Seuls les succès ou échecs précédents peuvent faire passer un appariement relâché devant un appariement plug-in car nous considérons ces appariements relâchés comme moins fiables que les appariements plug-in.

Gamme d’échelle compatible

Le deuxième filtrage effectué par le registre vérifie la compatibilité des gammes d’échelles (la gamme d’échelle globale du processus et la gamme d’échelle de la pré-condition appariée dans l’étape précédente). Nous avons vu que la description formelle d’un processus de généralisation comprend une gamme d’échelle avec un saut d’échelle optimal, des échelles initiales minimum et maximum et des échelles finales minimum et maximum. Cette gamme d’échelle peut être spécialisée (en d’autres termes, réduite) pour chacune des pré-conditions. Ce filtrage prend en compte la gamme d’échelle réduite (correspondant à la pré-condition utilisée) de chacun des processus déjà filtrés. Si l’échelle initiale ou l’échelle finale, décrites dans la requête de généralisation faite au registre, est hors des limites de la gamme d’échelle du processus, celui-ci est éliminé. De plus, si ces échelles sont assez éloignées du saut d’échelle optimal de la gamme, l’appariement est considéré comme relâché, et le processus est placé en queue de liste avec les autres appariements relâchés.

Filtrage par les post-conditions

Les deux premiers filtrages doivent avoir éliminé les processus de généralisation disponibles non pertinents et cette étape de filtrage par les post-conditions permet de réordonner les processus restant en fonction de leur pertinence calculée principalement en ayant recours aux post-conditions des descriptions formelles. Trois critères sont utilisés pour calculer la pertinence d’un processus : la confiance dans la pré-condition, le saut d’échelle et surtout l’adéquation des post-conditions avec les conflits effectivement identifiés par des moniteurs dans l’espace à généraliser. La Figure C-61 illustre le fonctionnement du filtrage (l’échelle n’est pas prise en compte pour simplifier). Avec une confiance dans la pré-condition identique de 4, la pertinence est décidée en faveur du processus 2 car ses post-conditions sont mieux en adéquation avec les conflits présents dans l’espace rural.

Figure C-61. Illustration du filtrage par les post-conditions par mise en adéquations avec les moniteurs

contenus dans l’espace.

La pertinence d’un processus par rapport à un espace géographique est une valeur numérique comprise entre 0 et 5 (5 étant la pertinence maximum). Les processus sont classés du plus pertinent (celui dont la pertinence est la plus grande) au moins pertinent. Cette valeur de pertinence est calculée de la manière suivante :

Les coûts dus aux contraintes et à l’échelle sont des réels compris entre 0 et 1 qui pondèrent la pertinence a priori exprimée dans la pré-condition. Le coût dû aux contraintes est le plus complexe à calculer car il nécessite de trouver un indicateur pour quantifier les conflits à partir des moniteurs de contraintes localisés à l’intérieur de l’espace géographique demandeur et de faire le rapport avec les moniteurs dont la contrainte correspondante est prise en compte par le processus d’après les conditions. Le tout est pondéré par l’importance des contraintes et l’indice de confiance des post-conditions :

Notre fonction f est donc un moyen de remédier à la difficulté de quantifier les conflits à partir des contraintes. Il faut noter que cette fonction donne plus d’importance aux contraintes relationnelles car elles impliquent deux objets et aux contraintes meso dont l’importance est multipliée par le nombre d’objets composant le meso. Si nous reprenons l’exemple de la Figure C-61, le coût dû aux contraintes est différent car le moniteur de la contrainte de maintien d’alignement de bâtiments concerne cinq objets ce qui donne des coûts de contrainte de 13/33 pour le processus 1 et 28/33 pour le processus 2 qui est bien toujours le processus le plus pertinent (on considère ici que les indices de confiance des post-conditions sont tous de 5).

Le coût d’échelle essaie d’évaluer la distance du saut d’échelle de la généralisation demandée avec le saut d’échelle optimal de la description formelle du processus dont le composant évalue la pertinence. Le registre évalue donc l’écart avec l’échelle initiale et l’écart avec l’échelle finale. L’échelle finale et l’échelle initiale contribuent chacune pour moitié au coût d’échelle. Par exemple, si le saut d’échelle optimal d’un processus est de 1 : 15000 à 1 : 50000, son coût d’échelle pour un saut d’échelle assez proche de 1 : 10000 à 1 : 55000 est de 0,92. Ainsi, tant que le saut d’échelle est proche du saut optimal, le coût d’échelle contribue bien moins que le coût de contrainte à la pertinence du processus.

Faire contribuer les contraintes à la pertinence de manière quantitative plutôt que qualitative est relativement dangereux car cela peut amener à de mauvaises interprétations de la pertinence d’un processus. Ce n’est pas parce qu’il y a une grande quantité de contraintes non satisfaites qu’il y a une grande quantité de conflits. Ainsi, l’expérience du projet EuroSDR d’état de l’art des logiciels de généralisation du commerce (Stöter et al, 2010) montre que l’évaluation quantitative des contraintes peut être trompeuse. En effet, les cartes généralisées obtenues avec les différents logiciels participant au test ont été évaluées de différentes manières et notamment par des experts qui ont noté les cartes pour chacune des contraintes que les cartes devaient respecter (Stöter et al, 2009). Ces travaux montrent que cumuler ces chiffres d’évaluation est trompeur car certaines contraintes peu nombreuses dans les données (comme les contraintes meso) ont beaucoup plus d’importance sur la qualité et la lisibilité de la carte que d’autres contraintes bien plus fréquentes dans les données. Pour se prémunir contre ces problèmes, nous avons introduit dans nos formules de pertinence une forte pondération par l’importance ainsi qu’une pondération par le nombre d’objets concernés par chaque contrainte. Nous considérons que ces précautions nous protègent de mauvaises évaluations de la pertinence mais des tests sur un plus grand nombre de cas sont nécessaires pour bien valider cette proposition (voir E.4).

Exemple de requête

Reprenons maintenant de manière plus complète l’exemple précédent de généralisation d’un espace rural pour illustrer le déroulement complet de la méthode de réponse à une requête au registre de généralisation. La Figure C-62 présente la situation initiale avec une requête pour généraliser cet

espace rural du 1 : 15 000 au 1 : 50 000 avec quatre processus enregistrés. Le premier filtre sur le type d’espace permet d’éliminer le processus 3 qui n’a pas de pré-condition avec espace rural ou un concept parent de l’espace rural. Le deuxième filtre permet d’éliminer le processus 4, car son échelle finale maximum (1 : 25000) est supérieure à l’échelle finale de la requête (1 : 50000). Le troisième filtre permet d’ordonner les processus 1 et 2 par pertinence. Le processus 1 a un indice de confiance de 4 pour les espaces ruraux, un coût d’échelle de 0,88 et un coût de contrainte de 0,57 (16+30+18+25/155) ce qui donne une pertinence de 2,02. Le processus 2 a un indice de confiance de 4 également, un coût d’échelle de 1 et un coût de contrainte de 0,46, ce qui donne une pertinence de 1,83. Le processus 1 est donc le premier dans la liste de processus servant de réponse à la requête.

Figure C-62. Exemple de requête au registre de généralisation : parmi les 4 processus disponibles, quels sont

les plus adaptés pour généraliser cet espace rural ?

Dans le document Le Modèle CollaGen : collaboration de processus automatiques pour la généralisation cartographique de paysages hétérogènes (Page 138-142)