• Aucun résultat trouvé

La fusion d’information

5.7 Intégration des BD vers un schéma intégré

5.7.2 Le processus d’intégration

5.7.2.4 La fusion d’information

Une problématique qui rend l’interprétation des résultats d’appariement de données géographiques plus complexe est liée à la cardinalité des liens d’appariement, c'est-à-dire le nombre d’objets en correspondance. Dans le processus d’appariement, les liens générés ont des cardinalités différentes, d’une part en raison des niveaux de détail différents des bases de données appariées, et d’autre part en raison de la différence des règles de spécifications

2 Candidats de la BDComp

Objet de la BDRef

146

de saisie associées à chaque base. L’appariement [1-1] apparaît lorsque les objets à apparier présentent une bonne proximité géométrique et/ou sémantique. Tandis que l’appariement [1-n] peut se produire à cause d’une différence de segmentation entre les deux bases. Les différences de segmentation ainsi que l’écart géométrique et/ou sémantique sont derrière la génération des liens [n-m].

Si des objets sont mis en correspondance, cela indique qu’ils représentent le même phénomène dans la réalité. Cela indique aussi que les différences, si elles existent, répondent au seuil d’acceptation (Sheeren, 2002). Dans les tests d’appariement effectués, nous avons maintenu les liens ″certains″ résultants du filtrage pour analyser leur cardinalité en vue d’une fusion d’information. Notons que les liens invalides ou non sûrs n’ont subi aucun traitement particulier, vu l’indisponibilité d’une source d’information supplémentaire. Nous considérons deux types d’analyses conformément aux objectifs prédéfinis pour l’appariement qui consistent en une fusion d’information sémantique et une mise à jour géométrique.

Fusion de l’information sémantique

La décision sur la fusion d’information est réalisée sur base d’une analyse des cardinalités des liens obtenus dans le cas d’appariement entre la base de données du PICC (BDRef) et la base de données de l’AGDP (BDComp). Notons l’objet de référence par «ObjetRef» et l’objet homologue dans la base de comparaison par «ObjetComp». La base de données résultant de la fusion est notée «BDFusion». Vu que nous voulons maintenir la précision géométrique de la BDRef, seule l’information sémantique sera fusionnée à travers un transfert de la valeur sémantique de l’attribut «Nature» de la BDComp sur les données géométriques de la BDRef. L’information extraite sera stockée dans la BDFusion en tant qu’attribut représentant la fonction du bâtiment.

Dans les résultats d’appariement, 90% des liens trouvés sont de type [1-1]. Ces liens sont établis entre des objets quand la similarité géométrique et/ou sémantique respecte les seuils de sélection et d’acceptation définis dans le processus d’appariement. Les liens résultant du filtrage sont considérés comme des liens sûrs. Pour chacun de ces liens, on conserve la géométrie de l’ObjetRef et on récupère le concept de l’ontologie de support correspondant au concept stocké dans l’attribut «Nature» dans la BDComp. Dans le cas d’un lien de type [1-n], lorsque les n objets de la BDComp contiennent la même information sémantique, celle- ci est transférée sur la géométrie de l’ObjetRef. Dans le cas contraire, l’information sémantique de l’ObjetRef sera maintenue dans la BDFusion. Les autres liens présentant des cardinalités multiples, doivent être validés par un autre processus. A défaut, nous maintenons l’information sémantique contenue dans la BDRef pour les entités participantes à ces liens.

Mise à jour de la donnée géométrique

L’analyse de l'appariement entre la base de données du PICC (BDRef) et la base de données de l’IGN (BDComp) présente un intérêt particulier dans la détection des évolutions géométriques intervenues dans la base de référence. Nous avons appliqué un filtrage des liens en ne maintenant que les liens présentant une distance surfacique supérieure à un seuil que nous avons choisi par analyse visuelle des résultats. Ce seuil a été fixé à la valeur de 0.6. Les liens résultants du filtrage sont considérés comme des liens certains. La détection des mises à jour est basée sur l’analyse des cardinalités obtenues :

147

 Les liens [1-1] mettent en correspondance deux objets présentant une proximité satisfaisante qui correspond aux seuils prédéfinis dans le processus d’appariement et dans l’étape de filtrage des liens sûrs. On distingue le cas où les géométries de l’ObjetRef et de l’ObjetComp sont très semblables et le cas où ces géométries présentent des différences signalant un cas de modification de l’ObjetRef. Des contrôles d’égalité géométrique (position, forme, rapport de surface) doivent être réalisés. Dans le cas d’absence de conflit géométrique, la géométrie de l’ObjetRef est conservée dans la BDFusion. Tandis que les liens simples présentant des différences de forme géométrique doivent être traités par contrôle externe pour sélection de la géométrie valide qui sera stockée dans BDFusion. Ces liens peuvent être imputés à une erreur de saisie ou à une modification de la géométrie de l’ObjetRef. Dans le cas d’une indécision, on conserve la géométrie de l’ObjetRef en lui associant une alerte de contrôle qualité.

 Les objets de la BDRef qui n’ont pas été appariés (liens [1-0]) sont de l’ordre de 3%. Ils peuvent donner lieu à plusieurs interprétations. En effet, ce type de liens peut signifier que l’ObjetRef n’a plus une existence physique, ce qui justifie son absence dans la BDComp. Il peut également s’agir d’une omission de saisie dans la BDComp, c'est-à-dire à un cas d’erreur. Autrement, l’absence de l’objet peut être justifiée par les spécifications de saisie lorsque celui-ci ne répond pas au critère de sélection défini pour la BDComp. Pour validation des hypothèses d’interprétation précitées, le recours à une autre source d’information est primordial. L’utilisation d’une ortho photo récente est recommandée.

Il s’avère à travers ce cas que la notification du statut du bâtiment (en démolition, en ruines, etc.), défini en tant qu’attribut dans la base de données collaborative pourrait apporter une information supplémentaire dans l’interprétation des liens d’appariement de type [1-0].

 Un lien de type [0-1] signale un cas de création d’objet qui doit être ajouté dans la BDFusion. 544 détections de mise à jour ont été trouvées. Les géométries associées à ces objets sont transférées dans la BDFusion. Il faut cependant noter que les objets résultant de la mise à jour ont une résolution géométrique moins bonne que celle de la BDRef. Cette information sur la précision doit être conservée dans les métadonnées pour qualifier la position géométrique des objets ajoutés. Un complètement sur le terrain doit être programmé pour améliorer leur représentation et assurer une homogénéité de la résolution de la BDFusion.

Les liens [1-n] ne sont pas très fréquents dans le cas où la BDRef représente la meilleure résolution géométrique. Ce type de liens est établi si l’objet de la base BDComp a éventuellement subi une scission. La comparaison des données attributaires associées aux objets pourrait confirmer cette hypothèse. Dans le cas de validation, les instances géométriques représentées par les n objets de la BDComp seront maintenues dans la BDFusion. Parmi les trois liens [1-n] trouvés dans les tests, nous avons repéré un cas de scission tandis que les deux autres cas présentent une anomalie de saisie dans la BDRef.

 Les liens [n-1] présentent un cas naturel dû aux différences de résolutions. La BDRef étant d’une bonne résolution géométrique par rapport à BDComp. Dans ce cas, les géométries associées à ces objets dans la BDRef sont conservées dans la BDFusion.

148

 Les liens [n-m] présentent le cas des liens d’appariement les plus difficiles à gérer. Ils sont créés lorsque plusieurs objets de la BDRef sont appariés avec plusieurs objets de la BDComp. En raison de leur complexité, ces liens demandent l’intervention d’un opérateur pour validation avant qu’une fusion d’information géométrique soit réalisée.