• Aucun résultat trouvé

Les spécifications renferment de nombreuses déclarations imprécises et implicites. Cette particularité est liée à plusieurs aspects : l’usage de la langue naturelle, la nature des données à laquelle se réfèrent les spécifications (l’espace), et le contexte d’utilisation pour lequel ces spécifications sont destinées.

Ainsi, le caractère vague de certaines spécifications réside d’abord dans le fait qu’elles sont énoncées sous forme textuelle. De nombreux de qualificatifs du langage naturel sont flous et présentent des caractères de généralités. Qu’entend-on par « près », « nombreux », « trop », « principaux », « petit » ? Ces termes comme bien d’autres sont fréquemment utilisés dans les spécifications. On trouve par exemple des déclarations du type : « les petits bâtiments d’aspect précaire sont exclus » ou « si les sentiers sont trop nombreux, seuls les principaux sont retenus » ou encore « les points d’eau sont sélectionnés s’ils sont hors d’une ville importante ». Dans certains cas, une représentation schématique de la réalité est fournie mais elle laisse également une bonne part d’ambiguïté. Le schéma représenté en figure 38 concerne les ronds-points. On peut comprendre qu’il y a deux représentations pour cet objet (en fonction du diamètre), mais faut-il considérer que cette contrainte ne s’applique qu’à des ronds-points circulaires ?

Figure 38. Une représentation schématique des critères de saisie peut introduire des ambiguïtés dans les spécifications : la contrainte s’applique-t-elle uniquement aux ronds-points circulaires ?

(Source : [BDPays 2001])

Si les spécifications présentent ces imprécisions, c’est aussi parce qu’elles sont destinées à des personnes possédant une expertise importante du domaine. Il n’est pas toujours nécessaire d’être plus précis dans les documents pour la production des données. Les opérateurs de saisie ont acquis au fil du temps un tel savoir-faire qu’il leur est facile d’interpréter les règles mentionnées. Ces règles les guident dans leur choix mais une part importante d’interprétation leur est laissée : « toutes les lignes de transport par câbles de plus de 100m de long sont saisies, exception faite des installations sommaires servant uniquement à transporter du matériel » ; « les cours d’eau temporaires artificiels ou artificialisés sont saisis en fonction de leur importance et de leur environnement » ; « les constructions de moins de 20m² et de moins de 50m de haut sont incluses lorsque leur taille ou leur forme font d’elles des constructions à la fois bien identifiables et caractéristiques dans le paysage ». La sélection de ces objets dans la base ne sera pas la même suivant la personne chargée de la saisie, son expérience et éventuellement la connaissance qu’elle a du terrain.

∅ ∅∅ ∅ > 30m ∅ ∅∅ ∅ < 30m

Une imprécision est donc tolérée. C’est même le cas des spécifications pour lesquelles un seuil précis est fixé. Le seuil de 100m relatif aux lignes de transport par câbles par exemple ne sera pas rigoureusement respecté. Un câble de 98 m sera peut-être introduit dans la base car les opérateurs ne mesurent pas précisément les objets. Doit-on alors considérer que ces objets ne respectent pas les spécifications ? Il s’agit là d’un choix d’interprétation.

Nous considérons qu’il est nécessaire de tenir compte de cette imprécision et d’interpréter les différences de représentation avec des spécifications qui reflètent les connaissances implicites utilisées lors de la saisie. Il y a dans les données des représentations qui ne respectent pas rigoureusement les spécifications papiers mais qu’on peut considérer comme exactes en raison de l’imprécision tolérée au moment de leur création. Un travail s’impose sur les données pour cette raison : il faut quantifier l’imprécision pour mener une interprétation plus juste, avec des spécifications qui traduisent plus fidèlement le contenu des bases.

L’imprécision des spécifications s’illustre assez clairement en figure 39. Elle représente le résultat de la saisie de l’occupation du sol par deux producteurs différents, à partir des mêmes sources et en suivant les mêmes spécifications (celles de la BDTopo de l’IGN). Les différences de saisie entre les deux extraits sont évidentes et sont d’ailleurs particulièrement importantes mais la nature des données traitées accentue cette imprécision. L’occupation du sol est un thème particulier car les limites des zones sont par nature assez floues. Comment fixer précisément la limite d’une forêt ou d’une zone de broussailles ?

Figure 39. Résultats de la saisie de l’occupation du sol par des producteurs différents, en suivant les mêmes spécifications (les données sont ici à la même échelle) (Source : [Vauglin et Bel Hadj Ali 1998])

L’imprécision peut donc venir du langage utilisé, du manque d’information dans les spécifications mais aussi des phénomènes géographiques eux-mêmes. L’espace géographique est complexe. Il est parfois difficile de le décrire parfaitement. Il contient beaucoup de concepts aux limites floues (une ville, une agglomération, un talus,…) et il n’est pas simple d’en définir précisément le contour de manière univoque (voir à ce sujet l’ouvrage de [Burrough et Franck 1996]). La réalité géographique est également peuplée de nombreux cas particuliers. Des spécifications, aussi exhaustives soient-elles, ne pourront jamais tenir compte de tous ces cas particuliers. Une part de liberté et d’interprétation sera immanquablement laissée aux opérateurs lors de la sélection.

Couche Végétation

Producteur : Rollin Couche Végétation Producteur : F.I.T

Ces imprécisions vont naturellement apporter des difficultés dans la justification des différences de représentation mais un des enjeux de cette thèse est aussi de clarifier les critères de saisie peu précis. Un enrichissement peut être envisagé en « fouillant » les données de chaque base indépendamment les unes des autres mais surtout, en analysant les correspondances une fois les données appariées. En plus de l’étude de la cohérence des représentations, il devrait être possible d’éliciter certaines spécifications d’une des bases en s’aidant de l’autre base. Si on imagine par exemple que dans la première, les spécifications indiquent que toutes les cours intérieures des bâtiments sont saisies et que pour la deuxième, les contraintes relatives à ces objets sont absentes, on pourrait envisager d’utiliser la première base pour enrichir les spécifications de la deuxième. En analysant les données, on découvrirait par exemple que les cours intérieures ne sont saisies que sous certaines conditions (pour une longueur > 10 m et une largeur > 5 m par exemple).