• Aucun résultat trouvé

Nombre d’espèces 100 - 264

3.3.2.2. FORMATS DE DONNEES

Les données géographiques stockées dans ces SI sont de deux natures possibles. Soit ce sont des objets discrets, c'est-à-dire qu'ils n'occupent le territoire que de manière limitée (point de relevé, rivières, zone de végétation, …), soit il s'agit de variables continues qui peuvent être définies en chaque point de l'espace géographique (température, précipitation, altitude, …). Suivant la nature de la donnée de base, le mode de stockage numérique de l'information sera différent. Deux formats principaux sont actuellement disponibles pour la numérisation de données: le format vecteur et le format raster (Figure 23).

Monde réel

Raster

Vecteur Monde réel

Raster

Vecteur

Figure 23: Représentation des modes raster et vecteur (@ ESRI).

Le format vecteur permet de stocker des objets de type point, ligne ou polygone.

Chaque type d'objet se voit attribuer une table permettant de définir ses points remarquables. Pour les objets de type point, une seule table est suffisante contenant l'identificateur de l'objet, ainsi que ses coordonnées x, y, voire z. Pour un objet de type ligne, deux fichiers sont nécessaires, le premier contenant les points remarquables (nœuds marquant les débuts et fins d'arcs, les point d'inflexions), ainsi qu'une table définissant les arcs à partir de la table de point. Pour les objets de type polygone, la logique est la même et une troisième table est indispensable pour déterminer les polygones à partir de la table des arcs (Figure 24). La structure du stockage va donc se complexifier au fur et à mesure que la dimension spatiale augmente.

100

Figure 24: Structure des tables associées aux objets de types point, ligne (arc) et polygone.

Les tables décrivant la géométrie des objets sont appelées tables primaires. Par la suite d'autres tables d'attributs peuvent être associées selon une structure relationnelle en fonction de l'identificateur de l'objet qui doit être unique. Celles-ci sont appelées tables indirectes. On trouve donc deux types d'information distincts: l'un spatial et l'autre thématique (COLLET et HUSSY, 1995). On parle également pour ce format de données d'approche orientée objet. Ce mode de stockage permet d'obtenir une très grande précision. Les objets ont une définition précise indépendante de l'échelle et seule une portion discrète du territoire est saisie (position des objets). Il est évident que la précision dépend du mode de saisie, ainsi que de la précision du support d'origine. La méthode la plus courante pour la saisie de telles données est la numérisation, soit sur

une table à digitaliser, soit à l'écran (CHRISMAN, 1987). Les données de base sont le plus souvent des cartes papier, mais il peut également s'agir de données provenant d'un GPS (Global Positionning System), ou de données possédant des coordonnées (x;y;z) issues de BDR.

La structure des données raster consiste à appliquer une grille sur les objets qu'on veut numériser et d'attribuer une valeur à chaque cellule de la grille en fonction de sa position (Figure 25). On parle également de pixel pour picture element. Le mode de stockage est plus simple, puisqu'une couche d'information raster est totalement définie par un seul et unique fichier. La première partie du fichier spécifie la taille de la grille, nombre de lignes et de colonnes, la taille du pixel et les coordonnées d'un coin. Ensuite, on trouve à la suite la valeur de chaque pixel. Une grille ne peut donc stocker qu'une variable à la fois. Il faut donc autant de couches que de plans d'information ou de variables. On parle également d'une approche orientée attribut. L'avantage vient de la simplicité du fichier numérique qui permet de stocker de grandes quantités de données de manière compacte. Le principal inconvénient de ce format est que l'ensemble de la zone étudiée doit être numérisé à la manière d'une image. Il en résulte des tailles de fichier parfois importantes. La précision dépend directement de la taille du pixel. Celle-ci détermine la résolution et donc la taille du plus petit phénomène observable. Plus le pixel est petit, ou la grille est fine, plus la précision est grande. Par contre, la taille du fichier augmente au carré. La méthode d'acquisition la plus courante est le scannage.

Figure 25: Format de données raster.

Le mode vecteur, ou approche orientée objet, est particulièrement adapté pour les applications nécessitant la gestion d'objets géographiques, alors que le mode raster, ou approche orientée attribut, est généralement utilisé dans la modélisation de phénomènes spatiaux qui nécessitent le croisement (overlay) de plusieurs couches

d'informations différentes (LEHMANN, 1997). Ces deux modes de stockage ne sont pas en opposition, mais ils sont plutôt complémentaires. De plus en plus de logiciels sont capables d'intégrer ces deux modes et même d'assurer des transferts de l'un vers l'autre.

Il faut rester attentif qu'à chaque traduction, de l'information est perdue (MAGUIRE et DANGERMOND, 1991; CONGALTON, 1997). Le Tableau 6 montre un comparatif de ces deux modes de stockage, avec les avantages et inconvénients de chacun.

VECTEUR RASTER

Avantages Bonne représentation de la structure

Compacité des données

Topologie

Excellente représentation graphique

Haute précision spatiale

Couplage avec BDR

Structure de données très simple

Superpositions et combinaisons de données très simples

Analyses spatiales aisées

Excellente représentation des variables spatialement continues

Inconvénients Structure de données complexe

Opérations de superposition très difficiles

Analyses spatiales limitées

Faible résolution thématique

Gros volume de données

Résolution dépendante du phénomène étudié

Aspect visuel médiocre

Approche objet impossible

Tableau 6: Propriétés comparatives des formats (d'après CALOZ, 1992).

Le point délicat lors de la saisie de données géographiques, que ce soit dans les formats vecteur ou raster, est le géoréférençage, c'est-à-dire le soin porté à l'attribution de coordonnées géographiques. De cette précision dépendront les comparaisons qu'on pourra effectuer entre les différentes couches d'informations (SCHÖLZEL et al., 2002). Afin de minimiser la propagation d'erreurs, cette opération est cruciale et l'erreur doit être quantifiable. Les sources d'erreur sont nombreuses et variées dans un SIG, non seulement lors de la saisie, mais également lors de l'exploitation du système. Les erreurs doivent être identifiées et si possible estimées. Malheureusement, la multiplication des opérations lors d'un processus de traitement ou d'analyse rend cette partie de l'élaboration d'un SIG parfois très ardue (GOODCHILD et GOPAL, 1989; HEUVELINK et al., 1989; CHRISMAN, 1991; THAPA et BOSSLER, 1992; STANISLAWSKI et al., 1996). La seconde chose à laquelle il faut être attentif lors de la saisie de données dans un SIG est la compatibilité des informations. En effet, si le géoréférençage est correctement effectué, tous les plans d'informations peuvent être utilisés conjointement sans distinction de

l'origine. C'est une erreur classique qui fait superposer une carte de végétation issue d'une carte papier au 1:2'500 ième avec une carte pédologique dont l'échelle d'origine est le 1:50'000 ième. Les conclusions qu'on peut tirer d'une telle opération sont pour le moins hasardeuses.

Pour conclure, il faut encore mentionner deux autres types de formats de données numériques, mais d'une utilisation plus restreinte. Il s'agit du lattice, grille régulière de points (et non plus de cellules ou de pixels) et le format TIN (Triangular Irregulate Network, réseau de triangles irréguliers). Ces deux formats sont le plus souvent exploités pour représenter des Modèles Numériques d'Altitude (MNA), voire des Modèles Numériques de Terrain (MNT). Ils peuvent également être utilisés pour la représentation de toutes les variables spatialement continues (température, pluviométrie, …).