• Aucun résultat trouvé

1 La modélisation du développement des cultures dans l’espace : du processus à la

1.2 La représentation des hétérogénéités des cultures : des causes aux méthodes de

1.2.2 La représentativité spatiale des mesures et des modèles

1.2.3.1 Les méthodes d’acquisition et interprétation des mesures localisées dans

Les mesures peuvent être effectuées de manière ponctuelle, avec une forte répétitivité spatiale (géophysique, capteurs embarqués) ou représenter l’espace de manière exhaustive (imagerie). Les méthodes d’échantillonnage, l’interprétation des mesures dans l’espace ainsi que les méthodes pouvant être utilisés vont différer suivant la nature des données à spatialiser.

67

1.2.3.1.1 Les mesures ponctuelles

Certaines mesures sont difficiles à acquérir ce qui impose de limiter le nombre de mesures à effectuer. C’est notamment le cas des analyses de terre et des prélèvements de biomasse qui sont des mesures particulièrement contraignantes à obtenir. Le nombre de mesure étant techniquement limité, le choix des zones à échantillonner est donc déterminant dans la représentation de l’espace. Sans être totalement exhaustif, il est possible de distinguer deux types d’échantillonnages (Figure 30) (i) un échantillonnage sans a priori (ii) un échantillonnage orienté sur des connaissances préalables de la répartition spatiale. Dans le premier cas, l’échantillonnage de l’espace pourra être aléatoire (Figure 30 a) ou bien systématique (Figure 30 c). Ces deux méthodes n’induisent pas de biais lié à des a priori mais ces méthodes nécessitent parfois un grand nombre de mesures pour se rapprocher au mieux de l’exhaustivité (Allen et al., 2010). En revanche il existe différentes méthodes qui permettent de sélectionner un nombre de points à échantillonner en se basant sur des connaissances préalables et de maximiser la représentativité des points de mesure.

Figure 30 : Différentes méthodes d’échantillonnage : (a) échantillonnage purement aléatoire (b) un échantillonnage aléatoire stratifié sur la base de critère géographiques (c) échantillonnage aléatoire stratifié selon une variable explicative (ex variable obtenue par télédétection) (d) un échantillonnage régulier de l’espace. Tiré de Allen et al. (2010)

Une de ces stratégies d’échantillonnage consiste à se baser sur des algorithmes qui exploitent la connaissance des schémas de distribution spatiaux via des critères géostatistiques. En

68

géostatistique, la répartition des variables dans l’espace est étudiée par l’autocovariance et/ou l’autocorrélation. Ces critères géostatistiques sont des fonctions qui permettent d’étudier la similarité ou la dissimilarité des variables en fonction de critères de distance basés soit sur la variance soit sur des coefficients de corrélation. Ainsi la covariance représentée visuellement par un variogramme, couramment représenté comme semi-variogramme (1/2 du facteur de définition) permet d’identifier la répartition spatiale de la variable. La covariance se calcule d’après la formule suivante :

Eq 3 Où Z est la variable d’espace x et h est l’éloignement entre deux points. Var est la variance et E l’espérance.

Trois paramètres principaux permettent d’interpréter l’autocovariance et les variogrammes : la pépite (valeur en distance 0 de la variance/espérance), la plage (range) qui peut représenter la distance pour atteindre un plateau et la troisième valeur est celle du plateau appelé seuil (sill) (Figure 31). Le cas représenté dans la Figure 31 est le cas d’une variable stationnaire, autrement dit cette variable aura une moyenne stable dès lors qu’une distance minimale est atteinte (plage). Le phénomène de pépite est quant à lui attribuable soit à la taille de l’entité mesurée soit à l’incertitude associée à la mesure. Ainsi, sur la base de ces critères géostatistiques il est possible de créer un modèle empirique qui reproduit les schémas de répartition spatiale d’une variable et de s’en servir pour établir des zones à échantillonner par inférence statistique (Brus and De Gruijter, 1997; McBratney et al., 1981).

Figure 31 : Schéma d’un semi variogramme d’une variable stationnaire avec seuil. « Nugget », en français la pépite est la valeur en distance 0 de la variance ou de l’espérance, « range » ou plage, est la distance pour atteindre un plateau et « sill » est valeur atteinte au plateau. La pépite se compose d’une part liée à l’intégration de la mesure (msmt error) et une autre pouvant être dû à l’absence de données sur des courtes distances entres les données spatiales (subgrid var). tiré de Grayson and Blöschl (2001)

69

La covariance connue avec une ou plusieurs variables qui sont mesurées avec une forte répétitivité spatiale (Figure 30b, Figure 30c) peut être elle aussi exploitée pour déterminer un échantillonnage. C’est le cas des méthodes d’échantillonnage stratifiées comme la méthode de Monte Carlo et de ses dérivées. La méthode stratifiée consiste à créer des classes au sein des variables d’entrée puis à faire un échantillonnage aléatoire itératif au sein de ces nouvelles entités (Figure 30 b). Il est toutefois nécessaire de s’assurer que la probabilité d’occurrence des différentes classes créées est bien équiprobable. La méthode d’échantillonnage stratifiée la plus courante et la plus connue est l’échantillonnage par hypercube latin (Lagacherie et al., 2006; Minasny and McBratney, 2006). Il s’agit de la méthode qui a été retenue pour déterminer les points de suivi au

cours de la thèse car cette méthode a déjà été éprouvée dans différentes études et a montré sa pertinence pour les mesures des propriétés de sol.

1.2.3.1.2 Le cas des mesures à forte répétitivité spatiale

Certaines mesures sont moins contraignantes et peuvent être répétées plus facilement dans l’espace. Cela concerne toutes les mesures rapides d’acquisition et qui peuvent être acquises de manière itinérante : pénétrométrie, résistivité, ou encore estimation du rendement de manière spatialisée. Ces mesures étant régulières mais ponctuelles et avec une répartition spatiale hétérogène, elles nécessitent d’être interpolées pour représenter la distribution spatiale. Pour cela il existe de très nombreuses méthodes qui peuvent s’appuyer sur des méthodes géostatistiques (krigeage) ou non géostatistiques comme la méthode des voisins naturels ou encore avec une pondération inverse au carré de la distance (Li and Heap, 2011).

Le krigeage (Figure 32 b) est une méthode qui s’appuie sur la reproduction de l’autocovariance spatiale en calant un modèle sur un variogramme issu des mesures. C’est une méthode locale non-biaisée, le modèle étant calé sur la minimisation de la variance. Cette méthode s’appuie sur le critère de distance par rapport à une distance du point stationnaire et de la distance inter-points. Le calage peut se faire soit d’après une espérance connue (krigeage simple) ou avec une espérance inconnue (krigeage ordinaire). En conditions réelles l’espérance n’étant que rarement (voire jamais) connue le krigeage le plus utilisé est le krigeage ordinaire. Enfin, suivant la répartition spatiale des données, avec une projection en deux ou trois dimensions, le krigeage est soit circulaire, soit sphérique.

70

Figure 32 : Différentes techniques d’interpolation appliquées à un modèle numérique de terrain: (a) données attribuées des polygones par un diagramme de Voronï (b) interpolation linéaire (c) distance inverse (d) krigeage sphérique. Tiré de Mitas and Mitasova (1999)

L’interpolation par voisins naturels (ou immédiats) passe par l’attribution d’une ou de plusieurs des valeurs mesurées à des surfaces/volumes différents de leur représentativité initiale. Par exemple, la méthode des polygones de Thiessen se base sur une fragmentation de l’espace en polygones en attribuant une valeur mesurée à chacun ces polygones (Figure 33). La méthode de triangulation fragmente quant à elle l’espace en triangles dont chacun des sommets correspond à une mesure.

71

Figure 33 : Schéma montrant le principe des voisins naturels par la méthode des polygones de Thiessen (traits pleins) ou le principe de triangulation (traits discontinus). (Baillargeon, 2005)

Enfin, la méthode par pondération inverse à la distance (Figure 32 b) attribue des valeurs à des mailles qui sont calculées dans une surface ou un volume déterminé, chaque point va contribuer à la valeur finale de la maille à l’inverse de sa distance avec celui-ci. La contribution des mesures spatiales à la valeur calculée et attribuée à chaque maille peut être limitée à une certaine distance (à définir) ou calculée avec toutes les mesures.

Les méthodes d’interpolation présentées ici ne sont pas exhaustives et de nombreuses autres existent qui sont parfois des mélanges de différentes méthodes préexistantes. L’utilisation de ces

différentes méthodes va dépendre du contexte local, de la nature de la variable mesurée à interpoler mais aussi de la répartition spatiale des points (Karydas et al., 2009) ; toutefois certaines méthodes sont robustes statistiquement comme la méthode du krigeage (Baillargeon, 2005) et/ou celles qui font appel à des variables covariantes et déjà spatialisées pour guider l’interpolation (Jarvis and Stuart, 2001).