• Aucun résultat trouvé

Chapitre 2 : Cadre théorique

2.3 Approches de spatialisation des données agrométéorologiques

2.3.1 Méthodes déterministes de prédiction spatiale

Les méthodes de prédiction spatiale ou d’interpolation spatiale sont utilisées dans de nombreuses disciplines pour estimer des données manquantes en différents lieux du territoire (Di Piazza et al. 2011) ou établir une vue perspective de divers phénomènes géographiques à l'aide de cartes de surfaces continues. Les méthodes déterministes d'interpolation spatiale sont basées sur des fonctions mathématiques qui établissent la relation entre un ensemble d'observations ponctuelles et des sites de valeur inconnue. Alors que les méthodes géostatistiques sont fondées sur la théorie probabiliste selon laquelle un processus aléatoire sous-tend la distribution spatiale des points d'observation (Özdamar et al. 1999). Elles font à la fois appel à des fonctions mathématiques et aux propriétés statistiques des données d'observation. Ce qui leur permet de décrire la structure spatiale du phénomène étudié et d'évaluer l'incertitude de la prédiction spatiale. Les méthodes d'interpolation peuvent être réparties en deux groupes selon que ce sont des approches d'estimation globale ou des approches d'estimation locale. Les méthodes d'interpolation globale utilisent tous les points d'observation pour prédire la valeur des points inconnus. L’interpolation globale peut, selon le nombre d’observations disponibles et leur représentativité spatiale, masquer certaines variabilités locales du phénomène étudié. Un interpolateur global peut également être appliqué localement en considérant un certain rayon autour du point inconnu (Hengl 2009; Özdamar et al. 1999). Les méthodes d’interpolation locale utilisent un certain nombre d’observations proches du point inconnu pour estimer la valeur de ce dernier. Les méthodes d'interpolation peuvent aussi être classifiées comme exactes ou approximatives. Les interpolateurs

exacts conservent la valeur des points d'observation après l'interpolation, alors que les interpolateurs approximatifs ne le font pas (Özdamar et al. 1999). Il existe plusieurs méthodes déterministes d’interpolation spatiale dont les plus connues sont la régression polynomiale, les splines, la méthode du plus proche voisin et la distance inverse pondérée (Benavides et al. 2007; Boudhar et al. 2011; Di Piazza et al. 2011; Hengl 2009; Li et Heap 2011).

Les modèles de régression polynomiale décrivent pour l’ensemble du territoire étudié la relation entre la variable à prédire ou variable dépendante et un ensemble de variables indépendantes ou prédictives dont les valeurs sont connues en tout point du champ d'intérêt (Burrough et McDonnell 1998). Cette méthode d'interpolation globale assume que les données sont indépendantes les unes des autres, qu'elles sont normalement distribuées et de variance homogène (Li et Heap 2008). La méthode des surfaces de tendance est un cas particulier de la régression polynomiale. Elle utilise les coordonnées géographiques comme variables explicatives pour prédire la valeur des points inconnus (Li et Heap 2008).

Les splines sont l’équivalent mathématique des règles flexibles utilisées pour ajuster des courbes aux jeux de données ponctuelles (Burrough et McDonnell 1998). Elles sont constituées d'un ensemble de fonctions polynomiales. Chaque polynôme est ajusté localement aux données et les polynômes sont reliés entre eux par lissage. Le processus de lissage est effectué de façon arbitraire et a un important effet sur le résultat de l'interpolation (Burrough et McDonnell 1998; Li et Heap 2008). Les points d’arrêt des différents polynômes peuvent coïncider ou non avec les points d’observation. Ainsi, avec les splines, le maximum ou le minimum après l’interpolation n’est pas nécessairement le maximum ou le minimum des observations (Burrough et McDonnell 1998). Fondamentalement, les fonctions splines sont unidimensionnelles. Elles sont par exemple utilisées en climatologie pour déterminer des valeurs journalières à partir de données mensuelles (Lundqvist 1998). L’application des splines aux données bidimensionnelles donne lieu à une interpolation spatiale par surfaces de tendance locales (Li et Heap 2008). Dans cette approche, des surfaces polynomiales sont ajustées localement aux points d’observation au voisinage des points inconnus afin de déterminer la valeur de ces derniers. Il existe plusieurs méthodes d'interpolation spatiale basées sur les fonctions splines. Selon le degré m du polynôme, nous avons des splines linéaires (m = 1), des splines quadratiques (m = 2) ou des splines cubiques (m = 3) (Burrough et McDonnell 1998). L’interpolation par splines de plaques minces (thin

plate spline), initialement développée pour les données climatiques, demeure l’une des approches splines les

plus utilisées (Hengl 2009; Li et Heap 2008).

La méthode du plus proche voisin, plus connue comme les polygones de Thiessen (ou encore polygones de Dirichlet et polygones de Voronoï), établit la prédiction spatiale des points inconnues en leur attribuant la valeur du point d'observation le plus proche identifié selon les polygones de Thiessen (Burrough et McDonnell

1998; Li et Heap 2008). Ces polygones sont mathématiquement définis par les bissectrices perpendiculaires aux lignes reliant les points d’observation. Ces lignes forment un ensemble de triangles connu sous le nom de triangulation de Delauney (Burrough et McDonnell 1998; Gold et Mostafavi 2000; Mostafavi et al. 2010). Les polygones de Thiessen sont souvent utilisés dans les SIG ou dans les analyses géographiques comme une méthode rapide pour créer des surfaces à partir de données ponctuelles. Heinemann et al. (2002) ont par exemple utilisé les polygones de Thiessen pour délimiter des surfaces homogènes autour des stations météorologiques (SM) d’un bassin hydrographique. Le tracé des polygones de Thiessen dépend uniquement de la configuration géométrique des sites d’observation et non des valeurs observées sur ces sites (Arnaud et Emery 2000). Les estimations ponctuelles sont constantes sur chaque polygone de Thiessen et présentent des discontinuités lorsqu’on passe d’un polygone à un autre. Ces discontinuités dépendent uniquement de la géométrie des observations et ne traduisent pas le phénomène réel (Arnaud et Emery 2000).

La distance inverse pondérée, proposée par Shepard (1968), est l'une des plus anciennes et des plus utilisées des méthodes d’interpolation spatiale (Di Piazza et al. 2011; Hengl 2009; Sahlin et al. 2014). Le principe qui guide cet interpolateur local et exact est fondé sur la loi de Tobler (1970) selon laquelle les points les plus proches présentent plus de similarité que les points les plus éloignés (Di Piazza et al. 2011; Hengl 2009; Li et Heap 2008; Robinson et Metternicht 2006; Sahlin et al. 2014). Ainsi, les points d'observation au voisinage du point de prédiction influencent davantage la valeur de ce dernier. D'où l'aspect local de cette méthode d'interpolation (Li et Heap 2008). C'est une méthode qui combine la notion du plus proche voisin et le changement graduel de la surface interpolée (Burrough et McDonnell 1998). Elle effectue la prédiction spatiale à l'aide d'une combinaison linéaire des valeurs pondérées des points d'observation (Équation 2.32). La fonction de pondération est définie par l'inverse de la distance entre le point inconnu et les points d'observation, élevée à une puissance r (Équation 2.33). Le paramètre de puissance est le principal facteur affectant la précision de l’interpolation par la distance inverse pondérée (Burrough et McDonnell 1998; Li et Heap 2008). La qualité de l’interpolation repose également sur l'existence d'une autocorrélation spatiale positive entre les points d’observation (Di Piazza et al. 2011). La valeur de puissance la plus utilisée est 2 (Burrough et McDonnell 1998; Li et Heap 2008). Une valeur de puissance optimum peut être cependant déterminée sur la base d’une évaluation d'erreur à l’aide de la validation croisée (Li et Heap 2008; Robinson et Metternicht 2006). Mo et al. (2005) ont par exemple utilisé la distance inverse pondérée pour interpoler la température de l’air (TA), la pression atmosphérique et la durée de l’ensoleillement à partir de 52 SM reparties dans les plaines du nord de la Chine. Cette méthode est souvent utilisée en comparaison avec des méthodes géostatistiques comme le krigeage ordinaire et le cokrigeage (Li et Heap 2011). Son principal avantage est sa simplicité. Elle peut être affectée par une mauvaise distribution des points d’observation, car elle ne tient pas compte de leur configuration géométrique (Caruso et Quarta 1998). Elle a par conséquent tendance à

surpondérer les groupements de données, alors que celles-ci sont en partie redondantes (Arnaud et Emery 2000). 𝑧̂(𝑥𝑗) = ∑ 𝑧(𝑥𝑖) × 𝑤(𝑑𝑖𝑗) 𝑁 𝑖=1

Équation 2.32

𝑧̂(𝑥𝑗) = Prédiction au point 𝑥𝑗 𝑧(𝑥𝑖) = Observation au point 𝑥𝑖

𝑁 = Nombre d’observations utilisé pour l’interpolation du point 𝑥𝑗 𝑤(𝑑𝑖𝑗) = Fonction de pondération

𝑤(𝑑𝑖𝑗) = 𝑑𝑖𝑗 −𝑟 ∑𝑁 𝑑𝑖𝑗−𝑟

𝑖=1

Équation 2.33

𝑑𝑖𝑗 = Distance entre le point d’observation et le point de prédiction 𝑟 = Paramètre de puissance

Les méthodes déterministes d’interpolation spatiale sont généralement simples à utiliser et disponibles dans la plupart des logiciels d’analyse géographique dont les SIG. Il peut être difficile d'obtenir une cartographie précise de données agrométéorologiques continues car ces méthodes sont habituellement appliquées sur de grands territoires avec des données largement espacées (Benavides et al. 2007). Cependant, dans certaines situations elles peuvent donner des résultats similaires ou meilleurs que les approches géostatistiques (Hengl 2009; Robinson et Metternicht 2006).

2.3.2 Caractérisation des relations spatiales et de la variabilité spatiale à l’aide