• Aucun résultat trouvé

CHAPITRE 4 : CARTOGRAPHIE DE LA STRUCTURE DES FORÊTS DENSES HUMIDES

4.2.4 Les modèles texture-structure

Des modèles linéaires ont été développés afin de tester le pouvoir explicatif des indices de texture de la canopée pour prédire des paramètres structuraux mesurés sur le terrain à travers les 15 parcelles du site de Forêt Plate. Les paramètres structuraux retenus pour cette analyse sont : i) le coefficient de variation des DBH (CV, en %) qui traduit diversité des tailles de diamètre des arbres présents sur une parcelle, ii) le diamètre quadratique moyen (Dquad, en cm) qui traduit le diamètre de

l'arbre d'aire basale moyenne, iii) la densité de tiges (D, en tiges/ha), iv) l'aire basale (AB, en m2/ha) et v) la biomasse aérienne (AGB, en t/ha). Pour chacun de ces paramètres, deux modèles de prédiction ont été testés. Le premier modèle utilise les indices de texture issus de l'ACP construite sur l'ensemble des imagettes comme prédicteurs et le second utilise les indices de texture issus de l'ACP construite uniquement sur les imagettes de forêt. Celles-ci ont été au préalable sélectionnées selon les résultats de la première classification des imagettes. Les paramètres des modèles ont été estimés à partir des 15 parcelles du site de Forêt Plate. Chaque modèle a été construit à partir de régressions linéaires multiples basées sur les 3 indices de texture (PCA1 à PCA3, Proisy et al. 2007), comme variables indépendantes, et les données de terrain comme variables dépendantes, à l'aide d'un modèle linéaire de la forme :

ܺ ൌ ܽ෍ ܽ ௜ୀଵ

ܲܥ

où ܺ est le paramètre structural considéré, ܽ et ܽ sont les coefficients de régression multiple de l'équation qui lient le paramètre structural aux indices FOTO (PCi) obtenus à partir des trois premiers axes de l'APC. Les indices PCi ont été calculés pour chaque parcelle en moyennant les valeurs des indices FOTO de toutes les imagettes qui chevauchent la zone délimitée par la parcelle, cette moyenne a été pondérée par les surfaces occupées respectivement par chaque imagette au sein de la parcelle.

Une méthode de sélection de variable pas à pas (" stepwise "), basée sur le Critère d'Information d'Akaike (AIC) a été utilisée pour identifier les modèles de prédiction des paramètres structuraux les plus performants, à l'aide de la fonction stepAIC du package MASS du logiciel R (3.1.2, R Development Core Team 2014). La fiabilité des modèles de prédiction a été testée à l'aide d'une méthode de validation croisée (du type " leave one out ") à laquelle une méthode de sélection de variable pas à pas a également été intégrée. Toutes les parcelles sauf une sont utilisées comme ensemble d'apprentissage, puis la capacité de prédiction du modèle est testée sur la parcelle non utilisée. Enfin, la qualité des modèles linéaires a été optimisée en supprimant les points (parcelles) aberrants, opération délicate du fait du faible nombre de points utilisés pour paramétrer les modèles texture-structure. Ainsi les points aberrants ont été repérés sur la base des distances de Cook

de Cook mesure l'effet de la suppression d'un point sur la qualité d'une régression, les points ayant une distance de Cook importante sont considérés comme méritant un examen plus approfondi dans l'analyse. Ainsi les parcelles correspondant à ces points aberrants ont été examinées afin de comprendre la raison de leur caractère aberrant (Fox 1991).

L'application des modèles de prédiction a été testée sur les autres images Pléiades, en dehors du site de Forêt Plate (FP). Les paramètres structuraux des 6 parcelles d'1 ha présentes sur des images Pléiades, c'est-à-dire, Aoupinié, Arago, Atéu, Boirou, La Guen et Tiwaé, ont été prédits à partir des modèles paramétrés sur les parcelles du site de Forêt Plate.

Pour caractériser la qualité des modèles de régression qui prédisent les paramètres structuraux des forêts à partir des indices de texture, les indices suivants ont été utilisés :

1. le coefficient de détermination (R2), fournit une évaluation de la qualité de l'ajustement du modèle en quantifiant la proportion de la variance expliquée par les variables explicatives, plus il est proche de 1 plus le modèle est performant. Le R2 est calculé de la façon suivante :

ܴൌ ෍ሺݕොെ ݕതሻ Ȁ ෍ሺݕെ ݕതሻ 

avec ݊ le nombre de données, ݕ les valeurs des mesures, ݕො les valeurs prédites et ݕത la moyenne des mesures.

2. le critère d'information de Akaike (AIC), compromis entre la qualité de l'ajustement d'un modèle et le nombre de paramètres qu'il implique. Sa valeur n'a pas de sens par elle-même, c'est un outil utilisé pour la sélection du modèle : le modèle offrant le meilleur compromis obtient la valeur d'AIC la plus basse. Le AICest calculé de la façon suivante :

ܣܫܥ ൌ ʹ݌ െ ʹ݈݊ሺܮሻ où ݌ est le nombre de paramètres à estimer du modèle et ܮ est le maximum de la fonction de vraisenblance du modèle.

3. l'erreur relative (s), est calculée comme l'erreur absolue (la valeur de la différence entre la valeur exacte et la valeur prédite par le modèle) divisée par la moyenne des valeurs exactes. L'erreur relative est donnée en pourcentage (i.e. pourcentage d'erreur). L'erreur absolue est calculée de la façon suivante :

ݏ ൌ ሺܣȀܤሻ ൈ ͳͲͲ avec ܣ : somme des valeurs absolues des résidus du modèle et ܤ : somme des valeurs absolues des données exactes.

4. l'erreur quadratique moyenne (RMSE) et l'erreur quadratique moyenne normalisée (RMSEn), sont des mesures courantes pour quantifier la différence entre les valeurs prédites par le modèle et les valeurs réelles, afin de caractériser comment le modèle est ajusté aux données. La RMSE est exprimée dans les mêmes unités que les valeurs prédites. La RMSEn qui est normalisée par la différence entre les valeurs minimale et maximale observées, est exprimée en %. La RMSE et la RMSEn sont calculées de la façon suivante :

ܴܯܵܧ ൌ ඩͳȀ݊ ෍ሺݕොെ ݕ

ܴܯܵܧ݊ ൌ ܴܯܵܧȀሺݕ௠௔௫െ ݕ௠௜௡

5. L’erreur absolue moyenne (MAE pour " Mean Absolute Error "), moyenne arithmétique des valeurs absolues des écarts. La MAE est calculée de la façon suivante :

ܯܣܧ ൌ ͳȀ݊ ෍ȁݕොെ ݕȁ

Enfin, la biomasse a été prédite sur toutes les imagettes des images en utilisant les coefficients de régression multiple calculés à partir du modèle linéaire paramétré sur les 15 parcelles du site de Forêt Plate et en utilisant les indices de texture calculés à partir des imagettes comme variables prédictives. La biomasse aérienne a ensuite été cartographiée sur les huit images Pléiades. La résolution spatiale de ces cartes est égale au décalage choisi lorsque l’on positionne les imagettes de 100 m de côté selon la logique de fenêtre glissante, c'est-à-dire 50 m de côté (Figure 4.4 E)

4.3 Résultats