• Aucun résultat trouvé

Autres variables d’intérêt de l’IFN non retenues dans la typologie

Construction d’une typologie structurelle

Encadré 6.1. Autres variables d’intérêt de l’IFN non retenues dans la typologie

Structure du peuplement

Des variables de description de la structure de peuplement existent au sein de l’IFN : il s’agit de la variable « Structure forestière » (SFO) remplacée par la variable « Structure Verticale » (SVER) à partir de l’année 2014. La variable SFO distinguait cinq catégories très classiques en sylviculture : futaie régulière ou irrégulière, taillis, mélange futaie-taillis et enfin absence de structure. La variable SVER est plus informative concernant la structure verticale du peuplement. Une carte de distribution de la variable pour les années 2014 à 2016 sur le territoire métropolitain est disponible en Annexe 7.

186 Elle distingue sept catégories :

1) Pas de structure 2) Futaie régulière basse

3) Autre peuplement régulier bas 4) Structure verticale irrégulière

5) Structure verticale régulière haute avec sous-étage 6) Structure verticale régulière haute sans sous-étage 7) Boisement ouvert

Ces catégories, étant uniquement structurelles, sont particulièrement intéressantes pour notre étude. Malheureusement, cette variable n’étant enregistrée que depuis 2014, son utilisation aurait conduit à laisser de côté près des trois quarts des données. On peut également s’interroger sur la fiabilité et l’homogénéité des mesures effectuées au sein du territoire pour une mesure aussi récente, le protocole étant susceptible d’évoluer grâce au retour des techniciens sur le terrain après la première année de campagne. Nous avons fait le choix d’exclure cette variable, qui demeure pertinente pour les objectifs de notre étude. Son utilisation est une bonne perspective pour les années à venir, au fur et à mesure que le jeu de données s’étoffera.

Inclusion des espèces

Ne pas prendre en compte la composition spécifique peut sembler problématique dans la mesure où le comportement hydrique ne sera pas le même suivant l’espèce pour un climat identique. L’inventaire présentant plus de 120 espèces arborées, leur inclusion telles quelles dans la classification est compliquée, à moins de les rassembler en grandes classes de réponse hydrique à la sécheresse.

On souhaite séparer les rôles respectifs de la structure et de la teneur en eau. Or la composition spécifique est liée aux deux : selon l’espèce arborée on aura plus ou moins de sous-bois, une structure de canopée différente, et ce sous-bois et cette canopée seront plus ou moins sensibles aux contraintes hydriques. Donc ce serait plutôt un indicateur de vulnérabilité à la sécheresse qu’il faudrait pour compléter ceux liés à la structure. Nous avons fait le choix d’utiliser comme proxy de ces aspects le taux d’enrésinement présenté précédemment. Il est sans doute perfectible.

187

La distribution de plusieurs variables de description au sein des placettes de l’inventaire est représentée dans la Figure 6.3. On y observe que le nombre de placettes relevé chaque année est stable, bien qu’une légère tendance décroissante semble visible. La surface terrière, la hauteur dominante, l’indice de Gini et le couvert arboré cumulé présentent des distributions assez continues, proches d’une gaussienne (éventuellement tronquée). Les autres variables ont des distributions différentes. Le taux d’enrésinement est assez bimodal, entre peuplements purs de feuillus et de conifères, avec comparativement peu de peuplements mélangés. Les couverts herbacé et arbustif bas présentent des effectifs importants dans chacune de leurs 10 catégories (ces variables sont relevées par dixième de la surface de la placette recouvert). Ce n’est pas le cas du couvert arbustif haut, qui présente des effectifs beaucoup plus forts pour les derniers dixièmes (distribution de forme exponentielle), ce qui le rend moins discriminant (la plupart des placettes correspondent à la catégorie la plus élevée).

Tableau 6.1 : Étude des corrélations entre variables sélectionnées pour la typologie du combustible

lign1 lign2 herb Hdom1 Surf tca Gini Feuillu lign1 1,00 -0,00 -0,06 -0,05 -0,17 -0,07 0,02 0,19 lign2 -0,00 1,00 -0,24 0,31 0,41 0,70 0,34 0,23 herb -0,06 -0,24 1,00 -0,07 -0,15 -0,20 -0,15 -0,23 Hdom1 -0,05 0,31 -0,07 1,00 0,56 0,43 0,35 -0,01 Surf -0,17 0,41 -0,15 0,56 1,00 0,52 0,32 -0,15 tca -0,07 0,70 -0,20 0,43 0,52 1,00 0,40 0,15 Gini 0,02 0,34 -0,15 0,35 0,32 0,40 1,00 0,16 Feuillu 0,19 0,23 -0,23 -0,01 -0,15 0,15 0,16 1,00

Le Tableau 6.1 présente les corrélations observées au sein des grandes variables décrites précédemment. La plus forte corrélation est observée entre le taux de couvert arboré cumulé (tca) et le recouvrement arbustif haut (lign2). Pour la suite de l’étude, nous décidons de ne conserver que la variable tca, la définition de lign2 étant relative.

On observe également que la surface terrière, la hauteur dominante, le taux de couvert arboré et l’indice de Gini sont assez corrélés entre eux. Cela s’explique physiquement : les placettes présentant une surface terrière importante (gros arbres) étant en général aussi les placettes avec les arbres les plus hauts, avec de forts recouvrements, et des hétérogénéités de taille entre gros arbres et régénération (indice de Gini élevé).

188

Figure 6.3 : Distribution de plusieurs variables d’intérêt pour l’étude au sein des points forêt relevés entre 2006 et 2016. La surface terrière, l’indice de Gini et la hauteur dominante sont calculés à partir des mesures d’arbres individuels échantillonnés au sein de chaque placette. Le couvert arboré cumulé et le pourcentage de feuillus sont calculés à partir des taux de recouvrement par espèce mesurés sur chaque placette.

2.1.3 Méthode de clustering utilisée

Deux grands types d’approches existent pour réaliser des clustering. On distingue d’un côté les approches hiérarchiques, et de l’autre les approches de type k-means (avec inertie). Dans notre cas, nous souhaitons appliquer notre clustering à un grand nombre de points (70 000 points forêt), en privilégiant une méthode robuste, rapide et économe en temps de calcul. L’algorithme k-means fait partie des méthodes couramment utilisées pour ce genre d’application, et il présente l’avantage d’être implémenté sous R. Nous avons choisi d’utiliser

189

cette méthode sur l’ensemble de nos variables centrées réduites, qu’elles soient catégorielles ou numériques. La méthode k-means diffère des approches hiérarchiques dans le sens où elle fonctionne en affectant des points au centroïde le plus proche, et en recalculant le barycentre des nouveaux nuages obtenus à chaque étape. Le nombre de clusters est donc imposé par l’utilisateur, et non déterminé par la méthode.

Pour répondre à la question du choix du nombre de clusters à conserver, différents critères statistiques ont été testés. La méthode graphique du coude (elbow method) n’a pas permis de répondre sans ambiguïté à la question. Les critères statistiques objectifs (Tibshirani et al. 2001; Pham et al. 2005) s’appliquent assez mal à des données aussi continues que les nôtres : Ils ont tendance à sélectionner un seul cluster, ce qui équivaut à une absence de structuration dans les données. La stabilité des clusters ayant été étudiée pour plusieurs options et paraissant satisfaisante (les points sont affectés au même cluster à chaque fois), nous avons décidé de retenir le chiffre de huit clusters pour la suite, dans un souci d’équilibre entre facilité d’interprétation des groupes et espace d’exploration pour l’algorithme.

2.2 Résultats

Les distributions des variables au sein des huit clusters sont présentées dans la Figure 6.4, où ils ont été ordonnés par surface terrière croissante. D’une manière générale, les clusters obtenus sont assez continus, en particulier en ce qui concerne les caractéristiques arborées (Hauteur dominante Hdom1, surface terrière Surf, taux de recouvrement arboré tca et indice de Gini), elles-mêmes très continues. On observe que ces caractéristiques arborées évoluent de concert au sein des clusters, à l’exception de l’avant dernier, dont le taux de recouvrement arboré et l’indice de Gini sont plus bas qu’attendu, rompant la monotonie des évolutions.

Concernant les autres variables reliées au sous-bois, elles semblent assez discriminantes, avec une variabilité importante entre groupes. C’est particulièrement vrai pour les clusters présentant des surfaces terrières intermédiaires. Le recouvrement herbacé est ainsi très différent entre le type 4 (peu d’herbacées) et les types 3 et 5 (recouvrement fort). Le type 5 et le type 6 sont aussi distingués par des recouvrements arbustifs respectivement faibles et élevés par exemple.

190

Figure 6.4 : Distribution des variables de sélection au sein de chacun des 8 clusters, correspondant aux 8 types de combustible. Signification des abréviations : lign1 = taux de recouvrement arbustif, Hdom1 = hauteur dominante de la placette, tca = taux de recouvrement arboré cumulé, herb = taux de recouvrement herbacé, Surf = surface terrière de la placette, Gini = indice de Gini (non utilisé comme variable discriminante dans le clustering)

La Figure 6.5 présente les distributions spatiales des différents types. Certains grands massifs forestiers appartiennent préférentiellement à certains types (par exemple les Landes de Gascogne, majoritairement représentées par les types 2 et 7). Par ailleurs, les types 1, 2 et 3 sont plus largement présents en région méditerranéenne, ce qui s’explique par la productivité généralement plus faible dans le Sud-Est de la France, où les conditions climatiques et stationnelles moins favorables qu’ailleurs (surface terrière et hauteur du peuplement généralement moins importantes).

191

Figure 6.5 : Distribution spatiale des types de combustible sur le territoire national.