• Aucun résultat trouvé

5.3.1 Modélisation

L’apprentissage des réseaux écologiques associés aux arthropodes observés se fait par un modèle de réseau bayésien dynamique étiqueté, la dynamique est mesurée sur deux pas de temps : early (t = 0) et late (t = 1). La mesure de la présence ou de l’absence d’une espèce i à un instant t sur

une parcelle s est considérée comme la réalisation d’une variable aléatoire

s

Xt

i dont la probabilité découle d’un modèle de réseau bayésien dynamique étiqueté où ε décrit la probabilité d’apparition ou de survie spontanée, ρ décrit la probabilité de réussite d’une interaction positive (impulsion), τ la probabilité de réussite d’une interaction négative (inhibition). πiqi∪πri décrit l’ensemble des parents de i, c’est à dire l’ensemble des espèces ayant une influence positive q ou négative r sur i. Ces parents sont les mêmes pour toutes les parcelles. Πti désigne l’ensemble des variables aléatoires Xt j telles que j ∈ πi. q Nt i et r Nt

i décrivent le nombre de parents dont l’influence est respectivement positive et négative sur i présents à t. ui différencie les espèces basales des espèces non basales : si i est basale, c’est à dire qu’elle n’a pas de parents à influence positive, soit πqi = ∅, alors ui = 0 ; sinon, ui = 1. Ce modèle fixe la quantité εsur

0 = 1 et εsur

1 = 0 afin de gérer le fait qu’une espèce basale n’a pas besoin d’influences positives pour survivre. La probabilité d’apparition d’une espèce

est indépendante de ses parents et décrite par P  s Xit+1= 1| s Xt i = 0  = ε et la probabilité de survie est décrite dans l’équation 5.1.

P  s Xit+1= 1| s Xit= 1, Πti  =  εsuru i + (1 − εsuru i ) ·  1 − (1 − ρsur) q Nt i  · (1 − τsur) r Nt i (5.1)

L’apprentissage de la structure de ce réseau bayésien dynamique étiqueté consiste à trouver pour chaque espèce son ensemble de parents le plus vraisemblable sachant les observations de sa présence/absence sur les deux pas de temps, à l’aide de la procédure décrite dans le chapitre 4.

5.3.2 Apprentissage par graphe consensus

Un graphe dans lequel chaque espèce a 12 parents au maximum est appris par parcelle, et l’agrégation des graphes de toutes les parcelles d’une certaine culture donne un graphe consensus relatif à cette culture. Ces graphes sont représentés dans la figure 5.5 sous forme de heatmap, chaque lien étant coloré selon le nombre de parcelles dans lequel il a été appris. On remarque que certaines espèces ont des interactions avec beaucoup d’autres espèces. Le tableau 5.2 identifie les espèces dont le plus d’arcs ont été reconstitués. Par exemple, en moyenne, 19,13 interactions négatives de Diptera adults vers une autre espèce dans les cultures de betterave ont été apprises. Cette espèce a donc été identifiée comme prédatrice ou compétitrice de 19,13 espèces en moyenne pour cette culture, et elle a été identifiée comme proie ou facilitatrice de 26,15 espèces en moyenne pour cette culture.

Espèce

Moyenne du nombre d’arcs partant de l’espèce nommée reconstituées

B M SR WR Total

négative positive négative positive négative positive négative positive

Diptera adults 19,13 26,15 18,11 24,89 25,67 25,03 16,50 32,93 23,61 Parasitica 33,68 20,38 23,57 13,43 26,92 22,72 28,82 13,43 23,40 Other Coleoptera 18,55 6,18 18,71 8,93 21,62 27,31 22,71 18,04 17,82 Aphidoidea 14,00 20,50 13,54 10,39 18,90 19,77 19,32 8,36 16,05 Sminthuridae 19,45 15,45 14,75 12,56 25,31 8,49 24,25 6,07 16,04 Entomobryidae 25,30 3,05 21,64 8,43 21,77 11,63 17,57 14,93 15,62 Staphylinidae adult 9,05 9,08 14,93 8,86 23,26 15,13 23,93 14,89 14,72 Araneae 16,15 14,95 16,57 10,54 17,87 10,10 10,82 6,64 13,27 Auchenorhyncha 16,43 9,18 10,64 7,46 17,77 8,33 10,18 1,26 10,66 Linyphiidae 12,73 8,68 11,61 3,29 8,33 11,28 13,04 5,89 9,51 Curculionidae 7,03 8,65 2,04 1,00 9,00 8,72 10,43 7,59 7,66 Isotomidae 6,10 7,07 11,23 1,00 2,54 1,00 6,75 Coleoptera 9,05 8,53 2,34 1,00 6,62 Cimicidae nymphs 8,30 2,33 5,46 1,32 6,38 6,51 5,24 Heteroptera 5,03 1,20 4,60 Diptera 9,05 4,38 2,21 1,41 4,40

Table 5.2 – Tableau renseignant le nombre moyen d’arcs dans les graphes appris dans chaque parcelle en excluant les espèces d’oiseaux.

5.3.3 Intégration des tailles des individus comme niveau trophique et

apprentissage par vraisemblance généralisée

Afin d’affiner l’apprentissage, nous souhaitons utiliser les informations sur la taille des espèces. Les mesures de longueur et de poids moyen de plusieurs espèces permettent d’établir une « classe » de taille de ces espèces, c’est à dire de regrouper les espèces ayant des tailles similaires (petites, grandes etc.). Nous considérons 4 classes de taille différentes, de 1 (petites) à 4 (grandes). Plusieurs espèces n’ont pas de taille bien identifiée. L’apprentissage de structure de réseau par réseau Bayésien étiqueté permet d’intégrer des connaissances sur une structure du graphe en communautés distinctes. La connaissance de la structure des communautés permet de prioriser certains arcs par rapport à d’autres. Dans le cas d’un réseau trophique, ces communautés peuvent s’appliquer à la taille des individus, que l’on peut interpréter sous la forme de niveau trophique. On peut alors changer les probabilités P (Gij|ci, cj) de présence de certains arcs de la façon suivante :

— Aucune espèce ne peut avoir d’influence positive sur une espèce de classe de taille inférieure, afin d’éviter qu’une espèce puisse être la proie d’une espèce plus petite : P (G+ij|ci> cj) = 0. — Une espèce a plus de chances d’avoir une influence positive vers une espèce d’une classe

de taille proche de la sienne. L’intérêt est de voir apparaître des niveaux trophiques dans la structure du graphe, et une espèce aura plus souvent pour proie des espèces du niveau trophique directement inférieur. Par exemple, une espèce de classe 1 aura plus de chance d’avoir une influence positive pour une espèce de classe 2 que pour une espèce de classe 3, et de classe 4 : P (G+ij|cj− ci= 1) > P (G+ij|cj− ci= 2) > P (G+ij|cj− ci= 3). . .

— Une espèce a plus de chance d’avoir une influence négative sur une espèce d’une classe de taille directement inférieure à la sienne. Cela priorise les relations trophiques vers des niveaux trophiques proches. Une espèce peut avoir une influence négative sur n’importe quelle autre espèce, mais avec une probabilité moindre : P (Gij+ |ci− cj= 1) > P (Gij+ |cj− ci6= 1).

5.3.4 Apprentissage par vraisemblance généralisée et connaissance des

niveaux trophiques

L’agrégation de plusieurs graphes pose problème. Il est en effet difficile de construire un seul graphe à partir d’une agrégation de plusieurs graphes. De plus, cette méthode d’agrégation n’est pas très solide d’un point de vue théorique. L’apprentissage de la structure du réseau en prenant en compte les tailles des espèces se fait donc en intégrant les données d’observation d’espèces de tous les champs d’une même culture. Un seul graphe est appris : celui qui maximise la somme des vraisemblances de tous les champs. La forme des graphes peut être visualisée dans la figure 5.6, où chaque point représente une espèce, placé au même endroit pour toutes les cultures. Les espèces absentes d’un type de culture ont un numéro coloré en rouge dans la représentation du graphe correspondant à cette culture. Les réseaux obtenus semblent très différents pour les 4 cultures différentes, bien que certains arcs soient communs à plusieurs cultures.