• Aucun résultat trouvé

Analyse de différents facteurs explicatifs de la variabilité 1. Hauteur et diamètre des arbres

Les terpénoïdes

4.2. Echantillonnage de bois de cœur, analyses chimiques et statistiques

4.2.3. Méthode d’analyse statistique

4.2.3.6. Analyse de différents facteurs explicatifs de la variabilité 1. Hauteur et diamètre des arbres

Nous avons voulu vérifier que la composition chimique, autrement dit l’expression des gènes impliqués dans les voies de biosynthèse chimique, était indépendante de la taille des arbres. Bien que les récoltes aient été conduites de manière à obtenir un échantillon homogène au niveau de la hauteur et du diamètre, il subsiste une petite variabilité entre les arbres récoltés, que nous avons tenté d’exploiter pour voir si elle pouvait constituer un facteur explicatif de la variabilité de la composition chimique. Nous avons donc mené un test de corrélation de Pearson entre les aires des pics et les variables hauteur et diamètre de l’arbre au niveau des moyennes par population.

4.2.3.6.2. Facteurs abiotiques.

De nombreuses études rapportent une influence des paramètres abiotiques sur la variabilité chimique (voir IV.1.). Ces facteurs, notamment la pluviométrie très variable entre populations, pourraient influencer la composition chimique du bois de Santal. Nous avons donc là encore mené un test de Pearson entre les aires des pics moyennes par population et la pluviométrie moyenne par population.

Pour étudier l’effet du type de sol, nous avons réalisé une Analyse de Variance (ANOVA) en prenant chaque type de sol comme étant une variable qualitative.

Afin de visualiser le lien entre ces variables abiotiques et les molécules identifiées de la concrète, nous avons aussi mené une ACP sur ces molécules en utilisant leur moyenne par population, puis nous avons ajouté en variables supplémentaires la pluviométrie, la température, le type de sol, et le nombre de mois secs.

La température annuelle n’a pas été retenue pour cette étude car sa variation inter-population est très faible (cf chapitre 1).

4.2.3.6.3. Analyse combinée des marqueurs chimiques et des marqueurs microsatellites

Ne disposant ni des gènes codant pour les molécules de la concrète, ni même d’essai contrôlé permettant de connaître la variation des caractères d’une génération à l’autre, nous ne pouvions pas maîtriser la composante génétique de la variabilité chimique.

En revanche, nous disposions d’une étude sur des marqueurs neutres, c’est-à-dire non soumis à la sélection. Il nous a donc semblé intéressant de vérifier l’hypothèse que les gènes codant les molécules des huiles essentielles étaient soumis à la sélection, c’est-à-dire ne suivaient pas le même processus de dérive que les microsatellites nucléaires. Pour cela nous avons comparé la structuration des individus sur une base chimique avec celle obtenue sur la base des microsatellites. Pour cette étude, nous avons fait l’hypothèse que les microsatellites étudiés n’étaient pas liés à des gènes soumis à sélection.

Cette comparaison a été explorée par le biais de différentes méthodes. Pour ces diverses approches, nous avons conservé les molécules ayant une proportion moyenne dans la concrète supérieure à 1%, leurs valeurs étant plus fiables que celles des molécules en quantité infime. Nous avons utilisé les mêmes individus pour l’approche génétique et chimique, c’est-à-dire les 157 individus analysés par ces deux méthodes.

• La première méthode de comparaison consiste à comparer les arbres de distances. Nous avons obtenu l’arbre des distances chimiques entre populations avec le logiciel DARWIN 5 (Perrier, 2003), en utilisant comme distance entre populations la distance Euclidienne usuelle et en réalisant 1000 bootstraps. L’arbre des distances génétiques a quant à lui été réalisé avec PHYLIP 3.6. (Felsenstein, 1993), logiciel d’analyse de données moléculaires. Les distances génétiques entre paires d'îles et/ou de populations ont été estimées à l'aide de la formule de Cavalli-Sforza (1967) adaptée à la description de la structuration des populations en considérant leur histoire évolutive, et notamment les effets de dérive.

La matrice de distances a été obtenue à partir du programme GENDIST de PHYLIP (PHYLIP, version 3.6, Felsenstein, 1993) et a permis, à l'aide du programme NEIGHBOR (PHYLIP) de construire un arbre de distances de type Neighbor-Joining, suivant la méthode de Saitou & Nei (1987). La robustesse des nœuds a été évaluée par 1000 bootstraps à l'aide du programme SEQBOOT (PHYLIP), et l'arbre consensus obtenu par le programme CONSENSE (PHYLIP) a été dessiné à l'aide du logiciel TREEVIEW (Page, 1996).

• La seconde est la comparaison statistique des matrices de distances grâce au test de Mantel (1967) utilisant le coefficient de corrélation de Pearson. Nous avons comparé ces matrices pour l’ensemble des individus, puis entre individus d’une même population et enfin

Tableau 4.3

Récapitulatif des différents pics : fonction (si connue), pourcentage de l’aire totale, écart type, Coefficient de variation (CV), valeurs maximum et minimum de ce pourcentage d’aire totale, sur l’ensemble des individus échantillonnés. Les 4 molécules d’aires les plus importantes sont soulignées.

groupe 13 *: groupe de plusieurs molécules autour du pic 13.

Fonction Pic Aire [%] Ecart type CV

(écart-type/moyenne) Min Max

(Z)-α-santalene (5) 0.84 0.43 0.51 0.07 2.84 7 0.13 0.07 0.57 0.01 0.53 Epi-β-santalene (10) 0.72 0.32 0.44 0.12 2.04 (Z)-β-santalene (11) 0.68 0.4 0.58 0 3.04 groupe 13 * 1.07 1.23 1.15 0.03 11.02 Hydrocarbures 14 0.12 0.27 2.22 0 2.75 15 0.12 0.27 2.33 0.01 2.45 16 0.1 0.25 2.43 0 1.84 non déterminé 17 0.17 0.33 1.93 0 2.17 24+25 0.63 0.57 0.9 0.1 6.25 26 a 28 0.75 0.34 0.46 0.06 2.96 (+)-(Z)-α-santalol (30) 39.36 11.2 0.28 2.77 53.34 32 1.32 0.97 0.73 0.16 5.45 (-)-(Z)-α-trans-bergamotol (34) 7.25 2.24 0.31 1.07 11.36 35 0.19 0.48 2.5 0.01 5.72 36 0.46 0.22 0.48 0.07 1.62 Epi-β-santalol (37) 2.86 0.86 0.3 0.11 4.35 38 0.34 0.26 0.77 0.12 2.42 39 0.47 0.96 2.04 0.01 8.95 (-)-(Z)-β-santalol (40) 16.42 5.23 0.32 0.45 24.28 (Z)-nuciferol (41) 1.47 1.25 0.85 0.15 8.28 44 0.2 0.13 0.62 0.02 0.89 45 0.68 0.57 0.83 0.08 4.42 46 0.52 0.45 0.86 0.1 4.72 (-)-(E)-β-santalol (47) 1.23 0.79 0.65 0.24 6.64 48+49 0.95 0.96 1.01 0.11 9.29 (E)-lanceol (50) 13.66 16.61 1.22 0.12 80.83 mono -alcools 51 0.2 0.26 1.28 0.01 2.78 63 0.42 1.09 2.6 0.02 11.84 non déterm iné 64 a 69 1.35 1.43 1.06 0.18 11.02 71 0.37 0.87 2.36 0 8.22 73 a 77 1.71 1.3 0.76 0.18 10.12 Diols 79 + 80 1.46 0.52 0.36 0.05 3.36 Moyenne 2.98 1.61 1.08 0.19 9.63

entre populations. La distance chimique utilisée était à nouveau la distance Euclidienne, et la

distance génétique était le simple matching, calculée avec DARWIN 5 :

u m u dij + = , où dij est la distance entre les unités i et j, u le nombre d’allèles non partagés au même locus, m le nombre d’allèles communs au même locus.

• La dernière est la méthode de co-inertie. Cette méthode présentée pour la première fois par Chessel et Mercier (1993) pour comparer un tableau faunistique et un tableau environnemental, et introduite en hydrobiologie par Dolédec et Chessel (1994) permet d'évaluer la concordance des structures de deux tableaux de données portant sur les mêmes points d'échantillonnage. Cette analyse dégage de chaque tableau un vecteur sur lequel sont projetés les points-relevés. Les deux jeux de coordonnées des projections des points-relevés résultants sont de covariance maximum, c’est-à-dire que le produit de la corrélation et des variances de chaque série de coordonnées est maximisé. Le calcul d'un indice appelé coefficient de corrélation vectoriel ou coefficient RV (Escoufier, 1973 ; Robert et Escoufier, 1976) permet de mesurer l’adéquation des deux tableaux de données. Sa signification statistique peut être vérifiée par des tests de permutations. Nous avons mené cette étude sur nos données chimiques et génétiques grâce au package Ade4 du logiciel R (Chessel et al., 2005). Les données chimiques analysées étaient comme précédemment constituées par les moyennes des pourcentages d’aire des pics par population, en revanche pour les données génétiques, nous avons utilisé les fréquences alléliques.

Nous avons aussi mené une analyse de co-inertie au niveau individuel, en comparant l’Analyse en Composantes Principales menée sur les données chimiques et l’Analyse des Correspondances Multiples menée sur les données génétiques (allèles) prises comme des « caractères ».

4.3.

Résultats