• Aucun résultat trouvé

Diversité génétique des lignées de M truncatula

I. Synthèse bibliographique: Diversité naturelle des plantes, intérêts et utilisations

II.1. Analyse de la diversité génétique

II.1.1. Caractérisation de la diversité naturelle

La prospection et la collecte ne consistent pas seulement à ramasser des plantes ou parties de plantes en attribuant à chacune une fiche de renseignements. Bien qu'il n'existe aucun procédé standard, cette activité doit tenir compte de quelques règles élémentaires et indispensables qu'il faut savoir respecter. L'échantillonnage en constitue la phase clé. Les méthodes varient selon le type de matériel collecté: graines, organes de propagation végétative (tubercules, bulbes, stolons, fruits…).

Les méthodes de collecte et les normes d'échantillonnage varient beaucoup selon l'espèce recherchée, sa fréquence, l'étendue de sa culture ou de son aire de répartition pour les plantes spontanées, ainsi que son mode de reproduction: allogame ou autogame.

L'analyse de la variabilité peut être abordée par un ensemble de techniques allant de l'observation macroscopique du phénotype jusqu'à l'analyse de l'ADN.

II.1.1.1. Marqueurs morphologiques

Chapitre 1

longueur des tiges, surface foliaire, initiation de la floraison (Cui et al. 2001; Gomez et al. 2004). Ces caractères sont utilisés de même pour estimer la variation intra- et inter- populations. Ils sont généralement limités en nombre de caractères relevés et directement influencée par l’environnement. Néanmoins, ils fournissent des informations utiles pour décrire et identifier le matériel biologique (Andersson et al. 2006).

II.1.1.2. Allozymes

Les marqueurs biochimiques dont les allozymes, ont été utilisés pour caractériser la diversité génétique de plusieurs plantes. Les allozymes sont des formes moléculaires distinctes d’une enzyme chez un même organisme et ayant la même activité catalytique. Leur origine est la mutation au niveau de l’acide aminé qui affecte la charge totale de la protéine sans affecter le site catalytique. Leur révélation se fait par séparation electrophorétique des protéines et puis une coloration histochimique des enzymes.

Des populations naturelles tunisiennes de M. ciliaris et M. intertexta ont été évaluées pour leur polymorphisme génétique à l’aide de 7 systèmes enzymatiques. Six locus polymorphes ont été distingués permettant une analyse du polymorphisme génétique existant entre ces deux espèces annuelles (Abdelkefi et al. 1997).

La diversité génétique d’espèces annuelles de pois chiche a été étudiée par Labadi et

al. (1996) à l’aide de marqueurs enzymatiques. Egalement, ces marqueurs ont été utilisés en

combinaison avec des marqueurs morphologiques pour comparer la structuration de la diversité génétique chez M. sativa (Jenczewski et al. 1999).

Les allozymes ont l’inconvénient d’être lourd et difficile à manipuler, de même qu’ils présentent une reproductibilité assez faible. Comme les marqueurs morphologiques, ils sont très sensibles à l’environnement

II.1.1.3. Marqueurs neutres

Pendant longtemps, les caractères morphologiques ont été les seuls outils disponibles pour retracer l’histoire des populations. Toutefois, ce type de marqueur ne rend souvent pas fidèlement compte de l’histoire des populations. En effet, il arrive fréquemment que les variations phénotypiques ne soient pas seulement liées à l’histoire évolutive des populations mais soient également déterminées par des facteurs tels que l’adaptation locale. Les marqueurs moléculaires, réputés neutres (n’agissant pas sur les caractères sélectionnés), s’affranchissent de ces facteurs confondants et peuvent permettre d’accéder à l’histoire des

L'analyse de la diversité génétique neutre permet de comprendre la structuration spatiale de la diversité et de construire des hypothèses sur les différents événements liés à la domestication et à la diffusion de la plante (Nordborg et al. 2005).

Les outils moléculaires à eux seuls ou bien en combinaison avec d’autres approches biotechnologiques ont beaucoup facilité la conservation des ressources génétiques et leur utilisation. Les marqueurs moléculaires basés sur l’ADN (RFLP, RAPD, AFLP, SSRs, etc.) ont été beaucoup utilisés pour identifier, maintenir, caractériser et évaluer les ressources génétiques avec plusieurs espèces de plantes. Contrairement aux marqueurs traditionnels (morphologiques et biochimiques), les marqueurs moléculaires ne sont pas influencés par les fluctuations de l’environnement et sont indépendants de l’organe analysé et du stade de développement de la plante. Parmi ces marqueurs, les microsatellites sont les outils les plus polymorphes et informatifs.

Remarque: Même si les marqueurs phénotypiques et les microsatellites sont les outils les plus utilisés dans les études de diversité naturelles des plantes, il n’y a généralement peu ou pas de corrélation entre la diversité révélée par ces deux types de marqueurs (Vanhala et al. 2004). Bajracharya et al. (2006) ont montré que, chez des populations de riz au Népal se trouvant à hautes altitudes, il n’y a pas d’association entre caractères morphologiques et SSR analysés. Ceci pose une question fondamentale à laquelle nous essaierons de répondre plus loin dans ce chapitre en comparant les données morphologiques et moléculaires.

II.1.2.Paramètres d’analyse de la diversité II.1.2.1.Hétérozygotie (H0)

L’hétérogyzotie moyenne est estimée à partir des fréquences alléliques de chaque population et des fréquences attendues des hétérozygotes en supposant chaque population à l’équilibre de Hardy-Weinberg. Les taux d’hétérozygotie pourront ainsi être utilisés pour mesurer la différenciation entre population.

II.1.2.2. Déséquilibre de liaison (DL)

Le déséquilibre de liaison (DL) mesure l’association entre allèles présents en deux sites polymorphes. Il dépend de la distance physique entre ces deux sites mais aussi de l’histoire évolutive (goulots d’étranglements, expansion démographique, épisodes de sélection, ….) (Flint-Garcia et al. 2003; Rafalski et Morgante 2004) et du système de

Chapitre 1

au sein de populations autogames ou au sein de populations subdivisées. A grande échelle, (collection) les patrons de DL peuvent nous renseigner sur l'histoire évolutive et sélective de l'espèce. A l'échelle d'une population, les patrons de DL peuvent refléter une histoire plus récente. Le DL peut dépendre des caractéristiques génomiques de la zone étudiée (taux de recombinaison local, structure en introns/exons).

Connaître comment le DL décroît avec la distance physique qui sépare deux sites, dans différentes régions chromosomiques est important notamment pour établir des stratégies efficaces d’échantillonnage de la diversité (core collection), et pour prédire l’efficacité de méthodes de cartographie par association (DL mapping). Lorsqu’un fort DL existe à l’échelle du génome, on peut espérer capturer une diversité importante pour des gènes utiles en échantillonnant une richesse allélique maximale à des locus neutres (démarche core- collection, Bataillon et al. (1996)). A l’inverse, un DL limité à des sites physiquement proches (quelques kb) rend cette démarche peu efficace mais peut être utile pour cartographier à fine échelle des gènes d’intérêt (Remington 2001).

Chez les plantes, peu de données sont disponibles, notamment pour des espèces autogames (Nordborg et Tavaré 2002). Chez ces espèces, on s'attend notamment à ce que l'échelle d'étude (population naturelle, collection) modifie fortement les patrons de DL observés.

Dans les populations d’Arabidopsis thaliana, le déséquilibre de liaison au niveau des populations locales est bien plus fort qu’à l’échelle de l’ensemble des populations (Nordborg

et al. 2002).

II.1.2.3. Indices de diversité

HE (Hétérozygotie espérée): Chez les eucaryotes, les régions du génome peuvent avoir

des taux de recombinaison méiotiques différents. L’Etude de ces variations du taux de recombinaison le long des chromosomes a pour objectif de comprendre leurs causes et aussi leurs conséquences sur la structure et l’évolution des génomes eucaryotes.

On démontre ainsi que la population observée, considérée dans son ensemble, n'est pas dans les proportions de la loi de Hardy-Weinberg. Il existe un "déficit relatif en hétérozygotes", par rapport à la valeur théorique 2x 1x 2. Cette "réduction d'hétérozygotie" est appelée l'effet Wahlund. Elle ne s'observe que s'il existe une divergence des fréquences alléliques entre les sous-populations. Les taux d'hétérozygotie pourront ainsi être utilisés pour mesurer la différentiation entre populations.

Distance de Nei : Une distance génétique quantifie le degré de divergence génétique entre unités taxonomiques (populations, espèces, ...) prises deux à deux. Plusieurs mesures de distance génétique ont été proposées. La plus utilisée est actuellement celle de Nei (Nei 1978). Cette distance s'établie sur un ensemble de locus (>10) afin d'obtenir une meilleure estimation. Si la distance génétique D est par exemple égale à 0,57, cela signifie que 0,57 substitutions alléliques par locus (ou 57 substitutions pour 100 locus) sont survenues au cours de l'évolution séparées des deux populations. La variance de D dépend du nombre de locus analysés et de la taille de l'échantillon.

II.1.2.4. ACP et AFC

ACP: L'ACP a pour but de condenser et réduire des données quantitatives. Le pré- traitement doit être soit centré soit centré-réduit. Le programme calcule la matrice des covariances, la diagonalise, en extrait les valeurs et vecteurs propres.

Les vecteurs propres de la matrice définissent les axes factoriels. Les données du tableau réduit sont ensuite projetées sur ces axes. Les coefficients de corrélation étant toujours compris entre -1 et +1, le programme affiche le cercle de corrélation de rayon 1. La méthode s'applique lorsque les données sont quantitatives (ou qualitatives avec recodage)

AFC: L'AFC peut être considérée comme une ACP particulière dotée de la métrique du Khi-2 qui ne dépend que du profil des colonnes du tableau. L'analyse permet, dans le plan des deux premiers axes factoriels, une représentation simultanée, souvent fort suggestive des ressemblances entre les colonnes ou les lignes du tableau et de la proximité entre lignes et colonnes.

Le logiciel utilisé calcule, comme en ACP, la matrice des covariances, la diagonalise et en extrait les valeurs et vecteurs propres. Ce qui est intéressant dans l'AFC, c'est que les données des colonnes (les descripteurs) et des lignes (les molécules) sont interchangeables, alors qu'en ACP on ne travaille que l'ensemble des colonnes. Elle permet de traiter des variables quantitatives et qualitatives (ce qui n'est pas le cas de l'ACP). Cette méthode est la meilleure façon de visualiser et d'interpréter les corrélations entre variables.

L'AFC a un autre avantage, c'est d'étudier la proximité entre les 2 nuages de points (colonnes et lignes):

 le nuage des colonnes (descripteurs) (allèles)  le nuage des lignes (molécules) (lignées)

Chapitre 1

 et la superposition des 2 nuages ce qui nous permet de mieux comprendre les relations entre descripteurs et molécules (lignées et allèles).

Les éléments proches du centre correspondent à la moyenne, les éléments éloignés étant les plus caractéristiques. Le montant d'inertie (exprimé en %) de chaque facteur est visualisable sous forme d'histogramme. Si les 2 premiers axes ont pour valeurs propres cumulées un montant supérieur à 80%, une représentation en 2D en général suffit. Dans les autres cas, on choisit les axes factoriels en entrant leur numéro dans chaque boîte d'édition de la boîte de dialogue générale.

II.1.2.5. Test sur permutations

Des permutations permettent d’examiner des hypothèses et d’évaluer la précision à estimer quand les propriétés distributionnelles des tests statistiques ne sont pas connues (par exemple la mesure de la distance génétique), ou des évaluations des mesures d'incertitude (par exemple la normalité) ne sont pas rencontrées. L'attribution ou l'ordre des points de repères est permutée et le test statistique est recalculé pour chaque permutation. Habituellement 99 à 4 999 permutations sont évaluées. La valeur vraie de la statistique est comparée à la distribution des valeurs des données permutées. Si la valeur vraie est 95% plus grand que de la valeur permutée, alors l'hypothèse nulle est rejetée (P = 0.05).

II.1.2.6. Isolement par la distance (test de Mantel)

Le test de Mantel (Mantel 1967) est utilisé pour mesurer et tester la corrélation linéaire entre deux matrices de proximité. Il est souvent utilisé en écologie pour tester si les différences entre plusieurs sites, d'une part en termes d'abondance des espèces étudiées, d'autre part en termes de caractéristiques géophysiques, peuvent être reliées ou non.

En génétique des populations ce test est utilisé pour tester l’hypothèse d’isolement par distance en comparant une matrice des distances génétiques basées sur les données moléculaires des populations à une matrice de distances géographiques entre les sites d’origine correspondants (Timothy et al. 2000).

Il est recommandé pour les petits échantillons (n<20) d’effectuer des permutations pour la signification du test. L'hypothèse nulle est que le rapport observé entre les deux matrices de distance pourrait avoir été obtenu par n'importe quel arrangement aléatoire dans l'espace des observations.