• Aucun résultat trouvé

Effet du nombre de marqueurs

Dans le document Genetic diversity and breed management in dogs (Page 133-138)

E Etudes des relations entre données généalogiques et moléculaires à partir de populations simulées

I. Materiel et méthode : modélisation des populations

3. Effet du nombre de marqueurs

Comme on pouvait s’y attendre, les corrélations semblent augmenter avec le nombre de marqueurs (Figure 3.2). La modélisation indique un effet significatif du logarithme népérien du nombre de marqueurs (P<0.0001) sur celles-ci. Les corrélations sont aussi significativement plus élevées entre Ф et RXY qu’entre F et H (P=0.0015). Encore une fois,

aucune interaction significative n’a été obtenue. Avec les deux variables, un r² de 0,97 était obtenu. En passant de 5 à 200 marqueurs, les corrélations augmentent de 0,19 à 0,77 pour le couple (Ф, R ) et de 0,18 à 0,75 pour le couple (F,H), en valeur absolue. XY

r

Figure 3.2 - Effet du nombre de marqueurs sur les corrélations (r) entre données généalogique et moléculaire x : r(Ф, RXY) o : r(F,H), en valeur absolue Nombre de marqueurs -120-

III. Discussion

L’étude comparée des trois situations montre que les populations avec des parentés et des consanguinités importantes sont aussi celles qui ont une faible hétérozygotie. Ce résultat était d’autant plus attendu que les populations étaient simulées sur 30 générations, avec dans la situation 3, de très fortes valeurs de F et Ф.

Le second point à retenir concerne les corrélations qui sont d’autant plus importantes que les valeurs de F et Ф (et leurs écart-types) sont élevés. Slate et al. (2004) ont montré que les corrélations entre hétérozygoties n’augmentaient pas avec la valeur moyenne de F mais avec sa variance. En effet, on peut supposer que les paramètres généalogiques et moléculaires devraient être liés par une relation de type linéaire (Hill et Weir, 2007), à une erreur de variance plus ou moins constante (aléa des allèles, fréquences alléliques initiales, générations remontées). Dans un tel contexte, la corrélation va être par définition meilleure sur une large échelle de valeurs de Ф et de F que sur un champ restreint de valeurs.

Au sein des populations étudiées, des valeurs moyennes de paramètres généalogiques vont cependant de paire avec des variances élevées de ces paramètres. Ces résultats justifieraient donc que des corrélations supérieures à 0,60 aient été obtenues pour les deux races avec les parentés moyennes les plus importantes (Braque Saint Germain et Berger des Pyrénées).

Parmi les trois situations, seule la deuxième permet de simuler des populations de configuration généalogique et moléculaire similaire à ce qui a pu être trouvé au sein des 24 races, ce qui justifie de l’utiliser en exemple. Il est intéressant de constater qu’en répétant ces simulations, les variations de valeurs observées entre les simulations sont plus fortes au sein des F que des Ф. Ceci peut en partie être expliqué par le fait que dans chaque population simulée, le F moyen est calculé sur les 5 000 valeurs de la dernière génération, alors que le Ф moyen est estimé à partir des n n( −1)

2 coefficients calculés à partir l’échantillon, soit 19 900 dans notre cas.

Les corrélations obtenues entre Ф et RXY sont apparues dans nos simulations légèrement

supérieures aux corrélations entre F et H. Ces résultats peuvent probablement être expliqués par le fait que Ф est calculé sur les individus de la dernière génération, alors que F est calculé

sur les parents de celle-ci. Une génération est donc perdue dans ce dernier cas, ce qui a pu uire à la précision de cet indice et donc à la corrélation.

diées, même si les populations simulées sont re

limite maximale des fr uences de fausses filiations. Avec 20% de fausses filiations, le coefficient de corrélation chutait de 0,37 à 0,20. Sur nos données réelles, les corrélations obtenues ne se situaient ja

age, e

n’est pas utilisée. Afin d’obtenir des évaluations satisfaisantes de parentés individuelles à inquante à deux cent marqueurs, comme l’ont souligné Eding et Meuwissen (2

n

Les résultats montrent aussi clairement les liens entre la diminution de la corrélation et la proportion de fausses filiations. Il parait cependant difficile d’en faire des conclusions précises en ce qui concerne les races étu

lativement similaires aux populations canines étudiées, tant d’un point de vue généalogique que moléculaire. D’une part les structures généalogiques étaient très variables en fonction des races (Ф moyen entre 0,6 et 8,8%). Or nous avons pu voir que ces différences ont des effets significatifs sur les corrélations entre données généalogiques et moléculaires. D’autre part, les corrélations ont été calculées pour les races sur des échantillons de taille modérée (20 à 30 individus). Ces deux raisons, ajoutées à la non-connaissance des fréquences alléliques initiales, peuvent expliquer les différences de corrélations obtenues en fonction des races. Il est cependant possible d’émettre une hypothèse quant à la

éq

mais en dessous de 0,25 ; il apparaît donc peu probable que pour les races étudiées, la proportion de fausses filiations dépasse 20%. Il est néanmoins difficile d’estimer si ce pourcentage est de 0, 1 ou 10%. Afin d’affiner ces résultats, il pourrait être envisagé d’une part, d’accroître le nombre d’individus génotypés, afin de limiter les biais d’échantillon

t d’autre part, d’effectuer des simulations personnalisées pour chaque race.

En ce qui concerne l’effet du nombre de marqueurs sur les corrélations nos résultats sont relativement similaires à ceux obtenus par Baumung et Sölkner (2003). Pour F et H, les corrélations restent modérées et ne dépassent pas 0,60 si au moins une centaine de marqueurs partir de données moléculaires, il serait nécessaire d’augmenter ce nombre jusqu’à une valeur autour de cent c

001). Au cours des prochaines années, le développement des SNP devrait permettre d’effectuer ce genre d’études sans trop de difficultés.

F - Conclusion

ettre en évidence pour deux races (Caniche et English Cocker Spaniel) des effets Walhund se traduisant par des valeurs im

cas du Barbet, les retrem

ique vis-à-vis du nombre de A partir des 61 races analysées, il nous a été possible de mettre en évidence les différences d’informations apportées par les pedigrees d’une part, et par les marqueurs moléculaires, d’autre part. Les données généalogiques permettent d’obtenir des informations complètes sur les dynamiques de populations, ainsi que des indicateurs fiables de la variabilité génétique intra-raciale. Du fait d’une connaissance très variable des généalogies, il est cependant souvent difficile de comparer les situations des différentes races. Pour certaines des populations étudiées, il était rarement possible de remonter à plus de trois ou quatres générations, et les généalogies sont apparues en conséquence trop incomplètes pour être informatives en terme de variabilité. L’approche moléculaire n’ayant pas cet inconvénient, elle permet une comparaison de la variabilité génétique sur l’ensemble des races étudiées. Cependant, du fait du nombre forcément limité de marqueurs employés, elle est souvent considérée comme moins fiable que l’approche généalogique (Fernandez et al., 2005).

A l’échelle des populations, aucune corrélation franchement significative n’a pu être obtenue entre les deux sources de données. En revanche, en s’intéressant aux résultats race par race, nous avons pu, d’une part, mettre en évidence des résultats similaires à d’autres études (Irion et al., 2003), et d’autre part, expliquer d’éventuelles similitudes ou différences entre résultats généalogiques et moléculaires. Par exemple, il a été possible de m

portantes de FIS, et des écarts importants entre Φ et F. Dans le

pes récentes, effectuées à partir de plusieurs races sur cette population d’effectif très limité et de généalogie mal connue, permettaient d’expliquer la différence entre une très faible valeur de fa et une hétérozygotie importante. Au niveau individuel, les corrélations entre données généalogiques et moléculaires, évaluées sur les races étudiées, étaient toutes significatives mais relativement modérées. Des résultats similaires ont pu être obtenus à partir de simulations, montrant une relation linéaire entre les corrélations et la fréquence des fausses filiations, et logarithm

Les résultats obtenus sur notre panel de races ne font que souligner la nécessité d’utiliser

les deux approches de manière co er la situation des races en terme

de variabilité génétique. Ces résultats doivent aussi être interprétés en intégrant le contexte historique et social dans lequel évoluent les populations, en tenant compte de facteurs tels que les variations d’effectifs (effets de m

mplémentaire, pour évalu

ode, …), leur éventuelle importance culturelle (utilisations traditionnelles…) ou l’existence de races génétiquement très proches. Les méthodes permettant d’évaluer les relations génétiques entre populations vont en conséquence être traitées au cours du prochain chapitre.

Quatrième partie

Dans le document Genetic diversity and breed management in dogs (Page 133-138)