• Aucun résultat trouvé

II – Analyse du caractère « présence de pampilles »

B. Matériels et méthodes

3. Analyse approfondie de la zone d’intérêt

Dans leur étude, Reber et al [157] se sont concentrés sur la zone située entre 25,5 et 26,5 Mb. En raison de nos résultats, nous avons un peu élargi la zone d’étude en particulier à droite, car notre SNP le plus significatif se trouve à 26,65 Mb. Nous nous sommes finalement intéressés à la zone située entre 25 et 28 Mb. Cette région contient 15 gènes dont la liste figure dans le tableau 10. Deux d’entre eux sont des candidats fonctionnels évidents pour leur implication dans le développement embryonnaire des membres, et ont déjà été mis en avant par Reber et al : FMN1 et GREM1. Nous avons également considéré deux autres gènes en raison de leurs fonctions. Le premier, le gène ACTC1, impliqué dans des processus embryonnaires de formation et de migration de tissus, est par ailleurs le plus proche de notre marqueur le plus significatif (tableau 9). Le second, le gène AVEN, est un régulateur de l’apoptose. Il pourrait lui aussi être impliqué dans des processus embryonnaires et participer à la régression de certaines zones.

Nous avons ensuite analysé les données de séquence des pères du dispositif de détection de QTL, afin de déterminer une potentielle mutation causale. Parmi les 20 pères séquencés, seuls six d’entre eux étaient phénotypés pour le caractère « pampilles » et inclus à l’analyse d’association. Tous possédaient des pampilles. Avec le concours de Capgènes, nous avons pu mobiliser des photos d’une partie des mâles non-phénotypés (et morts) et observer s’ils étaient porteurs de pampilles. Ainsi, quatre nouveaux mâles sans pampille ont pu être intégrés à l’analyse.

Dans un premier temps, nous avons recherché dans la zone les SNP pour lesquels les quatre pères « sans pampille » étaient homozygotes du même type tandis que les six pères « avec pampilles » étaient soit hétérozygotes soit homozygotes de l’autre type, les génotypes manquants étant acceptés. Un total de 227 SNP répondait à ces critères. Aucun d’entre eux n’était situé dans une région directement codante (exonique) ni n’était prédit avec un effet. Quelques SNP introniques ont toutefois été détectés : 3 dans AVEN, 1 dans RYR3, 3 dans

111

Génotype Sans pampille Avec pampilles Total

AA 0 17 17

AG 14 51 65

GG 64 10 74

Total 78 79 156

Tableau 9 : Répartition des 156 boucs génotypés sur le marqueur 31040-scaffold343-1577663 en fonction de leur génotype et de leur phénotype.

112 AQR et 8 dans DPH6. Un SNP dans le downstream du loc non caractérisé (à 27,0 MB) est aussi à noter. Les autres SNP sont annotés comme intergéniques. Aucun SNP correspondant à ce filtre sur les génotypes n’a pu être mis en évidence dans l’un des trois autres gènes candidats.

Dans un second temps, nous avons mené une approche différente en filtrant sur l’effet prédit des SNP de la zone. Un seul SNP de la zone est prédit avec un effet fort. Il s’agit d’une délétion de deux bases à 26,6 Mb décalant le cadre de lecture du gène GJD2. Toutefois, tous nos animaux phénotypés, porteurs de pampilles ou non, étaient du même génotype à cette position. Soixante-cinq SNP sont quant à eux prédits avec un effet modéré. La quasi-totalité d’entre eux est néanmoins complètement déconnectée des génotypes des pères, avec un seul animal (ou deux) présentant un génotype différent de tous les autres sans concordance avec le phénotype. Un seul SNP présentait une distribution concordante (en partie) avec le phénotype. Il s’agit d’un SNP non synonyme dans le gène ARHGAP11A. Les quatre boucs sans pampille sont homozygotes TT, tandis que parmi les boucs porteurs de pampilles on dénombre deux homozygotes CC, trois hétérozygotes et un homozygote TT. Le phénotype de ce dernier animal a été vérifié sur les photographies et il est bien porteur de pampilles.

A ce stade, la mutation causale n’a donc pas été formellement identifiée. Il est possible qu’elle fasse partie des 227 SNP détectés précédemment. Pour ces SNP, il faudrait génotyper l’ensemble des mâles utilisés pour l’analyse GWAS afin de voir si l’un de ces SNP conserve une concordance parfaite sur un plus grand nombre d’animaux. Les trois SNP introniques du gène AVEN – potentiel candidat fonctionnel – sont particulièrement intéressants. Ces génotypages devraient être réalisés prochainement.

La mutation causale pourrait aussi ne pas avoir été détectée. Plusieurs raisons peuvent alors être évoquées. Tout d’abord, il est possible que le SNP causal soit en dehors de la zone étudiée.

Une deuxième possibilité serait que la mutation causale n’est pas sur la séquence de référence, car celle-ci contiendrait des N à cette position ou serait mal assemblée. Par visualisation de la séquence de référence, il s’avère que cette zone contient en effet 235 blocs de N, d’une taille moyenne de 477 N (jusqu’à 4 534 N pour le plus grand). Concernant l’assemblage de la zone, un blast a été réalisé sur le génome de référence bovin (Bos taurus UMD 3.1.1). Sur la zone bovine correspondante, le BTA 10, on ne peut aligner que 86% de la séquence caprine (avec 95% d’identité sur les parties alignées).

Enfin, une autre possibilité impliquerait l’existence d’erreurs dans la séquence de nos pères ou, plus probablement, que le polymorphisme n’est pas un SNP.

Une visualisation des données est en cours à l’aide du logiciel IGV. L’un des mâles sans pampille séquencé semble être différent des trois autres dans la zone. Il est en effet beaucoup plus souvent hétérozygote, y compris au niveau du marqueur 31040-scaffold343- 1577663, le plus significatif de la détection de QTL.

Nous savons qu’une partie des animaux sans pampille de l’analyse GWAS était également hétérozygote à ce marqueur (association non totale avec le phénotype). Il pourrait donc s’agir d’un recombinant qui nous aiderait à réduire la zone. Une visualisation des données dans IGV devrait également pouvoir détecter des variants de structure

113

start stop Symbol O Description

24958558 25122173 AVEN + protein apoptosis, caspase activation inhibitor

Negative regulation of apoptotic process

25122320 25510847 RYR3 - mRNA ryanodine receptor 3 Calcium transport, ion transport, muscle contraction

25757885 25773425 LOC102168731 + protein transmembrane and coiled-coil domain- containing protein 5B-like

Membrane component

25854735 26292437 FMN1 + mRNA formin 1 Limb development, kidney

development, skeletal morphognesis

26361816 26365927 GREM1 - mRNA gremlin 1, DAN

family BMP

antagonist

Early limb outgrowth, carcinogenesis, kidney organogenesis

26400753 26455999 SCG5 - mRNA secretogranin V Regulation of hormone secretion

26457952 26479994 ARHGAP11A - protein Rho GTPase activating protein 11A

GTPase mediated signal transduction

26636473 26639545 GJD2 - mRNA gap junction protein, delta 2, 36kDa

Synaptic transmission, transport

26673591 26678423 ACTC1 - protein actin, alpha, cardiac muscle 1

Cell motility, mesenchyme migration, muscle morphogenesis

26741929 26822012 AQR - mRNA aquarius intron-

binding spliceosomal factor

DNA repair, mRNA splicing

26822649 26822721 TRNAS-GGA - transfer RNA serine (anticodon GGA) 26832371 26839326 ZNF770 - mRNA zinc finger protein

770

Transcription regulation 26839468 27006078 LOC102171611 + rnaseq uncharacterized

LOC102171611 27216431 27408126 DPH6 - mRNA diphthamine biosynthesis 6 Post-translational protein modification 27352714 27353457 LOC102171158 - ab

initio ELMO containing protein 3 domain- pseudogene

Cell projection,

cytoskeleton

Tableau 10 : Liste des 15 gènes situés entre 25 et 28Mb sur le chromosome 10 caprin.

Les colonnes contiennent, dans cet ordre, les coordonnées de début et fin du gène sur le génome de référence, son nom abrégé, son brin d’ADN, la nature du transcrit associé, le nom complet et les fonctions biologiques associées si elles sont connues. Extrait du NCBI et de Uniprot pour la dernière colonne.

114 (insertion/délétion, CNV…) qui ne sont pas observables via l’étude bio-informatique des SNP.