• Aucun résultat trouvé

Comme nous l’avons présenté précédemment, les marqueurs génétiques utilisés dans notre étude de susceptibilité/sévérité de la PR étaient des marqueurs microsatellites de la région HLA.

L’utilisation de marqueurs microsatellites de la région HLA dans les études génétiques s’est considérablement développée depuis le début des années 1990. Le grand polymorphisme de ces marqueurs et le faible coût de leur génotypage constituent des points forts qui ont permis leur utilisation dans plusieurs domaines : génétique des populations, étude de susceptibilité à des maladies, médecine légale…

Etant donné l’intérêt de ces marqueurs polymorphiques dans la région HLA, il nous a paru pertinent de se lancer dans un travail de standardisation de la nomenclature de ces marqueurs en compilant des données moléculaires et des informations issues de la littérature. Ces efforts de standardisation de l’information des marqueurs microsatellites de la région HLA ont déjà donné lieu à plusieurs publications (180- 184). Cette volonté de développer une nomenclature internationale unique s’exprime notamment à travers les activités du « HLA Msat Working Group », dont l’objectif principal est d’assurer la recherche et le partage d’informations sur les différents aspects des marqueurs microsatellites de la région HLA (185). Ceci se traduit par la réunion des informations issues des différents domaines d’application des marqueurs microsatellites de la région HLA (aspects techniques, cartographie, études des maladies, fréquences populationnelles et déséquilibres de liaison, références

base de données disponible sur le site du NCBI (http://www.ncbi.nlm.nih.gov/mhc/html/STRsearch2.html), et faisant l’objet de

développements spécifiques (http://bioinfo.genopole-toulouse.prd.fr/MAMSat).

Au travers du travail mené dans notre équipe, il est apparu que la mise en place d’une nomenclature standardisée pour les marqueurs microsatellites, avec les amorces correspondantes, constitue une tâche d’une très grande ampleur (186). La mise en place d’une telle nomenclature serait un outil d’un grand intérêt pour la communauté scientifique, notamment pour les chercheurs travaillant spécifiquement sur l’histocompatibilité. L’existence de plusieurs synonymes pour un même microsatellite reste un facteur limitant, et il convient de choisir une nomenclature pertinente et compréhensible par tous. Une telle nomenclature vient d’être proposée

par le 14ème Workshop International « HLA et Immunogénétique » (187).

Depuis plusieurs années maintenant les études d’association en génétique tendent à privilégier des marqueurs de type SNP, notamment avec des approches d’études basées sur des analyses de fréquences haplotypiques. On peut dénombrer au moins quatre avantages liés à l’utilisation des SNPs par rapport à d’autres marqueurs pour étudier la composante génétique des maladies multifactorielles (188, 189). Premièrement, les SNPs sont très nombreux et répartis sur l’ensemble du génome : dans les introns, les exons, les promoteurs, les séquences régulatrices (190)… et certains de ces marqueurs peuvent même constituer des polymorphismes fonctionnels. Deuxièmement, des groupes de SNPs adjacents peuvent montrer des motifs de corrélation qui peuvent être utilisés dans la cartographie génique et faire ressortir des sites de recombinaison (191). Troisièmement, les différences de fréquences inter-populationnelles des SNPs permettent leur utilisation dans des

études de génétique des populations (192, 193). Enfin, les SNPs sont moins soumis à des phénomènes de mutation que d’autres types de marqueurs génétiques (194, 195), cette plus grande stabilité permettant des associations gène-phénotype plus « consistantes ».

Plusieurs projets ont été lancés avec pour objectif de créer une base de données des SNPs identifiés par recherche de mutation ou lors du séquençage de gènes candidats, ces projets étant financés par des fonds industriels et/ou gouvernementaux (196, 197). Sur les 10 millions de SNPs identifiés, un peu plus de la moitié ont ainsi été validés. Des limites de coût et de non exhaustivité des bases de données sur ce type de marqueurs rendent complexes les études d’association sur des SNPs autres que ceux constituant des candidats biologiques pertinents. Plusieurs équipes de recherche, qui s’intéressent à des gènes ou des voies métaboliques spécifiques, ont indépendamment cherché à identifier des variants de séquences par puce de reséquençage dans leur population d’étude (198).

Etant donné que beaucoup de SNPs sont situés en dehors des gènes connus ou ne constituent pas des polymorphismes associés à une fonction précise, ils ne sont généralement pas directement associés avec le phénotype observé (199). La sélection des gènes candidats étant complexe, et les informations fonctionnelles sur les SNPs n’étant pas monnaie courante, la recherche d’une association indirecte entre le marqueur et le gène testé est le modèle le plus souvent éprouvé. Cette recherche se base donc sur le phénomène de déséquilibre de liaison. Beaucoup d’études de localisation génique, et notamment de gènes de pathologies sont basées sur l’exploitation des DL entre un marqueur génétique que l’on sait étudier et le gène à identifier. Cette méthode d’association indirecte par le déséquilibre de liaison nécessite une cartographie fine et une densité importante de marqueurs (176). Cette

méthode peut être améliorée par l’étude de plusieurs marqueurs de manière simultanée, ou en utilisant des haplotypes. Dans l’étude des maladies multifactorielles, où plusieurs facteurs génétiques contribuent à la susceptibilité à la maladie, l’étude des haplotypes est pertinente, notamment depuis que différentes combinaisons d’allèles d’un même gène peuvent agir de concert, comme « un méta- SNP », et avoir des effets différents sur la production d’une protéine ou la régulation transcriptionnelle (200). Dans des études populationnelles, les origines exactes des allèles parentaux sont inconnues, et la phase des haplotypes, notamment pour les doubles hétérozygotes, doit être estimée (201). C’est ce que nous avons réalisé dans notre étude d’association avec la PR, en utilisant le logiciel Estihaplo développé par Pierre-Antoine Gourraud (142).

Devant ce développement important de l’information sur les marqueurs de type SNPs, un débat considérable a eu lieu sur les différents avantages et inconvénients de l’utilisation de ces marqueurs, en lieu et place des marqueurs microsatellites habituellement utilisés. Ce débat concernait notamment leur informativité dans les études de liaison, la capacité des logiciels existants à analyser un nombre important de SNPs, et les conséquences du phénomène de déséquilibre de liaison entre les SNPs sélectionnés. L’avantage principal des microsatellites est leur polymorphisme important, ce qui leur garantit une grande informativité, contrairement aux marqueurs de type SNPs qui sont bi-alléliques. L’avantage principal des SNPs est qu’ils sont présents en très grand nombre dans le génome, ce qui laisse penser qu’ils compensent leur faible polymorphisme par leur densité, celle-ci permettant notamment des analyses d’haplotypes de plusieurs SNPs contigus.

Dans ce cadre, Schaid et al. ont effectué une étude de comparaison des marqueurs microsatellites et des SNPs dans le contexte d’une étude de susceptibilité au cancer de la prostate par analyse pangénomique (202). Ils arrivent à la conclusion que les SNPs apportent une meilleure information en termes de liaison génétique grâce à leur plus grande densité dans le génome. Malgré tout, dans les cas où il existe un grand déséquilibre de liaison entre les SNPs, les auteurs observent une inflation importante des LOD scores, ce qui semble être une conséquence de l’hypothèse d’équilibre requise par les logiciels d’analyse de liaison utilisés.

Dans un même schéma d’étude, John et al. sont arrivés à une conclusion identique dans le cadre de la PR (77). Malgré ces résultats probants, John et al. ont réalisé une étude de liaison génétique sur une population de familles anglaises et américaines en utilisant 744 marqueurs microsatellites répartis sur l’ensemble du génome (78).

Une meilleure complétude des bases de données sur les marqueurs génétiques, notamment grâce à un développement important des techniques moléculaires et des bases de données informatiques, ainsi que des tailles d’échantillons importantes sont des facteurs essentiels pour l’étude de la composante génétique des maladies multifactorielles, mais elles ne garantissent pas le « succès ».

Avec le développement exponentiel du nombre d’études en génétique, associées à l’augmentation de la masse d’informations disponibles sur le génome, il apparaît indispensable d’adapter les méthodes statistiques pour une prise en compte de l’ensemble des informations. Connue et reconnue dans le milieu médical, considérée comme le plus haut niveau de preuve par les cliniciens, la méta-analyse connaît un essor considérable dans les études d’épidémiologie génétique.