• Aucun résultat trouvé

Génomique structurale et fonctionnelle

Dans le document UNE BIOLOGIE POUR LE DÉVELOPPEMENT (Page 67-71)

I. LE FABULEUX DESTIN DE LA BIOLOGIE

I.5. GÉNOMIQUE – DONNÉES GÉNÉRALES – CONSÉQUENCES –

I.5.1. Génomique structurale et fonctionnelle

Entre le génome d’une bactérie qui comprend quelques millions de bases, et celui de l’homme, qui en comporte 3,5 milliards, soit 1 000 fois plus, on conçoit que la mise en œuvre de procédés automatisés, réalisés par des machines appelées « séquenceurs », se soit avérée indispensable. Une fois établies les séquences « brutes » d’un génome, il convient pour les raisons évoquées précédemment de localiser celles des gènes « véritables » qui sont disposés dans sa continuité chimique. Cette opération baptisée « annotation » est facilitée par la reconnaissance d’éléments de séquences promotrices, d’îlots CpG, mais également de séquences de terminaison et de poly-adénylation (en effet, les messagers des eucaryotes comportent généralement en leurs extré-mités 3’OH, des chaînes plus ou moins longues de poly.A). Le repérage des introns est également rendu possible par la détermination des séquences très particulières qui les bordent à leurs deux extrémités, en alternance avec les deux exons qui les encadrent (Chambon).

Mais les objectifs princeps de la génomique ne se limitent pas au séquençage complet des génomes, à la délimitation brute, sur les chaînes d’ADN ainsi étudiées, des éléments codants et non codants (annotation) et à leur dénombrement, ce qui constitue la démarche dite de génomique struc-turale. Ils consistent également à connaître les rôles que jouent ces différents gènes dans l’économie de la cellule (génomique fonctionnelle).

Une des façons d’appréhender ce problème réside, au premier niveau, dans la caractérisation des produits moléculaires des gènes, c’est-à-dire dans l’étude des ARN codants et non-codants, ainsi, et surtout, que des protéines et de leurs interactions. Une autre approche, sorte de caractérisation par défaut, consiste à rechercher la fonction de chaque gène en étudiant les conséquences résultant de son élimination par recombinaison homologue (technique dite du « knock-out ») (M. Capecchi). On peut toutefois conjecturer que l’effet résultant de l’effacement expérimental d’un gène, entraînera à la fois des effets « spécifi ques », dus par exemple à l’absence d’un facteur de régulation particulier codé par le gène, et des effets « secondaires » parfois diffi ciles à

Génomique – Données générales – Conséquences – Applications 67

discriminer des précédents. La technique du knock-out s’avérera surtout utile pour préciser les conséquences physiologiques globales de l’élimination d’un élément génétique particulier, a fortiori en connaissance de ses produits d’expression.

l Les « surprises » de la génomique – Le nombre de gènes

Le séquençage des génomes appartenant à diverses espèces, voire divers règnes, devait réserver de grandes surprises une fois dénombrés les gènes proprement dits. Il apparut en effet que, d’un règne ou d’une espèce à l’autre, le nombre total de gènes ne variait que dans d’assez faibles proportions. Avec ses 25 000 gènes, Homo sapiens ne se distingue guère, en effet, que d’un facteur 5 par rapport à la bactérie E. coli, assez peu du ver Caenorhabditis, et encore moins de la souris ou de la plante Arabidopsis thaliana ! Si l’on prend en compte, à présent, les génomes des plantes supérieures, on constate que certaines d’entre elles renferment pratiquement le même nombre de gènes que l’homme, voire davantage ! (c’est le cas du riz). Le critère numérique absolu semble, à première vue, sans corrélation stricte avec la place occupée par les diverses espèces étudiées dans l’échelle évolutive.

Tableau 1. Données génomiques comparatives des bactéries à l’homme.

L’ADN présent dans une cellule de mammifère (souris, homme) est 800 fois plus long que celui présent dans une cellule de la bactérie E. coli. Les contenus informa-tifs (nombre total de paires de bases) sont à peu près dans le même rapport. Toutefois le nombre de gènes (codant pour des protéines ou des ARN) varie dans des proportions beaucoup plus faibles (5 fois environ). Cela est lié au fait que, contrairement à ce que l’on observe chez E. coli, la majorité de l’ADN de mammifère est de type « non codant » (voir le texte).

Cet apparent paradoxe est encore plus accusé lorsque l’on examine la nature chimique des séquences génomiques codantes (gènes). On constate, en effet, que ces séquences sont fréquemment conservées, sinon dans leur tota-lité, du moins dans de grandes proportions. Le cas est certes frappant lorsque l’on compare le chimpanzé à l’homme. Le nombre absolu des gènes est iden-tique et les différences observées dans leurs séquences sont minimes (1,2 %).

Il y a même de grandes parentés entre les séquences des gènes de souris et d’homme. Plus frappant encore est le fait que de nombreux gènes de levure (dont le génome ne comporte environ que 6 000 gènes) ont été conservés au cours de l’évolution, à travers la panoplie des génomes eucaryotiques, y compris le génome de l’homme. Cette situation n’implique pas toutefois que les gènes « conservés » remplissent toujours la même fonction d’une espèce à l’autre, c’est-à-dire que les protéines correspondantes appartiennent au même réseau métabolique (cf. l’hypothèse dite du « bricolage génétique » émise par F. Jacob).

Comment rendre compte du fait que le nombre de gènes en prove-nance d’organismes supérieurs, diffère dans des proportions, au demeurant si faibles, d’une espèce à l’autre ? Plusieurs explications ont été avancées. On peut penser par exemple qu’un petit nombre de gènes de développement fait la différence. Ces gènes seraient responsables, entre autres, d’un développe-ment exceptionnel du « télencéphale » dans l’espèce humaine (les aptitudes cognitives propres à cette espèce, dépendant beaucoup plus d’ailleurs de l’ap-prentissage et de l’éducation lesquels auraient pour support biologique une stabilisation préférentielle de certains réseaux synaptiques (J.-P. Changeux et A. Danchin)) que de la richesse en gènes actifs dans le cerveau. On a également invoqué que la complexité évolutive était davantage déterminée par le nombre de gènes « régulateurs », ou par la richesse en réseaux de régulation lorsque l’on s’élève dans l’échelle évolutive. Il est clair qu’une faible différence dans le nombre d’éléments d’une série peut engendrer des différences considéra-bles dans le nombre des combinatoires entre ces éléments. Enfi n, et surtout, il convient de ne pas oublier que la complexité biochimique d’une cellule ou d’un organisme entier repose avant tout sur les protéines qui constituent son patri-moine (notion de protéome). Or les mécanismes d’épissage alternatif peuvent conduire à une amplifi cation considérable du nombre de ces protéines et c’est de leurs interactions que dépendent la plupart des propriétés des cellules ou des organismes, qu’il s’agisse de propriétés structurelles ou métaboliques.

Quel que soit le bien fondé de cette interprétation, il n’en demeure pas moins que la situation issue de la numérologie comparée des gènes, provenant d’es-pèces souvent très éloignées sur le plan évolutif, a conduit certains biologistes (K. Scherrer et al.) à s’interroger sur la vraie signifi cation et la défi nition du mot « gène ». Pour être plus précis, il apparaît que, chez les organismes

Génomique – Données générales – Conséquences – Applications 69

supérieurs, le concept de gène ne se réduit pas simplement à ses délimitations moléculaires au niveau de l’ADN (même en y associant les séquences régula-trices). Le gène des eucaryotes peut diffi cilement se défi nir en dehors de son contexte fonctionnel. Ses produits ultimes sont des protéines dont la nature résulte des modalités de l’épissage et dont les rôles dépendent des interactions qui s’établissent entre elles et les autres protéines, ainsi que des modifi cations post-traductionnelles (acétylations, phosphorylations, glycocylations, etc.).

Ces considérations seront à nouveau évoquées lorsque nous discuterons de la

« biologie des systèmes ».

I.5.2. POLYMORPHISME GÉNÉTIQUE – LES SNP

La nécessité d’élargir notre conception de ce qu’est un gène s’impose également à la lueur des études sur le polymorphisme des génomes. En effet, l’établissement des séquences des génomes de nombreuses espèces a révélé une particularité nouvelle très importante : les ADN en provenance des indi-vidus d’une même espèce, présentent, dans leurs séquences, des différences, ou « polymorphismes » qui sont propres à chacun d’entre eux, indépendam-ment des rares changeindépendam-ments dus à la présence de mutations dont la fréquence est relativement rare. Ces polymorphismes sont à l’origine d’une véritable vidualité génétique. Ainsi la probabilité pour que les séquences ADN des indi-vidus d’une même espèce soient rigoureusement semblables est quasi nulle.

Cette particularité est mise d’ailleurs à profi t dans le fameux « test à l’ADN » (qui a remplacé l’utilisation des empreintes digitales) dans les investigations policières ou en recherches de paternité. Ce polymorphisme individuel peut se manifester sous plusieurs aspects :

– Une répartition particulière des séquences « satellites » (cf. supra) ; – Des modifi cations « ponctuelles » dans la séquence de l’ADN géno-mique caractérisées par la variation d’une seule et unique paire de base à l’in-térieur de la séquence d’un gène. Ce type de modifi cations est décrit en anglais sous le nom de « polymorphisme au niveau d’un seul nucléotide » (single nucleotide polymorphism, SNP en abrégé, ou encore « snip », dans le jargon consacré des « génotypistes »). On considère qu’il existe en moyenne un SNP toutes les 500 à 1 000 paires de bases. Ainsi dans l’espèce humaine, chaque individu diffère de chaque autre par plusieurs millions de traits polymorphes et, selon le fameux aphorisme du généticien Langaney : « nous sommes donc tous parents et tous différents ».

L’existence de ce polymorphisme a des conséquences à la fois fondamen-tales et pratiques. Au plan fondamental, si la présence d’un SNP particulier au

sein d’un gène ne suffi t pas dans la plupart des cas contrairement à celle d’une mutation ponctuelle, à modifi er les propriétés de la protéine correspondante, elle peut néanmoins entraîner des changements dans le degré d’expression de ce gène, voire dans la magnitude des effets entraînés par les mutations elles-mêmes. On peut donc tirer parti de la connaissance topographique des SNP à l’intérieur du génome (génotypage), pour classer, par exemple, des groupes d’individus selon la distribution de leurs SNP. Après avoir établi les corré-lations statistiques appropriées, on pourra par exemple établir des recorré-lations entre telle répartition de traits polymorphes (notamment de SNP) dans des génomes de populations données et les probabilités qu’elles ont de présenter tel ou tel phénotype (degré de susceptibilité à des cancers ou autres maladies).

Ce génotypage des populations intéresse les anthropologues et les généticiens.

Il n’a pas manqué toutefois de susciter des craintes relatives à l’émergence d’un eugénisme scientifi que !

Si, à présent, le polymorphisme concerne des gènes codants pour des enzymes impliquées dans la modifi cation d’une molécule douée d’activité pharmacologique, on pourra en déduire, par recherche de corrélations, le degré d’effi cacité thérapeutique de cette molécule en fonction des polymor-phismes observés chez tel ou tel groupe d’individus. C’est le principe de ce que l’on a dénommé « pharmacogénomique », une démarche qui préfi gure, d’une certaine manière, une pharmacothérapie « à la carte »… Quoi qu’il en soit, on voit bien à travers ces exemples que l’expression d’un gène ou l’ampleur des effets des mutations peuvent dépendre, dans une large mesure, du contexte génomique global, lequel varie sensiblement d’un individu à l’autre.

Dans le document UNE BIOLOGIE POUR LE DÉVELOPPEMENT (Page 67-71)