• Aucun résultat trouvé

Prédictions d’événements évolutifs guidées par des données

Prédictions guidées par des données et par des modèles

2.2 Études de cas de prédictions guidées par des données et de prédictions guidées par

2.2.1 Prédictions d’événements évolutifs guidées par des données

Dans un article de 2009, le philosophe de la biologie Ramsus Winther fournit des exemples de prédictions issues de la théorie de la sélection naturelle30. Il souligne que celles-ci sont à la fois capable de réfuter cette

théorie (« risquées ») et propres à cette théorie (« surprenantes »). Ces exemples portent sur des expériences réalisées en laboratoire par Richard Lenski, qui a soumis douze lignées d’E. Coli à la même pression sélective sur 30 000 générations pendant presque vingt ans, et a observé, conformé- ment à la prédiction de la théorie de la sélection naturelle, une évolution parallèle des lignées.

Cependant, ce cas ne serait pas probant pour une partisane de la thèse de Mayr et Scriven. En effet, elle pourrait aisément argumenter qu’il s’agit d’un cas de biologie expérimentale qui illustre la thèse selon laquelle la biologie n’est prédictive que dans un contexte expérimental, sans que cela ne prouve que les disciplines biologiques qui sont des sciences naturelles historiques soient prédictives31.

À l’inverse, le cas que l’on propose d’étudier ici appartient clairement au domaine de la théorie de l’évolution. Il s’agit des recherches menées depuis la fin des années 2000 par deux biologistes, Virginie Orgogozo, spécialiste de l’organisme modèle Drosophilia melanogaster de l’Univer- sité Paris VI, et David Stern, spécialiste de biologie du développement à

30

Rasmus Winther, “Prediction in Selectionist Evolutionary Theory”, Philosophy of Science 76 (2009), p. 889–901.

31R. Winther propose un deuxième cas de prédictions, celles réalisées par Margulis

à partir de l’hypothèse selon laquelle les organelles intracellulaires des cellules euka- ryotes sont des cellules incorporées suite à une symbiose. Cependant, il n’est pas clair que la théorie de la sélection naturelle joue un rôle important dans ces prédictions, voilà pourquoi je ne les discute pas ici.

Princeton 32.

Le résultat de ces recherches permet, selon eux, de prédire l’évolution génétique d’une espèce. Il ne s’agit donc pas de prédire des événements évolutifs comme l’apparition ou l’extinction d’une espèce, mais de prédire quels loci des chromosomes sont les plus susceptibles de muter pour une espèce donnée — phénomène qui, selon Scriven et Mayr, est impossible à prédire et représente une des deux sources d’aléatoire rendant la biologie évolutive incapable de faire aucune prédiction.

Une hypothèse largement répandue est que la plupart des mutations ayant un rôle dans l’évolution d’une espèce prennent place dans les ré- gions cis-régulatoires des gènes33. En effet, es gènes sont composés de

deux régions différentes (voir figure 2.1) : l’une encodant un produit (une protéine, une molécule d’ARN, etc.), l’autre (la région cis-régulatoire) en- codant les instructions qui déclenchent ou inhibent l’expression de ce pro- duit. Or, la plupart des gènes ont des effets « pléiotropiques », c’est-à-dire affectant de nombreux autres gènes : une mutation dans la région codante d’un gène pléiotropique peut donc, par effet domino, avoir des effets délé- tères sur l’ensemble de l’organisme et le rendre non-viable. En revanche, un changement dans la cis-région d’un gène ne fait qu’« éteindre » ce gène en évitant ces effets négatifs : c’est pourquoi on peut faire l’hypothèse que ce type de mutation serait, le plus souvent, responsable d’évolution adaptatives.

C’est cette hypothèse qu’examinent et utilisent V. Orgogozo et D. Stern à des fins prédictives. Il va de soi que je ne discute pas ici la validité ou la portée de ces travaux récents en biologie : c’est la manière dont ces deux chercheurs réalisent leurs prédictions qui nous intéresse ici, que celles-ci soient ou non, par la suite, confirmées. Et cette manière de réaliser des prédictions me semble particulièrement représentative des raisonnements

32Je m’appuie ici principalement sur les deux articles publiés par V. Orgogozo et

D. Stern sur cette question : Virginie Orgogozo et David Stern, “The Loci of evolution : how predictable is genetic evolution ?”, Evolution 62.9 (2008), p. 2155– 2177, et Orgogozo et Stern, “The Loci of Evolution”. On trouve aussi ces résultats exposés, ainsi que d’autres recherches sur la prédiction des mutations génétiques, dans le livre de Stern : David Stern, Evolution, Development, and the Predictable Genome, Yosemite, Roberts & Company Publishers, 2010.

33

Virginie Orgogozo et David Stern, “Is Genetic Evolution Predictable ?”, Science 323.5915 (2009), p. 746–751, p. 747.

Figure 2.1 : Régions codantes et cis-régions d’un gène. Les rectangles gris indiquent les portions d’ADN qui encodent une protéine. Les rectangles blancs indiquent les portions d’ADN qui permettent à ces portions d’être transcrites : ce sont ces régions que l’on appelle cis-région des gène. Source : Virginie Or- gogozo et David Stern, “The Loci of evolution : how predictable is genetic evolution ?”, Evolution 62.9 (2008), p. 2155–2177, p. 2157.

prédictifs concrètement réalisés en biologie évolutive.

En premier lieu, V. Orgogozo et D. Stern ne mentionnent aucune « loi ». Ils soulignent au contraire qu’ils n’essayent pas de généraliser l’hypothèse selon laquelle les mutations évolutives ont lieu dans les cis- régions des gènes. Cette hypothèse ne sert que comme hypothèse de travail, comme esquisse de généralisation fondée sur des considérations théoriques à propos de la pléiotropie qui laisse de côté de très nombreux facteurs qui peuvent avoir autant d’importance que la pléiotropie. Seule l’utilisation de nombreuses données concernant ces autres facteurs — qui ne sont pas forcément d’origine génétique, et relève donc d’autres disci- plines biologiques comme l’épigénétique — peut, selon V. Orgogozo et D. Stern, rendre l’évolution génétique prévisible :

Les arguments théoriques fournissent des raisons de penser que l’évolution phénotypique est dominée par l’évolution cis- régulatoire, mais d’autres forces évolutives comme la taille de la cible de la mutation, ou l’histoire démographique de la population, peuvent perturber cette tendance. La question de l’importance de l’évolution cis-régulatoire sera réglée en dernière instance par les données empiriques34.

34

C’est le second point important de la méthode prédictive de V. Or- gogozo et D. Stern : afin d’étudier le rôle de ces facteurs dans l’évolution à court et à long terme, V. Orgogozo et D. Stern ne recourent pas à une méthode expérimentale (bien que les mouches drosophiles sur lesquelles travaille V. Orgogozo soient parmi les organismes modèles les plus ma- nipulés expérimentalement), mais construisent et utilisent une base de données d’études compilant des mutations génétiques à l’origine de va- riations phénotypiques. Cette base de donnée, disponible sur le site web de la revue Evolution, regroupe les 332 études de cas de mutations ayant eu un impact phénotypique, chacun de ces cas étant accompagné de 45 informations sur la localisation du gène, les espèces impliquées, etc. Bien que le nombre de données ainsi atteint ne soit pas effrayant, il est bien supérieur au nombre de données normalement utilisées pour appliquer une loi physique à une situation expérimentale car aucune loi n’est dis- ponible qui donne a priori les facteurs importants à prendre en compte et donc les données à observer.

De plus, il est probable que ces données ne soient pas toutes perti- nentes : elles sont ici pour servir à l’analyse statistique, et ne concernent pas un ensemble d’entités et de propriétés déjà définies théoriquement. Une telle base de données ne sert donc pas uniquement à tester ou induire une loi scientifique : elle est susceptible de révéler différentes informa- tions sur les facteurs d’origines diverses qui affectent les mutations. Le tri entre données pertinentes et données non-pertinentes pour la prédic- tion se fait ainsi après avoir récoltées les données, et non avant comme dans un contexte de prédiction guidées par des lois.

Ainsi, en comparant les cas de mutations intraspécifiques et inter- spécifiques, V. Orgogozo et D. Stern peuvent comparer les mutations de l’évolution à long terme et de l’évolution à court terme. Les mutations à long terme sont celles qui ont été testées dans une grande variété d’en- vironnements, et qui maintiennent une forme de plasticité d’adaptation pour faire face à ces nouveaux environnements. Or, si les mutations pléio- tropiques sont susceptibles de favoriser l’adaptation rapide à de nouveaux environnements, elles provoquent une baisse de plasticité, et seraient donc bien moins favorables sur le long terme. Afin de tester cette prédictions,

V. Orgogozo et D. Stern appliquent une forme d’analyse statistique, le test de Fisher 35. D’autres facteurs peuvent ensuite être analysés de la

même manière et recoupés avec la distinction entre mutation à court terme et à long terme, comme le type de mutation phénotypique (mor- phologique ou physiologique) ou le type de gènes36.

C’est là le troisième point important de la méthode de V. Orgogozo et D. Stern : ils utilisent des outils statistiques pour pouvoir, à partir de leur large base de données, extraire et recouper différents facteurs qui jouent sur la corrélation entre mutation dans une cis-région et évolu- tion phénotypique. Lorsque Hempel parle de prédiction dérivée d’une loi statistique-probabiliste, il décrit un processus de quasi-déduction dans lequel les prémisses du raisonnement et sa conclusion sont liées par une forte probabilité à défaut d’une implication logique. Le raisonnement pré- dictif de V. Orgogozo et D. Stern est une induction à partir d’une base de données qui analyse le rapport entre la variance de plusieurs variables, c’est-à-dire leur corrélation, qu’elle soit fréquente ou non. Au lieu de ne prendre en compte que les facteurs importants d’un phénomène, les pré- dictions de V. Orgogozo et D. Stern cherchent à prendre en compte tous les facteurs en les pondérant grâce à une analyse statistique sur leur base de données.

En dernier lieu, les travaux de V. Orgogozo et D. Stern montrent que leurs prédictions se font en utilisant d’autres sciences biologiques que la biologie évolutive comme la génétique, l’épigénétique et la biologie du dé- veloppement, surtout lorsqu’il s’agit de réaliser la prévision précise d’une mutation susceptible d’affecter l’évolution d’une espèce donnée. En effet, durant le développement d’un organisme, la position d’un gène dans son réseau génétique de régulation est un facteur déterminant. V. Orgogozo et D. Stern soutiennent ainsi que le développement des poils de soie — des organes sensoriels qui poussent sur le dos de la mouche drosophile — est affecté par un grand nombre de gènes mais qu’un seul, nommé scute, est à une place telle qu’il reçoit de très nombreux signaux de régulation et active de nombreux autres gènes (cf. figure 2.2.1). Il est donc responsable

35Ce test statistique est exposé plus en détail dans le chapitre 7, section 7.1.2. 36

de la différenciation de quasiment toutes les cellules du dos des mouches. V. Orgogozo et D. Stern nomment ce genre de gènes des « points chauds » (hot spot genes) pour indiquer leur place cruciale dans le ré- seau de régulation génétique. Leur prédiction prend donc la forme sui- vante : les mutations génétiques ayant un effet phénotypique susceptible d’être avantageux pour la mouche drosophile ont une forte probabilité d’avoir lieu dans les régions cis-régulatoires des points chauds du réseau génétique de développement de cette mouche37. Cette prédiction est pro- babiliste et résulte de la convergence d’informations qui proviennent de différents domaines de la biologie :biologie évolutive, biologie du dévelop- pement, génétique, biologie des populations, physiologie et morphologie. La conclusion de leur article de 2008 souligne ce point : « En regroupant la génétique de l’évolution et du développement, les biologistes peuvent être capables de prédire, en un sens probabiliste, les mutations sous-jacentes aux évolutions phénotypiques ».

Si l’on reprend les caractéristiques des recherches de V. Orgogozo et D. Stern relevées ci-dessus, on peut caractériser la structure de la prédiction qu’ils réalisent par quatre points :

1. Cette prédiction ne donne une place centrale ni à des lois ni à des généralisations empiriques qu’elle permettrait de tester. A fortiori, elle n’est pas la conséquence d’une seule théorie organisée de ma- nière axiomatique et hiérarchique.

2. Cette absence de loi est palliée par la construction et l’utilisation de « méta-études », c’est-à-dire de bases de données regroupant un nombre important de résultats d’études précédentes d’origine et de nature diverses.

3. Pour formuler et tester une telle prédiction, on utilise des tests statistiques sur cette base de données : cela permet de prendre en compte les nombreux facteurs de nature différente et leurs interac- tions qui interviennent dans un système ouvert comme celui d’un organisme.

37

Figure 2.2 : Ce schéma représente une partie du réseau génétique de régulation des poils de soie de Drosophilia melanogaster. Le gène scute est affecté par les mu- tations de beaucoup d’autres gènes (comme wingless, Bat, hairy, ...) et déclenche des effets phénotypiques qui aboutissent à la différentiation des cellules du dos de la dro- sophile en soie (bas du schéma). Ce gène est donc un « point chaud » (Hot spot gene), c’est-à-dire un gène dont la mutation est susceptible d’affecter le phénotype de la drosophile. Source : Virginie Orgogozo et David Stern, “The Loci of evolution : how predictable is genetic evolution ?”, Evolution 62.9 (2008), p. 2155–2177, p. 2170.

4. La formulation de ce type de prédiction nécessite la convergence de données, d’hypothèses (comme l’hypothèse des « hot spot genes ») et de modèles (comme le modèle du réseau de régulation des gènes de la drosophile gouvernant le développement des poils de soie) qui proviennent de disciplines différentes.

Il est difficile de refuser aux travaux de V. Orgogozo et D. Stern le titre de « prédictions » : ils permettent bien, par une série d’inférences, de déterminer quels sont les loci d’un génome susceptible de muter sous une pression sélective donnée 38. Autrement dit, les résultats de V. Orgogozo

et D. Stern permettent bien de définir une méthode pour fixer, avec une certaine probabilité, la valeur de la variable concernant les loci d’un génome qui ont une importance évolutive, sans avoir à la mesurer ou à l’observer.

La structure de cette prédiction diffère donc sur plusieurs points de la conception classique des prédictions scientifiques représentée par le modèle des prédictions guidées par des lois proposé dans le chapitre pré- cédent (voir section 1.4) :

1. Les lois n’y jouent pas un rôle essentiel, mais les données sont en revanche indispensables.

2. Les prédictions sont inférées à partir de ces données en utilisant des procédures d’analyse statistique.

3. Ces données visant à étudier l’interaction d’un grand nombre de facteurs de nature différente, cette forme de prédiction est néces- sairement multidisciplinaire.

Pour désigner ce type de raisonnement prédictif, on parlera de prédictions guidées par des modèles.

38Certes, il ne permettent pas de prédire quels seront les changements de milieu qui

feront varier cette pression sélective : c’est la tâche de la climatologie, de la géologie et de l’écologie scientifique. Cependant, on montre dans la section suivante qu’il est tout à fait possible, dans certains de ces domaines, de recourir à des prédictions qui réduisent la part d’aléatoire qui les rendaient parfaitement imprévisibles aux yeux de Mayr et de Scriven.

Les prédictions guidées par des données sont caractéristiques des contextes non-expérimentaux39 et diffèrent radicalement des prédictions

guidées par des lois que cherchaient, sans les trouver, Mayr et Scriven en biologie évolutive et C. Cleland dans la méthodologie des sciences naturelles historiques.

Dans un article de 1982 sur les prédictions de la théorie de l’évolu- tion, M. Williams reconnaît que, contrairement à ce qu’elle a soutenu une décennie plus tôt, « une partie de la raison pour laquelle on a échoué à reconnaître les prédictions de la théorie de l’évolution est que l’on cher- chait des prédictions qui ressemblaient aux prédictions de la physique »40 (ce qui signifie, dans le cadre de cet article, des prédictions à partir de la résolution d’équations différentielles). Il me semble que l’on peut gé- néraliser cette remarque : si l’on a échoué à reconnaître des prédictions portant sur l’évolution des espèces, c’est que l’on a cherché des prédic- tions correspondant à la conception classique des prédictions, c’est-à-dire des prédictions guidées par des lois. Au contraire, si l’évolution d’une es- pèce ou de son génome est bien un processus multifactoriel affectant des systèmes ouverts soumis à de nombreuses perturbations, ce sont les pré- dictions guidées par des données qui peuvent servir à la biologie évolutive et que l’on doit rechercher pour juger du pouvoir prédictif de cette disci- pline.

Dans la section qui suit, on étudie un cas de prédictions en géologie qui révèle une troisième et dernière forme de raisonnement prédictif : les prédictions guidées par des modèles.

39Dans le cas de V. Orgogozo et D. Stern, ceux-ci excluent explicitement de leurs

données les résultats expérimentaux :« Nous n’avons pas inclus les variations sélec- tionnées dans des expériences de laboratoires »Orgogozo et Stern, “The Loci of Evolution”, p. 2164. Cela ne signifie pas que des études expérimentales ne sont pas parfois reportées dans les méta-études qui servent de base de données. Mais comme on l’a vu dans le cas des géomorphologistes, certains scientifiques des sciences naturelles historiques sont particulièrement réticent à extrapoler les résultats d’expériences de laboratoire consistant modéliser et à contrôler des systèmes ouverts.

40

Williams, “The Importance of Prediction Testing in Evolutionary Biology”, p. 297.

2.2.2

Prédictions géologiques guidées par des mo-

Outline

Documents relatifs