• Aucun résultat trouvé

CHAPITRE 1 : PERSPECTIVES CRITIQUES SUR LES PRATIQUES DE LA RECHERCHE EN GÉNOMIQUE HUMAINE

C. Le partage comme principe : dimension éthique de la convergence entre développement informatique et génomique

2. Le partage dans l’histoire de la biologie

Le partage n’est pas nouveau en biologie. Les scientifiques partagent leurs résultats dans les journaux et dans les conférences. Mais qu’en est-il de leurs données, c’est-à-dire des éléments de connaissance qui préexistent à leur interprétation définitive sous forme de

de leur laboratoire quand bien même ces éléments pourraient constituer des ressources utiles pour d’autres et ainsi faire avancer les connaissances ? Et comment coopérer dans les projets de grande envergure, notamment les cartographies de protéines, de gènes et de génomes si prisées dans la recherche génétique (Rheinberger and Gaudillière 2004), sans partager les données au fur et à mesure de leur production ?

Les historiens des sciences nous éclairent de ce point de vue en montrant qu’il .existe une tradition du partage des données dans les communautés formées autour de l’étude d’organismes modèles. Qu’il s’agisse des communautés formées autour des drosophiles (Drosophila melanogaster) ou de celles formées autour du ver nématode (Caenorhabditis

elegans), nombreux sont les travaux historiques ayant rapporté ces pratiques de partage

(Ankeny and Leonelli 2011; García-Sancho 2012; Kohler 1994; Leonelli and Ankeny 2012). L’analyse de ces pratiques illustre un double intérêt des scientifiques qui partagent leurs données au sein de leur communauté d’étude: d’une part, le partage est un enjeu stratégique de positionnement pour les laboratoires ; d’autre part, le partage, constitué comme une valeur de la recherche scientifique (Merton 1942), qui témoigne des orientations normatives d’un chercheur, d’un laboratoire, d’un groupe.

Depuis les années 1970, les pratiques de partage de données sont largement liées à l’utilisation de technologies informatiques qui permettent à des communautés de scientifiques de communiquer et de travailler en réseau. Le cas de la communauté d’étude formée autour du séquençage du ver nématode est particulièrement intéressant de ce point de vue, à la fois parce que l’activité de partage via les réseaux électroniques fut au centre du projet (García- Sancho 2012) et parce que les méthodes d’analyse et de traitement informatique mises en avant dans ce projet annoncent à bien des égards le mode opératoire du Projet Génome Humain (Fortun 1999a). La communauté d’étude formée autour de C. elegans est l’une des premières à se langer dans l’aventure du séquençage entier d’un génome. Alors que les données de séquençage affluent depuis de nombreux laboratoires, les moyens traditionnels utilisés pour partager les données relatives à C. elegans, tels que The Worm Breeder’s

Gazette, deviennent insuffisant (Stevens 2015, 477). Nous sommes à la fin des années 1980:

les chercheurs s’échangent des disquettes mais les mises à jour prennent du temps et la collaboration pâtit de ces difficultés à communiquer les données.

Pour mieux contextualiser notre propos, rappelons que ces soucis sont partagés dans différentes communautés scientifiques. C’est en tous cas le même type de problème que celui rencontré par les chercheurs du CERN (du nom du Conseil européen pour la recherche nucléaire), l’Organisation européenne pour la recherche nucléaire. Et face à cette difficulté,

les chercheurs du CERN ont développé une solution. Tim Berners-Lee, informaticien au CERN, crée en 1989 un système hypertexte distribué sur réseau informatique permettant de partager les informations au sein de l’institution. Cet outil deviendra la Toile mondiale, le

World Wide Web. De leur côté, les chercheurs de la communauté travaillant sur le séquençage

de C.elegans n’ont pas vent de ce nouvel outil développé au CERN et qui bientôt, révolutionnera non seulement la science mais le monde.

Bruce Shatz, informaticien chez Bell Labs, construit un système similaire qui devient, en 1991, Système de la Communauté du ver (Worm Community System). Il s’agit d’une ressource en ligne permettant d’accéder à des descriptions, des cartes génétiques, des séquences d’ADN, de la littérature publiée et non publiée – le tout à propos de C. elegans. La communauté peut ainsi collaborer au jour le jour comme jamais cela n’avait été possible auparavant.

« Le nouveau rôle des ordinateurs a changé la nature et l'utilité des données descriptives recueillies dans le projet. Les données de cartographie ont été présentées comme un moyen pour étudier la génétique de C. elegans plutôt que comme une fin en soi. Cela a rendu la circulation des données aussi importante que leur collecte et que leur traitement informatique. L'échange d'informations de cartographie et de logiciels au sein de la communauté croissante des chercheurs de ver a transformé la façon dont les objectifs du projet C. elegans ont été atteints.

( ... ) La communauté internationale du ver a, par conséquent, modelé progressivement son organisation autour de l'expansion des réseaux informatiques consacrés à la distribution et à l'échange de données. Ces éléments relatifs à l’informatique et aux données ont reconfiguré la communauté C.

elegans, notamment en ce qui concerne la répartition du travail entre les groupes

– de plus en plus nombreux et de plus en plus connectés79 ». (García-Sancho, 2012, pp. 22-23)

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!

79 Nous traduisons de l’anglais : “The new role of computers changed the nature and utility of the descriptive

data gathered in the project. The mapping data was presented as a means to the genetics of C. elegans rather than an end in itself. This made the circulation of data as important as its collection and computer processing. The exchange of mapping information and software within the growing community of worm researchers transformed the way in which the goals of the C. elegans project were achieved.

(…) The international worm community was, thus, gradually modeling its organization on expanding computer networks devoted to the delivery and exchange of data. These computer and data components reconfigured the

La création de réseaux informatiques constitue une étape cruciale dans l’organisation de la coopération scientifique. Non seulement ces technologies de communication ouvrent de nouvelles possibilités mais elles déterminent les contours de la coopération. La circulation des données devient, à partir des années 1990, un enjeu crucial dans la gouvernance scientifique. Pour la communauté organisée autour de l’étude du ver nématode, le système informatique mis en place pour partager les données permet de coordonner les recherches mais aussi d’inaugurer, grâce à ces technologies de type Web, de nouvelles façons de travailler en croisant des données hétérogènes et en organisant les données biologiques de sorte que leur accès puisse être interactif. A mesure que le Web s’étend et que les scientifiques se familiarisent avec les nouvelles configurations de travail permises, c’est toute la chaîne de production des données, depuis leur collection jusqu’à leur diffusion, qui s’en trouve réformée : « les technologies du Web commencèrent à jouer un rôle de plus en plus important dans la façon de conserver, gérer, transmettre et accéder aux données de génomique80 » (Stevens 2015, 481).

Alors que les laboratoires engagés dans la recherche en génomique reconnaissent de plus en plus ouvertement les mérites des outils informatiques de partage, la diffusion des données de génomique n’est pas aisée à organiser en dehors des communautés aux liens très denses telles que celles que nous avons décrites autour de C. elegans. Pour en revenir à l’Atlas de Dayhoff, les contributions des généticiens sont loin d’être à la hauteur de ce que l’on aurait pu espérer. Comme nous l’avons souligné plus haut, l’une des raisons qui explique le manque de participation tient au fait que l’Atlas est lui-même soumis à un droit d’auteur, ce qui pour certains chercheurs est interprété comme un acte d’appropriation de leur travail (Strasser 2010a). Mais d’autres tensions sont à l’œuvre.

Depuis les années 1970, la tension entre partage des données et reconnaissance des chercheurs s’est aggravée autour de ce nouvel enjeu que constitue l’autorisation de breveter le vivant. En 1974, les chercheurs Herbert Boyer et Stanley Cohen parviennent en effet à faire breveter leur méthode pour recombiner l’ADN. Les « inventions biologiques » peuvent ainsi désormais faire l’objet d’un brevet. Le climat est alors à l’extension du brevet au vivant et à sa promotion. En témoigne, en 1980, la promulgation par le Congrès américain du Bayh Dole Act (officiellement The Patent and Trademark Law Amendments Act, « la loi sur les !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!

80 Nous traduisons de l’anglais : “Web technologies began to play a more and more important role in storing,

modifications apportées au droit sur le brevet et les marques »). Cette loi permet aux universités américaines, et de façon générale à toute organisation non lucrative bénéficiant de fonds publics, de breveter ses découvertes et inventions, y compris concernant le séquençage du génome. En autorisant des institutions publiques à breveter leurs découvertes, la loi vise à favoriser le « transfert de technologie », c'est-à-dire l'application commerciale des découvertes issues de la recherche publique. Cette loi n’est pas appréciée par tout le monde. Elle est notamment critiquée par les défenseurs du libre-accès aux connaissances qui y voient une véritable menace. Parmi ceux qui contestent la loi, les chercheurs occupent des positions qui s’étirent en un vaste spectre entre le refus par principe de l’appropriation de la connaissance et le soutien de la recherche privée passant par l’acceptation, sous certaines conditions, de la commercialisation de certaines des découvertes de la biologie (Cassier 2002).

Face à ces menaces de confiscation de la connaissance, le partage des données est érigé en bastion pour ceux qui défendent le libre-accès aux connaissances. Il devient de plus en plus important pour les laboratoires publics mais aussi privés81 qui reconnaissent dans le partage des données une valeur à part entière de la science d’organiser les institutions qui permettront aux libertaires de communiquer librement. L’heure est alors à la construction d’infrastructures solides et sécurisées permettant aux tenants du partage de mettre en œuvre leurs idéaux. Aux Etats-Unis, deux institutions majeures sont créées au cours des années 1980 pour faciliter le partage des données de séquence : GenBank (1982) qui permet de recueillir, conserver et mettre à disposition de la communauté scientifique les données de séquence d’ADN et d’ARN ; le Centre national pour l’information biotechnologique (National Center for

Biotechnology Information) qui, depuis 1988, poursuit la délicate mission de coordonner le

travail des universités, des instituts de recherche privés et publics afin de construire une base de données intégrée facilement accessible par les chercheurs à travers le monde. De l’autre côté de l’Atlantique, le partage aussi s’organise. L’institut de bioinformatique européen (European Bioinformatics Institute) est fondé en 1992 dans un objectif similaire. Le rôle prioritaire de ces institutions consiste à créer des standards de communication permettant d’assurer que les diverses bases de données restent compatibles entre elles. La Base de données Génome Humain (Human Genome Database), fondée en 1990, marque un pas de plus dans l’ouverture des données puisqu’elle offre un accès public aux données de séquence et ce, que l’on soit ou non membre de la communauté de génétique moléculaire.

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!

Toutes ces ressources permettent aux biologistes de partager leurs ressources plus rapidement, plus efficacement et plus largement. Les agences de financement de recherche, que ce soit aux États-Unis ou en Europe, soutiennent ainsi de plus en plus explicitement la « science ouverte » (Open Science) en faisant la promotion des « données ouvertes » (Open

Data).

En pratique, cela signifie qu'elles font pression sur leurs bénéficiaires pour publier les données sur des bases de données publiques – une dynamique qui à son tour affecte la façon dont les scientifiques construisent leur recherche et dont ils mesurent et traitent leurs productions. De nombreux chercheurs investissent maintenant du temps et des ressources considérables dans le don de données à des dépôts publics ; et ils considèrent la consultation des bases de données en ligne comme une première étape cruciale pour le développement de nouvelles lignes d'investigation82. (Leonelli 2013, p.7)

La création de ces vastes bases de données met en avant le rôle des agences de recherche qui ont notamment le pouvoir d’influencer les relations entre chercheurs en faisant la promotion du partage. D’ailleurs, dans les débats sur les bases de données de séquence, la rhétorique du partage et de l’ouverture est généralement associée aux projets financés par les pouvoirs publics. Le partage n’est pas neutre. Le partage des données de séquence va ainsi passer du statut d’usage lié à la recherche de l’efficacité des sciences à celui de principe en devenant emblématique de l’opposition à l’appropriation de la connaissance et au brevetage des gènes et séquences.

Documents relatifs