• Aucun résultat trouvé

B. La base de données, une institution de la recherche ?

2. Une institution de publication communautaire

En raison de sa proximité avec la technologie, la science est certainement l’un des premiers domaines à avoir été touché par la vague d’informatisation qui submerge la société dans la deuxième partie du vingtième siècle. Dans les années 1990, le « tournant informatique » de la biologie est commenté à la fois par les témoignages de biologistes et l’analyse d’historiens des sciences:

- « Dans le nouveau paradigme, qui émerge en ce moment même, tous les gènes seront connus (au sens où ils seront hébergés sur des bases de données disponibles électroniquement)10 » (Gilbert 1991, p.99) ;

- « La plupart des données produites par les scientifiques lors de projets de séquençage ou de cartographie ne seront jamais publiées dans des journaux conventionnels mais seront et resteront hébergées dans des bases de données »11 (Hilgartner 1995, p.241).

Ce qui frappe dans un premier temps, en lisant ces deux prophéties, c’est que les deux auteurs parlent dans des termes très proches. Ils ont notamment recours à la métaphore du foyer (home) pour désigner ce qui n’est pas à proprement parler un lieu mais un espace d’accueil et d’hospitalité. Comme le chante le poète, « (h)ome is the place where, when you have to go there, they have to take you in » 12.À cette époque, la base de données pouvait encore être conçue comme un espace intime, une ressource locale.

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!

10 Nous soulignons et traduisons de l’anglais : “The new paradigm, now emerging, is that all the ‘genes’ will be known (in the sense of being resident in databases available electronically)” .

11 Nous soulignons et traduisons de l’anglais : “Most of the data produced by scientists engaged in genome mapping and sequencing will never be published in conventional journals but will find their ultimate home in databases”.

12 Nous nous inspirons ici de ces mots du poète Robert Frost dans son poème The death of the Hired Man (in North of Boston).

Mais ni le biologiste, ni le sociologue ne s’en tiennent à cette acception. Tous deux évoquent une conception de la base de données envisagée comme le moyen matériel permettant de mettre à disposition de la communauté scientifique ces données, sur des réseaux électroniques qui fonctionneraient comme un nouveau système de revues scientifiques.

D’ailleurs, se former à l’informatique devient un impératif pour pouvoir accéder à cette ressource scientifique d’un nouveau genre13. Autrement dit, l’espace symbolique auquel renvoie la base de données n’est plus celui du foyer mais celui d’un espace public structuré autour d’une communauté aux pratiques culturelles formatées par les nouveaux moyens de communication informatique.

La base de données informatique joue donc ici un rôle analogue à celui du journal dans les « communautés imaginées » de Benedict Anderson. Ce concept, créé en 1983, dans un tout autre contexte d’études que le nôtre, a permis de rendre compte du processus culturel qui accompagnait le développement de communautés particulières, les États-Nations (B.

Anderson 1996). Il s’agit de réfléchir à la façon dont des communautés peuvent se créer, lorsque celles-ci sont suffisamment larges pour admettre que des citoyens ne se connaîtront jamais les uns les autres. Dans ce contexte, seule la faculté imaginante peut faire exister un collectif. La communauté n’émerge que parce que ses membres se représentent faire partir d’un tout qui les subsume. Or, l’hypothèse d’Anderson, est que la technologie de l’imprimerie et la réalisation de journaux s’avèrent cruciales dans ce processus. D’une part, en effet, les journaux œuvrent à la diffusion des langues vernaculaires et composent de vastes publics de lecteurs monoglottes. D’autre part, la lecture du journal forme une vaste communauté de co-lecteurs qui, même s’ils sont seuls dans l'accomplissement de ce rituel séculier, ont la connaissance intime d'un partage avec des milliers d'autres lecteurs qu'ils ne voient pas, qu’ils ne connaissent pas mais qui s’intéressent, comme eux, au sort de la nation.

De la même façon que le journal est crucial dans la construction d’une communauté politique, la revue s’avère essentielle à la communauté scientifique. Il ne s’agit pas seulement d’informer les lecteurs des nouvelles dans leur domaine, ce qui est évidemment la mission première du journal scientifique mais aussi de dessiner un cercle d’inclusion et d’exclusion entre ceux qui sont capables de lire ces revues, voire d’y publier, et les autres. C’est en ce sens

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!

13 Telle est en tous cas la prophétie de Gilbert: « pour utiliser ce déluge de connaissances qui s’apprête à se déverser au gré des réseaux informatiques du monde entier, les biologistes doivent développer des compétences informatiques (become computer-literate). (…) Ce n’est pas plus difficile que de savoir accéder à la littérature scientifique telle qu’elle se présente aujourd’hui. » (Gilbert 1991, p.99). Nous traduisons de l’anglais: “To use this flood of knowledge, which will pour across the computer networks of the world, biologists (…) must become

que l’on peut admettre qu’une base de données peut jouer un rôle analogue à celui de la revue dans la cohésion d’une communauté scientifique, qui s’y réfère et y contribue.

Pourtant, il faut bien reconnaître que la revue et la base de données opèrent différemment. C’est notamment la raison pour laquelle, l’étude de la culture numérique et de ses spécificités prend toute son importance lorsque l’on entreprend la démarche d’analyser les pratiques en vigueur dans la génomique d’aujourd’hui. Cinq aspects permettent de distinguer le mode de fonctionnement de la base de données par rapport à celui du journal (Hilgartner 1995) :

i. Contrairement aux journaux scientifiques qui présentent une distinction stricte entre données publiées et données non publiées, les bases de données permettent de réviser cette opposition binaire et de la remplacer par un spectre de possibilités. En effet, dans une base de données, le partage entre « public » et « privé » n’est pas donné mais doit être construit, dans chaque cas, au moyen d’une réglementation explicite. On peut alors circonscrire des espaces ou établir des niveaux qui correspondent : à un hébergement simple de données sans que celles-ci ne fassent encore l’objet d’un partage ; à une communauté bien définie de partage ou encore à une diffusion publique des données. Toutes ces considérations sont l’objet de processus de négociations entre institutions, organismes de financements et équipes de recherche – voire entre pays membres dans le cas d’infrastructures internationales.

ii. Contrairement aux journaux, les bases de données peuvent être mises à jour continuellement. Aussi faut-il se demander s’il faut conserver les archives pour être en mesure d’historiciser les données (savoir « qui a dit quoi et quand ») ou s’il est plus pertinent de mettre le système à jour de façon continue. Dans une base de données de cartographies génomiques, on pourra ainsi se demander si les divergences entre cartes créées par groupes différents doivent être réconciliées afin de produire une carte de consensus ou si les différences doivent être mis en valeur.

iii. Contrairement aux journaux pour lesquels la publication est intégrée au régime de reconnaissance des scientifiques, la question de la motivation des chercheurs pour rendre publique leurs données reste ouverte.

iv. Contrairement aux journaux dont l’économie repose sur des systèmes de souscription et de publicité établis, il faut se demander qui sera responsable de la construction et du maintien d’une base de données.

v. Contrairement au régime de communication du journal, pour lequel « assembler » l’information est une tâche dévolue au lecteur, la base de données doit mettre en relation les données. C’est la raison pour laquelle « des spécialistes en bio-informatique travaillent à créer des moyens de plus en plus sophistiqués de lier les différentes bases de données et rêvent du jour où les bases de données biomoléculaires formeront une structure parfaitement intégrée et sans accroc (a seamlessly integrated structure) » (Hilgartner 1995).

Ce rapprochement entre base de données et journal confirme la thèse de l’anthropologue Christine Hine selon laquelle lorsque l’on s’intéresse aux pratiques de la génomique, il faut faire porter notre attention sur le mode d’évaluation des chercheurs, sur l’évolution des pratiques scientifiques, sur les formes que prennent les environnements spatiaux au sein desquels la science se fait (Hine 2006). En prenant en compte toutes ces dimensions, il apparaît que les bases de données ne sont pas que des versions digitales des journaux mais qu’elles comportent des spécificités qui supposent autant d’adaptations voire posent autant de défis aux scientifiques, aux techniciens, aux juristes et aux bioéthiciens. D’une part, les systèmes informatiques posent des contraintes sociales lorsqu’il s’agit de les financer, les entretenir, les intégrer à un système plus vaste d’économie de la connaissance. D’autre part, l’informatique infuse les pratiques par sa culture propre.

De même que, chez Anderson, le journal jouait un rôle social parce qu’il était autant une technologie qu’un langage, aussi convient-il de se demander quel espace symbolique ouvre la base de données et dans quelle langue les membres communiquent. Cette langue qui est celle de la culture numérique n’est pas neutre. Le théoricien de l’informatique Lev Manovich va jusqu’à lui attribuer un impact sur notre représentation du monde puisque, par un phénomène de projection, le monde exploré par les moyens de l’informatique finirait par être conçu comme étant lui-même composé de structures de données et d’algorithmes (Manovich, 2001, p. 223). Que l’on accrédite cette thèse radicale ou que l’on se contente des études de sciences qui montrent comment les pratiques et les attentes des chercheurs concernant les technologies d’information et de communications (TIC) façonnent la science (Nentwhich 2003), il faut reconnaître le rôle que joue la culture numérique dans des sciences très informatisées (comme c’est le cas de la génomique).

En effet, si, sur le modèle du rôle fondateur joué par le journal dans la construction d’une unité linguistique, d’une unité temporelle et d’une unité de représentation (qui constituent les fondements de l’expérience communautaire), on admet que la base de données

fournira le langage – et donc l’espace symbolique – de nos représentations. La « computer literacy » ne peut être cantonnée à un simple jeu de compétences, mais le fait que les chercheurs s’expriment selon les codes de la culture numérique suppose que l’on se demande ce qu’écrire, lire et publier signifient à l’âge de l’informatique (Berry 2011). L’utilisation d’une base de données passe par le déploiement d’une culture informatique qui influence les représentations scientifiques.