• Aucun résultat trouvé

Jeux et enjeux des données : de la crédibilité empirique à la crédibilité numérique Pour que la sélection génomique soit opérationnelle, il ne suffit pas d’avoir un dispositif

Génétique quantitative : calculer la valeur de la vache

2.1. Faut-il de la biologie pour quantifier le vivant ?

2.2.3. Jeux et enjeux des données : de la crédibilité empirique à la crédibilité numérique Pour que la sélection génomique soit opérationnelle, il ne suffit pas d’avoir un dispositif

technologique ad hoc ni de légitimer la promesse auprès des financeurs et des diffuseurs. Il est nécessaire aussi, comme le rappelle Pierre-Benoît Joly (2015) dans son analyse des promesses technoscientifiques, de construire sa crédibilité en dehors du noyau professionnel de spécialistes. Il soutient notamment, que « la construction d’une promesse technoscientifique répond à deux contraintes contradictoires : la contrainte de nouveauté radicale et celle de crédibilité. » (p. 36) En effet, comment parler d’une rupture scientifique, technologique et organisationnelle de la sélection génomique sans maintenir la crédibilité des évaluations construite sur le système ancien ?

Les méthodes statistiques de prédiction utilisent, comme je l’ai déjà dit dans la section précédente, la perspective ‘fréquentiste’, loi des grands nombres à l’appui (Desrosières 2014).

Dans le paradigme génétique de la sélection bovine, cette prédiction est fondée sur le testage des taureaux-reproducteurs sur leur descendance, c’est-à-dire sur l’épreuve de la mesure. Avant que la valeur génétique du taureau ne soit confirmée, l’information sur des centaines de vaches-productrices descendantes de ce taureau doit être recueillie et analysée. Le paradigme génomique faisant promesse aux entreprises de sélection de pouvoir se passer du testage, doit trouver d’autres moyens que l’empirisme de la mesure à répétition pour rendre l’estimation des valeurs crédible auprès de leurs utilisateurs finaux – les éleveurs. Dans l’évaluation par testage, comme nous l’avons vu précédemment, le CD, l’indice de fiabilité de la prédiction, est calculé en fonction du nombre de données en provenance de filles du taureau (cf. paragraphe 2.1.3). Avec la sélection génomique, c’est la population de référence constituée en amont des évaluations de routine qui remplace cette répétition de mesures pour chaque animal. Dans sa configuration usuelle, elle est composée d’animaux mâles phénotypés et génotypés, c’est-à-dire ayant été testés sur leur descendance (mais non sélectionnés) et dont l’ADN a déjà été marqué par les SNP mis sur la puce génomique59

. Les corrélations entre les marqueurs génétiques et les performances des vaches étant estimés statistiquement, la population de référence (propre à chaque race) fournit alors une moyenne qui permet ensuite d’évaluer en routine les animaux candidats à la sélection. Leur valeur est donc calculée sans recours au testage, ce qui permet d’évaluer les taureaux reproducteurs très jeunes et de les utiliser très tôt dans l’insémination artificielle.

Pour que l’évaluation soit considérée comme fiable, c’est-à-dire pour que le CD des index génomiques soit au moins égal à celui des index génétiques issus de l’évaluation par testage (c’est-à-dire que sa valeur numérique ne descende pas en dessous de 0,7), il faut un nombre de données considérable en provenance d’une population de référence de plusieurs milliers de taureaux. Cette mission est chose impossible pour un seul élevage ni d’ailleurs pour un seul pays. C’est une affaire collective à grande échelle. Même si les industries de semence des pays présents sur le marché international de la génétique bovine se concurrencent, elles ont compris l’intérêt de la ‘coopétition’60

. Déjà en 2008, les producteurs américains de semence Holstein s’associent avec leurs confrères et concurrents du Canada en mettant en commun leurs données et en formant ainsi la population de référence de 16 000 animaux phénotypés et génotypés. En 2009, les pays européens, sur l’initiative des généticiens et de la profession

59 Avec la baisse des coûts du génotypage, les femelles participent dorénavant aussi dans la constitution des populations de référence, mais ce changement et très récent dans la sélection génomique traditionnellement construite sur des populations de référence des taureaux reproducteurs.

60 Mot-valise formé par assemblage de deux mots : coopération et compétition. Dans sa définition, ll se réfère à une collaboration de circonstance ou d'opportunité entre différents acteurs économiques qui, par ailleurs, sont des concurrents (‘competitors’ en anglais).

d’IA, forment également un consortium appelé Eurogenomics afin de concurrencer le groupement nord-américain sur le niveau de la précision des évaluations génomiques. Deux consortia génomiques concurrentiels se sont ainsi formés et leur antagonisme marque toujours le paysage mondial de la sélection Holstein, comme nous le verrons dans le chapitre 4. Rapidement, la compétition entre eux, ainsi que les avancées technologiques et organisationnelles liées à l’utilisation de la génomique, ont fait doubler les populations de référence concurrentes. Arrivés à environ 35 000 taureaux chacun, les deux consortia poursuivaient leur course acharnée à la précision des évaluations. Les scientifiques ont alors décidé d’augmenter du nombre de marqueurs :

« On a commencé à se dire 'ok, on travaille avec une puce de 54 000 SNPs, on arrive à avoir des précisions de la valeur au niveau de la valeur d'élevage qui est quand même impressionnante, bien meilleure que la moyenne des parents, donc on fait un grand pas en avant. Et donc si avec 54000 marqueurs on arrive à ça, est-ce que avec 800 000 marqueurs on ne va pas gagner encore 10% en précision sur la valeur d'élevage qu'on va pouvoir calculer ?' Et les gens se sont mis à vouloir ça. Je me souviens, j'étais déjà à Illumina à l'époque, les gens nous ont dit : 'mais oui, il faut faire une puce avec 800 000 SNPs, ça va bien améliorer les choses'. » (entretien AE)

Mais en 2009, des études réalisées par le généticien américain Paul Van Raden et ses collègues démontrent que la limite de la précision est atteinte (P.M. VanRaden et al. 2009).

« Je me rappelle avoir croisé Paul Van Raden juste avant un congrès, où il disait 'ce que je vais présenter c'est que ça améliore les choses, mais à peine de 1% sur la Holstein'. Alors que les gens pensaient à 10%. Ça n’a pas amélioré les choses. »

(entretien AE)

Les données représentent toujours un enjeu important lorsqu’il s’agit des « politiques des grands nombres » (Desrosières 2010). La sélection bovine n’y fait pas exception. Avec la génomique, malgré des limites qui ont été démontrées, la question des données y est devenue la pierre angulaire et en même temps la pierre d’achoppement. Les données apparaissent notamment comme un des facteurs majeurs de la redistribution des cartes entre les acteurs. Comme nous l’avons vu dans le chapitre précédent, le modèle de gestion des ressources génétiques bovines jusqu’alors dominant est celui des biens communs. La double nature des

ressources – biologique et informationnelle – ne posait pas de problèmes majeurs tant que tout était géré ou du moins coordonné au sein des organisations coopératives de la sélection au niveau national. Avec l’arrivée de la génomique, les entreprises de sélection ont massivement investi dans le génotypage des animaux et sont ainsi devenues propriétaires des informations stratégiques. La partie ‘biologique’ des ressources génétiques étant toujours considérée comme non appropriable, sa partie informationnelle le devient (Labatut 2009; Allaire, Labatut, et Tesnière 2018). Cela rend bien compliquée la gestion commune des ressources génétiques scindées en deux dans leur ontologie propre et ayant deux statuts différents. Ce changement a ouvert la porte du marché de la sélection bovine aux structures totalement privées comme Sexing Technology qui détient le monopole de la semence sexée ou Zoetis, la filiale du géant multinational dans le domaine du médicament Pfizer. Constituant leurs propres bases de données génomiques, ces compagnies privées mettent en péril l’organisation traditionnellement coopérative de la sélection bovine et les fondements de la crédibilité garantie par la science publique. De plus, l’internalisation progressive des infrastructures de calcul par les détenteurs des données génomiques les rend préparés à la production autonome des index et à la commercialisation des ressources évaluées uniquement sur la base de données génomiques. La valeur du produit est ainsi concentrée dans sa partie informationnelle de plus en plus déconnectée de la partie biologique. Les scientifiques sonnent l’alerte à cette vision partielle de l’animal et essaient de communiquer autant qu’ils peuvent sur l’importance primordiale des mesures phénotypiques non seulement pour la fiabilité de la valeur des ressources commercialisées, mais aussi et surtout pour la durabilité de la sélection. « Dans la sélection génomique, le phénotype est le roi, » - peut-on entendre souvent dans les communications scientifiques lors des congrès ou des workshops professionnels. Mais étant donné que la logique du marché privilégie la simplification et le court terme, les voix des généticiens semblent être peu entendues. Cette affirmation basée sur l’observation participante sera réitérée dans le chapitre 4 où j’aurai l’occasion de présenter la tension renforcée entre les scientifiques et les industriels dans le cadre du consortium génomique européen.

Malgré ces points critiquables, la ‘révolution’ génomique dans le domaine de l’amélioration bovine reste très peu critiquée, paradoxe que je propose à l’analyse dans le paragraphe suivant.