• Aucun résultat trouvé

2 - Constitution du corpus bibliographique du programme MUSORSTOM-TDSB

Comme indiqué ci-dessus, le critère retenu pour inclure un article dans le corpus bibliographique du programme TDSB est qu’au moins une partie des spécimens étudiés (ou des données analysées) soient issus des travaux réalisés lors d’une des campagnes de la liste. Pour constituer ce corpus bibliographique entre 1979 et 2016, et les intégrer dans la base de données RefBiblio, plusieurs stratégies ont été mises en œuvre.

Pour réunir l’ensemble des articles associés au programme, le point de départ a été les listes constituées par les chefs de mission. Une première source a été le travail de veille bibliographique réalisée, jusqu’en 2008, par Bertrand Richer de Forges, avec l’aide de Christian Hoffshir, (ingénieur à l’IRD), qui ont alimenté une base de données (OCEANE)

dont l’objet était de documenter les données d’occurrence d’espèces aux stations échantillonnées par le programme TDSB et de les lier aux articles publiés dans des revues scientifiques. Une seconde source est fournie par les fiches de valorisation remplies depuis une quinzaine d’année par les chefs de missions. Enfin, dans les dossiers de demande de campagne, les listes de chercheurs fournies dans la section dédiée aux collaborations suscitées par la campagne indiquent les chercheurs auxquels du matériel issu des campagnes a été confié. En examinant la production des chercheurs ainsi listés, des références omises dans les fiches de valorisation ont pu être retrouvées.

La liste a ensuite été complétée par l’examen du contenu des bases de données de collections. En effet, pour les descriptions de nouvelles espèces, ces bases de données fournissent pour chaque nouveau taxon la référence bibliographique associée. En listant les nouvelles espèces associées aux stations des campagnes du programme, on obtient une liste d’articles associés à chacune des campagnes du programme. Ce travail sur les bases de données des collections a été réalisé avec l’aide de Julien Brisset. Il a permis d’intégrer des références absentes dans les listes figurant dans les fiches de valorisation.

Ce fastidieux travail de recherche des articles a également bénéficié de plusieurs projets en cours au Muséum. Notamment, pour les Mollusques un travail de veille bibliographique est réalisée par Virginie Héros. Cette veille vise à constituer une liste de tous les articles traitant des descriptions d’espèces de Mollusques, qu’ils soient marins, fluviatiles ou terrestres, et récoltés dans le monde entier. Cette liste est consignée dans une base de données dédiée (Zoological Record, ZR). Cette base permet notamment d’associer aux articles le nom des espèces décrites et la provenance (avec le nom de la campagne concernée). Cette base sert de référence pour documenter, dans la base de données collections du MNHN des Invertébrés Marins (INVMAR), les noms et les références des nouvelles espèces dont les types sont déposés au Muséum. Cette base est aussi utilisée par les chefs de mission pour constituer les listes incluses dans les fiches de valorisation.

Une convention entre l’Agence des Aires Marines Protégées de Nouvelle-Calédonie et le MNHN (2015-2016) a également contribué, via notamment le travail de Julien Brisset et de Gilberto Marani, à documenter dans BasExp les campagnes réalisées en Nouvelle-Calédonie et à compléter les données bibliographiques dans RefBiblio. Enfin une convention (2016-2017), avec les Terres Australes et Antarctiques Française, en lien avec la campagne BIOMAGLO réalisée en 2017 dans le Nord du Canal du Mozambique, a permis de consolider les références associées à l’ensemble des campagnes réalisées dans l’océan Indien. Enfin, une 96

analyse de macro-écologie réalisée dans le cadre d’un stage de Master 2 réalisé par Louise Keszler (encadré par Sarah Samadi et Juliette Delavenne) a contribué à compléter les références concernant les campagnes réalisées en Polynésie-Française.

La veille bibliographique réalisée par les chefs de mission en vue de remplir les fiches de valorisation ou par les chargés de collections en vue de faire des bilans de la valorisation des collections déposée au MNHN est particulièrement difficile car la façon dont est cité le matériel d’origine est très peu standardisée. L’utilisation des noms des campagnes dans les moteurs de recherche bibliographique ne permet en effet pas de retrouver toutes les références pertinentes. Ainsi, pour compléter ces recherches, les noms des chercheurs à qui du matériel a été confié, ou encore le nom des chefs de missions et/ou chargés de conservation, souvent mentionnés dans les remerciements, ont été utilisés.

L’étape suivante consiste à vérifier quelles sont les campagnes qui ont fourni le matériel examiné dans chaque article. Pour l’ensemble des articles réunis grâce à ces différentes sources, un important travail de croisement des données et un examen du texte de chaque référence a dû être réalisé pour confirmer le rattachement au programme et préciser la liste des campagnes concernées, et ce pour chacun article. Cette étape peut être compliquée à franchir. En effet, il n’est pas rare que le nom de la campagne n’apparaisse pas dans la publication, qui ne fournit que des numéros d’inventaire, dont il faut donc vérifier le rattachement aux campagnes via les bases de données. Parfois encore, la publication contient des numéros d’inventaire qui ne sont plus actuels, comme par exemple dans l’article de Yang et al. 2012. En effet, la forme des numéros d’inventaire utilisés par le MNHN a changé au cours des années 2000, si bien que pour les articles utilisant les anciens numéros d’inventaire, il a fallu établir la correspondance avec les nouveaux numéros. D’autres articles ne contiennent pas d’information permettant de confirmer que le matériel analysé dans l’article provient bien des campagnes TDSB. C’est par exemple le cas de l’article de Cohen, Kaulfuss, et Lüter 2014. Dans ce cas, l’auteur principal a participé à une campagne au cours de laquelle le chef de mission lui a confié du matériel qu’il a valorisé des années après sans s’inquiéter de la façon dont il devait référencer ce matériel. Cet article a été retrouvé parce que le chef de mission était cité, que les milieux et organismes concernés ainsi que la zone géographique correspondait bien aux campagnes du programme. De tels cas ont dû être vérifiés en interrogeant les chefs de missions. De même, de nombreuses études réunissent du matériel d’un grand nombre de campagnes, et même si les positionnements géographiques sont bien

documentés dans les articles, les campagnes ne sont pas toujours renseignées par leur nom de façon accessible aux moteurs de recherche (cf. par exemple Krug et al. 2013).

L’ensemble de ce travail de compilation a demandé d’examiner de façon précise le contenu de chaque articles (à partir de sa version numérique). Pour les articles récents, associés à des revues éditées par des éditeurs scientifiques, des versions électroniques sont disponibles (accessibles notamment via les abonnements institutionnels du CNRS et du MNHN). Les bases documentaires de l’IRD (base Horizon) ou encore celle d’Ifremer (ARCHIMER) ou du site documentaire du MNHN (notamment ASFA) sont une autre source. Pour des articles plus anciens, les projets internationaux tels que Biodiversity Heritage Library (BHL), ou Assembling the tree of life (ATOL) ont également été utilisés. Enfin, les articles non disponibles par ces sources ont été soit scannés à partir des copies disponibles dans les bibliothèques du MNHN, soit demandés aux auteurs (directement ou via des réseaux sociaux tels que Researchgate). L’ensemble des références réunies et les versions numériques sous format pdf ont été référencées dans le logiciel ZOTERO.

Le traitement des références bibliographiques a consisté à extraire les données bibliographiques standards des articles et à les lier au fichier PDF en utilisant le logiciel ZOTERO. Il s’agit lors de cette étape de récupérer le titre du document, le type de document (article de revue, rapport, article de colloque), le nom de la revue et son indexation (tomaison, volumes, pages), la date de publication, les noms et prénoms des auteurs, les noms des éditeurs, le résumé, la langue, etc… Ces données peuvent être disponibles dans les métadonnées des fichiers pdf, mais ce n’est pas le cas pour les documents qui ont été scannés. Dans tous les cas, les données ont été vérifiées, et donc consolidées dans Zotero. Ensuite, chaque article à été systématiquement associé aux campagnes dont provient le matériel étudié. Cette donnée est intégrée dans la base RefBiblio, qui en retour alimente BasExp.

Au total, 1579 articles ont été réunis pour une période allant de 1979 à 2016. Ces articles ont été enregistrés dans Refbiblio et liés à chacune des campagnes concernées pour un affichage dans Basexp. La liste de publications rassemblées consiste en des articles de revue, de la littérature grise (comptes rendus de campagne, rapports), des articles de colloque et des livres. Les travaux universitaires (mémoires et thèses) n’ont cependant pas été pris en compte.

3 – Construction des métadonnées