• Aucun résultat trouvé

systémique du niveau d’intégration du moléculaire au paysage

6. Questionnements, hypothèses et objectifs concernant l’observation à large échelle du benthos de substrat dur en

milieu côtier et les systèmes d’information associés

La conservation de la biodiversité marine est une préoccupation mondiale illustrée par le programme de travail proposé par la Convention sur la Diversité Biologique (C.D.B.) visant à “promouvoir des actions politiques pour réduire la biodiversité et la dégradation des écosystèmes et des services écosystémiques, ainsi que leurs conséquences pour le bien- être humain."55 La C.D.B. exhorte les parties prenantes “à promouvoir la production et

l'utilisation d'informations scientifiques, à développer des méthodologies et des initiatives pour surveiller l'état et les tendances de la biodiversité et des services écosystémiques, partager des données, développer des indicateurs et des mesures, et effectuer des évaluations régulières et en temps opportun pour chaque usager de ces données".

Dans le cadre de ce travail de thèse, nous tentons d'apporter des solutions qui permettraient de répondre positivement et efficacement à ces recommandations en nous focalisant : - sur la construction de réseaux de suivi et d’observation écologiques et environnementales pérennes et utiles pour différents types d’usages, - sur le partage efficace des connaissances à long terme entre les producteurs de données et ses différents utilisateurs potentiels (scientifiques, gestionnaires, élus, O.N.G., amateurs, grand public…) et sur l’inter-opération des systèmes d’information, - sur les méthodes, outils et interfaces d’analyses de la pléthore de données exploitant les nouvelles avancées dans le domaine du Big Data, de la gestion des données hétérogènes et de leur analyse sous forme de graphes.

En se basant sur deux dispositifs « cas d’étude » : les habitats coralligènes à l’échelle de la Méditerranée (programme CIGESMED) et la colonisation de récifs artificiels (ARMS) dans différentes mers régionales et dans le cadre des questions posées concernant l’observation à large échelle, cette thèse a pour objectif de proposer des méthodes et des protocoles, puis de tester leur applicabilité à un réseau multi-observateurs dans plusieurs pays.

Les premiers résultats de ces suivis et l’évaluation de l’efficacité des méthodes testées ont été analysés en vue de produire de premières recommandations pour construire et/ou soutenir la mise en place de réseaux de suivis utiles et pérennes de la biodiversité à l’échelle

55 www.cbd.int/doc/decisions/cop-10/cop-10-dec-11-en.pdf La Convention sur la diversité biologique (C.D.B.) est un traité international adopté lors du sommet de la Terre à Rio de Janeiro

en 1992, avec trois buts principaux : la conservation de la biodiversité ; l'utilisation durable de ses éléments ; le partage juste et équitable des avantages découlant de l'exploitation des ressources.

d’une zone biogéographique ou sur le plan international, s’appuyant sur les acteurs locaux (dispositifs allant des suivis de gènes aux suivis d’espèces et d’habitats).

- Il en résulte les hypothèses formulées dans le cadre de la thèse. L’une des hypothèses majeures de cette thèse est qu’en créant des modules avec différents types de protocoles, il est possible de favoriser les utilisations multiples et novatrices des données et leur mise à disposition pour des études ayant des périmètres thématiques, géographiques et temporels différents.

- La deuxième hypothèse consiste à poser le principe qu’il est possible de s’affranchir des technologies utilisées en construisant un système réparti, utilisant une standardisation minimale :

● Qui permet non seulement une agrégation d’une partie des données qu’il faut identifier selon l’objectif initial du protocole,

● Mais qui favorise aussi des usages possibles, en tenant compte des moyens potentiels de nouveaux usagers et des perspectives à court ou long terme de chacun des usages de la donnée.

Il s’agit donc de décrire les principes d’une méthode d’augmentation du “potentiel de la donnée” basée sur une architecture, des concepts d’utilisation et des services autour de cette donnée “répartie” et “hétérogène” sachant que la création de la donnée précédera nécessairement la conception de ces “nouveaux” usages. Une des conséquences sera, par exemple, que dans le cas d’une réutilisation dans un nouvel objectif scientifique, cette donnée sera produite avant l’écriture des hypothèses. La conséquence de cet état de fait est que les hypothèses scientifiques devront être bâties en fonction du contenu et de la qualité des données pré-existantes. Afin d’assurer la pertinence de ces hypothèses, il sera alors nécessaire de mettre en place des processus d’enrichissement et d’amélioration de la donnée (la “curation de données”).

De plus, certains freins doivent être mis en lumière en tenant compte notamment des expériences et des leçons tirées des travaux sur les protocoles et les données produites dans le cadre de CIGESMED et de DEVOTES. Ce travail a ainsi pour objectif majeur d’identifier les verrous concernant la réutilisation des données produites, et notamment de décrire comment sur ces deux modèles d’études, il est possible de proposer des processus de traitement et de mise à disposition selon les modèles FAIR (Findable, Accessible,

Interoperable, Reusable) et les nouveaux concepts émergeants autour du concept de Data Management Plan (D.M.P.) alors que l’information est produite puis stockée et utilisée dans

En particulier, des questionnements jalonnent ce travail de thèse et concernent :

- Les niveaux d'interopérabilité atteignables en tenant compte des moyens disponibles des travaux existant en la matière (ne concernant pas forcément les disciplines écologiques/environnementales) et de l’évolution des standards sur lesquels ils s’appuieront,

- La préservation de la donnée à long terme et notamment les problématiques d’obsolescence plus ou moins prévisible,

- La préservation des droits de l’auteur/inventeur des dispositifs, tout en augmentant et améliorant les différents accès aux données (brutes, traitées et de synthèse),

- La préservation de la véracité56 de la donnée, notamment lorsque celle-ci est

prétraitée par des systèmes intégratifs d’indication et d’aide à la décision.

Un deuxième objectif de cette thèse est d’apporter une part des réponses à ces questionnements : cette partie plus opérationnelle consiste donc à concevoir et tester le potentiel des données et de lever les verrous qui empêchent son amélioration grâce à la conception et au développement d’un prototype permettant de manipuler et d’agréger ces données sous forme de flux multi-formats et de représentations visuelles basées sur la théorie des graphes.

Ce prototype et les résultats de tests effectués sur les jeux de donnée des programmes CIGESMED et DEVOTES permettent de proposer de premières recommandations pour une mise en oeuvre opérationnelle et réussie d’un système d’accès multi-usagers aux données de la biodiversité marine. Dans le chapitre suivant, nous détaillons différents protocoles et méthodes de production de données produites pour répondre aux différentes hypothèses énoncées dans le cadre des programmes CIGESMED et DEVOTES, avant d’en détailler les différents résultats puis de les discuter.

56 Le groupe d’analystes Gartner (https://blogs.gartner.com/) et IBM utilisent six lettres V

fondamentales pour décrire le Big Data : Volume, Variété, Vélocité, Visibilité, Valeur et Véracité. La véracité est la capacité d’un grand ensemble de données contenant certaines données incertaines à donner les mêmes résultats lorsqu'il est soumis à l’analyse que le même ensemble comportant uniquement des données « certifiées ».

Chapitre 2 : Les travaux concernant les