• Aucun résultat trouvé

Avec la numérisation de toutes les activités liées à la santé, on assiste à une explosion de la production de données. La maladie cancéreuse est en première ligne en...

N/A
N/A
Protected

Academic year: 2022

Partager "Avec la numérisation de toutes les activités liées à la santé, on assiste à une explosion de la production de données. La maladie cancéreuse est en première ligne en..."

Copied!
2
0
0

Texte intégral

(1)

Correspondances en Onco-Thoracique - Vol. I - n° 2 - juillet-août-septembre 2020 60

É d i t o r i a l

La donnée de santé : un enjeu majeur

Health data: a major challenge

A vec la numérisation de toutes les activités liées à la santé, on assiste à une explosion de la pro- duction de données. La maladie cancéreuse est en première ligne en raison de sa fréquence et de l’utilisation de données de grands volumes (big data), images et séquençage à haut débit. Les volumes uni- taires ne sont pas tous considérables : un compte-rendu médical n’occupe que quelques kilooctets, les images de scanners ou d’IRM sont de l’ordre du mégaoctet.

D’autres données occupent des volumes beaucoup plus conséquents : les lames virtuelles peuvent rapidement atteindre le gigaoctet et les données brutes issues du séquençage sont de l’ordre du téraoctet. Ces grands volumes de données posent des problèmes d’archivage et de conservation dans la durée ; il est aussi néces- saire de résoudre la qualité des bandes passantes des réseaux et l’administration de ces bases de données gigantesques, centralisées ou réparties. Il persiste des préoccupations techniques comme la durée de vie et la fiabilité des supports numériques, la sécurisation des données et les problèmes éthiques, confidentialité des données et protection de la vie privée.

Dans son but premier, le dossier médical est conservé pour la continuité des soins ou la transmission d’in- formations. Les données qu’il rassemble ne sont pas utilisables telles quelles : elles doivent être regroupées, transformées, stockées dans des entrepôts où elles se présentent sous plusieurs formes : des textes, des données structurées, des signaux, des images.

Plusieurs défis doivent être relevés pour utiliser ces don- nées dans une démarche de recherche clinique, pour l’apprentissage automatique ou l’intelligence artificielle.

Le traitement du langage naturel avec une struc- turation automatique est nécessaire. La majorité des informations figurant dans les dossiers ne sont pas structurées, ne sont pas analysables telles quelles et il est nécessaire de les transformer en données codi- fiées, normalisées selon les concepts des nomenclatures internationales.

Les comptes-rendus médicaux relatent une histoire, différente d’un patient à l’autre, interprétée par un

médecin ou un soignant. La valeur informationnelle de chaque compte-rendu dépend de l’observateur, de son expertise, de la situation clinique, du temps disponible, du support électronique. La subjectivité est la règle plus que la reproductibilité.

Le partage de données entre différentes institutions de soins est nécessaire, car la maladie cancéreuse n’est pas une entité unique. Plus nous avançons dans la compréhension des mécanismes moléculaires, plus le nombre de cas d’une même entité se réduit et devient trop faible dans un seul hôpital pour alimen- ter les algorithmes d’apprentissage. Le partage des données nécessite une interopérabilité technique et sémantique, il requiert d’utiliser des classifications communes et des systèmes permettant les échanges (HL7, FHIR, OMOP).

Un des points majeurs est le contrôle de la qualité des données qui servent à l’apprentissage auto matique.

Les données qui alimentent les algorithmes sont par nature de grand volume, ce qui les rend difficiles à contrôler une par une, nécessitant des vérifications logiques ou par tirage au sort.

Il est indispensable de disposer de données lon- gitudinales dès lors que l’objectif est la prédiction de la réponse à un traitement ou l’étude du pronostic. Il faut s’assurer que les données utilisées sont récentes et que l’algorithme ne reproduit pas le passé, car dans certaines pathologies, les progrès sont rapides.

Si l’hôpital concentre la majeure partie des données des patients atteints de cancer, il est utile de les lier et de les corréler à des données extrahospitalières ou recueillies auprès des patients. Lors des prises en charge dans plusieurs établissements, il est important d’assurer un lien avec les données démographiques pour l’ana- lyse de la survie et il est possible pour cela d’utiliser les données de l’INSEE ou du Centre d’épidémiologie sur les causes médicales de décès.

Un des points essentiels pour pouvoir utiliser ces données est l’information des patients et le respect de la législation, le règlement général de protection des données.

(2)

Correspondances en Onco-Thoracique - Vol. I - n° 2 - juillet-août-septembre 2020 61

Éditorial

Pour la recherche, il s’agit d’un changement complet de paradigme dans la mesure où la donnée devient le sujet majeur. L’approche big data ne s’appuie pas sur des structurations d’information préexistantes dans un contexte prédéterminé, comme dans un essai théra- peutique, mais sur la donnée issue de la vie réelle.

L’approche big data et intelligence artificielle repose sur un nouveau triptyque : donnée-hypothèse-connais- sance. On passe d’un raisonnement déductif à un rai-

sonnement inductif et ce changement de paradigme va modifier la façon de concevoir la recherche. La donnée de santé devient donc un enjeu majeur. Il faut consi- dérer qu’il s’agit d’un bien commun et qu’il serait non éthique de ne pas l’utiliser pour faire progresser la recherche contre le cancer.

Dr Alain Livartowski Direction des data, institut Curie, Paris.

A. Livartowski déclare ne pas avoir de liens d’intérêts en relation avec l’article.

AVIS AUX LECTEURS

Les revues Edimark sont publiées en toute indépendance et sous l’unique et entière responsabilité du directeur de la publication et du rédacteur en chef.

Le comité de rédaction est composé d’une dizaine de praticiens (chercheurs, hospitaliers, universitaires et libéraux), installés partout en France, qui représentent, dans leur diversité (lieu et mode d’exercice, domaine de prédilection, âge, etc.), la pluralité de la discipline. L’équipe se réunit 2 ou 3 fois par an pour débattre des sujets et des auteurs à publier.

La qualité des textes est garantie par la sollicitation systématique d’une relecture scientifique en double aveugle, l’implication d’un service de rédaction/révision in situ et la validation des épreuves par les auteurs et les rédacteurs en chef.

Notre publication répond aux critères d’exigence de la presse :

· accréditation par la CPPAP (Commission paritaire des publications et agences de presse) réservée aux revues sur abonnements,

· adhésion au SPEPS (Syndicat de la presse et de l’édition des professions de santé),

· indexation dans les bases de données internationale ICMJE (International Committee of Medical Journal Editors)

· déclaration publique de liens d’intérêts demandée à nos auteurs,

· identification claire et transparente des espaces publicitaires et des publirédactionnels en marge des articles scientifiques.

Toute l’équipe Edimark

vous souhaite une rentrée 2020 pleine d’espérance !

Claudie Damour-Terrasson, directrice des publications

Références

Documents relatifs

La conjonction d’un diagnostic d’assez fort isolement du monde des enseignants de la conduite et de la sécurité routière, par rapport au monde de l’éducation à la

Cependant, alors que la position des femmes françaises en Europe est la meilleure pour les maladies cardio-vasculaires et un peu au dessous de la moyenne pour la mortalité par

L’indicateur correspond au nombre de femmes ayant séjourné au moins une fois dans ce type d’unité au cours de la période gravido-puerpérale, rapporté au nombre de

En 2012, le taux d’incidence standardisé sur l’âge de la population mondiale est de 362,6 pour 100 000 personnes-années chez l’homme et de 252,0 chez la femme en France

Les éléments de l’instruction montrent donc que d’août 2002 au 6 février 2003 au moins, des organisations professionnelles de la sécurité incendie (FIM, FFMI, CNMIS, SYFEX)

En l’espèce, l’Autorité a établi aux paragraphes 416, 417, 418, 428, 429 et 437 à 440 ci-dessus que la règlementation de l’OCM fruits et légumes (désormais OCM

que ces comités devaient faire l’objet d'un agrément, assorti de diverses obligations, des services du ministre de l'Agriculture et que l'Etat était représenté au sein de ces

regrouper pour constituer, dans une région donnée, un comité économique agricole, tel le CERAFEL, comité économique agricole de la Région Bretagne, et le CELFNORD,