• Aucun résultat trouvé

De la nécessité du partage pour l’optimisation de l’analyse des données massives par

Chapitre 2 – Les promesses de l’utilisation des systèmes d’intelligence artificielle en santé

1. Enjeux inhérents au fonctionnement des systèmes d’intelligence artificielle

1.2. De la nécessité du partage pour l’optimisation de l’analyse des données massives par

S’il n’existe pas de règles spécifiques concernant la taille nécessaire de l’échantillon pour qu’un système soit considéré comme valide, plus l’échantillon est grand, plus le réseau de neurones a des chances de fonctionner efficacement (Zhang 2010; LeCun, Bengio, et Hinton 2015; Chartrand et al. 2017). Le développement de l’innovation numérique en santé (et plus largement de toutes applications de systèmes d’IA) est donc dépendant du partage de données (ou data sharing). Cet aspect est extrêmement important pour assurer la validité et la portée des prédictions des systèmes qui seront développés, qu’il s’agisse des systèmes experts comme Watson (Lee 2014), de la mutualisation des données pour des perspectives de santé publique (Brouard 2017) ou du développement de la médecine de précision (Azencott 2018; Fiore et Goodman 2016; Iyengar, Kundu, et Pallis 2018).

Ce partage est généralement vu comme étant nécessaire lorsque l’on considère l’intérêt du plus grand nombre, en particulier en ce qui a trait à la recherche. Comme le reconnaît Rial-Sebbag (2017):

Le principe est relativement simple : afin d’accélérer la production de connaissances dans les sciences de la vie il est nécessaire d’encourager les chercheurs à partager leurs données pour le « bien » de la science et afin d’éviter toute réplication inutile dans les recherches (p. 48).

57 Brouard (2017) définit le « quantified-self » comme « l’auto-mesure de soi », concept apparu en Californie en 2007 qui « consiste à mesurer des données relatives à notre organisme et à nos activités physiques. Il se situe à la croisée

de la santé connectée et des services de bien-être, car il s’adresse aux patients, mais aussi aux individus en bonne santé » (p. 27). Cependant, la traduction du quantified-self par un « soi quantifié » semble plus appropriée car

elle élargit le phénomène à la connaissance de soi par les nombres (Ajana 2017), que ces nombres soient issue de mesures effectuées par l’individu lui-même ou par d’autres personnes.

L’essor de l’innovation numérique en santé s’inscrit alors dans la veine des discussions autour de la « science ouverte », une forme de nouvel impératif social, comme le défend la Recommandation révisée de l’UNESCO concernant la Science et les Chercheurs scientifiques (2018b). La Recommandation reconnait la science comme un bien commun, demande de faciliter les mécanismes pour une science ouverte et collaborative, de garantir un accès libre et équitable aux données et contenus scientifiques et d’assurer le partage du fruit de toutes recherches à tous (UNESCO 2018b). C’est bien dans une perspective de partage que s’inscrit également le phénomène du quantified self, qu’Ajana (2017) décrit comme une « biopolitique du soi » ou le partage de données personnelles permet d’informer la communauté médicale selon un phénomène qui incite les individus à partager, par exemple, leurs informations d’activités physiques ou leur données biologiques (Ajana 2017) donnant ainsi accès à un nouveau type de données de santé, de haute qualité et auparavant inaccessibles. La nécessité du partage et de la mutualisation des données se défend sur la base d’un principe de solidarité (Ajana 2017; Sharon 2017; Woods 2016), ou selon un certain impératif moral de « sacrifice » des patients qui prennent le risque de partager leur données afin d’assurer de potentialiser les bénéfices (collectifs) de l’innovation numérique en santé (Longo et Drazen 2016; Woods 2016).

Différentes initiatives nationales ou internationales de création de bases de données accessibles à tous voient le jour, visant la mutualisation en vue de l’avancée des connaissances en santé. Par exemple, le gouvernement canadien a mis en place en 2011 le Portail de données ouvertes du Canada58 – afin de fournir aux canadiens les données qui sont produites, recueillies et utilisées par différents ministères et organismes. Le but est d’offrir des ensembles de données ouvertes59 en vue de soutenir l’innovation, la recherche et les consommateurs. À partir de ces ensembles, différentes applications sont développées, notamment en santé pour les consommateurs comme pour les professionnels; telle que l’application de visualisation des données fondée sur la Base de

58 Voir : https://ouvert.canada.ca/fr/donnees-ouvertes

59 Le gouvernement canadien définit les données ouvertes comme « des données structurées, lisibles par machine, qui peuvent être librement partagées, utilisées et mises à profit par quiconque, sans restriction » (voir :

https://ouvert.canada.ca/fr/donnees-ouvertes). Elles se caractérisent par leur accès et leur disponibilité, doivent permettre la réutilisation (à des fins commerciales ou non) et favoriser la participation universelle (Verdier et Murciano 2017).

données Canada Vigilance qui permet de visualiser les effets indésirables de médicaments60. Dans la même lignée, en France, la plateforme ouverte des données française data.gouv.fr rend accessible, entres autres, les données relatives à l’offre et la consommation de soins, à l’efficacité du système de santé, à la santé publique ou aux médicaments61. Cette plateforme représente aujourd’hui une « communauté vivante de 17 500 contributeurs » offrant à la société civile la possibilité de partager et d’améliorer les données (Verdier et Murciano 2017).

Dans la même lignée, le Open Data Institute, une compagnie indépendante basée à Londres et fondée en 2012, a pour objectif de favoriser l’utilisation de données ouvertes dans le but d’offrir des bénéfices à l’échelle mondiale. L’institut travaille, avec différentes compagnies et gouvernements, à la construction d’un écosystème de données qui pourrait permettre aux individus de prendre de meilleures décisions tout en participant à la gestion d’impacts négatifs potentiels. Différentes initiatives de chaînes de blocs (ou Blockchain)62 offrent également de nombreuses opportunités pour le secteur de la santé, qu’il s’agisse de la gestion de la santé publique, de la recherche médicale basée sur les données personnelles des patients ou de la contrefaçon de médicaments (Mettler 2016).

Les avantages du partage ne sont pas uniquement relatifs aux données mais concernent également l’accès, en open source, au code des algorithmes. La création de l’Écosystème IBM Watson pour aider différents secteurs (incluant la santé) à tirer parti des compétences de Watson en est un exemple. Grâce à cet écosystème, IBM offre un accès ouvert à sa plateforme permettant de créer des applications personnalisées, notamment afin que leurs partenaires puissent développer une vaste gamme de produits, tout en rendant Watson accessible au plus grand nombre (Lee 2014). Ce partage démontre ainsi autant un intérêt scientifique qu’économique. Il est parfois même

60 Voir : https://ouvert.canada.ca/fr/apps/base-donnees-canada-vigilance-effets-indesirables-medicaments-canadiens 61 Voir : https://www.data.gouv.fr/fr/topics/sante-et-social/

62 Le Blockchain est une technologie de stockage et de gestion des données décentralisée et distribuée qui se présente

comme une séquence continue de « blocs » ou d’informations. Ces informations proviennent des utilisateurs (généralement via un pseudonyme), elles sont vérifiées et les différentes actions réalisées dans le temps sont transparentes. Ces technologies sont particulièrement intéressantes pour la création de bases de données publiquement accessibles à différentes parties qui ont besoin de la même information tout en respectant la protection de l’anonymat des utilisateurs et de la propriété des données (Mettler 2016).

considéré comme un mode de gouvernance à part entière : celui des (biens) communs numériques, définis comme l’ensemble des ressources et savoirs librement accessibles, à la fois partagés et cocréés selon un mode d’organisation coopératif qui assure l’horizontalité des échanges entre les pairs, lesquels décident eux-mêmes des formes de régulation de cette organisation (Le Crosnier 2018).

Ce partage, une des conditions essentielles à l’existence du paradigme du Big data, ouvre alors la porte à de nombreuses préoccupations éthiques relatives à la vie privée et au consentement des individus qui génèrent des données pouvant être infiniment réutilisées, de différentes manières et sans qu’il soit possible de prévoir avec précision pour quelles fins elles le sont (Christen et al. 2016; Jones, Kaufman, et Edenberg 2018; Mittelstadt et Floridi 2016b). L’ouverture des contenus numériques expose également au risque de re-enclosure63 privée (qui s’observe lors de croisement de données ouvertes et propriétaires) ou par l’État (Verdier and Murciano 2017; Le Crosnier 2011). Certains s’inquiètent également que la grande majorité des données demeurent la propriété de grosses firmes internationales (Sharon 2016), situation qui s’avère particulièrement préoccupante dans le cadre de données de santé où une asymétrie de pouvoir entre système publique et privé serait potentiellement dommageable.

Le potentiel économique ainsi que le pouvoir associé à la propriété des données massives font de ces dernières le « nouveau pétrole » de nos sociétés numériques (Malik 2013; WEF 2012). Selon cette conception, les données (dont les données de santé) deviennent des marchandises à croissance rapide qui confèrent aux géants du traitement des données (les GAFAM) un caractère imparable (The Economist 2017). Cette mutualisation pose aussi des problèmes de contrôle et de règlementation, notamment parce-que le partage dépasse les frontières et doit alors répondre à des législations différentes (Danaher 2015), conférant aux enjeux relatifs à l’ouverture des données une portée internationale. Ainsi, les enjeux de stockage et de gestion de ces bases de données gigantesques et publiquement accessibles dépassent les seuls défis de moyens techniques et financiers.

1.3. Opacité des réseaux de neurones : la « boite noire » de l’intelligence