Favoriser la mise à disposition de données : cartographie des indicateurs de santé

En partenariat avec la DSSIS et en lien avec les organismes concernés, la mission accompagne le BAEER dans ses travaux sur la gouvernance des indicateurs de santé et l’outil de cartographie associé. En effet, le constat a été dressé qu’une trentaine de producteurs alimentent des portails d’indicateurs de façon indépendante et non concertée, suggérant la nécessité d’une harmonisation, d’une mise en cohérence et d’une gouvernance. Le projet de gouver-nance des indicateurs a donc été présenté au Conseil national de pilotage des ARS (CNP) le 22 juin 2017. Le CNP a validé les deux orientations proposées par le projet de gouvernance des indicateurs :

Développer un portail web recensant et facilitant l’accès aux milliers d’indicateurs de santé existants et diffusés aujourd’hui par une trentaine de producteurs distincts.

Installer une instance de gouvernance unique des indicateurs.

Un recensement des indicateurs disponibles a été mené par le BAEER, en lien étroit avec les producteurs de bases d’indicateurs, fournissant une description précise de chaque base d’indicateurs, renseignant le classement d’un indicateur selon le schéma retenu par le producteur, les sources mobilisées, la granularité géographique retenue, le rythme d’actualisation... La mise à disposition de ce catalogue sur internet implique le développement d’un outil ergonomique et adapté et la définition d’une nomenclature commune et agréable d’utilisation. Une première no-menclature a été proposée par le BAEER. La mise en place du portail web nécessite d’affecter pour chacun des indica-teurs recensés un ou plusieurs thèmes de cette nomenclature. Pour cette étape, nous avons fait appel à la start-up Invenis pour tester des approches de codage automatique (machine learning) ; cette même société nous proposera un premier portail fonctionnel à la fin du 1er trimestreT1 2018. Ce POC (preuve de concept) pourra donc servir de support aux échanges dans le cadre de la mise en place de la gouvernance, voire au déploiement d’un outil pérenne et capable d’être actualisé sur une base régulière.

Promouvoir la réutilisation des données sociales et de santé, mobiliser la datascience : mise en place du Lab Santé

Le Programme « Entrepreneur d’intérêt général », lancé en 2016 par la présidence de la République et piloté par la mission Etalab, a pour objectif de développer l’innovation ouverte dans l’État et d’améliorer la connaissance par l’administration de nouvelles ressources afin d’accélérer sa capacité d’expérimentation et de modernisation. Concrè-tement, une promotion de talents extérieurs à l’administration, recrutés pour 10 mois et financés par le programme d’investissement d’avenir, participeront à résoudre, par leurs compétences numériques et en mobilisant des données, des défis d’intérêt général au sein des ministères. Ayant candidaté l’été dernier, la DREES a été retenue pour sa proposition de créer un « datalab santé social ». Elle a ainsi recruté trois Entrepreneurs d’Intérêt Général (EIG) qui participeront donc, en mobilisant leurs compétences en datascience, à la valorisation des données sociales et de santé et, en particulier, du système national des données de santé (SNDS).

S’il s’agit d’une source très riche pour améliorer la connaissance de l’ensemble des aspects du système de santé (financement des soins, offre de soins, parcours de soins et recours aux soins de la population), la masse d’informations brutes qui la constitue rend sa mobilisation complexe dans le temps de la décision politique. Les compétences en datascience des Entrepreneurs d’Intérêt Général pourront donc être utilement mobilisées à divers

titres : pour une manipulation optimisée des données (optimisation des requêtes, diffusion d’outils et de logiciels plus pertinents), pour promouvoir les outils et pratiques du travail collaboratif et ainsi améliorer la structuration et la transmission du savoir (présentation d’outils de versioning et de partage de code, de documentation ergonomique et collaborative), mais également pour illustrer l’intérêt de méthodes d’analyse statistique avancées : modélisation prédictive, datavisualisation afin d’ouvrir le champ des possibles en matière d’exploitation de ces données…

La mise en place de ce datalab, concrétisé à la mi-janvier 2018 par l’arrivée des EIG, se fait en collaboration avec divers bureaux, ainsi qu’avec le DMSI et le BRHAG. La mission d’administration des données de santé s’occupe en particulier de veiller à ce que les EIG puissent accéder aux données de santé dès leur arrivée, et établit, avec l’aide des bureaux de la sous-direction, une feuille de route précisant les premiers projets abordés par les EIG à leur arrivée et l’organisation de leur travail. Au-delà des dix mois que dureront ce programme, la question de la pérennisation de cette cellule et de la transmission des travaux qui y seront développés se posera. À ce stade, les sujets identifiés sont les suivants : développement d’outil de prévision de la santé financière des établissements de santé (avec le BES et la DGOS), développement d’un outil de flux de patients en cas de modification de l’offre de soin (avec le BAEER, la sous-direction « synthèses » et l’Insee) et extraction d’information des avis de transparence de la HAS dans le but d’enrichir des études sur le médicament (avec le BAMEDS).

Au-delà du datalab, la mission (appuyée des EIG tant qu’ils seront présents) pourra venir en soutien à tous les chargés d’étude qui souhaiteraient développer des projets de cet ordre, mobilisant des sources de données originales ou des techniques ou technologies d’analyse statistique innovantes. Ainsi, elle appuie le BESP sur son projet d’étude sur des données de caisse. Il s’agit de juger de l’opportunité d’utiliser des données de caisse (RelevanC) pour évaluer des dispositifs mis en place par le ministère, que ce soit le dispositif NutriScore conçu par Santé publique France à la demande de la direction générale de la santé sur les comportements de consommation ou bien plus tard la taxe

« soda ». La mission vient également en soutien du BPS pour le développement et le déploiement de son application web de restitution des simulations démographiques des professionnels de santé.

Promouvoir une culture commune autour de la donnée et de l’innovation : séminaire big data de la DREES, offre de formation, système d’information, comité intelligence artificielle en santé

Le « big data » fait, depuis quelques années déjà, l’objet de beaucoup d’attention dans un contexte de profusion de données (dont une part croissante est ouverte), de collecte et de traitement facilités par les progrès technologiques et de démocratisation des outils. On utilise classiquement les « 3 V » (volume, variété, vitesse) pour qualifier les big data.

Si ces données sont caractérisées en premier lieu par leur volume, elles peuvent être également de nature très variée : numériques, textuelles, photographiques, sonores, vidéos… Enfin, elles peuvent être produites en continu et ainsi générer des flux importants. Du fait de l’amélioration des infrastructures matérielles et logicielles, notamment s’agissant de la collecte, du stockage et de l’optimisation des calculs, tous ces formats sont devenus exploitables dans des délais raisonnables. Ces nouvelles données peuvent offrir de nouvelles opportunités pour les instituts nationaux de statistiques. Au niveau international (Eurostat et ONU), plusieurs réflexions ont d’ailleurs été lancées. Les avantages pressentis de ces sources seraient de réduire les délais de publication de certains indicateurs, d’en augmenter la précision et le degré de finesse de la description qu’ils permettent, et enfin d’enrichir la production statistique, tout en réduisant la charge d’enquête. Au-delà de l’utilisation de données originales, le terme « big data » est aussi souvent associé à des méthodes spécifiques de traitement et d’analyse des données. Ces techniques ne sont ni nouvelles ni réservées aux données massives, mais elles ont gagné en popularité par leurs applications par des géants du web (Amazon, Google…) et par l’essor de la culture de l’open source avec le développement de langages, d’outils et applications accessibles librement. Il peut s’agir de techniques adaptées au format non standard de certaines données (analyse textuelle ou d’images, outils d’analyses des réseaux), mais souvent de méthodes d’analyse prédictive issues du machine learning (apprentissage automatique).

Les domaines de la santé et du social n’échappent pas à ce phénomène, les données de gestion des hôpitaux et de l’assurance maladie, exploitées déjà depuis longtemps à des fins d’exploitation statistique, vont l’être de plus en plus et à des fins de plus en plus variées. S’ajoutent potentiellement à ces données, les données d’entrepôts hospitaliers, de la biologie, de logiciels de médecins, de prestations sociales…Ces enjeux sont depuis début 2016, parfaitement identifiés par la DREES, qui a fait la promotion de ces nouveaux outils et usages à la fois en interne et au niveau du

ministère. En interne, le séminaire Big Data se tient environ une fois par mois et permet à un intervenant extérieur de présenter des innovations en matière de santé et bientôt du social mobilisant la science des données. Au-delà de la vulgarisation et de la dissémination autour de l’innovation en santé/social et de la datascience, la mise en pratique de ces nouveaux outils en interne a été rendue possible grâce à des vagues de formations (logiciels et techniques statis-tiques : R, shiny, datascience) et la mise en place d’un système d’information dédié. Au niveau ministériel, la DREES avait notamment organisé, en partenariat avec la DSSIS, le colloque « Big Data en santé » qui s’est tenu en juillet 2016. Ces différentes initiatives seront poursuivies et développées, notamment par l’administrateur, en 2018.

MÉDECIN CHEFFE DE PROJET EN SANTÉ PUBLIQUE

Le médecin cheffe de projet en santé publique (MSP), placé auprès de la sous-directrice de l’observation de la santé et de l’assurance maladie a pour mission générale d’apporter un appui à la sous-direction dans les différents champs de la santé publique. Elle peut travailler sur des projets ou études conduits par les bureaux composant la sous-direction, piloter des projets en coordination avec les bureaux ou sur des sujets spécifiques. Elle représente la sous-direction dans certaines instances. Elle participe à la réponse aux demandes ou projets non programmés.

Dans le document Programme d’études et d’enquêtes 2018 de la DREES - Août 2018 - APHP DAJDP (Page 57-60)