• Aucun résultat trouvé

Les données de l’étude CESIR

Dans le document en fr (Page 42-45)

1.3 Défauts d’attention et traumatismes non intentionnels

3.1.2 Les données de l’étude CESIR

3.1.2.1 Source des données

Les données sont issues d’un appariement entre les données sur les accidents corporels recueillies par les forces de l’ordre - les Bulletins d’Analyse des Accidents Corporels de la Circulation (BAAC) et les Procès Verbaux (PV) - et les données de remboursement de soins de la Caisse Nationale d’Assurance Maladie des Travailleurs Salariés (CNAM-TS).

PV En France, chaque accident corporel doit faire l’objet d’un PV établi par les forces de l’ordre (environ 70 000 PVs/an). Ils permettent d’établir les circonstances de l’accident et de déduire les responsabilités réciproques pour l’indemnisation et/ou les éventuelles procédures judiciaires. Tous les PV disponibles des accidents corporels survenus entre le 1erjuillet 2005 et le 31 décembre 2011 ont été collectés. Sous forme

de fichiers images, ils contiennent notamment le Numéro d’Inscription au Répertoire des personnes physiques (NIR, plus connu sous le terme de numéro de sécurité sociale) des individus lorsque celui-ci a été relevé. Ce numéro est attribué à tout individu vivant en France lorsqu’il commence à travailler, au cours de la dernière année de lycée ou au plus tard à 20 ans et reste identique tout au long de sa vie. Le NIR de l’assuré couplé au sexe et la date de naissance du conducteur permettra ensuite l’appariement aux données de l’AM. Une étude de validation portant sur

141 PV impliquant des piétons a permis d’estimer que le NIR était présent pour 39% des piétons impliqués dans ces accidents.

BAAC Pour tout individu impliqué dans un accident corporel de la circulation ayant fait l’objet d’un PV doit également correspondre une fiche BAAC. C’est une fiche standardisée remplie par les forces de l’ordre. Elle regroupe des informations sur les caractéristiques des conducteurs (p. ex. sexe, catégorie socio-professionnelle), des véhicules (p. ex. type de véhicule, obstacle), de l’accident (p. ex. data, heure) ainsi que le numéro de PV associé.

SNIIR-AM Le Système National d’Information Inter-Régimes de l’Assurance Maladie (SNIIR-AM) a été mis en place en 2003 par la CNAM-TS [104]. C’est une base de données nationale et anonyme qui contient les remboursements de soins sur une période de trois ans plus l’année en cours des assurés de tous les régimes de l’Assu- rance Maladie [104]. Elle réunit à la fois des informations socio-démographiques sur les patients (p.ex. sexe, caisse d’allocation), médicales (p. ex. diagnostiques d’Af- fection de Longue Durée (ALD), diagnostics hospitaliers) mais également sur sa consommation de soins de ville (p. ex. date de délivrance, code CIP). Récemment, le SNIIR-AM conjointement avec les données des hôpitaux et autres établissements de santé (Programme de Médicalisation des Systèmes d’Information - PMSI) et les données statistiques relatives aux causes de décès (BCMD) ont été fusionnées au sein du Système national des données de santé (SNDS) qui rassemble ainsi des informations de santé pseudonymisées collectées par des organismes publics.

3.1.2.2 Procédure d’appariement

La Figure 3.1 détaille le déroulement de la procédure d’appariement, développée dans le cadre du doctorat de Ludivine Orriols, et qui a été décrite en détail [105]. Cette procédure comporte 10 étapes qui sont présentées succinctement ci-dessous :

Étape 1 : Transmission des fichiers BAAC et PV

Chaque année, l’organisme Trans PV1 et l’Observatoire National Interminis-

tériel de Sécurité Routière (ONISR) transmettent respectivement les PV et les fiches BAAC à l’Institut français des sciences et technologies des transports, de l’aménagement et des réseaux (IFSTTAR).

Étape 2 : Lecture automatique des PV

Les NIR, sexe et date de naissance des conducteurs impliqués sont extraits des PV. Ces derniers étant à l’origine sous forme de fichiers images, un logiciel de lecture automatique des PV a été développé spécialement dans le cadre du projet CESIR. Cette procédure a été validée sur un échantillon de 293 PV qui ont été imprimés et codés manuellement lors de la première vague du projet CESIR [105].

1. La section Trans PV de l’Association pour la Gestion des Informations sur le Risque en Assurance (AGIRA), créée par la Fédération Française de l’Assurance, adresse aux sociétés d’assurance concernées une copie des procès-verbaux d’accidents de la circulation reçus des services de police et de gendarmerie. Sa mission est de faciliter et d’accélérer l’indemnisation des victimes d’accidents de la circulation par les sociétés d’assurance automobile.

Étape 3 : Appariement BAAC/PV

Pour chaque individu dont le NIR avait pu être extrait des PV, une procédure d’appariement PV avec les fiches BAAC a été réalisée. En l’absence d’identi- fiant fiable commun entre les fichiers BAAC et PV, l’appariement à été réalisé par le biais d’une méthode de chaînage probabiliste [106]. Dans le cadre de CESIR, six variables communes ont été utilisées : le numéro de PV, la date de l’accident, le lieu de l’accident (code postal), les forces de l’ordre qui ont enregistré l’accident ainsi que la date de naissance et le sexe de l’individu ac- cidenté. Cette méthode consiste à considérer toutes les paires possibles avec une pondération selon leur valeur discriminante. Pour chacune des paires, un poids composé correspondant à la somme des poids de chacune des 6 variables est attribué. Le détail quant à l’attribution des poids et du seuil utilisé pour la décision de chaîner ou non tout en minimisant les erreurs (paires appariées alors que discordantes et inversement) est expliqué dans le mémoire de thèse de Ludivine Orriols [105].

Étape 4 : Anonymisation des identifiants

Afin de sécuriser les informations lors des échanges entre les différents parte- naires, l’ensemble « NIR-date de naissance-sexe » est anonymisé en utilisant la Fonction d’Occultation des Identifiants Nominatifs (FOIN) développée par la CNAM-TS.

Étape 5 : Transmission des identifiants anonymisés et des données BAAC de l’IFST- TAR à l’INSERM

Les identifiants anonymisés ainsi que certaines variables caractérisant l’acci- dent issues des BAAC sont cryptés et envoyés à l’INSERM.

Étape 6 : Création d’un numéro propre à l’étude

Un numéro d’anonymat propre à l’étude est attribué à chacun des sujets. Étape 7-8 : Données de délivrance de médicaments

Les identifiants anonymisés, le numéro dans l’étude et la date de l’accident sont transmis à la CNAM-TS après cryptage des données.

En retour, celle-ci envoie à l’INSERM des données sur la délivrance de médi- caments ainsi que le numéro propre à l’étude de chaque sujet.

Étape 10 : Appariement des données et analyses statistiques

À la fin des étapes précédentes, on obtient une table de correspondance BAAC- PV, la table des BAAC, la table des PV, la table contenant les consommations de soins et celles des affections longues durées. La dernière étape consiste donc à mettre en commun ces tables et à effectuer les analyses. Dans le cadre de ce travail de thèse, j’ai réalisé la mise en commun et le nettoyage de ces tables pour les données de la seconde vague, avec l’appui du statisticien de l’équipe.

Figure 3.1 – Les étapes de la procédure d’appariement

Dans le document en fr (Page 42-45)