• Aucun résultat trouvé

2. État des connaissances

2.3 L’utilisation des banques de données administratives en épidémiologie

2.3.4 Précisions sur les fichiers de la RAMQ

Les données administratives sont utilisées depuis plus de 25 ans, les chercheurs en ayant tiré un constat plutôt positif pour effectuer des études épidémiologiques et pharmacoépidémiologiques (Strom et al., 2012). Il demeure que la validité des données administratives a été soulevée maintes fois (Tamblyn et al., 1995; Sorensen et al., 1996). Il existe de nombreuses banques de données entièrement administratives (p. ex. RAMQ, Health Service Database en Saskatchewan, Medicaid (É.-U.), etc.), des banques administratives pouvant être qualifiées de mixtes qui contiennent certaines variables cliniques (e.g. HMO Research Network (É.-U.)), et enfin des banques de dossiers médicaux (e.g. UK general practice research database, The Health Improvement Network (É.-U.)).

De nombreux pays occidentaux font donc usage de banques de données administratives pour des fins de réclamation et de suivi des services cliniques depuis les années 1950. Leur utilisation pour des fins de recherche ne s’est faite qu’autour des années 1980. Cependant, la tendance en Europe dans la même décennie a plutôt été de créer des banques de données pour des fins de recherche. Depuis quelques années, les banques médicoadministratives de l’Amérique du Nord s’adaptent progressivement à cette réalité du chercheur, soit de rendre disponibles les données médicoadministratives qui peuvent y être exploitées et de permettre de les lier à des données de banques de dossiers médicaux afin d’accroitre le nombre et la qualité des études épidémiologiques et ainsi faciliter le processus de veille sanitaire (Strom et al., 2012). La banque administrative de la RAMQ n’est donc pas un exemple unique de banque médicoadministrative en Amérique du Nord. Historiquement, elle a été constituée en novembre 1970 sous une perspective visionnaire de couverture universelle pour des fins purement administratives. Cependant, dans la littérature médicale, certaines études portant sur des données de la RAMQ apparaissent dans PubMed au début des années 1980, suivi d’une nette progression d’études publiées depuis 1995.

Les banques de données médicoadministratives sont avantageuses à plusieurs égards. Elles permettent d’étudier des maladies rares, des maladies orphelines et d’étudier l’exposition à plusieurs molécules pharmacologiques particulièrement en raison de leur grande taille d’échantillon (Sorensen et al., 1996; Vinet et al., 2011). Au Québec, entre autres, la banque RAMQ a une excellente représentativité de la population (c.-à-d. bonne validité externe) puisqu’elle regroupe les données médicales d’individus ayant accès à une couverture universelle. Les banques de données médicoadministratives sont également particulièrement intéressantes pour des études longitudinales et permettent de s’affranchir des biais de rappel (Bernatsky et al., 2007; Asghari et al., 2009; Strom et al., 2012). Afin d’étudier certaines maladies, ou pour déterminer la fréquence d’une condition médicale, des algorithmes basés sur des codes de diagnostics CIM-9 ou CIM-10 à partir de fichiers d’actes médicaux, croisés aux fichiers des données pharmaceutiques sont de plus en plus répandus. Cela permet avant tout de faire des gains en terme de temps par l’analyse

secondaire de données déjà disponibles et d’économiser des sommes importantes qui devraient sinon être déboursées à produire de nouvelles données primaires en procédant à des études cliniques classiques utilisant des devis prospectifs (Sorensen et al., 1996).

Avec la demande accrue pour des données administratives en vue d’études épidémiologiques, la proportion d’études portant sur la validité des données de ces banques médicoadministratives augmente progressivement depuis quelques années. Malgré la très bonne validité globale de nos banques médicoadministratives au Canada (voir Figure 7), il faut demeurer critique en fonction des limites qui existent pour les mesures utilisées (données pharmaceutiques ou diagnostiques) et des conditions de santé étudiées. Deux publications se sont principalement penchées sur cette question de validité, soit celle de Wilchesky et collaborateurs sur la validation des diagnostics (Wilchesky et al., 2004) et celle de Tamblyn et collaborateurs sur la validation des données pharmaceutiques (Tamblyn et al., 1995). En terme de validation des diagnostics, la banque de données étalon (« gold standard ») était celle rassemblant les dossiers d’une étude clinique portant sur 15 000 patients de 66 ans et plus de la province du Québec. Un ensemble de 14 maladies, pour lesquelles il y avait des contrindications d’utilisation de médicaments, a été étudié. Parmi toutes les réclamations de services médicaux, 72 % présentaient des codes diagnostics CIM-9 valides, 23 % une absence de codes et 5 % des codes invalides. Parmi les maladies étudiées, la spécificité des codes CIM-9 était de plus de 90 %, voire même de plus de 98 % pour la plupart des maladies, sauf pour l’hypertension (88 %). La sensibilité des données était cependant inférieure à la spécificité, comme attendu, avec des valeurs sous les 61 %. Cependant, en liant les données diagnostiques de l’étude clinique aux données diagnostiques extraites du fichier de rémunération à l’acte de la RAMQ pour un même patient, la sensibilité augmentait de plusieurs points de pourcentage, jusqu’à 72 % dans le cas du glaucome. La spécificité de ces analyses de données diagnostiques agrégées se maintenait au-delà de 90 %. Cette étude indiquait donc que la spécificité était excellente dans la banque administrative de la RAMQ (c.-à-d. capacité à détecter ceux qui n’ont pas la maladie), mais que la sensibilité était inférieure (c.-à-d. capacité à détecter ceux qui ont la maladie), constituant une faille de validité interne. Le fait que 28 % des diagnostics étaient manquants ou invalides pouvait également contribuer à affecter la sensibilité en augmentant la proportion de faux négatifs. Il faut aussi garder à l’esprit que la mesure étalon était

potentiellement imparfaite (c.-à-d. les dossiers cliniques des patients), ce qui fait que ces mesures de validité devraient être considérées des estimés conservateurs. Le besoin de travailler avec des données plus sensibles est important pour contrôler l’effet de facteurs confondants et pour permettre la comparaison des performances entre les dispensateurs de soins de différents établissements. Pour améliorer la sensibilité, il pourrait être intéressant d’accroitre la fenêtre de temps d’observation pour capturer plus de diagnostics pour un même patient. Il serait aussi envisageable de croiser les données diagnostiques avec d’autres sources, telles que les codes d’actes ou les données pharmaceutiques. Par exemple, une équipe de recherche s’est penchée sur la sensibilité des codes diagnostics de la RAMQ liés aux blessures de chute dans la population des plus de 65 ans se présentant à l’urgence. La sensibilité des codes diagnostics CIM-9 a été évaluée à 54 % en utilisant une fenêtre de temps élargie, et de 81 % si le CIM-9 était croisé à un code d’acte spécifique aux fractures (Tamblyn et al., 2000). Néanmoins, il est important de garder à l’esprit que ces deux précédentes études de validité portaient sur l’analyse de dossiers-patients de plus de 65ans, et que la validité des données pourrait être inférieure en prenant en compte la population de tous âges. Une étude a cependant rapporté que les diagnostics d’asthme dans le fichier des services de la RAMQ étaient très sensibles et spécifiques chez les 16 à 45 ans (85 % et 95 % respectivement) (Blais et al., 2006).

L’étude de Tamblyn et collaborateurs se basait pour sa part sur le fichier pharmaceutique de la RAMQ et l’analyse des données de prescriptions de 1 917 214 entrées de dossiers-patient âgés de 65 ans et plus. Les dossiers étalons consistaient en des dossiers de patients consentants de l’hôpital Royal Victoria de Montréal. Sur l’ensemble des dossiers, seulement 0,4 % présentaient une erreur d’attribution du code d’identification ou l’absence d’information de paiement pour la prescription. En termes de données manquantes ou aberrantes (prescriptions hors des normes), peu d’erreurs ont été relevées. Les plus fréquentes étaient l’absence de précision pour un ordre verbal ou écrit (0,7 %), s’il s’agissait d’une nouvelle prescription ou d’un renouvèlement (0,7 %), ou l’inscription d’un codes de moins de cinq chiffres (trois entiers et deux décimales) pour indiquer un dosage (0,4 %). Un échantillon composé des dossiers initiaux de prescription de 311 patients vus en clinique a ensuite été croisé avec les données de ces mêmes patients, puis envoyé à la RAMQ pour évaluer la validité des informations. L’étude révélait que le degré de précision

était supérieur à 83 % pour rapporter l’information du patient, des médicaments et du médecin traitant. La validité des informations de quantité et de durée avoisinait les 70 %. Les auteurs qualifient de raisonnablement précis le fichier pharmaceutique de la RAMQ, le classant équivalent ou meilleur que d’autres sources de données. Cependant, il s’agissait encore d’une étude sur la population des 65 ans et plus, dont la représentativité était d’environ 90 % dans le fichier des services pharmaceutiques de la RAMQ (voir Tableau 4). Une autre étude portant sur le profil de consommation de médicaments chez les femmes de moins de 65 ans avançait la conclusion que la validité interne dans cette tranche d’âge était acceptable, mais que c’était plutôt la validité externe, la généralisabilité à l’ensemble de la population, qui risquait d’être grandement affectée à partir d’analyses portants sur les fichiers pharmaceutiques de la RAMQ (Bérard & Lacasse, 2009).