• Aucun résultat trouvé

Par abus de langage, on parlera de signaux pour désigner les variables qui sont sélec-tionnées avec les méthodes de détection présentées ci-dessus. Il est sous entendu que les signaux sont les couples formées par ces variables et l’évènement indésirable considéré.

2.5.1 Critères de détection

Nous avons implémenté la méthode CISL pour la détection de signaux en considérant les quantiles à 5% et 10% de la distribution de la quantité (2.4). Les approches de détection qui découlent de ces différentes valeurs de quantiles sont dans la suite désignées par CISL-5% et CISL-10%.

Le seuil de détection pour le FDR est fixé à 5% pour les méthodes basées sur le PS en grande dimension. Les termes adjustPS-hdPS, mwPS-hdPS, iptwPS-hdPS, adjustPS-BIC, mwPS-BIC, iptwPS-BIC, adjustPS-CISL, mwPS-CISL, iptwPS- CISL et adjustPS-GTB, mwPS-GTB, iptwPS-GTB font référence aux approches mises en œuvre selon la manière dont le PS a été estimé (lasso-bic, CISL, GTB ou hdPS) et selon la manière dont le score a été pris en compte dans l’analyse (ajustement, pondération MW, ou IPTW). Afin d’implémenter ces approches pour toutes les expositions renseignées, nous avons parallélisé nos calculs.

En plus des méthodes présentées ci-dessus, nous avons inclus dans la comparaison une approche dite univariée, qui peut être assimilée à une méthode de disproportionnalité, le ROR, afin de servir de niveau de référence. Cette approche repose sur la mise en œuvre de régressions logistiques univariées où Y est régressé sur Xj pour j ∈ {1, .., P } :

logit(P (yi = 1|xij)) = β0+ βjxij. (2.6)

La règle de décision pour générer un signal avec cette méthode est la même que celle utilisée pour les méthodes de détection basées sur le PS. Dans la suite, le terme Univ servira à désigner cette méthode.

2.5.2 Évaluation des performances

Pour évaluer les performances de toutes les approches de détection considérées, nous avons comparé la capacité de chaque méthode à détecter les vrais signaux et à ne pas détecter les faux signaux à partir d’un ensemble de signaux de référence présenté en section 2.5.4. Ces performances sont mesurées en termes de sensibilité et de spécificité, de valeur prédictive positive (Positive Predictive Value, PPV) et de proportion de faux positifs (False Discovery Proportion, FDP). Ces critères sont présentés dans le tableau 2.2. Ils sont évalués uniquement à partir des signaux dont le statut réel est connu, ce qui n’est pas le cas de tous les signaux générés.

Statut réel

Témoin positif Témoin négatif

Statut prédit

Prédit

positif Vrai positif Faux positif

FDP = |Faux positif|

|Prédit positif|

PPV = |Vrai positif|

|Prédit positif|

Prédit

négatif Faux négatif Vrai négatif

Sensibilité = |Témoin positif||Vrai positif| Spécificité = |Témoin négatif||Vrai négatif|

Tableau 2.2 – Critères d’évaluation des performances des méthodes de détection.

Nous avons également évalué pour chaque approche sa capacité à fournir un classement pertinent des signaux générés afin de pouvoir comparer si, à effectifs de signaux générés égaux, une approche détecte plus de vrais positifs et moins de faux positifs par rapport à une autre. Ainsi, les signaux générés sont ordonnés selon un critère propre à chaque approche, puis on représente le nombre de vrais positifs et de faux positifs détectés en fonction du nombre de signaux générés. Avec cette représentation graphique, une méthode montre de bonnes performances si la courbe obtenue

• est proche de l’identité pour la détection de vrais positifs,

• est proche de l’axe des abscisses pour la détection de faux positifs.

Pour lasso-bic, les signaux sont rangés selon leur p-valeur dans le modèle de régression logistique classique qui minimise le BIC. Pour CISL-5% et CISL-10%, les signaux sont

ordonnés selon leur valeur de quantile 5% et 10% de la quantité (2.4). Pour toutes les approches basées sur le PS en grande dimension, ainsi que pour l’approche univariée, les signaux sont ordonnés selon les valeurs du FDR estimé.

2.5.3 Base française des notifications spontanées

Nous avons implémenté les différentes méthodes de détection de signaux présentées sur les données issues de la BNPV. La classification Anatomique, Thérapeutique et Chi-mique (ATC) sert à coder l’ensemble des médicaments. Elle repose sur cinq niveaux dif-férents de classement hiérarchisés. Dans la BNPV, le niveau de classification le plus fin est utilisé : un code est alors composé de sept caractères qui permettent de préciser le système d’organe cible, les propriétés thérapeutiques, pharmacologiques et chimiques du produit. Les évènements indésirables sont codés selon la terminologie du dictionnaire mé-dical des affaires réglementaires (Memé-dical Dictionary for Regulatory Activities, MedDRA) qui comprend cinq niveaux de précision. Dans la BNPV le niveau de termes préférentiels (Preferred Term, PT) est utilisé, ce qui correspond au quatrième niveau de précision. Ce code à huit chiffres se rapporte à un symptôme, une maladie, un diagnostic, une indi-cation thérapeutique, une intervention chirurgicale ou médicale, ou une caractéristique d’antécédent médical, social ou familial. Pour cette étude, nous avons exclu (i) la phyto-thérapie, l’homéophyto-thérapie, les compléments alimentaires, l’oligothérapie et les inhibiteurs enzymatiques ; (ii) les surdosages ou les erreurs de médication.

Nous avons travaillé sur une extraction de la BNPV sur la période allant du 1er janvier 2000 au 31 décembre 2016, ce qui représente 382 484 notifications avec 5 906 EI différents et 2 344 médicaments différents selon leurs classifications respectives. La majorité (60,93%) des notifications ne mentionnait qu’un seul médicament, et 56,24% ne mentionnaient qu’un seul EI. La valeur médiane du nombre de notifications pour les médicaments était de 33 (Q1 = 5 et Q3 = 179). La valeur médiane du nombre de notifications pour les EI était de 4 (Q1 = 1 et Q3 = 20).

2.5.4 Ensemble de signaux de référence

Afin d’établir les performances des méthodes de détection considérées, nous avons utilisé l’ensemble de signaux de référence constitué par Chen et al. (2011) et qui concerne l’évènement DILI : DILIrank. Cet ensemble a été construit en analysant les résumés des caractéristiques du produit (RCP) des médicaments qui ont été approuvés par la FDA. Ces RCP contiennent des informations relatives aux indications, posologies et effets indésirables connus ou suspectés des médicaments. Ces informations sont structurées dans différentes sections. La figure A.1 en annexe est un exemple de RCP de la FDA non remplie.

Une liste de mot-clés liés à l’évènement DILI a été déterminée. Si aucun mot-clé n’apparaissait dans le RCP d’un médicament, alors le médicament était considéré comme non associé à une DILI. En revanche, si un mot-clé était identifié alors le médicament était classé comme moyennement ou fortement associé à une DILI, en fonction de la section de de RCP dans laquelle le mot-clé apparaissait. Chaque mot-clé s’est vu également attribuer un niveau de sévérité lié à une DILI via un score allant de zero à huit : si un mot-clé avait un score de huit alors il était associé à une DILI grave. En 2016, cette classification a été raffinée en incluant des informations provenant d’autres sources de données afin d’évaluer la relation de cause à effet entre chaque médicament considéré et un événement DILI. Seuls les médicaments confirmés comme associés de manière causale à une DILI ont été retenus (Chen et al., 2016). De manière générale, il y avait corrélation entre force d’association avec une DILI et gravité de l’évènement. Autrement dit, si un médicament était fortement lié à une DILI, alors il s’agissait très souvent d’une forme sévère de DILI. La table A.1 en annexe fournit la liste des médicaments étudiés. Pour chaque médicament, il est précisé son code ATC, la section du RCP dans laquelle un mot-clé apparaissait, la sévérité attribuée à ce mot-clé et le niveau d’association de ce médicament avec une DILI. Cette table est issue des travaux de Chen et al. (2011) et Chen et al. (2016). Dans la construction de l’ensemble de référence, nous avons considéré comme témoins négatifs les médicaments « non liés à une DILI », et comme témoins positifs les médicaments « fortement liés à une DILI ».

En collaboration avec Antoine Pariente et Franscesco Salvo de l’unité Inserm 1219 (Bordeaux Population Health, équipe Médicament et santé des populations, Bordeaux,

France), nous avons converti les mots-clés utilisés pour définir l’évènement DILI en codes PT de la classification MedDRA. Le tableau A.2 en annexe présente ces différents codes, leur signification ainsi que les concepts plus généraux auxquels ils sont rattachés, appelés requêtes standardisées dans le dictionnaire MedDRA. Au total, 91 codes PT ont été considérés comme traduisant un évènement DILI. Parmi ces codes, 54 étaient présents dans la BNPV. Chaque notification spontanée impliquant au moins un de ces 54 codes a été considérée comme une DILI déclarée, ce qui s’est traduit par 22 440 notifications de cas de DILI dans la BNPV.

Pour éviter les problèmes numériques dus à la très faible notification de certains mé-dicaments, nous avons limité la comparaison aux médicaments qui ont plus de trois no-tifications en commun avec une DILI, et qui ont plus de dix nono-tifications au total. Cette restriction appliquée, nous avons considéré 922 médicaments différents sur les 2344 médi-caments présents à l’origine dans la BNPV. Sur ces 922 médimédi-caments, notre ensemble de référence comprenait 90 témoins négatifs et 114 témoins positifs.