• Aucun résultat trouvé

4.3 Exploitation conjointe des données de l’Échantillon Généraliste des Béné-

4.3.2 Constitution de la base hybride

Comme nous cherchons à extraire de l’EGB uniquement les données de consommations de médicaments, nous avons pu travailler sur la période 2006-2016. Dans un premier temps, nous avons réalisé une extraction de la BNPV sur cette période selon les mêmes filtres que ceux présentés en section 2.5.3. Nous avons considéré les notifications pour lesquelles l’âge et le sexe étaient renseignées. Nous avons ensuite déterminé les cas de DILI présents dans la base de données selon les critères présentés en section 2.5.4. Au total, cette extraction de la BNPV comprenait 14 509 cas de DILI sur 252 118 notifications.

Dans un second temps, nous avons apparié les cas de la BNPV à des témoins de l’EGB sur le sexe et par classe d’âge de 10 ans. Les cas et les témoins étaient appariés au moment de la survenue de l’EI des cas. Sont considérés comme témoins les individus qui n’ont pas été hospitalisés pour un quelconque problème hépatique l’année de leur appariement et les années antérieures. Ainsi nous avons retiré tous les individus qui ont été hospitalisés avec un diagnostic principal, relié ou associé4 dont le code CIM-10 commençait par K75. Nous avons cherché à apparier jusqu’à 100 témoins par cas, tout en interdisant le fait qu’un témoin soit apparié avec plusieurs cas. Au final, nous obtenons 525 506 témoins uniques de l’EGB appariés aux cas de DILI.

Les consommations médicamenteuses des témoins ont été regardées dans le mois pré-cédent la date de survenue de l’EI du cas auquel ils sont appariés. Les témoins étaient considérés comme exposés à un médicament s’ils avaient au moins une délivrance de ce médicament dans le mois. En se restreignant aux expositions médicamenteuses communes aux cas de la BNPV et aux témoins de l’EGB et qui sont présents plus de 10 fois dans la base hybride, nous avons considéré 1 023 variables médicaments. Sur ces 1 023 médica-ments, 101 étaient des témoins positifs et 96 étaient des témoins négatifs selon DILIrank. Au total, 714 médicaments étaient notifiés au moins trois fois avec un cas de DILI, dont 88 étaient des témoins positifs et 68 étaient des témoins négatifs.

4. Le diagnostic associé concerne l’ensemble des « morbidités (maladies, symptômes et autres motifs de recours aux soins) associées au diagnostic principal et ayant donné lieu à une prise en charge

effec-tive diagnostic ou thérapeutique au cours du séjour dans l’unité médicale ». Site du Département de

l’Information Médicale

4.3.3 Résultats

Dans un premier temps, nous comparons les détections obtenues sur la base hybride et sur l’extraction de la BNPV considérée. Le tableau 4.5 présente le nombre de signaux générés, le nombre de vrais et faux positifs détectés et les performances en termes de FDP, PPV, sensibilité et spécificité des méthodes RFET et lasso-bic, mises en œuvre sur les deux bases de données. Sur la base hybride, la procédure RFET a généré 336 signaux dont 97 avaient un statut connu selon DILIrank. 74 de ces signaux étaient des vrais positifs, menant à une sensibilité de la méthode à 73%, et 23 de ces signaux étaient des faux positifs ce qui a conduit à une FDP de 23%. La méthode lasso-bic a généré 217 signaux dont 74 avaient un statut connu dans DILIrank : 64 étaient des vrais positifs et 10 des faux négatifs, conduisant respectivement à une sensibilité de 63% et une FDP de 13%.

RFET et lasso-bic ont généré significativement moins de signaux lorsqu’elles ont été implémentées sur la BNPV avec respectivement 145 et 99 signaux. Parmi les 54 signaux à statut connu générés par RFET, 50 étaient des vrais positifs et 4 des faux positifs. Ainsi cette approche a montré une sensibilité de 49% et une FDP de 7%. Lasso-bic n’a détecté aucun faux positif sur cette extraction de la BNPV. Elle a détecté 45 vrais positifs, et a ainsi montré une sensibilité à 44%.

Approches Nombre de Nombre de Vrais positifs Faux positifs

signaux signaux à

statut connu n PPV Sensibilité n FDP Spécificité

(%) (%) (%) (%) Base Hybride RFET 336 97 74 76,29 73,27 23 23,71 76,04 lasso-bic 217 74 64 86,49 63,37 10 13,51 89,58 BNPV RFET 145 54 50 92,59 49,50 4 7,41 95,83 lasso-bic 99 45 45 100,00 44,55 0 0,00 100,00

Tableau 4.5 – Résultats de la détection de signaux avec les méthodes RFET et lasso-bic, dans la base hybride et dans la Base Nationale de Pharmacovigilance (BNPV).

PPV : Valeur Prédictive Positive

FDP : Proportion de Fausses Découvertes

Dans un second temps, nous comparons, à nombre de signaux générés égaux, la ré-partition des signaux générés par les méthodes de détection basée sur le lasso pondéré présentées en section 4.3.1 avec un lasso classique implémenté dans la BNPV. La figure 4.4 représente la répartition des signaux, des vrais positifs, et des faux positifs (en colonne)

générés par les approches basées sur la lasso pondéré avec les poids w(1), w(2), wlb, wcisl (en ligne) et un lasso classique.

En regardant la répartition des signaux générés par le lasso d’une part, et les différents lasso pondérés d’autre part (première colonne de la figure 4.4), on constate que les poids

wlb ont conduit à des signaux générés très différents (graphique (c.1)). Cela était égale-ment le cas pour l’approche basée sur les poids wcisl pour un nombre de signaux générés supérieur à 70 (graphique (d.1)). Les approches basées sur les poids naïfs w(1) et w(2) ont généré un plus grand nombre de signaux en commun avec le lasso classique (graphique (a.1) et (b.1)).

Parmi les signaux générés par les deux approches basées sur les poids naïfs et non générés par le lasso classique, peu étaient de vrais positifs. La méthode qui repose sur les poids w(2) a montré de moins bonnes performances avec un nombre de vrais positifs détectés toujours plus faibles que le lasso classique, et un faux positif détecté à partir de 38 signaux générés (figure (b.3)). La méthode de détection qui repose sur les poids wlb a détecté jusqu’à huit vrais positifs de plus que le lasso classique pour un même nombre de signaux générés (figure (c.2)). Elle a également détecté jusqu’à trois faux positifs de plus que le lasso classique (figure (c.3)). A partir de 127 signaux générés, la méthode basée sur les poids wcisl a détecté plus de vrais positifs que le lasso classique (figure (d.2)). En revanche, dès 70 signaux générés cette approche a détecté deux faux positifs (figure (d.3)). A partir de 150 signaux générés, cette approche a détecté autant de faux positifs que le lasso classique.

Signaux (a.1) 0 50 100 150 1 13 43 87 142 167 w (1 ) Vrais positifs (a.2) 0 10 20 30 40 50 60 1 13 43 87 142 167 Faux positifs (a.3) 0 2 4 6 8 1 13 43 87 142 167 (b.1) 0 50 100 150 1 13 31 48 73 95 114 144 167 w (2 ) (b.2) 0 10 20 30 40 50 60 1 13 31 48 73 95 114 144 167 (b.3) 0 1 2 3 4 5 6 1 13 31 48 73 95 114 144 167 (c.1) 0 50 100 150 200 1 12 40 83 129 151 164 170 w lb (c.2) 0 10 20 30 40 50 60 1 12 40 83 129 151 164 170 (c.3) 0 2 4 6 8 1 12 40 83 129 151 164 170 (d.1) 0 50 100 150 1 13 31 48 73 95 114 144 167 w cisl (d.2) 0 10 20 30 40 50 60 1 13 31 48 73 95 114 144 167 (d.3) 0 1 2 3 4 5 1 13 31 48 73 95 114 144 167

intersection lasso classique lasso pondéré

Figure 4.4 – Comparaison des signaux générés et des vrais/faux positifs détectés (en colonnes) entre le lasso classique et les lasso pondérés avec poids obtenus dans la base hybride (en ligne). Les effectifs en vert, jaune et bleu sont les effectifs des signaux générés par le lasso classique et le lasso pondéré, le lasso classique uniquement et le lasso pondéré uniquement, respectivement. Par exemple (graphe (d.2)), pour 114 signaux générés, 38 vrais positifs étaient détectés par le

lasso classique et le lasso pondéré avec les poids wcisl, 12 étaient détectés par le lasso classique

4.3.4 Discussion

Le travail présenté ici est une première tentative pour exploiter conjointement les données de la BNPV et de l’EGB. Dans la BNPV, des cas d’un EI donné sont comparés à des cas d’autres évènements indésirables. Partant de ce constat, nous avons cherché à construire une population de témoins ayant des caractéristiques proches de celles des cas et avons apparié des individus de la BNPV avec des individus de l’EGB. Cette démarche reste assez empirique.

En comparant les performances de méthodes mises en œvre sur cette base hybride et la BNPV, on constate que les méthodes génèrent le double de signaux sur la base hybride. Les performances des méthodes sur cette base se sont avérées mauvaises en termes de fausses découvertes. De part la grande différence dans le recueil des données entre la BNPV et l’EGB, la base hybride ainsi créée nous est apparue comme peu fiable en elle même pour la détection.

Nous avons alors cherché à intégrer l’information que pouvait recéler cette base via un lasso pondéré mis en œuvre dans la BNPV « originale ». Ainsi nous avons défini deux poids dits naïfs, qui reposent sur une détection dans la base hybride avec une méthode de disproportionnalité. Par la suite, nous avons décidé d’inclure dans la comparaison les poids qui présentaient de bons résultats dans la chapitre 3 dérivés d’un lasso-bic et de CISL. Chacun des lasso pondérés ont été comparés à une régression lasso classique. Afin de regarder plus globalement les détections des différentes approches, nous nous sommes affranchie du choix de λ dans toutes les régressions pénalisées.

Les méthodes de détection développées ici reposant sur le lasso pondéré ont, dans l’en-semble, des performances moins bonnes en termes de fausses découvertes par rapport à une méthode basée sur une régression lasso classique. Néanmoins elles ont permis de détec-ter certains vrais positifs qui n’étaient pas détectés avec le lasso classique. En particulier, l’approche qui repose sur des poids obtenus à partir d’un lasso-bic dans la base hybride a même détecté un nombre plus important de vrais positifs que le lasso classique à nombre de signaux générés équivalent. Pour un nombre de signaux générés élevé, la méthode de détection basée sur les poids dérivés de CISL a détecté plus de vrais positifs et autant de faux positifs qu’un lasso classique. Néanmoins pour un nombre de signaux générés plus faible, ses performances étaient moins satisfaisantes. Les deux approches basées sur les

poids naïfs ont amené les résultats les moins satisfaisants avec peu de vraies découvertes comparées au lasso classique. En particulier, le lasso pondéré avec les poids basés sur les p-valeurs corrigées a détecté des faux positifs pour un nombre faible de signaux générés (38 signaux).

4.4 Conclusion

La taille relativement faible de l’EGB ne permet pas de disposer d’un effectif suffisant de cas pour la détection de signaux concernant l’évènement indésirable DILI. La taille réduite de l’ensemble de référence couplée au déséquilibre du nombre de témoins négatifs et positifs rendent difficile l’évaluation des performances de nos méthodes de détection. Ainsi les approches qui nous avaient semblé pertinentes à mettre en œuvre au moment de cette étude ont donné des résultats décevants. Nos ambitions autour du développement de nouvelles méthodes de détection basées sur l’exploitation conjointe des détections réalisées dans la BNPV d’une part, et l’EGB d’autre part se sont vues contrariées.

Nous avons alors tenté d’exploiter conjointement les données de ces deux bases de données. Au prix de quelques fausses découvertes, l’information apportée par la consti-tution d’un groupe de témoins issu de l’EGB dans la détection sur la BNPV a permis de détecter des vrais positifs qui n’étaient pas détectés par un lasso classique. Cela a été particulièrement le cas avec la méthode basée sur les poids wlb, qui a fourni des résultats satisfaisants avec des signaux générés très différents d’un lasso classique. Ces résultats ouvrent des perspectives intéressantes et mériteraient d’être approfondis avec d’autres études empiriques.