• Aucun résultat trouvé

4.2 Détection de signaux dans l’Échantillon Généraliste des Bénéficiaires

4.2.2 Sequence Symmetry Analysis : définition et mise en œuvre

Méthodes

La SSA a été introduite par Petri et al. (1988) puis formalisée par Hallas (1996). Cette méthode d’analyse de données longitudinales repose sur la comparaison du nombre de séquences « évènement A puis évènement B » versus « évènement B puis évènement A ». Historiquement, A et B étaient des consommation de médicaments, avec A : médicament suspect et B : médicament pour soigner l’événement indésirable que l’on suspecte être induit par A. Cette approche a été étendue au cas où B est un évènement indésirable par la suite (Tsiropoulos et al., 2009). Dans tous les cas, les évènements A et B sont des évènement incidents.

Si on considère que A est la prise du médicament suspect j pour j ∈ {1, ..., P } et B la survenue de notre EI d’intérêt Y , la SSA consiste à dénombrer le nombre de séquences « médicament puis EI (noté Xj → Y) » et « EI puis médicament (noté Y → Xj) » sur

une fenêtre d’observation donnée. Pour chaque individu, on considère sur cette fenêtre d’observation uniquement la première occurrence des évènements « prise de médicament » et « survenue de l’EI ». Soit U le nombre de jours de la fenêtre d’observation considérée. Pour cette section uniquement, la matrice X sera de dimension (N × U) × P : on compte par individu autant de lignes que de jours dans la période d’observation. De même, la réponse d’intérêt est ici définie par y ∈ RN ×U. Ainsi, on a xiuj = 1 si l’individu i a pris le médicament j le jour u, et yiv = 1 si ce même individu a vécu l’EI d’intérêt le jour v, pour

u, v ∈ {1, ..., U}. Dans un premier temps, la SSA consiste à calculer le crude sequence

ratio défini par :

rc= |Xj → Y | |Y → Xj| = PN i=1  PU −1 u=1 xiujPUv=u+1yiv  PN i=1  PU −1 u=1 yiuPUv=u+1xivj .

Afin de prendre en compte les tendances de prescriptions et d’hospitalisations dont les prévalences varient dans le temps, on calcule le null sequence ratio, qui peut être interprété comme une valeur de référence du crude sequence ratio. En notant xuj le vecteur de taille

N qui est l’indicatrice de présence du médicament j le jour u, et yu le vecteur de taille

N qui est l’indicatrice de survenu de la réponse le jour u, on définit :

a= PU −u=11xujPUv=u+1yu

PU

u=1xujPUu=1yu

.

Le null sequence ratio est défini par :

rn = 1 − aa .

La mesure d’intérêt avec l’approche SSA est alors l’adjusted sequence ratio défini comme le rapport

ra = rc

rn

.

La figure 4.2 présente un exemple schématique de la SSA avec le calcul de rc, rnet ra. Enfin, l’intervalle de confiance bilatéral de l’adjusted sequence ratio est déterminé, et si la borne inférieure de cet intervalle est supérieur à 1, alors on considère le couple (médicament

j, EI) comme un signal. La SSA est ensuite mise en œuvre pour tous les médicaments enregistrés et sur plusieurs fenêtres d’observation.

Fenêtre d'observation

médicament événement indésirable

J1

J2

J3

J4

Figure 4.2 – Présentation schématique de la sequence symmetry analysis. Dans cette exemple,

on a rc= 5/2 = 2,50, a = [(1 × 5) + (3 × 4) + (2 × 3)]/(7 × 7) =0,47, rn=0,89 et ra=2,81.

Pour déterminer l’intervalle de confiance de l’adjusted sequence ratio, nous avons implé-menté une méthode dite exacte, qui est celle évoquée dans le travail de Hallas (1996) sur la base des travaux de Morris et Gardner (1988). Dans son travail, Hallas (1996) af-firme que la variance du null sequence ratio est faible devant celle du crude sequence ratio, et donc que l’intervalle de confiance de l’adjusted sequence ratio est quasiment entièrement déterminé par l’intervalle de confiance du crude sequence ratio. Afin de déterminer l’inter-valle de confiance du crude sequence ratio, on calcule l’interl’inter-valle de confiance à (1 − α)% de la probabilité de succès d’une loi binomiale, où le succès est l’évènement « Xj → Y », et le nombre d’expériences est le nombre total de séquences. L’intervalle de confiance de cette probabilité est calculé à partir de la loi binomiale. On en déduit l’intervalle de confiance à (1 − α)% du crude sequence ratio, puis celui de l’adjusted sequence ratio en divisant les deux bornes de l’intervalle de confiance du crude sequence ratio par la valeur du null sequence ratio.

Nous avons également déterminé l’intervalle de confiance de l’adjusted sequence ratio par bootstrap, comme cela est fait dans la littérature (Wahab et al., 2013; Arnaud et al., 2018). Nous avons obtenu par bootstrap une distribution de B = 200 valeurs de l’adjusted

sequence ratio, ce qui nous permet de déterminer l’intervalle de confiance à (1 − α)% de

cette quantité en prenant les percentiles d’ordre α

2 et 1 − α

2 de la distribution.

Pour ces deux intervalles de confiance, nous avons fixé α = 0,05. Un signal est généré avec la méthode de l’intervalle de confiance exact si, sur au moins une fenêtre d’observa-tion, la borne inférieure de l’intervalle de confiance de l’adjusted sequence ratio obtenu avec cette méthode est strictement supérieure à un. La même règle de décision est appliquée pour la méthode de l’intervalle de confiance obtenu par bootstrap.

Paramétrages

Wahab et al. (2013) ont observé des différences en termes de sensibilité de la SSA pour la détection de signaux en fonction de la durée de la fenêtre d’observation. Comme dans leur travail, nous avons implémenté la SSA en testant plusieurs durées pour observer les séquences : 3, 6 et 12 mois. De plus nous avons considéré deux façons différentes de définir deux fenêtres d’observation consécutives :

• soit de manière totalement disjointe : la seconde fenêtre d’observation commence quand la première se termine,

• soit à la façon de fenêtres glissantes sur un mois : la seconde fenêtre d’observation commence un mois après le début de la première.

Tous ces paramétrages sont résumés dans le tableau 4.2.

Paramétrage Durée de la fenêtre Superposition des

d’observation (mois) fenêtres d’observation

m3-no 3 non m3-o 3 oui m6-no 6 non m6-o 6 oui m12-no 12 non m12-o 12 oui

Tableau 4.2 – Paramétrages testés dans la mise en œuvre de la sequence symmetry analysis pour la détection de signaux dans l’EGB

Tout comme dans le travail d’Arnaud et al. (2018), nous avons considéré une expo-sition médicamenteuse dans une fenêtre d’observation donnée s’il y a au moins (i) trois séquences dans la fenêtre qui impliquent ce médicament et l’EI d’intérêt, (ii) une séquence « médicament puis EI » dans la fenêtre. S’il n’y a pas de séquence « EI puis médicament » dans la fenêtre étudiée, le crude sequence ratio est fixé à 0.49.

4.2.3 Extraction et mise en forme des données de l’Échantillon