Méthodes de détection compétitrices - Score de propension en grande dimension et régression pén

3.4.1 Méthodes de détection basées sur le lasso adaptatif en

grande dimension

On se propose de considérer des approches de détection basées sur les mises en œuvre du lasso adaptatif pour la grande dimension évoquées en section 3.2.

La première approche repose sur la proposition de Bühlmann et van de Geer (2011). Elle consiste à utiliser les coefficients de régression obtenus avec régression lasso afin de déterminer les poids adaptatifs. A la fois pour cette étape et pour l’étape du lasso adaptatif, le paramètre de pénalisation λ est sélectionné par validation croisée. En notant

βlcv le vecteur de taille P des coefficients de régression du lasso logistique déterminé par validation croisée, le poids adaptatif associé à la Xj dans le lasso adaptatif est défini par :

w_p^lcv =          1 |βblcv j | si βblcv j 6= 0 ∞ sinon.

Ainsi, une variable qui n’a pas été sélectionnée par validation croisée dans la première régression lasso est automatiquement exclue par le lasso adaptatif. Par construction, les variables sélectionnées avec le lasso adaptatif sont un sous-ensemble de celles sélectionnées à l’aide de la validation croisée dans la première régression lasso.

La deuxième approche, basée sur le travail de Huang et al. (2008b), consiste à déter-miner les poids adaptatifs à partir des coefficients obtenus avec des régressions univariées sur la réponse d’intérêt. En notant βbuniv

on définit son poids associé dans le lasso adaptatif par :

w_j^univ= ¹ |βbuniv

j |.

Comme dans le travail de Huang et al. (2008b), on détermine la valeur du paramètre de pénalité dans le lasso adaptatif par validation croisée.

Dans la suite, les approches de détection qui résultent de ces deux implémentations du lasso adaptatif en grande dimension seront désignées sous les appellations adapt-cv et adapt-univ. Sont considérés comme signaux avec ces approches toutes les variables qui ont un coefficient de régression associé strictement positif dans le lasso adaptatif.

3.4.2 Méthodes de détection basées sur la régression lasso

Afin de quantifier l’intérêt de l’utilisation du lasso adaptatif par rapport au lasso classique en pharmacovigilance, nous avons implémenté des approches de détection de signaux basées sur la régression lasso logistique (présentée en section 2.3.1). En plus du lasso-bic défini en section 2.3.4 et de CISL présenté en section 2.3.3, nous avons choisi de mettre en œuvre deux autres stratégies pour sélectionner le paramètre de pénalisation dans la régression lasso : la validation croisée et une méthode basée sur des permutations proposée par Sabourin et al. (2015) à partir de l’idée formulée par Ayers et Cordell (2010). Pour de multiples permutations aléatoires de la réponse, cette méthode consiste à identifier la plus petite pénalité associée à un ensemble de variables actives vide dans la régression lasso, puis à considérer la médiane de ces valeurs de pénalité. En notant

π une permutation de {1, ..., N}, on définit yπl = (yπ(1), ..., yπ(N)) une version permutée de la réponse d’intérêt y avec 1 ≤ l ≤ L. Une régression lasso est implémentée pour chaque permutation, où yπ_l est régressé sur le jeu de données original X. Pour chacune de ces L régressions lasso, la plus petite valeur du paramètre de pénalité aboutissant à un ensemble de variables actives vide est sélectionnée. On note cette valeur λmax(yπl) pour la permutation l. La valeur médiane de (λmax(yπ1), ..., λmax(yπL)) est finalement utilisée comme paramètre de pénalité dans une régression lasso effectuée avec la réponse d’intérêt non permutée. Comme suggéré dans leur travail, nous avons fixé L = 20.

Dans ce qui suit, lasso-cv et lasso-perm feront respectivement référence à l’approche impliquant la validation croisée ou des permutations. Pour la validation croisée, nous avons fixé le nombre de folds à cinq et nous avons utilisé comme mesure de performance la déviance, définie comme l’écart entre la log-vraisemblance du modèle évalué par rapport à la log-vraisemblance du modèle vide. Pour ces deux approches, les signaux sont les variables qui ont un coefficient de régression associé strictement positif.

3.4.3 Méthodes de détection basées sur le score de propension

en grande dimension

Nous avons également voulu comparer toutes ces approches de détection basées sur les régressions pénalisées avec les approches basées sur le score de propension en grande dimension définies au chapitre précédent.

Pour chaque variable médicament, un score de propension a été construit avec la mé-thode du lasso-bic en sélectionnant les variables à inclure dans les modèles d’estimation parmi tous les autres médicaments renseignés. Nous avons pris en compte ces scores dans le modèle de régression final par ajustement et pondération IPTW (Austin, 2011) et MW (Li et Greene, 2013). Pour tenter d’améliorer les performances médiocres de la méthode par pondération IPTW observées dans le chapitre précédent, nous avons éga-lement considéré une approche avec troncature de ces poids afin de limiter l’impact des poids extrêmes. Cela consiste à attribuer aux individus dont le poids correspondant est inférieur au rème percentile ou supérieur au (1 − r)ème percentile de la distribution des poids, la valeur du rème ou du (1 − r)ème percentile respectivement (Franklin et al., 2017). Ici, nous avons choisi de fixer r = 2,5%.

Pour tenir compte des tests multiples, nous avons utilisé la procédure proposée par Benjamini et Yekuteli (2001) pour contrôler le FDR sous des hypothèses de dépen-dance entre les tests réalisés. Cette procédure consiste dans un premier temps à ordonner les p-valeurs des P tests réalisés dans l’ordre croissant : p(1)≤ ... ≤ p(P ), avec p(1) la plus petite des P p-valeurs obtenues et p(P ) la plus grande. Pour un seuil α donné, on cherche

la plus grande valeur de h telle que

p_(h) ≤ h P × c(P )^α avec c(P ) =PP

j=1¹j. Les hypothèses nulles des tests associés aux p-valeurs p(1), ..., p(h) sont alors rejetées. Les variables médicaments sélectionnées par nos approches basées sur le PS en grande dimension sont les variables X₍₁₎, ..., X_(h). Nous avons fixé α = 5%. Dans ce qui suit, ps-adjust, ps-iptw, ps-iptwT et ps-mw feront respectivement référence à l’ajustement sur le PS, la pondération sur le PS avec les poids IPTW, IPTW avec troncature, et MW.

Dans le document Score de propension en grande dimension et régression pénalisée pour la détection automatisée de signaux en pharmacovigilance (Page 71-74)