• Aucun résultat trouvé

Plusieurs développements aux travaux présentés ici sont envisageables. L’étude de si-mulations réalisée dans le troisième chapitre a mis en évidence que pour certaines des méthodes proposées reposant sur le score de propension en grande dimension, une cor-rection de tests multiples ne permettait pas d’assurer un contrôle sur le False Discovery

Rate. Ces résultats surprenants constituent une première piste d’investigation envisagée

Une autre perspective autour des méthodes de détection basées sur le PS en grande dimension présentée en section 2.7 est de compléter l’évaluation des différentes méthodes d’estimation via le calcul de mesures d’équilibre. D’autres travaux peuvent être menés autour de la meilleure prise en compte de cette notion d’équilibre induit par les scores de propension. Imai et Ratkovic (2014) ont proposé une méthode d’estimation du score qui repose sur l’équilibre qu’il peut induire chez les variables observées : le covariate balancing

propensity score. A notre connaissance cette approche n’a pas été mise en œuvre dans le

cadre de la grande dimension, ni dans celui de la pharmacovigilance. Cette méthode serait un compétiteur intéressant pour les autres approches d’estimation du score que nous avons testées ici. Récemment, Li et al. (2018) ont proposé une nouvelle pondération sur le score de propension, les overlap weights, et ont montré que ces poids possèdent de bonnes propriétés en termes d’équilibre induits sur les variables observées dans la pseudo population qui découlent de cette pondération. Dans un autre travail, Li et al. (2019) ont également mis en évidence les bonnes performances de cette pondération comparées à celles de l’IPTW pour l’estimation de l’effet du traitement sur la réponse d’intérêt. Ils définissent dans ce même travail une forme explicite de l’estimateur de la variance de l’effet traitement avec cette pondération.

Tout au long de cette thèse, nous avons eu recours au critère BIC pour choisir la pénalité λ pour le lasso. Nous avons choisi de calculer le BIC à partir des modèles de régression classiques, constitués des variables sélectionnées par le lasso, pour différentes valeurs de pénalité. Les méthodes de détection de signaux basées sur ce critère nous ont donné satisfaction. Une extension de ce travail pourrait être de comparer les performances de cette méthode à une approche qui repose sur le calcul du BIC obtenu à partir de la vraisemblance pénalisée. Une possibilité serait même de considérer une forme de combi-naison de ces deux approches. Hastie et al. (2009) ont proposé une version simplifiée du

relaxed lasso initialement introduit par Meinshausen (2007) en définissant l’estimateur

b

βrelax comme une combinaison linéaire de l’estimateur obtenu avec le lasso pour un λk

donné et celui obtenu par maximisation de la vraisemblance du modèle non pénalisé com-prenant les variables actives associées à λk. Ainsi, en faisant varier le paramètre de cette combinaison linéaire on pourrait imaginer comparer les différences dans les sélections de variables obtenues avec ces BIC « différents ». Enfin, on pourrait étendre ce travail par

une comparaison avec d’autres variations autour du BIC qui ont été proposées dans le cadre de la régression lasso comme l’extended BIC (Chen et Chen, 2008), le modified

BIC (Wang et al., 2009) ou encore le high-dimensional BIC (Wang et Zhu, 2011). Pour

ce qui est du cadre spécifique de l’adaptive lasso, on pourra également considérer le critère de l’Extended Regularized Information Criterion proposé par Hui et al. (2015).

Une publication que nous avons trouvée tardivement au cours de ce travail de thèse a également attiré notre attention. Il s’agit des travaux de Shortreed et Ertefaie (2017) autour de l’outcome-adaptive lasso. Cette méthode permet de « fusionner » les champs méthodologiques abordés dans les chapitres 2 et 3 de cette thèse. Ainsi, Shortreed et Ertefaie (2017) proposent de construire un score de propension à partir d’un lasso adaptatif. Les poids adaptatifs sont déterminés à partir des coefficients de régression obtenus par maximum de vraisemblance dans la régression de la réponse d’intérêt par rapport à l’ensemble des variables observées et du traitement considéré. L’objectif de cette méthode est de favoriser dans la sélection des variables à inclure dans le modèle d’estimation du PS les variables qui sont associées à la réponse d’intérêt, comme cela est recommandé dans la littérature (Brookhart et al., 2006). Le paramètre λ est choisi selon une mesure d’équilibre, la weighted Average Standard Mean Difference, faisant intervenir la pondération IPTW. Mettre en œuvre cette méthode avec les enseignements tirés de notre travail serait intéressant et potentiellement prometteur. Ainsi, la pondération IPTW résultant en des poids instables dans notre situation, pourrait être remplacée par les

matching weights ou les overlap weights. Enfin, plutôt que des poids adaptatifs déterminés

à partir des estimations obtenues par maximum de vraisemblance, on pourra utiliser les poids proposés dans le chapitre 3.

Le travail présenté dans le chapitre 4 de ce manuscrit à mis en évidence la difficulté de l’utilisation des bases médico-administratives pour la pharmacovigilance dans certaines situations. Pour l’évènement indésirable que nous avons considéré, on peut incriminer la relative faible taille des données de l’EGB. Plus généralement, exploiter ces bases de don-nées reste une tâche ardue, à cause des biais auxquelles elles sont soumises. En particulier, une analyse préliminaire des signaux générés sur l’EGB laisse à penser que ces signaux sont dus à des bais d’indications ou des biais protopathiques. Ni les méthodes mises en

œuvre, pourtant pertinentes d’après la littérature, ni le filtre des indications avec la base de données SIDER n’ont a priori permis de pallier entièrement ces biais. Pour se pronon-cer sur les réelles performances des méthodes implémentées, il faudrait évaluer les signaux qui n’étaient pas présents dans l’ensemble de référence considéré. Ainsi, que ce soit pour identifier au mieux les biais à l’œuvre ou pour évaluer pleinement les performances des méthodes, il est de notre point de vue primordial d’impliquer une certaine expertise dans la détection sur les bases médico-administratives. Par exemple, on pourrait envisager de solliciter des experts pharmacologues pour évaluer les signaux générés, ou effectuer une recherche dans la littérature, éventuellement de manière automatisée à l’aide d’algorithme de text mining comme cela a été proposé par Avillach et al. (2013).

A l’heure actuelle, aucun système de surveillance ne repose sur des bases médico-administratives pour la pharmacovigilance en routine. Au delà des difficultés liées aux aspects méthodologiques dans l’exploitation des données, on peut également pointer le manque de réactivité dans la mise à jour et dans la mise à disposition de ces bases. Bien que les notifications spontanées soient également soumises à certains biais (Weber, 1984; Bégaud et al., 2002), elles restent la pierre angulaire pour la détection de signaux en pharmacovigilance. La réactivité des systèmes de surveillance ainsi que l’expertise médicale impliquée dans la construction des bases de données sont autant d’arguments en faveur des notifications spontanées. Ainsi, c’est plus la complémentarité des notifications spontanées et des BMA qui, à notre avis, est à viser (du moins pour le moment). En effet, les bases médico-administratives permettent d’étudier des évènements indésirables ou des populations qui ne peuvent être étudiés dans les notifications spontanées (Demailly

et al., 2020). Là aussi, pour définir précisément ces évènements ou ces populations ciblées,

il est nécessaire d’avoir recours à une certaine expertise médicale. Pour le moment, fournir une manière pertinente d’exploiter conjointement les données de notifications spontanées et les bases médico-administratives dans toutes les situations est difficile. Des propositions ont été faites pour interconnecter ces deux sources de données (Harpaz et al., 2013; Li

et al., 2015; Pacurariu et al., 2015) et il est certain que cette question va continuer à

Abadie, A. et G. W. Imbens. 2016, «Matching on the Estimated Propensity Score»,

Econometrica, vol. 84, no 2, p. 781–807. 22, 44

Ahmed, I., B. Bégaud et P. Tubert-Bitter. 2015, «chapter 13 : evaluation of post-marketing safety using spontaneous reporting databases», dans Statistical Methods for

EvaluatingSafety in Medecine Product Development, édité par A. L. Goud, Wiley, p.

332–344. 4

Ahmed, I., C. Dalmasso, F. Haramburu, F. Thiessard, P. Broët et P. Tubert-Bitter. 2010, «False discovery rate estimation for frequentist pharmacovigilance signal detection methods», Biometrics, vol. 66, no 1, p. 301–309. 5, 27, 59, 97

Ahmed, I., F. Haramburu, A. Fourrier-Réglat, F. Thiessard, C. Kreft-Jais, G. Miremont-Salamé, B. Bégaud et P. Tubert-Bitter. 2009, «Bayesian phar-macovigilance signal detection methods revisited in a multiple comparison setting»,

Statistics in Medicine, vol. 28, no 13, p. 1774–1792. 5

Ahmed, I., A. Pariente et P. Tubert-Bitter. 2018, «Class-imbalanced subsampling lasso algorithm for discovering adverse drug reactions», Statistical Methods in Medical

Research, vol. 27, no 3, p. 785–797. 5, 7, 14, 18, 19

Akaike, H. 1973, «Information theory and an extension of maximum likelihood prin-ciple», dans Proc. 2nd Int. Symp. on Information Theory, p. 267–281. 6

Ali, M. S., R. H. H. Groenwold, W. R. Pestman, S. V. Belitser, K. C. B. Roes, A. W. Hoes, A. de Boer et O. H. Klungel. 2014, «Propensity score balance measures in pharmacoepidemiology : a simulation study», Pharmacoepidemiology and

Almenoff, J., J. M. Tonning, A. L. Gould, A. Szarfman, M. Hauben, R. Ouellet-Hellstrom, R. Ball, K. Hornbuckle, L. Walsh, C. Yee, S. T. Sacks, N. Yuen, V. Patadia, M. Blum, M. Johnston, C. Gerrits, H. Seifert et K. LaCroix. 2005, «Perspectives on the use of data mining in pharmacovigilance»,

Drug Safety, vol. 28, no 11, p. 981–1007. 5

Arnaud, M., B. Bégaud, F. Thiessard, Q. Jarrion, J. Bezin, A. Pariente et F. Salvo. 2018, «An Automated System Combining Safety Signal Detection and Prio-ritization from Healthcare Databases : A Pilot Study», Drug Safety, vol. 41, no 4, p. 377–387. 87, 88

Arnaud, M., B. Bégaud, N. Thurin, N. Moore, A. Pariente et F. Salvo. 2017, «Methods for safety signal detection in healthcare databases : a literature review»,

Expert opinion on drug safety, vol. 16, no 6, p. 721–732. 80

Arnaud, M., F. Salvo, I. Ahmed, P. Robinson, N. Moore, B. Bégaud, P. Tubert-Bitter et A. Pariente. 2016, «A Method for the Minimization of Com-petition Bias in Signal Detection from Spontaneous Reporting Databases», Drug Safety, vol. 39, no 3, p. 251–260. 5

Austin, P. C. 2009, «Some methods of propensity-score matching had superior perfor-mance to others : results of an empirical investigation and monte carlo simulations»,

Biometrical Journal : Journal of Mathematical Methods in Biosciences, vol. 51, no 1, p. 171–184. 22

Austin, P. C. 2011, «An Introduction to Propensity Score Methods for Reducing the Effects of Confounding in Observational Studies», Multivariate Beahavioral Research, vol. 46, no 3, p. 399–424. 21, 44, 56

Austin, P. C. et E. A. Stuart. 2015, «Moving towards best practice when using inverse probability of treatment weighting ( IPTW ) using the propensity score to estimate causal treatment effects in observational studies», Statistics in Medicine, vol. 34, no 28, p. 3661–3679. 22

«Analysis of multiple exposures in the case-crossover design via sparse conditional li-kelihood», Statistics in Medicine, vol. 31, no 21, p. 2290–2302. 80, 82

Avillach, P., J. C. Dufour, G. Diallo, F. Salvo, M. Joubert, F. Thiessard, F. Mougin, G. Trifirò, A. Fourrier-Réglat, A. Pariente et M. Fieschi. 2013, «Design and validation of an automated method to detect known adverse drug reactions in MEDLINE : A contribution from the EU-ADR project», Journal of the American

Medical Informatics Association, vol. 20, no 3, p. 446–452. 109

Ayers, K. L. et H. J. Cordell. 2010, «SNP Selection in Genome-Wide and Candidate Gene Studies via Penalized Logistic Regression», Genetic Epidemiology, vol. 34, no 8, p. 879–891. 50, 55

Bate, A., M. Lindquist, I. R. Edwards, S. Olsson, R. Orre, A. Lansner et R. M. De Freitas. 1998, «A Bayesian neural network method for adverse drug reac-tion signal generareac-tion», European Journal of Clinical Pharmacology, vol. 54, no 4, p. 315–321. 5

Bégaud, B., K. Martin, F. Haramburu et N. Moore. 2002, «Rates of sponta-neous reporting of adverse drug reactions in France», Journal of the American Medical

Association, vol. 288, no 13, p. 1588. 8, 77, 109

Benjamini, Y. et Y. Hochberg. 1995, «Controlling the false discovery rate a practical and powerful approach to multiple testing», Journal of the Royal Statistical Society.

Series B (Statistical Methodology), vol. 57, no 1, p. 289–300. 5

Benjamini, Y. et D. Yekuteli. 2001, «The Control of the False Discovery Rate in Multiple Testing under Dependency», The Annals of Statistics, vol. 29, no 4, p. 1165– 1188. 56, 83, 97

Bergersen, L. C., I. K. Glad et H. Lyng. 2011, «Weighted lasso with data integra-tion», Statistical Applications in Genetics and Molecular Biology, vol. 10, no 1. 97 Brookhart, M. A., S. Schneeweiss, K. J. Rothman, R. J. Glynn, J. Avorn et

T. Stürmer. 2006, «Variable selection for propensity score models», American Journal

Bross, I. D. 1966, «Spurious effects from an extraneous variable», Journal of Chronic

Diseases, vol. 19, no 6, p. 637–647. 23

Bühlmann, P. et S. van de Geer. 2011, «Lasso for linear models», dans Statistics for

High-Dimensional Data, Springer Science & Business Media, p. 7–42. 50, 52, 54, 74

Caruana, E., S. Chevret, M. Resche-Rigon et R. Pirracchio. 2015, «A new weighted balance measure helped to select the variables to be included in a propensity score model», Journal of Clinical Epidemiology, vol. 68, no 2, p. 1415–1422. 44

Caster, O., K. Juhlin, S. Watson et G. N. Norén. 2014, «Improved statistical si-gnal detection in pharmacovigilance by combining multiple strength-of-evidence aspects in vigiRank : Retrospective evaluation against emerging safety signals», Drug Safety, vol. 37, no 8, p. 617–628. 5

Caster, O., G. N. Norén, D. Madigan et A. Bate. 2010, «Large-scale regression-based pattern discovery : The example of screening the WHO global drug safety data-base», Statistical Analysis and Data Mining, vol. 3, no 4, p. 197–208. 5, 6, 7, 14, 17, 19

Caster, O., L. Sandberg, T. Bergvall, S. Watson et G. N. Norén. 2017, «vi-giRank for statistical signal detection in pharmacovigilance : First results from pros-pective real-world use», Pharmacoepidemiology and Drug Safety, vol. 26, no 8, p. 1006– 1010. 5

Chan, C. L., S. Rudrappa, P. S. Ang et S. C. Li. 2017, «Detecting signals of dispro-portionate reporting from Singapore ’ s spontaneous adverse event reporting system – an application of the Sequential Probability Ratio Test Detecting signals of dispropor-tionate reporting from Singapore ’ s spontaneous adverse», Drug Safety, vol. 40, no 8, p. 703–713. 5

Chen, J. et Z. Chen. 2008, «Extended Bayesian information criteria for model selection with large model spaces», Biometrika, vol. 95, no 3, p. 759–771. 45, 108

The largest reference drug list ranked by the risk for developing drug-induced liver injury in humans», Drug Discovery Today, vol. 21, no 4, p. 648–653. 11, 15, 31, II Chen, M., V. Vijay, Q. Shi, Z. Liu, H. Fang et W. Tong. 2011, «FDA-approved

drug labeling for the study of drug-induced liver injury», Drug Discovery Today, vol. 16, no 15-16, p. 697–703. 11, 15, 31, II, XV

Choi, N.-K., Y. Chang, Y. K. Choi, S. Hahn et B.-J. Park. 2010, «Determinants of cholesterol and triglycerides recording in patients treated with lipid lowering therapy in UK primary care», Pharmacoepidemiology and drug safety, vol. 19, p. 138–146. 79 Choi, N.-K., Y. Chang, J.-Y. Kim, Y.-K. Choi et B.-J. Park. 2011, «Determinants

of cholesterol and triglycerides recording in patients treated with lipid lowering therapy in UK primary care», Pharmacoepidemiology and drug safety, vol. 20, p. 1278–1286. 79 Cole, S. R. et M. A. Hernan. 2008, «Constructing Inverse Probability Weights for Marginal Structural Models», American Journal of Epidemiology, vol. 168, no 6, p. 656–664. 20, 21

Curtis, J. R., H. Cheng, E. Delzell, D. Fram, M. Kilgore, K. Saag, H. Yun et W. DuMouchel. 2009, «Adaptation of Bayesian Data Mining Algorithms to Lon-gitudinal Claims Data : Coxib Safety as an Example», Medical Care, vol. 46, no 9, p. 969–975. 79

Dalmasso, C., P. Broët et T. Moreau. 2005, «A simple procedure for estimating the false discovery rate», Bioinformatics, vol. 21, no 5, p. 660–668. 27

Delaney, J. A. et S. Suissa. 2009, «The case-crossover study design in pharmacoepi-demiology», Statistical Methods in Medical Research, vol. 18, no 1, p. 53–65. 81

Demailly, R., S. Escolano, F. Haramburu, P. Tubert-Bitter et I. Ahmed. 2020, «Identifying Drugs Inducing Prematurity by Mining Claims Data with High-Dimensional Confounder Score Strategies», Drug Safety, p. 1–11. 9, 15, 23, 109

Ding, Y., M. Markatou et R. Ball. 2020, «An evaluation of statistical approaches to postmarketing surveillance», Statistics in Medicine, vol. 39, no 7, p. 845–874. 5

Dumouchel, W. 1999, «Bayesian data mining in large frequency tables, with an appli-cation to the FDA spontaneous reporting system», The American Statistician, vol. 53, no 3, p. 177–190. 4

Evans, S. J. W., P. C. Waller et S. Davis. 2001, «Use of proportional reporting ratios (PRRs) for signal generation from spontaneous adverse drug reaction reports»,

Pharmacoepidemiology and Drug Safety, vol. 10, no 6, p. 483–486. 4

Fan, J. et R. Li. 2001, «Variable Selection via Nonconcave Penalized Likelihood and its Oracle Properties», Journal of the American Statistical Association, vol. 96, no 456, p. 1348–1360. 7, 49, 50

Farrington, C. P. 1995, «Relative Incidence Estimation from Case Series for Vaccine Safety Evaluation», Biometrics, vol. 51, no 1, p. 228–235. 8, 79

Franklin, J. M., W. Eddings, P. C. Austin, E. A. Stuart et S. Schneeweiss. 2017, «Comparing the performance of propensity score methods in healthcare database studies with rare outcomes», Statistics in Medicine, vol. 36, no 12, p. 1946–1963. 15, 23, 27, 56

Franklin, J. M., W. Eddings, R. J. Glynn et S. Schneeweiss. 2015, «Regularized regression versus the high-dimensional propensity score for confounding adjustment in secondary database analyses», American Journal of Epidemiology, vol. 182, no 7, p. 651–659. 15, 23

Genkin, A., D. D. Lewis et D. Madigan. 2007, «Large-scale bayesian logistic regres-sion for text categorization», Technometrics, vol. 49, no 3, p. 291–304. 6

Groenwold, R. H. H., F. de Vries, A. de Boer, W. R. Pestman, F. H. Rut-ten, A. W. Hoes et O. H. Klungel. 2011, «Balance measures for propensity score methods : a clinical example on beta-agonist use and the risk of myocardial infarction»,

Pharmacoepidemiology and Drug Safety, vol. 20, no 11, p. 1130–1137. 44

Hallas, J. 1996, «Evidence of depression provoked by cardiovascular medication : a prescription sequence symmetry analysis», Epidemiology, p. 478–484. 79, 84, 86

Hallas, J. et A. Pottegård. 2014, «Use of self-controlled designs in pharmacoepide-miology», Journal of Internal Medicine, vol. 275, no 6, p. 581–589. 80

Harpaz, R., W. Dumouchel, N. H. Shah, D. Madigan, P. Ryan et C. Friedman. 2012, «Novel data-mining methodologies for adverse drug event discovery and analysis»,

Clinical Pharmacology and Therapeutics, vol. 91, no 6, p. 1010–1021. 5

Harpaz, R., S. Vilar, W. DuMouchel, H. Salmasian, K. Haerian, N. H. Shah, H. S. Chase et C. Friedman. 2013, «Combing signals from spontaneous reports and electronic health records for detection of adverse drug reactions», Journal of the

American Medical Informatics Association, vol. 20, no 3, p. 413–419. 5, 6, 9, 109 Hastie, T., R. Tibshirani et J. Friedman. 2009, «Boosting and additive trees», dans

The Elements of Statistical Learning, New York : Springer series in statistics, p. 337–

387. 26, 107

Hoerl, A. E. et R. W. Kennard. 2000, «Ridge regression : Biased estimation for nonorthogonal problems», Technometrics, vol. 42, no 1, p. 80–86. 52

Huang, J., S. Ma et C.-H. Zhang. 2008a, «The iterated lasso for high-dimensional logistic regression», The University of Iowa, Department of Statistics and Actuarial

Sciences. 50, 52, 74

Huang, J., S. Ma et C.-H. Zhang. 2008b, «Adaptive Lasso for Sparse High-Dimensional Regression Models», Statistica Sinica, p. 1603–1618. 50, 52, 54, 55

Huang, L., J. Zalkikar et R. C. Tiwari. 2011, «A likelihood ratio test based me-thod for signal detection with application to FDA’s drug safety data», Journal of the

American Statistical Association, vol. 106, no 496, p. 1230–1241. 5

Hui, F. K., D. I. Warton et S. D. Foster. 2015, «Tuning Parameter Selection for the Adaptive Lasso Using ERIC», Journal of the American Statistical Association, vol. 110, no 509, p. 262–269. 75, 108

Imai, K. et M. Ratkovic. 2014, «Covariate balancing propensity score», Journal of the

Jin, H., J. Chen, H. He, C. Kelman, D. McAullay et C. M. O’Keefe. 2010, «Si-gnaling potential adverse drug reactions from administrative health databases», IEEE

Transactions on knowledge and data engineering, vol. 22, no 6, p. 839–853. 79

Jin, H., J. Chen, C. Kelman, H. He, D. McAullay et C. M. O’Keefe. 2006, «Mining unexpected associations for signalling potential adverse drug reactions from administrative health databases», dans Pacific-Asia Conference on Knowledge

Disco-very and Data Mining, Springer, p. 867–876. 79

Ju, C., M. Combs, S. D. Lendle, J. M. Franklin, R. Wyss, S. Schneeweiss et M. van der Laan. 2019, «Propensity score prediction for electronic healthcare databases using super learner and high-dimensional propensity score methods», Journal

of Applied Statistics, vol. 46, no 12, p. 2216–2236. 15, 24

Kim, J., M. Kim, J.-H. Ha, J. Jang, M. Hwang, B. K. Lee, M. W. Chung, T. M. Yoo et M. J. Kim. 2011, «Signal detection of methylphenidate by comparing a spontaneous reporting database with a claims database», Regulatory Toxicology and

Pharmacology, vol. 61, no 2, p. 154–160. 79

Knight, K. et W. Fu. 2000, «Asymptotics for Lasso-type estimators», Annals of

Sta-tistics, vol. 28, no 5, p. 1356–1378. 49

Kuhn, M., I. Letunic, L. J. Jensen et P. Bork. 2016, «The SIDER database of drugs and side effects», Nucleic Acids Research, vol. 44, no D1, p. D1075–D1079. 89 Lee, B. K., J. Lessler et E. A. Stuart. 2010, «Improving propensity score weighting

using machine learning», Statistics in Medicine, vol. 29, no 3, p. 337–346. 24

Li, F., K. L. Morgan et A. M. Zaslavsky. 2018, «Balancing Covariates via Propensity Score Weighting», Journal of the American Statistical Association, vol. 113, no 521, p. 390–400. 107

Li, F., L. E. Thomas et F. Li. 2019, «Addressing Extreme Propensity Scores via the Overlap Weights», Practice of Epidemiology, vol. 188, no 1, p. 250–257. 43, 107

Li, L. et T. Greene. 2013, «A weighting analogue to pair matching in propensity score analysis», International Journal of Biostatistics, vol. 9, no 2, p. 215–234. 27, 44, 56

Li, Y., P. B. Ryan, Y. Wei et C. Friedman. 2015, «A Method to Combine Signals from Spontaneous Reporting Systems and Observational Healthcare Data to Detect Adverse Drug Reactions», Drug Safety, vol. 38, no 10, p. 895–908. 10, 96, 109

Lunceford, J. K. et M. Davidian. 2004, «Stratification and weighting via the propen-sity score in estimation of causal treatment effects : A comparative study», Statistics

in Medicine, vol. 23, no 19, p. 2937–2960. 22

Maclure, M. 1991, «The Case-Crossover Design : A Method for Studying Transient Effects on the Risk of Acute Events», American Journal of Epidemiology, vol. 133, no 2, p. 144–153. 79, 80

Mallows, C. 1973, «Some comments on cp», Technometrics, vol. 15, p. 661–675. 6 Mccaffrey, D. F., G. Ridgeway et A. R. Morral. 2004, «Propensity Score

Estima-tion with Boosted Regression for Evaluating Causal Effects in ObservaEstima-tional Studies»,

Psychological Methods, vol. 9, no 4, p. 403. 15, 24

Meinshausen, N. 2007, «Relaxed Lasso», Computational statistics & data analysis, vol. 52, no 1, p. 374–393. 107

Meinshausen, N. et P. Bühlmann. 2006, «High-dimensional graphs and variable se-lection with the Lasso», Annals of Statistics, vol. 34, no 3, p. 1436–1462. 49

Meinshausen, N. et P. Bühlmann. 2010, «Stability selection», Journal of the Royal

Statistical Society. Series B (Statistical Methodology), vol. 72, no 4, p. 417–473. 7, 14, 18

Morris, J. A. et M. J. Gardner. 1988, «Calculating confidence intervals for relative risks (odds ratios) and standardised ratios and rates», British Medical Journal, vol. 296, p. 1313–1316. 86

Norén, G. N., A. Bate, R. Orre et I. R. Edwards. 2006, «Extending the methods used to screen the WHO drug safety database towards analysis of complex associations and improved accuracy for rare events», Statistics in Medicine, vol. 25, no 21, p. 3740– 3757. 5

Norén, G. N., J. Hopstadius, A. Bate, K. Star et I. R. Edwards. 2010, «Tem-poral pattern discovery in longitudinal electronic patient records», Data Mining and

Knowledge Discovery, vol. 20, no 3, p. 361–387. 79

Pacurariu, A. C., S. M. Straus, G. Trifirò, M. J. Schuemie, R. Gini, R. Herings, G. Mazzaglia, G. Picelli, L. Scotti, L. Pedersen, P. Arlett, J. van der Lei, M. C. Sturkenboom et P. M. Coloma. 2015, «Useful Inter-play Between Spontaneous ADR Reports and Electronic Healthcare Records in Signal Detection», Drug Safety, vol. 38, no 12, p. 1201–1210. 9, 109

Pariente, A., P. Avillach, F. Salvo, F. Thiessard, G. Miremont-Salamé,