• Aucun résultat trouvé

Apport et utilisation des méthodes d’inférence bayésienne dans le domaine des études cliniques diagnostiques

N/A
N/A
Protected

Academic year: 2021

Partager "Apport et utilisation des méthodes d’inférence bayésienne dans le domaine des études cliniques diagnostiques"

Copied!
333
0
0

Texte intégral

(1)Apport et utilisation des méthodes d’inférence bayésienne dans le domaine des études cliniques diagnostiques Sophie Bastide. To cite this version: Sophie Bastide. Apport et utilisation des méthodes d’inférence bayésienne dans le domaine des études cliniques diagnostiques. Médecine humaine et pathologie. Université Montpellier, 2016. Français. �NNT : 2016MONTT047�. �tel-01496778�. HAL Id: tel-01496778 https://tel.archives-ouvertes.fr/tel-01496778 Submitted on 27 Mar 2017. HAL is a multi-disciplinary open access archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.. L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés..

(2)  . .   .   'pOLYUpSDUO·8QLYHUVLWpGH0RQWSHOOLHU  . 3UpSDUpHDXVHLQGHO·pFROHGRFWRUDOH,QIRUPDWLRQ 6WUXFWXUHV6\VWqPHV L6

(3)  (WGHO·XQLWpGHUHFKHUFKH($²,85&  6SpFLDOLWp%LRVWDWLVWLTXH    . 3UpVHQWpHSDU6RSKLH%DVWLGH    .      . $SSRUWHWXWLOLVDWLRQGHV PpWKRGHVG·LQIpUHQFHED\pVLHQQH GDQVOHGRPDLQHGHV pWXGHVFOLQLTXHVGLDJQRVWLTXHV.     6RXWHQXHOHGpFHPEUHGHYDQWOHMXU\FRPSRVpGH  .   03DXO/$1'$,6383+8QLYHUVLWpGH0RQWSHOOLHU 0PH&KULVWLQH/$66(7383+8QLYHUVLWp&ODXGH%HUQDUG/\RQ 0%HKURX].$66$,.283$,383+8QLYHUVLWp&ODXGH%HUQDUG/\RQ 0-HDQ3LHUUH'$85Ë635pP8QLYHUVLWpGH0RQWSHOOLHU 0/DXUHQW%$,//<3+&+8GH1LFH. . .  'LUHFWHXU 5DSSRUWHXU 5DSSRUWHXU ([DPLQDWHXU ([DPLQDWHXU.

(4) Titre : Apport et utilisation des méthodes d’inférence bayésienne dans le domaine des études cliniques diagnostiques Résumé : Les études diagnostiques correspondent à l’ensemble des études cliniques qui ont pour objectif l’évaluation d’un nouveau test diagnostique. Dans la démarche d’évaluation, l’étape centrale est l’évaluation de la performance du nouveau test par estimation de sa sensibilité et de sa spécificité. De manière classique, la performance du nouveau test est évaluée par comparaison à un test de référence supposé parfait, appelé un « gold standard » qui permet la connaissance du statut réel de chaque sujet vis-à-vis de la pathologie étudiée. Cependant, dans de très nombreuses situations cliniques, différentes difficultés existent : l’absence de gold standard parfait, l’impossibilité de réalisation du gold standard à tous les sujets, la dépendance des résultats des tests réalisés, la variabilité de la sensibilité et/ou de la spécificité du test en fonction de certaines conditions de réalisation, la multiple réalisation du test dans le temps ou sa multiple interprétation. Une revue méthodologique systématique a été effectuée pour faire l’état des lieux des méthodes d’inférence bayésienne disponibles dans les études diagnostiques et de leur utilisation en pratique. Le focus sur les méthodes bayésiennes a été retenu du fait de leurs avantages théoriques contrastant avec leur relative sous-utilisation dans le domaine médical. Actuellement, de nombreuses méthodes ont été proposées pour répondre à ces différentes difficultés, avec des développements très complexes en cas de combinaison de plusieurs difficultés dans une même situation. Nous avons ainsi pu établir une cartographie des combinaisons de méthodes disponibles. Cependant leur utilisation en clinique reste encore limitée, même si elle est en augmentation ces dernières années. En pratique, nous avons été confrontés à la problématique du diagnostic de pneumopathie à Pneumocystis jirovecii (PJ) (champignon ubiquitaire opportuniste responsable de mycose profonde chez les patients immunodéprimés). Dans ce projet, nous disposions des résultats de quatre techniques de PCR (Polymerase chain reaction) différentes mais sans gold standard, avec la difficulté supplémentaire de dépendance conditionnelle entre les tests du fait du principe commun à l’origine de ces quatre tests. Deux développements ont été réalisés en parallèle pour répondre à cette problématique : d’une part, un travail sur les méthodes d’élicitation des informations a priori adaptées spécifiquement aux études diagnostiques, et d’autre part, un travail de mise en œuvre d’un modèle statistique adapté à la problématique de quatre tests dépendants en l’absence de gold standard. En l’absence de données informatives dans la littérature, l’élicitation des a priori, étape obligatoire pour l’utilisation des méthodes d’inférence bayésienne, est réalisée par l’interrogation d’experts du domaine. Notre travail a consisté en une adaptation des méthodes existantes, disponibles dans le domaine des essais cliniques, spécifiquement aux études diagnostiques pour obtenir des a priori informatifs. Cette méthode a été appliquée à notre cas des PCR diagnostiques pour PJ. L’estimation des performances diagnostiques des tests en l’absence de gold standard repose de manière efficiente sur les modèles à classes latentes. Trois modèles ont été développés pour le cas de deux tests diagnostiques : un modèle à indépendance conditionnelle, un modèle à dépendance conditionnelle à effets fixes et un modèle à dépendance conditionnelle à effets aléatoires. Nous proposons dans cette thèse une adaptation de ces trois modèles à la situation de quatre tests diagnostiques avec une formulation des paramètres permettant une interprétation clinique des covariances entre les tests dans un souci de transmission des méthodes de la théorie à la pratique. Une application et une comparaison de ces modèles ont été faites pour l’estimation des sensibilités et spécificités des quatre techniques de PCR à PJ en utilisant les a priori informatifs obtenus auprès des experts. Mots-clés : Inférence bayésienne ; Diagnostic ; Sensibilité ; Spécificité ; Élicitation ; A priori ; Modèles à classes latentes.

(5) Title : Contribution and use of Bayesian inference methods in the field of clinical diagnostic studies Abstract : Diagnostic studies include all clinical studies the aim of which is the evaluation of a new diagnostic test. In the evaluation process, the main step is the evaluation of the performance of the new test i.e. its sensitivity and specificity. Usually, the performance of a new test is assessed by comparison to a test of reference which is supposed to be perfect, i.e. a "gold standard", and specifies the actual patient’s status for the disease of interest ("Diseased" or "Not-Diseased" status). However, in many clinical situations, different pitfalls exist such as (i) a gold standard is not available, (ii) the gold standard is not applicable to all patients, (iii) a conditional dependence exists between test results, (iv) the performance of a test is not constant and depends on the conditions of achievement of the test, (v) the tests are repeated in time or by several machines or read by several readers, together with multiple interpretation of the results. A systematic methodological review has been performed to inventory all Bayesian inference methods available in the field of diagnostic studies and their use in practice. The focus on Bayesian methods was based on the theoretical advantages of these methods contrasting with their relative underutilization in the medical field. Finally, several interesting methods have been proposed to address methodological issues of diagnostic studies, with very complex developments when several issues were combined in the same clinical situation. We propose to map the development methods and combinations that have already been done or not. However, their clinical use is still limited, although it has increased in recent years. In practice, we met the problem of the diagnosis of pneumonia due to Pneumocystis jirovecii (PJ). PJ is an ubiquitous opportunistic fungus leading to deep mycosis in immunocompromised patients. In this study, the results of four PCR (polymerase chain reaction) assays were available, but without any gold standard, and the supplementary difficulty of conditional dependence between tests because the four tests were based on the same principle. Two works were performed in parallel to address this issue : on one hand, an adaptation of methods to elicit prior information specifically in diagnostic studies, and on the other hand, the implementation of specific Bayesian statistical models adapted to the context of four-dependent tests in the absence of gold standard. When informative information is not available in the literature, the elicitation of priors, the mandatory first step of a Bayesian inference, is carried out by registering experts’ beliefs in the field. Our work consisted in an adaptation of existing methods, available in clinical trials, specifically for diagnostic studies to obtain informative priors. We then applied this method to our four PJ PCR assays. Estimation of the diagnostic test performance in absence of gold standard is efficiently based on latent class models (LCM). Three LCM were developed for the case of two diagnostic tests : a simple LCM assuming conditional independence between tests, a fixed effects LCM and a random effects LCM providing an adjustment for conditional dependence between tests. We extended these three models to a situation where four diagnostic tests are involved and proposed a formulation that enables an interpretation of between tests covariances in a clinical perspective in order to bind theory to practice. These models were then applied and compared in an estimation study of the sensitivities and specificities of the four PJ PCR assays, by using informative priors obtained from experts. Keywords : Bayesian inference ; Diagnosis ; Sensitivity ; Specificity ; Elicitation ; Prior ; Latent class models.

(6) Remerciements Cette thèse est l’aboutissement d’une nouvelle étape de mon parcours universitaire et professionnel, l’aboutissement de quatre années de « recherche » après déjà les dix années d’études de médecine et de spécialisation en Santé Publique. Ce parcours et sa concrétisation n’auraient toutefois pas été possibles sans la contribution non négligeable de nombreuses personnes. Je souhaite tout particulièrement adresser mes remerciements : À Paul Landais, qui a accepté de m’encadrer pour ce travail, dont les enseignements précieux et divers me resteront et dont je dois saluer le flegme britannique qui me fait parfois tout-à-fait défaut. À Christine Lasset et Behrouz Kassai Koupai qui ont accepté de lire, commenter et juger ce travail. J’espère que le chemin parcouru depuis le début de mon internat les aura réjouis. À Laurent Bailly qui a accepté de lire et juger ce travail. À Jean-Pierre Daurès qui a accepté de lire et juger ce travail, mais qui m’a surtout donné l’opportunité de m’engager dans la voie hospitalo-universitaire. Merci également pour son soutien et son aide durant ces quatre années, notamment dans les phases de doutes et de difficultés. Aux différentes équipes de Lyon qui m’ont accueillie et formée pendant mon internat, en particulier le service de biostatistique, sans qui je ne serais pas là où j’en suis. Aux différents médecins, pharmaciens et professionnels de santé du CHU de Nîmes avec qui j’ai eu l’honneur et le plaisir de travailler depuis cinq ans pour différents projets de recherche ; ce sont ces collaborations et questionnements qui nous permettent à tous d’avancer. À Laurence et Milène sans qui la problématique de cette thèse n’aurait pas germé. À tous mes collègues thésards qui ont partagé ces quatre années d’aventure riche en émotions, aux teintes de « galère » quand même de temps à autre. Traverser cela ensemble a été pour moi une grande source de réconfort. À tous les membres présents et passés du BESPIM, de la DRC et de l’IURC, quel que soit leur statut, qui ont tous à leur façon participé à cet aboutissement, par leur soutien, leur. 4.

(7) sympathie, leurs encouragements, leur écoute ou tout simplement leur présence, notamment dans les phases de profonde remise en question. Merci pour tous les moments de convivialité partagés et nos conversations parfois animées. Mention spéciale à Sandrine, Geneviève et Sylvie pour leur assistance à maintes et maintes reprises dans les difficultés organisationnelles et les soucis du quotidien. À Pascale pour sa bienveillance positive, son aide constante et ses conseils avisés, mais aussi pour tous les bons moments non professionnels partagés. À mes amis pour leur présence à mes cotés, leur fidélité et leur soutien indéfectible même si la finalité d’un tel travail ne leur était pas toujours évidente. Je nous souhaite encore de nombreuses années à partager remplies de petits et grands instants mémorables. À Sophie, Sandrine, Stéphanie, Léonie et Mariella pour, tour à tour, leurs « boulettes » rafraîchissantes du quotidien qui n’ont pas leur pareil pour dérider une journée, leur écoute patiente et compréhensive de mes éternelles questions existentielles, et leurs directs et précieux conseils pour toujours faire en sorte que jamais je ne me laisse abattre. À ma famille pour leur soutien et leur affection sans failles depuis toujours. À Benjamin, Fanny, Papa et Maman pour ne jamais cesser de croire en moi même dans mes phases de doute. Je leur dédie cette « nouvelle » thèse en gage de ma profonde reconnaissance et de ma tendresse.. 5.

(8) À tous les miens présents dans mon cœur, Ici ou ailleurs.... 6.

(9) Table des matières Table des matières. 7. Liste des abréviations. 11. Liste des figures. 13. Liste des tableaux. 15. Introduction. 16. I. Comparaison de quatre techniques de RT-PCR pour le thie à Pneumocystis jirovecii I.1 Introduction . . . . . . . . . . . . . . . . . . . . . . I.2 Méthodes . . . . . . . . . . . . . . . . . . . . . . . I.2.1 Design . . . . . . . . . . . . . . . . . . . . I.2.2 Population . . . . . . . . . . . . . . . . . . I.2.3 Analyses microbiologiques . . . . . . . . . . I.2.4 Interprétation clinique du statut des patients . I.2.5 Analyses statistiques . . . . . . . . . . . . . I.2.6 Taille de l’échantillon . . . . . . . . . . . . I.3 Résultats . . . . . . . . . . . . . . . . . . . . . . . . I.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . I.4.1 Problématique spécifique . . . . . . . . . . . I.4.2 Problématique générale . . . . . . . . . . . .. diagnostic de pneumopa. . . . . . . . . . . .. . . . . . . . . . . . .. . . . . . . . . . . . .. . . . . . . . . . . . .. . . . . . . . . . . . .. . . . . . . . . . . . .. . . . . . . . . . . . .. . . . . . . . . . . . .. . . . . . . . . . . . .. . . . . . . . . . . . .. . . . . . . . . . . . .. . . . . . . . . . . . .. . . . . . . . . . . . .. . . . . . . . . . . . .. II Méthodes bayésiennes et études diagnostiques : historique et revue systématique II.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . II.2 Historique de l’apparition et de l’évolution des méthodes d’inférence bayésienne II.3 Revue méthodologique systématique . . . . . . . . . . . . . . . . . . . . . . . II.3.1 Objectifs de la recherche . . . . . . . . . . . . . . . . . . . . . . . . . II.3.2 Matériel et méthodes . . . . . . . . . . . . . . . . . . . . . . . . . . . II.3.2.1 Méthodologie . . . . . . . . . . . . . . . . . . . . . . . . . 7. 23 23 26 26 26 26 27 28 28 29 33 33 34 36 36 39 42 42 42 42.

(10) II.3.3 II.3.4 II.3.5. II.3.2.2 Identification des articles . . . II.3.2.3 Sélection des articles à inclure II.3.2.4 Extraction des données . . . . II.3.2.5 Gestion du flux des données . . II.3.2.6 Analyse des données . . . . . . Article . . . . . . . . . . . . . . . . . . Résultats complémentaires . . . . . . . . Conclusion . . . . . . . . . . . . . . . .. . . . . . . . .. . . . . . . . .. . . . . . . . .. . . . . . . . .. . . . . . . . .. . . . . . . . .. . . . . . . . .. . . . . . . . .. . . . . . . . .. . . . . . . . .. . . . . . . . .. . . . . . . . .. . . . . . . . .. . . . . . . . .. . . . . . . . .. . . . . . . . .. 43 46 49 50 51 53 92 97. III Méthodes d’élicitation des a priori pour l’inférence bayésienne dans les études diagnostiques 98 III.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 III.2 Méthodes d’élicitation des a priori pour l’inférence bayésienne . . . . . . . . . 100 III.2.1 Principe général . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100 III.2.2 Recommandations méthodologiques . . . . . . . . . . . . . . . . . . . 101 III.2.3 Principaux outils de recueil disponibles . . . . . . . . . . . . . . . . . 104 III.3 Étude d’élicitation des a priori pour une étude diagnostique . . . . . . . . . . . 105 III.3.1 Objectifs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 III.3.2 Méthodes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 III.3.2.1 Recrutement des experts . . . . . . . . . . . . . . . . . . . . 106 III.3.2.2 Recueil des croyances des experts . . . . . . . . . . . . . . . 107 III.3.2.3 Agrégation des données . . . . . . . . . . . . . . . . . . . . 108 III.3.2.4 Élicitation des a priori . . . . . . . . . . . . . . . . . . . . . 108 III.3.3 Article . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 III.3.4 Résultats complémentaires . . . . . . . . . . . . . . . . . . . . . . . . 139 III.3.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141 IV Modèles à classes latentes pour l’évaluation de quatre tests diagnostiques dépendants en l’absence de gold standard 142 IV.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142 IV.2 Description des différents modèles à classes latentes utilisés et proposés . . . . 144 IV.2.1 Modèles à classes latentes classiques pour l’évaluation de deux tests diagnostiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144 IV.2.1.1 Modèle à indépendance conditionnelle . . . . . . . . . . . . 144 IV.2.1.2 Modèle à dépendance conditionnelle à effets fixes . . . . . . 146 IV.2.1.3 Modèle à dépendance conditionnelle à effets aléatoires . . . 151 IV.2.2 Modèles à classes latentes adaptés pour l’évaluation de quatre tests diagnostiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156 IV.2.2.1 Modèle à indépendance conditionnelle . . . . . . . . . . . . 156 IV.2.2.2 Modèle à dépendance conditionnelle à effets fixes . . . . . . 157 8.

(11) IV.2.2.3 Modèles de Berkvens . . . . . . . . . . . . . . . . . . . . . 163 IV.2.2.4 Modèle à dépendance conditionnelle à effets aléatoires . . . 167 IV.3 Analyses statistiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171 IV.3.1 Définition du modèle . . . . . . . . . . . . . . . . . . . . . . . . . . . 171 IV.3.2 Définition des distributions a priori . . . . . . . . . . . . . . . . . . . 172 IV.3.3 Estimation des distributions a posteriori par simulations numériques avec des MCMC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173 IV.3.4 Vérifications du modèle . . . . . . . . . . . . . . . . . . . . . . . . . 173 IV.3.5 Caractérisation des distributions a posteriori . . . . . . . . . . . . . . 175 IV.3.6 Validation du modèle . . . . . . . . . . . . . . . . . . . . . . . . . . . 175 IV.4 Résultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176 IV.4.1 Résultats complémentaires d’élicitation des a priori à partir des croyances des experts . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177 IV.4.2 Résultats de l’évaluation des quatre tests diagnostiques par comparaisons deux à deux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179 IV.4.3 Résultats de l’évaluation des quatre tests diagnostiques par comparaison directe globale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188 IV.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197 IV.5.1 Conclusion méthodologique . . . . . . . . . . . . . . . . . . . . . . . 197 IV.5.2 Conclusion clinique . . . . . . . . . . . . . . . . . . . . . . . . . . . 197 V Conclusions et perspectives V.1 Conclusion générale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . V.2 Perspectives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . V.2.1 Étude de simulations pour l’évaluation théorique des modèles à classes latentes pour quatre tests . . . . . . . . . . . . . . . . . . . . . . . . . V.2.2 Élicitation des croyances des experts concernant les covariances et incorporation de ces a priori . . . . . . . . . . . . . . . . . . . . . . . . V.2.3 Extension des méthodes d’évaluation des performances diagnostiques aux tests semi-quantitatifs . . . . . . . . . . . . . . . . . . . . . . . . Bibliographie. 199 199 200 200 201 202 203. A Article original de l’étude clinique de comparaison de quatre techniques de RTPCR pour le diagnostic de la pneumopathie à Pneumocystis jirovecii 212 B Grille de lecture de la revue méthodologique systématique. 220. C Matériel supplémentaire de l’article de revue méthodologique systématique. 247. 9.

(12) D Exemples de deux outils de recueil des croyances des experts pour une étude d’élicitation des a priori par interrogation des experts du domaine 266 D.1 Exemple de la méthode « bins and chips » pour le recueil des croyances d’experts267 D.2 Exemple de la méthode d’échelle de poids avec des « bins » pour le recueil des croyances d’experts . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 268 E Documents réglementaires du protocole de l’étude d’élicitation des a priori pour l’inférence bayésienne par interrogation d’experts du domaine pour une étude diagnostique 269 F Questionnaire pour les experts de l’étude d’élicitation des a priori. 279. G Matériel supplémentaire de l’article d’élicitation des a priori pour l’inférence bayésienne par interrogation d’experts du domaine dans les études diagnostiques 288 H Formalisation d’un DAG. 299. I. Description complémentaire des modèles de Berkvens 302 I.1 Définition des 31 probabilités conditionnelles du modèle de Berkvens complet . 303 I.2 Définition des contraintes utilisées pour définir le modèle de Berkvens contraint en modèle à indépendance conditionnelle . . . . . . . . . . . . . . . . . . . . 305. J. Code BUGS intégral des huit modèles utilisés J.1 MCL à indépendance conditionnelle pour deux tests . . . . . . . . . . . J.2 MCL à dépendance conditionnelle à effets fixes pour deux tests . . . . . J.3 MCL à dépendance conditionnelle à effets aléatoires pour deux tests . . J.4 MCL à indépendance conditionnelle pour quatre tests . . . . . . . . . . J.5 MCL à dépendance conditionnelle à effets fixes pour quatre tests . . . . J.6 MCL à dépendance conditionnelle à effets aléatoires pour quatre tests . J.7 Modèle de Berkvens contraint en modèle à indépendance conditionnelle J.8 Modèle de Berkvens complet . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . .. . . . . . . . .. . . . . . . . .. . . . . . . . .. 306 307 308 309 311 313 317 322 324. K Analyse de sensibilité de l’impact de la prévalence sur la robustesse des résultats de sensibilités et spécificités des quatre tests diagnostiques par comparaisons deux à deux 327 L Analyse de sensibilité de l’impact de la prévalence sur la robustesse des résultats de sensibilités et spécificités des quatre tests diagnostiques par comparaison directe globale 330. 10.

(13) Liste des abréviations – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – –. ADN : Acide désoxyribonucléique AIC : Akaike Information Criterion ANAES : Agence Nationale d’Accréditation et d’Évaluation en Santé ANOFEL : Association française des enseignants de Parasitologie et Mycologie BPCO : Broncho-pneumopathie chronique obstructive BUGS : Bayesian inference Using Gibbs Sampling CHU : Centre hospitalo-universitaire CI : Critère d’inclusion CNIL : Commission nationale de l’informatique et des libertés Ct : Cycle threshold DAG : Directed Acyclic Graph ddl : Degré de liberté DIC : Deviance Information Criterion DM : Données manquantes DNA : Deoxyribonucleic acid e-CRF : Case reporting form électronique EBELPRI : Experts’ belief elicitation for Bayesian priors ECG : Électrocardiogramme EEG : Électroencéphalogramme EVA : Échelle visuelle analogique FN : Faux négatifs FP : Faux positifs GG : Gomori-Grocott IC 95% : Intervalle de confiance à 95% ICr 95% : Intervalle de crédibilité à 95% IRM : Imagerie par résonance magnétique ISBA : International Society for Bayesian Analysis ISCB : International Society for Clinical Biostatisitcs ISI : Institute for Scientific Information JCM : Journal of Clinical Microbiology LBA : Lavage broncho-alvéolaire 11.

(14) – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – – –. LCR : Liquide céphalo-rachidien LCM : Latent class model M : Statut du sujet vis-à-vis de la pathologie étudiée MCL : Modèle à classes latentes MCMC : Markov chain Monte-Carlo MeSH : Medical Subject Headings MGG : May-Grünwald-Giemsa MSE : Mean square error NC : Non classé pbay : p-value bayésienne PCP : Pneumocystis pneumonia PCR : Polymerase chain reaction PJ : Pneumocystis jirovecii PPJ : Pneumopathie à Pneumocystis jirovecii PRISMA : Preferred Reporting Items for Systematic reviews and Meta-Analyses ROBUST : Reporting Of Bayes Used in clinical STudies ROC : Receiver Operating Characteristic RT : Radiographie thoracique RT-PCR : Real time polymerase chain reaction SAMPL : Statistical Analyses and Methods in the Published Literature SCT : Society for Clinical Trials Se : Sensibilité Se j : Sensibilité du test j SIGAPS : Système d’interrogation, de gestion et d’analyse des publications scientifiques Sp : Spécificité Sp j : Spécificité du test j SSc-PAH : systemic sclerosis associated pulmonary arterial hypertension (hypertension artérielle pulmonaire chez des patients atteints de sclérodermie) STARD : Standards for Reporting of Diagnostic Accuracy T : test diagnostique T j : test diagnostique j TDM : Tomodensitométrie TDM Th : Tomodensitométrie thoracique VIH : Virus de l’immuno-déficience humaine VN : Vrais négatifs VP : Vrais positifs. 12.

(15) Liste des figures 1 2 3 4. I.1 I.2. Étapes clefs de la démarche médicale . . . . . . . . . . . . . . . . . . . . . . Différentes phases d’études de la démarche d’évaluation diagnostique d’un nouveau test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tableau de contingence pour l’évaluation des performances d’un nouveau test diagnostique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tableau de contingence pour la comparaison de deux tests diagnostiques sans gold standard . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Flow chart des inclusions dans l’étude . . . . . . . . . . . . . . . . . . . . . . Tableaux de contingence de comparaison deux à deux des quatre techniques de RT-PCR pour la détection de PJ . . . . . . . . . . . . . . . . . . . . . . . . .. II.1 Frise chronologique de l’apparition et de l’évolution des méthodes d’inférence bayésienne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . II.2 Quatre grandes étapes de la méthodologie de la revue bibliographique systématique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . II.3 Schéma du processus de sélection . . . . . . . . . . . . . . . . . . . . . . . .. 16 18 19 21 29 32. 41 43 47. III.1 Cinq grandes étapes de la méthodologie d’élicitation des a priori pour l’inférence bayésienne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101 III.2 Biais spécifiques des études d’élicitation des a priori pour l’inférence bayésienne par interrogation d’experts du domaine . . . . . . . . . . . . . . . . . . 102 IV.1 Tableau de contingence pour la comparaison de deux tests diagnostiques sans gold standard avec les variables latentes . . . . . . . . . . . . . . . . . . . . . IV.2 Modèle à classes latentes à indépendance conditionnelle pour deux tests . . . . IV.3 Modèle à classes latentes à dépendance conditionnelle à effets fixes pour deux tests . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . IV.4 Modèle à classes latentes à dépendance conditionnelle à effets aléatoires pour deux tests . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . IV.5 Modèle à classes latentes à indépendance conditionnelle pour quatre tests . . . IV.6 Modèle à classes latentes à dépendance conditionnelle à effets fixes pour quatre tests . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13. 144 147 150 154 158 162.

(16) IV.7 Modèle à classes latentes de Berkvens complet . . . . . . . . . . . . . . . . . IV.8 Modèle à classes latentes de Berkvens contraint en modèle à indépendance conditionnelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . IV.9 Modèle à classes latentes à dépendance conditionnelle à effets aléatoires pour quatre tests . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . IV.10 Distributions a posteriori en densité marginale des sensibilités et spécificités des quatre tests diagnostiques par comparaisons deux à deux . . . . . . . . . . IV.11 Simulations du « posterior checking » des profils de réponses aux tests pour chaque comparaison deux à deux . . . . . . . . . . . . . . . . . . . . . . . . . IV.12 Analyse de sensibilité de l’impact de la quantité d’information a priori apportée sur la robustesse des résultats de sensibilités et spécificités des quatre tests diagnostiques par comparaisons deux à deux . . . . . . . . . . . . . . . . . . . IV.13 Distributions a posteriori en densité marginale des sensibilités et spécificités des quatre tests diagnostiques par comparaison directe globale . . . . . . . . . IV.14 Simulations du « posterior checking » des 16 profils de réponses aux quatre tests par comparaison directe globale . . . . . . . . . . . . . . . . . . . . . . . . . IV.15 Analyse de sensibilité de l’impact de la quantité d’information a priori apportée sur la robustesse des résultats de sensibilités et spécificités des quatre tests diagnostiques par comparaison directe globale . . . . . . . . . . . . . . . . . .. 164 166 169 183 185. 187 192 194. 196. D.1 Exemple de la méthode « bins and chips » pour le recueil des croyances d’experts267 D.2 Exemple de la méthode d’échelle de poids avec des « bins » pour le recueil des croyances d’experts . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 268 K.1 Analyse de sensibilité de l’impact de la prévalence sur la robustesse des résultats de sensibilités et spécificités des quatre tests diagnostiques par comparaisons deux à deux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 329 L.1 Analyse de sensibilité de l’impact de la prévalence sur la robustesse des résultats de sensibilités et spécificités des quatre tests diagnostiques par comparaison directe globale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 332. 14.

(17) Liste des tableaux I.1 I.2 I.3 I.4. Seuils d’interprétation des mesures de concordance . . . . . . . . . . . . . . . Caractéristiques des sujets inclus . . . . . . . . . . . . . . . . . . . . . . . . . Interprétation clinique du statut des patients analysés . . . . . . . . . . . . . . Résultats des concordances deux à deux entre les quatre techniques de RT-PCR pour la détection de PJ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Profils de réponse aux quatre techniques de RT-PCR . . . . . . . . . . . . . . .. 33 35. II.1 Mots-clefs et anti-mots-clefs retenus pour la stratégie de recherche systématique avec des mots-clefs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . II.2 Grands groupes de données à recueillir en fonction du type d’article . . . . . . II.3 Caractéristiques complémentaires des articles inclus . . . . . . . . . . . . . . . II.4 Descriptif détaillé des spécialités médicales des applications . . . . . . . . . . II.5 Descriptif détaillé du ou des tests diagnostiques évalués . . . . . . . . . . . . . II.6 Descriptif détaillé des 10 catégories de méthodes bayésiennes . . . . . . . . . .. 44 52 93 94 95 96. I.5. 28 31 33. III.1 Biais spécifiques des études d’élicitation des a priori par interrogation d’experts et les recommandations méthodologiques pour les éviter . . . . . . . . . . . . 103 III.2 Synthèse bibliographique des a priori disponibles concernant les sensibilités et spécificités des quatre techniques de RT-PCR . . . . . . . . . . . . . . . . . . 140 IV.1 Modèle à classes latentes à indépendance conditionnelle pour deux tests . . . . IV.2 Modèle à classes latentes à dépendance conditionnelle à effets fixes pour deux tests . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . IV.3 Dénombrement des différents éléments des modèles à classes latentes en fonction du nombre de tests à comparer . . . . . . . . . . . . . . . . . . . . . . . . IV.4 Estimations des hyperparamètres de l’ensemble des distributions a priori élicitées à partir des croyances des experts . . . . . . . . . . . . . . . . . . . . . . IV.5 Résultats des estimations des trois modèles pour chacune des comparaisons deux à deux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . IV.6 Résultats des estimations des trois modèles pour la comparaison directe des quatre tests . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 145 148 156 178 181 190. H.1 Exemples de relations possibles dans un DAG avec trois nœuds . . . . . . . . . 300 15.

(18) Introduction Au sein de toute démarche médicale, la prise en charge des patients se fonde sur trois grandes étapes clefs : (i) établir un diagnostic ; (ii) formuler un pronostic ; et (iii) prendre une décision thérapeutique [1]. Cependant, cette démarche n’est pas figée. Elle est en permanence adaptative et évolutive, passant du diagnostic initial d’une pathologie, avec son traitement initial, à d’éventuelles complications ou rechutes entrecoupées de rémissions, le tout nécessitant une mise à jour du diagnostic, donc du pronostic, avec les adaptations thérapeutiques nécessaires. La démarche médicale peut donc être résumée comme une démarche cyclique de trois étapes clefs étroitement intriquées (figure 1).. ƚĂďůŝƌƵŶ ĚŝĂŐŶŽƐƚŝĐ &ŽƌŵƵůĞƌƵŶ ƉƌŽŶŽƐƚŝĐ. WƌĞŶĚƌĞƵŶĞ ĚĠĐŝƐŝŽŶ ƚŚĠƌĂƉĞƵƚŝƋƵĞ. F IGURE 1 – Étapes clefs de la démarche médicale. Établir un diagnostic est l’étape fondamentale de la démarche médicale puisqu’elle conditionne directement les deux autres. Un diagnostic a pour but d’établir la présence initiale d’un 16.

(19) état du sujet considéré, classiquement la présence d’une pathologie, mais plus largement d’un phénomène de santé. Un diagnostic peut être simple, clinique et direct (comme, par exemple, le rash cutané d’une maladie éruptive), ou à l’inverse reposer sur des examens complémentaires, des examens de laboratoire (comme, par exemple, la sérologie pour le diagnostic d’infection à VIH) ou des examens d’imagerie (comme, par exemple, l’angio-IRM pour le diagnostic d’hémorragie cérébrale), parfois complexes, invasifs ou chers. Le raisonnement de cette démarche diagnostique se base, en fait, sur une suite de constructions logiques, complexes et variées de tests diagnostiques aboutissant au final à une règle de décision. Dans tous les cas, établir un diagnostic se fonde sur l’utilisation d’un ou plusieurs tests diagnostiques. Un test diagnostique est par définition tout signe ou examen dont le résultat va, d’une part, apporter de l’information sur l’état d’un patient (« Apport informationnel ») et, d’autre part, influencer et améliorer sa prise en charge : décisions diagnostiques, pronostiques et thérapeutiques (« Apport décisionnel »). Les tests diagnostiques sont multiples et variés, de natures et types différents. Différents grands groupes peuvent être décrits : (i) les symptômes (signes cliniques tels que ressentis et exprimés par le sujet lui-même), (ii) les signes d’examen (signes cliniques recueillis lors d’un examen clinique), (iii) les examens biologiques (mesures d’un paramètre biologique à partir d’un des liquides biologiques du sujet, que ce soit le sang, le sérum, le plasma, les urines, le LCR, ...), (iv) les examens microbiologiques (mises en évidence d’un micro-organisme, ou d’un de ses constituants, dans un prélèvement biologique), (v) les examens d’imagerie, (vi) les examens cytologiques ou histologiques, (vii) les examens fonctionnels (ECG, examen d’effort, EEG, ...), (viii) les questionnaires, ... Mais pour pouvoir être utile pour établir un diagnostic approprié, un test diagnostique doit être de qualité, être fiable, avoir de bonnes performances... En bref, il faut qu’il ait été rigoureusement évalué avec une démarche d’évaluation complète et précise. Les études diagnostiques correspondent à l’ensemble des études cliniques qui ont pour objectif l’évaluation d’un nouveau test diagnostique. Ces études peuvent être classées en différentes phases en fonction de leur objectif principal [2–4] ; l’ensemble compose la démarche d’évaluation diagnostique d’un nouveau test. Le figure 2 présente synthétiquement les différentes phases de cette démarche. L’étape centrale, qui est celle qui nous intéresse dans cette thèse, est l’étape d’évaluation de la validité d’un nouveau test diagnostique, c’est-à-dire l’évaluation de sa performance diagnostique (études diagnostiques de phases II et III) [2, 4]. La performance d’un test diagnostique. 17.

(20) ĐĐƵŵƵůĂƚŝŽŶĚĞƉƌĞƵǀĞƐ. ƚƵĚĞƐƉƌĠͲ ĚŝĂŐŶŽƐƚŝƋƵĞƐ. ƚƵĚĞƐĚŝĂŐŶŽƐƚŝƋƵĞƐ. ŽƸƚͲ ĞĨĨŝĐĂĐŝƚĠ /ŵƉĂĐƚ sĂůŝĚŝƚĠ;ϮͿ &ŝĂďŝůŝƚĠ ZĞƉƌŽĚƵĐƚŝďŝůŝƚĠ WƌĠĐŝƐŝŽŶ WƌĠͲĚŝĂŐ. /ŶƚĠƌġƚ. WŚĂƐĞ/. sĂůŝĚŝƚĠ;ϭͿ. WŚĂƐĞ//. WŚĂƐĞ///. WŚĂƐĞ/s. WŚĂƐĞs. 'ƌĂŶĚĞƐƉŚĂƐĞƐĚĞůĂĚĠŵĂƌĐŚĞĚŝĂŐŶŽƐƚŝƋƵĞ. F IGURE 2 – Différentes phases d’études de la démarche d’évaluation diagnostique d’un nouveau test (Pré-diag : pré-diagnostique) La formalisation de la démarche d’évaluation diagnostique d’un nouveau test en différentes « phases » [2, 4] dérivent de la classification existante en recherche clinique thérapeutique avec les différentes phases d’évaluation d’un nouveau médicament. est définie par sa sensibilité et de sa spécificité [4, 5] . De manière classique, un nouveau test diagnostique est évalué par comparaison à un test de référence supposé parfait, appelé un « gold standard ». Ce gold standard est appliqué à tous les sujets de l’étude pour permettre la connaissance du statut réel de chaque sujet (statut « malade » ou « non malade ») à partir duquel il est possible d’estimer la performance du nouveau test : sa sensibilité (capacité du test à correctement détecter les malades) et sa spécificité (capacité du test à correctement détecter les non malades). L’analyse statistique de ces études diagnostiques (pour rappel, nous nous limitons aux études de phase II et III) reposent sur des méthodes simples et universelles développées à partir d’un tableau de contingence classique. La formalisation du tableau de contingence diagnostique est présentée dans la figure 3 avec les définitions des effectifs et des différentes notations classiques utilisées. Les estimations des paramètres d’intérêt, à savoir la sensibilité du test (notée Se) et la spécificité du test (notée Sp), sont ensuite obtenues grâce aux équations 1 et 2. Le dernier paramètre d’intérêt à définir dans une étude diagnostique est la prévalence de la maladie, notée. 18.

(21) Dн. Dʹ. dŽƚĂů. dн. sW. &W. Ŷϭ. dʹ. &E. sE. ŶϬ. dŽƚĂů. ŵϭ. ŵϬ. E. F IGURE 3 – Tableau de contingence pour l’évaluation des performances d’un nouveau test diagnostique M représente le statut réel des patients vis-à-vis de la pathologie étudiée ; il est défini par le gold standard et a deux modalités de réponse possibles : positif (« + ») = statut « malade » ou négatif (« – ») = statut « non malade ». T représente le test à évaluer avec également deux modalités de réponse possibles : positif (« + ») ou négatif (« – »). Différents effectifs sont ainsi définis : les vrais positifs (VP), les faux positifs (FP), les faux négatifs (FN) et les vrais négatifs (VN). Sont aussi définis m1 le nombre de malades, m0 le nombre de non malades, n1 le nombre de tests positifs, n0 le nombre de tests négatifs et N l’effectif total de l’étude. π, et estimée suivant l’équation 3. Une attention toute particulière doit lui être apportée quant à son interprétation. Dans une étude diagnostique, la P (M+) ne peut en fait s’interpréter en termes de prévalence de la maladie que si le design de l’étude permet d’assurer l’inclusion d’un échantillon représentatif de la population cible, c’est-à-dire que le processus de sélection des sujets ne fait pas du tout intervenir le statut « malade » ou « non malade » de chacun d’entre eux. Si ce n’est pas le cas, ce paramètre est directement le reflet de ce processus de sélection et ne peut absolument pas être interprété en termes de prévalence. Cette notion d’échantillon représentatif ou non est ce qui signe la distinction entre les études diagnostiques de phase II (non représentatives) et les études de phase III (représentatives).. Se = P (T + | M+) =. VP V P + FN. (1). Sp = P (T − | M−) =. VN V N + FP. (2). m1 N. (3). π = P (M+) =. 19.

(22) Malheureusement, dans de très nombreuses situations cliniques, différents problèmes ou difficultés méthodologiques existent. Cette méthode simple d’estimation des performances diagnostiques d’un nouveau test ne peut donc être appliquée en l’état, et des méthodes plus complexes doivent être entreprises pour permettre d’obtenir des estimations non biaisées des résultats. En essayant de classer ces difficultés, nous pouvons citer : – L’absence de gold standard [6, 7] ; – Les biais de vérification partiel (quand le gold standard ne peut pas être vérifié chez tous les sujets) ou différentiel (quand tous les sujets ne sont pas vérifiés avec le même gold standard) [7, 8] ; – La dépendance conditionnelle entre les tests [9] ; – La répétition des tests avec des résultats multiples : répétition de réalisation du test dans le temps ou avec plusieurs machines, interprétations multiples avec plusieurs lecteurs... – La variabilité de la sensibilité et/ou de la spécificité du test en fonction de certaines conditions de réalisation de celui-ci ou du stade de gravité de la maladie [10, 11]. De plus, ces différentes difficultés peuvent être combinées dans une même situation clinique d’évaluation. L’absence de gold standard est, par définition, le principal de ces problèmes parce qu’il remet directement en cause le principe de l’analyse statistique des études diagnostiques. S’il n’existe pas de gold standard, il n’y a aucun moyen de connaître le statut réel des sujets, et le nouveau test diagnostique ne peut être comparé qu’à un test de référence imparfait. Cela conduit à un biais de classement parfois non négligeable dans l’estimation des performances diagnostiques du nouveau test, les résultats discordants étant forcément interprétés comme une erreur du nouveau test, alors que cela pourrait correspondre à des erreurs du test de référence. Les performances du nouveau test sont ainsi artificiellement limitées par celles du test de référence et il n’est jamais possible de montrer qu’un nouveau test est meilleur que le test de référence. Différentes méthodes ont été développées dans cette situation [6, 7] avec comme principe commun d’abandonner l’approche classique de comparaison d’un nouveau test à un test de référence (T vs M), mais de construire un test de référence à partir de deux tests imparfaits (T1 vs T2 ). Le statut vis-à-vis de la maladie devient alors une variable non observée ou variable latente, formellement une variable à deux classes latentes (« malade » et « non malade »). La nouvelle formalisation du tableau de contingence diagnostique est présentée dans la figure 4 avec les définitions des nouveaux effectifs et des notations utilisées. Dans cette configuration, cinq para-. 20.

(23) dϮ н. dϮ ʹ. dŽƚĂů. dϭ н. Ƶ. ǀ. Ƶнǀ. dϭ ʹ. ǁ. dž. ǁнdž. dŽƚĂů. Ƶнǁ. ǀнdž. E. F IGURE 4 – Tableau de contingence pour la comparaison de deux tests diagnostiques sans gold standard T1 et T2 représentent les deux tests à comparer, avec chacun, deux modalités de réponse possibles positif « + » (ou « 1 ») ou négatif « – » (ou « 0 »). Les différents effectifs ainsi définis sont : u, v, w et x les effectifs observés des profils de réponse (respectivement pour les profils « 11 », « 10 », « 01 » et « 00 »), et N l’effectif total de l’étude. mètres sont à estimer : la prévalence de la maladie π (avec la même précaution d’interprétation expliquée précédemment), la sensibilité et spécificité du premier test Se1 et Sp1 , et la sensibilité et spécificité du deuxième test Se2 et Sp2 . Ce qui est non identifiable en l’état avec seulement les trois degrés de liberté (ddl) d’un tableau de contingence à quatre cases. En effet, pour être identifiable en l’état, le nombre de ddl doit être supérieur ou égal au nombre de paramètres à es timer, sachant que le nombre de degrés de liberté de liberté se calcule suivant 2J − 1 × P, avec. J le nombre de tests et P le nombre de populations. Les différentes méthodes possibles pour résoudre cette problématique, dans ce concept des modèles à classes latentes (MCL) [7, 12–15], sont : (i) ajouter des contraintes sur certains paramètres, (ii) augmenter le nombre de degrés de liberté en appliquant plus de deux tests à cette même population, (iii) augmenter le nombre de degrés de liberté en appliquant les deux mêmes tests à plusieurs populations (plus d’une population), mais ces deux solutions imposent d’avoir la possibilité de modifier le design de l’étude [12–15], ou (iv) apporter aux données de l’information extérieure supplémentaire en utilisant de l’information a priori avec une méthode d’inférence bayésienne [15–17]. En pratique, nous avons été confrontés dans une étude clinique à la problématique méthodologique d’évaluation de quatre nouveaux tests diagnostiques microbiologiques, mais sans gold standard, et avec la difficulté supplémentaire potentielle de dépendance conditionnelle entre les tests. C’est l’élaboration d’une stratégie d’évaluation de cette problématique méthodologique en plusieurs étapes qui constitue le travail de cette thèse. Dans le chapitre I de ce mémoire de thèse, nous allons tout d’abord présenter l’étude clinique qui nous a amené à cette problématique méthodologique statistique. Le protocole de cette. 21.

(24) étude et l’analyse statistique initiale réalisée vont être synthétiquement exposés, ainsi que ses limites et la problématique statistique subsidiaire. Cette première analyse a fait l’objet d’un article original publié dans Journal of Clinical Microbiology. Les méthodes statistiques d’inférence bayésienne sont intéressantes dans les études diagnostiques notamment pour les MCL en l’absence de gold standard [15]. Faire un état des lieux précis de ces méthodes était un point de départ nécessaire pour notre travail. Le chapitre II présente ainsi une revue des méthodes bayésiennes appliquées au domaine des études cliniques diagnostiques en se basant, d’une part, sur un rappel historique du développement des méthodes statistiques d’inférence bayésienne, et d’autre part, sur une étude de revue bibliographique méthodologique systématique des méthodes bayésiennes appliquées au domaine des études cliniques diagnostiques. Le résultat de cette étude fait l’objet d’un article en cours de reviewing dans la revue PLoS ONE. Les chapitres III et IV présentent ensuite les deux développements méthodologiques et statistiques spécifiques réalisés en parallèle pour répondre à cette problématique, avec leur application respective aux données de l’étude clinique microbiologique. Le chapitre III présente notre travail concernant l’étape d’élicitation des a priori, première étape obligatoire pour l’utilisation des méthodes d’inférence bayésienne. En l’absence de données suffisantes disponibles dans la littérature, l’étape d’élicitation est réalisée grâce à une étude d’interrogation d’experts du domaine. L’interrogation des experts est une thématique pour laquelle différentes méthodes ont été développées en recherche clinique dans les essais mais jamais spécifiquement pour les études diagnostiques, c’est ce à quoi nous nous sommes attachés à faire dans ce chapitre dans une étude spécifique. Le résultat de cette étude fait l’objet d’un article en cours de soumission à la revue Journal of Clinical Epidemiology. Le chapitre IV présente, quant à lui, notre travail concernant le modèle statistique en lui-même. Trois modèles à classes latentes en inférence bayésienne ont été développés de manière efficiente pour le cas de deux tests diagnostiques : un modèle à indépendance conditionnelle, un modèle à dépendance conditionnelle à effets fixes et un modèle à dépendance conditionnelle à effets aléatoires. Nous proposons dans ce chapitre une adaptation de ces trois modèles à la situation de quatre tests diagnostiques avec une formulation permettant une interprétation clinique des covariances entre les tests. Ce travail fait l’objet d’un article en cours de préparation pour la revue BMC Medical Research Methodology. Enfin, le chapitre V consiste en une discussion générale des principaux résultats de cette thèse et les conclusions de notre travail ainsi que des perspectives de développement.. 22.

(25) Chapitre I Comparaison de quatre techniques de RT-PCR pour le diagnostic de pneumopathie à Pneumocystis jirovecii Le but de ce chapitre I est de présenter l’étude clinique qui nous a amené à notre problématique méthodologique statistique et nous a ensuite servi de matériel pour les chapitres III et IV. Le contexte, la problématique clinique, le design d’étude, la méthodologie et l’analyse statistique initiale réalisée, ainsi que les principaux résultats correspondants, sont synthétiquement exposés ici. Cette étude clinique avec sa première analyse a fait l’objet d’un article original publié dans Journal of Clinical Microbiology qui est intégralement reproduit avec son matériel supplémentaire en annexe A.. I.1. Introduction. La pneumopathie à Pneumocystis jirovecii (PPJ), communément appelée pneumocystose, est une mycose profonde et sévère, due à un champignon à comportement opportuniste nommé Pneumocystis jirovecii (PJ), qui se développe principalement dans les poumons des patients immunodéprimés [18, 19]. Les personnes à risque de cette infection sont en premier lieu les patients porteurs de VIH, et c’est chez ces patients que l’affection a initialement été décrite, mais d’autres états d’immunodépression sont également concernés. Les patients non VIH les plus à risque de PPJ sont les patients immunodéprimés qui présentent des pathologies telles que 23.

(26) I.1. Introduction les hémopathies malignes, les cancers solides, les greffes d’organe, les maladies inflammatoires ou auto-immunes systémiques, et/ou ceux qui suivent un traitement immunosuppresseur ou corticoïde au long cours [20–23]. L’atteinte de ces patients est en forte augmentation [21–23]. Plus récemment, de nouvelles populations à risque de développer une PPJ ont été identifiées. Il s’agit des patients atteints de mucoviscidose ou souffrant de broncho-pneumopathie chronique obstructive (BPCO), chez qui la « colonisation » par PJ pourrait être un facteur aggravant de leur pathologie pulmonaire. Les Pneumocystis sont des champignons cosmopolites et très ubiquitaires présents chez de nombreux mammifères (lapin, souris et rat, ...). Pneumocystis jirovecii (anciennement appelé Pneumocystis carinii) est l’espèce spécifiquement humaine qui a un comportement opportuniste. Sa transmission est aérienne avec des phases de colonisation possibles chez les patients ne présentant pas de signes de pneumopathie. Ainsi, les sujets infectés ou transitoirement colonisés semblent constituer le principal réservoir de PJ. Le diagnostic de PPJ repose sur un faisceau d’arguments clinico-biologico-radiologiques. Cliniquement, la PPJ se traduit par une triade de symptômes d’apparition progressive : de la fièvre, une toux sèche et une dyspnée d’intensité croissante. L’auscultation pulmonaire est, quant à elle, normale relativement longtemps. La radiographie thoracique, qui peut également être normale au début de l’infection, objective ensuite un infiltrat interstitiel diffus, bilatéral et à prédominance hilaire ; la tomodensitométrie thoracique retrouve classiquement un aspect en verre dépoli. Ces images typiques peuvent également être associées à des éléments nodulaires, à un pneumothorax ou à un pneumomédiastin. L’étude des gaz du sang montre le plus souvent une hypoxie. Les examens para-cliniques indispensables pour le diagnostic différentiel entre les différentes pneumopathies interstitielles sont les examens microbiologiques avec la mise en évidence directe de PJ. Cependant, interprétés seuls, ils demeurent insuffisants pour le diagnostic de PPJ à cause du problème de la distinction entre colonisation et infection. En définitive, le diagnostic de PPJ est très difficile à poser avec certitude et un traitement curatif probabiliste constitue souvent un argument de plus pour le diagnostic. Pour la réalisation des examens microbiologiques, différents types de prélèvements peuvent être utilisés. Deux grandes catégories sont à distinguer : les prélèvements profonds, dont le lavage broncho-alvéolaire (LBA) et la biopsie bronchique, et les prélèvements superficiels, notamment l’aspiration bronchique, le lavage rhinopharyngé et les expectorations. Le prélèvement de référence est le LBA qui permet d’évaluer directement l’état du parenchyme pulmonaire. 24.

(27) I.1. Introduction dans la zone atteinte. Cependant, c’est un prélèvement invasif réalisé au cours d’une fibroscopie bronchique qui est d’autant plus mal supporté que le patient est hypoxique, ce qui est inévitablement le cas des patients souffrant de pneumopathie. L’alternative réside dans la réalisation de prélèvements pulmonaires superficiels qui ont plusieurs avantages : (i) ils sont beaucoup moins invasifs, (ii) ils sont bien supportés par le patient, (iii) ils peuvent être utilisés en cas de contre-indication du LBA, (iv) ils sont plus aisés à réaliser par le personnel de soin, et (v) ils sont moins coûteux. Cependant, le principal défaut de ce type de prélèvement est l’obtention d’une quantité de matériel moindre avec une quantité de micro-organisme à détecter faible du fait de sa dilution dans les voies aériennes supérieures. La mise en évidence ensuite de PJ à partir de ces prélèvements microbiologiques peut également être réalisée avec différentes méthodes. Pendant de nombreuses années, l’étape de détection de PJ reposait exclusivement sur l’examen microscopique direct avec des techniques de coloration spécifiques, les colorations Gomori-Grocott (GG) et/ou May-Grünwald-Giemsa (MGG) pour PJ. L’examen direct est la méthode de référence empiriquement admise pour la détection de PJ, mais elle n’est fiable qu’à partir d’un LBA. La culture, qui est l’examen de référence pour la détection de nombreux micro-organismes, n’est quant à elle jamais réalisée pour la détection de PJ car ce champignon n’est pas cultivable. Par la suite, les méthodes de PCR (Polymerase chain reaction) et en particulier les méthodes RT-PCR (Real time PCR) ont été développées et de plus en plus utilisées pour la détection de PJ [24, 25]. Ces méthodes permettraient d’augmenter la reproductibilité et la sensibilité du diagnostic de PPJ à partir d’un LBA [26–28] mais aussi d’utiliser des prélèvements superficiels contenant peu de PJ [29, 30], ce qui permettrait de ne plus à avoir recours au LBA en systématique pour poser le diagnostic de PPJ. Actuellement, différentes méthodes de RT-PCR sont disponibles sur le marché pour le diagnostic moléculaire de PJ. Pour cette étude, quatre techniques ont été considérées : une technique de RT-PCR dite « maison » publiée par Fillaux et al. [31] (appelée PCR « Maison » par la suite) et trois trousses commerciales : « PCR en temps réel Pneumocystis jirovecii » de BioEvolution® (PCR BioEvolution® ), « AmpliSens® Pneumocystis jirovecii (carinii) – FRT PCR kit » de ServiBio (PCR AmpliSens® ), et « MycAssay® Pneumocystis » de Myconostica (PCR MycAssay® ).. 25.

(28) I.2. Méthodes L’objectif de cette étude était donc d’évaluer la concordance de ces quatre techniques de RT-PCR pour la détection de PJ, globalement et en sous-groupes, en fonction du type de prélèvements (prélèvements profonds vs prélèvements superficiels).. I.2 I.2.1. Méthodes Design. Il s’agissait d’une étude d’évaluation de différentes méthodes diagnostiques de phase II, monocentrique. L’objectif initial de l’étude se limitait à une étude de concordance des méthodes diagnostiques entre elles. Il ne s’agissait pas d’une étude d’estimation des performances diagnostiques, compte tenu de l’absence de gold standard acceptable pour le diagnostic de PPJ. En effet, le gold standard pour le diagnostic de PPJ est théoriquement l’examen direct (GG et/ou MGG) réalisé à partir d’un LBA. Cependant, il n’est réalisable et effectivement réalisé que pour une partie des patients (ceux pour lesquels un LBA est disponible), et il est de plus très imparfait.. I.2.2. Population. L’étude a été réalisée à partir des échantillons de la DNAthèque « Pneumocystis » collectés prospectivement de mars 2009 à février 2013 et conservés au laboratoire de ParasitologieMycologie du CHU de Nîmes suivant la réglementation en vigueur. La DNAthèque contient les échantillons de plus de 450 patients prélevés pour diagnostic de pneumopathie avec suspicion de PPJ. Différents types de prélèvements y sont contenus : biopsies bronchiques, LBA, aspirations bronchiques ou expectorations. Pour l’ensemble de ces patients, un ensemble de données cliniques, biologiques et radiologiques a été colligé à l’aide d’une fiche de recueil de données standardisée.. I.2.3. Analyses microbiologiques. Pour chaque prélèvement de la DNAthèque, quel que soit son type, les ADNs ont été obtenus par extraction automatisée à l’aide du kit Qiagen® et stockés à -20°C. L’étape d’extraction de l’ADN était commune pour chaque prélèvement.. 26.

(29) I.2. Méthodes Chacun des échantillons a ensuite été analysé à l’aide des quatre techniques de RT-PCR précédemment listées. La technique de PCR « Maison » a été réalisée suivant le protocole décrit par Fillaux et al. [31]. Les trois techniques commerciales (PCR BioEvolution® , PCR AmpliSens® , et PCR MycAssay® ) ont, quant à elles, été réalisées suivant la notice d’utilisation fournie respectivement par chacun des laboratoires. La RT-PCR (ou « PCR en temps réel » ou « PCR quantitative ») utilise le principe de base de la PCR classique (amplification cyclique d’un fragment d’ADN cible basée sur la réaction enzymologique de l’ADN polymérase) avec pour différence la mesure de l’amplification tout au long de la réaction, en temps réel, et pas seulement une mesure finale à la fin de la réaction. Pendant le processus d’amplification, la mesure de la quantité d’ADN repose sur la détection et la quantification d’un émetteur fluorescent. Le cycle de la PCR au cours duquel une augmentation significative du signal fluorescent est détectée par rapport au bruit de fond correspond au Ct (« cycle threshold ») qui est inversement proportionnel à la quantité d’amplicons spécifiques présents. Au final, la méthode de RT-PCR donne un résultat sous forme de réponse positive ou négative pour la détection de l’ADN cible, ici la détection de PJ, et, en cas de détection positive, une valeur semi-quantitative pour la quantification sous forme d’un Ct.. I.2.4. Interprétation clinique du statut des patients. Dans ce contexte d’absence de gold standard, les différents éléments du tableau clinicobiologico-radiologique ont été utilisés pour évaluer le statut de chaque patient vis-à-vis du diagnostic de PPJ de manière empirique. L’interprétation clinique a été établie a posteriori pour chaque patient par deux médecins spécialistes indépendants (un biologiste mycologue et un infectiologue) en aveugle des résultats de chaque RT-PCR. En plus du résultat de l’examen direct, quatre critères cliniques ont servi à la classification : (i) la présence d’au moins un facteur d’immunodépression, (ii) la présence de signes cliniques de pneumopathie, (iii) la présence de signes radiologiques de pneumopathie interstitielle (infiltration diffuse et/ou opacités en verre dépoli), et (iv) une amélioration significative des signes sous traitement spécifique. Au final, quatre modalités de réponse pouvaient être rendues avec les définitions suivantes : – PPJ prouvée : présence des quatre critères cliniques et d’un examen direct positif – PPJ probable : présence des quatre critères cliniques mais avec un examen direct négatif ou absent 27.

(30) I.2. Méthodes – PPJ possible : présence de trois des quatre critères cliniques, un examen direct négatif ou absent, et une absence de diagnostic différentiel pour la pneumopathie – Absence de PPJ : présence de moins de trois critères cliniques, un examen direct négatif ou absent, et un diagnostic différentiel pour la pneumopathie. I.2.5. Analyses statistiques. L’ensemble des données présentes dans la base de données ont été décrites. Les variables quantitatives sont présentées sous forme de médianes et étendues. Pour les variables qualitatives, les effectifs et les pourcentages associés sont présentés. Le degré de signification retenu était de 5%. Les intervalles de confiance ont tous été calculés à 95%. La concordance des quatre kits a été évaluée à l’aide du cœfficient Kappa de concordance (avec son intervalle de confiance à 95%, IC 95%) pour les résultats sous forme qualitative [32] et par le coefficient de corrélation de concordance généralisé (ρc ) (avec son intervalle de confiance à 95%, IC 95%) pour les résultats sous forme quantitative [33, 34]. Les seuils d’interprétation de ces deux paramètres sont décrits dans le tableau I.1. Une analyse stratifiée des résultats des quatre techniques de RT-PCR en fonction de l’interprétation clinique a également été réalisée. L’analyse statistique a été conduite sous SAS (SAS Institute, Cary, NC, USA) version 9.4. TABLEAU I.1 – Seuils d’interprétation des mesures de concordance [32–34] Kappa ≥ 0, 8 ≥ 0, 6 ≥ 0, 4 ≥ 0, 2 >0 <0. Concordance Excellent Bon Modéré Médiocre Mauvais Très mauvais. ρc. Concordance. ≥ 0, 9 ≥ 0, 8 ≥ 0, 6 < 0, 6. Bonne Acceptable Faible Inexistante. Dans ce chapitre, seuls les résultats qualitatifs (détection de PJ positive vs négative) sont présentés.. I.2.6. Taille de l’échantillon. Afin d’estimer un coefficient Kappa de concordance de 0,8 avec une précision de ±0, 2,. soit une borne inférieure de l’intervalle de confiance d’au minimum 0,6 (concordance jugée 28.

Références

Documents relatifs

Dans la suite de l’utilisation de mannequins physiques lors des essais de choc, le développe- ment de modèles numériques, substituts de l’être humain, autorise une

- Comprendre aussi qu’on ne peut pas se limiter à examiner les différences des nombres de truites au sein d’un même bassin (par exemple, choisir A car on y trouve 40 truites

Pour exploiter au mieux notre connaissance a priori des sources excitatrices, la structure est divis´ee en diff´erentes zones dans lesquelles on suppose que les a priori locaux sur

Les articles ont été inclus dans la liste des références s’ils présentaient une approche originale pour chacune des sections principales de la revue ou couvraient les

probabilités a posteriori qui traduisent un degré de crédibilité pour le nombre de castillons et pour les autres paramètres inconnus.. Les dispersions de ces

Pour un jeu, si X l est la présence d’un pattern l, et si C est le fait de jouer un coup, alors la probabilité de jouer le coup sachant que le pattern l est présent est égale à

En 1987, Mc CLOSKEY &amp; CARAMAZZA abordent les troubles du calcul en transposant au domaine numérique les recherches et les données théoriques qui ont été établies au cours

Par exemple dans le cas d'un pays comme Haïti, ces PEF sont utiles pour identifier les principaux points de vulnérabilité dans le processus de développement du pays tel que