• Aucun résultat trouvé

4.2.1 Méthodes disponibles

Les méthodes d’évaluation des performances des tests en l’absence de test de réfé- rence parfait, suivant les recommandations de Rutjes et al. (2007) consistent à :

— Corriger les erreurs d’un test de référence imparfait; — Construire une nouvelle référence;

— Valider les résultats d’un test imparfait par apport d’informations extérieures, le plus souvent en s’appuyant sur les signes cliniques.

La correction d’un test de référence imparfait nécessite de connaître les erreurs faites par ce dernier et d’ajuster les résultats du test de référence et du test que l’on cherche à évaluer. Cela est possible en faisant l’hypothèse, d’une part que les résultats des deux tests sont indépendants mais également que les erreurs sont indépendantes. Ces deux hypothèses, si elles ne se vérifient pas, vont conduire à une estimation biaisée des per- formances du test évalué. Les modèles à classes latentes peuvent être vus comme une évolution de cette méthode de correction du test de référence.

La construction d’une nouvelle référence peut se faire selon les quatre méthodes sui- vantes, qui peuvent éventuellement être combinées :

— utilisation d’un second test afin de résoudre les résultats discordants entre le test évalué et celui de référence;

— utilisation systématique de deux tests de référence, et utilisation d’un algorithme de tri permettant de déduire le statut de chaque individu;

— recours à un panel d’experts pour classer les individus;

— recours aux modèles à classes latentes (détaillés dans le paragraphe 4.2.2)

L’utilisation d’un second test pour résoudre les discordances est limitant puisque cela peut entraîner des erreurs de classement des individus dont les résultats ne sont pas dis- cordants. De plus, si les résultats des différents tests sont corrélés, les biais d’évaluation seront plus grands. L’application de deux tests de référence en parallèle requiert une défi- nition précise de l’état cible et de s’assurer que ces deux tests sont indépendants et qu’ils

4. PERFORMANCES DIAGNOSTIQUES DES TESTS BIOLOGIQUES ciblent le même processus biologique. Le classement des individus par un panel d’experts reste subjectif et peut conduire à des classements discordants, notamment si la définition de l’état cible n’est pas stricte.

4.2.2 Modèles à classes latentes

Principe. Les méthodes basées sur les classes latentes, initialement proposées par Hui and Walter (1980), sont de plus en plus utilisées pour l’évaluation des performances diag- nostiques des tests, que ce soit en médecine humaine ou vétérinaire (Collins and Huynh, 2014). De façon schématique, la classe latente correspond à une séparation des animaux selon un critère qui n’est pas atteignable par l’observateur (non observable). Les réponses à un test diagnostique seront modélisées avec des paramètres différents selon chaque classe latente dans le but d’approcher au mieux la distribution observée des résultats dans la population d’étude. Dans la cas de l’évaluation des performances diagnostiques des tests biologiques, deux classes latentes sont généralement définies : une classe la- tente correspond à la cible recherchée, l’autre inclus les animaux ne correspondant pas à la cible (par exemple malades/non malades, infectés/non infectés). L’approche par des modèles à classes latentes repose sur l’analyse des résultats de plusieurs tests sur de nom- breux individus permettant de construire une nouvelle référence et sur une évaluation simultanée des performances de tous les tests.

Conditionnellement à la classe latente, et en prenant l’exemple de deux tests binaires conditionnellement indépendants (T1) et T2) nous pouvons classer les individus selon quatre classes en fonction des résultats obtenus à chaque test pour parvenir à une des- cription des différentes combinaisons possibles d’évènements. Ainsi pour les individus appartenant à la classe latente C+:

                   P(T1+∩ T2+|C+) = P(T1+|C+) ∗ P(T2+|C+) P(T1+∩ T2-|C+) = P(T1+|C+) ∗ P(T2-|C+) P(T1-∩ T2+|C+) = P(T1-|C+) ∗ P(T2+|C+) P(T1-∩ T2-|C+) = P(T1-|C+) ∗ P(T2-|C+) (8)

C-.

Toujours sous l’hypothèse d’indépendance des tests conditionnellement à la classe latente, nous pouvons donc écrire :

P(T1+∩ T2+) = P(T1+∩ T2+|C+) ∗ P(C+) + P(T1+∩ T2+|C-) ∗ P(C-) (9) = P(T1+|C+) ∗ P(T2+|C+) ∗ P(C+) + P(T1+|C-) ∗ P(T2+|C-) ∗ (1 − P(C+)) = SeD1∗ SeD2∗ prev + (1 − SpD1) ∗ (1 − SpD2) ∗ (1 − prev)

En appliquant cette décomposition au quatre types d’évènements observables, nous obtenons le système d’équations suivant, permettant d’expliciter les indicateurs recher- chés :                    P(T1+∩ T2+) = SeD1∗ SeD2∗ prev + (1 − SpD1) ∗ (1 − SpD2) ∗ (1 − prev) P(T1+∩ T2-) = SeD1∗ (1 − SeD2) ∗ prev + (1 − SpD1) ∗ SpD2∗ (1 − prev) P(T1-∩ T2+) = (1 − SeD1) ∗ SeD2∗ prev + SpD1∗ (1 − SpD2) ∗ (1 − prev) P(T1-∩ T2-) = (1 − SeD1) ∗ (1 − SeD2) ∗ prev + SpD1∗ SpD2∗ (1 − prev) (10)

auquel nous pouvons ajouter l’équation suivante :

P(T1+∩ T2+) + P(T1+∩ T2-) + P(T1-∩ T2+) + P(T1-∩ T2-) = 1 (11)

Le modèle doit alors être résolu afin de déterminer les paramètres à estimer en fonc- tion des données observées. Dans le cas présenté, nous avons donc cinq paramètres à es- timer (SeD1, SeD2, SpD1, SpD2et pr ev), alors que la structure des données n’autorise que trois degrés de liberté (ddl). En effet en fixant trois des quatre probabilités dans l’équa- tion (11), la dernière est automatiquement déduite.

Un modèle peut être qualifié d’identifiable (ou inversible) s’il existe une unique sé- rie de paramètres aboutissant à la répartition observée des données. Jones et al. (2010) séparent les modèles en trois classes en fonction de leur identifiabilité :

— identifiable : le modèle est inversible sur tout l’espace des paramètres;

4. PERFORMANCES DIAGNOSTIQUES DES TESTS BIOLOGIQUES paramètres;

— non identifiable : il n’existe pas d’espace, même réduit, dans lequel le modèle est inversible.

Comme montré par de nombreux auteurs (Goodman, 1974 ; Allman et al., 2009 ; El- more et al., 2005), un nombre de ddl supérieur au nombre de paramètres à estimer est une condition nécessaire, mais non suffisante, assurant l’identifiabilité au moins locale d’un système d’équations. De plus, les modèles à classes latentes sont par nature non- identifiables du fait du phénomène de "label swapping" (Allman et al., 2009) (nommé "label-switching" par Jones et al. (2010)). Les classes latentes étant cachées aux yeux de l’observateur, une inversion des étiquettes entre population cible et population saine pro- duira des estimateurs biaisés qui permettent d’obtenir les données observées. Le pro- blème du "label swapping" peut être contourné, dans le cas des études d’évaluation des performances diagnostiques des tests, par recours au contexte, qui oriente les résultats en faisant l’hypothèse que les tests sont informatifs (c’est-à-dire en posant SeD+ SpD> 1).

Afin d’augmenter le nombre de degrés de liberté, il est possible d’appliquer plus de tests à la population, ou d’appliquer ces tests à un plus grand nombre de populations ayant des prévalences différentes. En effet, dans le cas d’une seule population et avec trois tests l’équation (11) devient :

P(T1+∩ T2+∩ T3+) + P(T1+∩ T2+∩ T3-) + P(T1+∩ T2-∩ T3+) + P(T1+∩ T2-∩ T3-)+

P(T1-∩ T2+∩ T3+) + P(T1-∩ T2+∩ T3-) + P(T1-∩ T2-∩ T3+) + P(T1-∩ T2-∩ T3-) = 1 (12)

Ce modèle autorise sept ddl pour sept paramètres à estimer (deux paramètres par test et la prévalence dans la population). Quand deux tests sont employés dans deux populations de prévalences différentes, et en appliquant les équations 10 et 11 dans les deux popula- tions, nous obtenons six paramètres à estimer (deux paramètres par test et les deux pré- valences) ainsi que six ddl. Nous pouvons généraliser le nombre de ddl et de paramètres

(nd p) pour les modèles à t tests et p populations comme suit :      ddl = (2t− 1) ∗ p nd p = 2t+ p (13)

Les modèles présentés jusqu’alors font l’hypothèse que les tests appliqués aux popu- lations sont conditionnellement indépendants. Deux événements A et B sont considérés comme indépendants si :

P(A ∩ B) = P(A) ∗ P(B) (14)

La notion d’indépendance conditionnelle se définit avec un troisième évènement (C) comme suit :

P(A ∩ B|C) = P(A|C) ∗ P(B|C) (15)

Dans le cadre des modèles à classes latentes, les évènements A et B sont les résultats des deux tests et l’évènement C est la classe latente d’appartenance. De manière générale, l’indépendance conditionnelle signifie que sachant la classe latente d’appartenance (par exemple en sachant qu’un animal est infecté), le résultat à un test n’apporte pas d’infor- mations sur le résultat des autres tests. Les tests diagnostiques peuvent donc être condi- tionnellement indépendants par rapport à une des classes latentes tout en étant dépen- dants lorsqu’il s’agit de l’autre classe latente.

Dans les faits, l’hypothèse forte d’indépendance conditionnelle des tests est rarement rencontrée, et cela même si les tests ont pour cible des phénomènes biologiques diffé- rents. Plusieurs auteurs (Vacek, 1985 ; Qu et al., 1996 ; Dendukuri and Joseph, 2001 ; Geor- giadis et al., 2003) ont proposé des améliorations de ce modèle pour prendre en compte les corrélations possibles entre les réponses aux tests utilisés. Nous retrouvons deux prin- cipales approches pour écrire la dépendance dans un modèle à classes latentes. En consi- dérant deux tests dont les résultats sur les animaux cibles sont dépendants, Dendukuri and Joseph (2001) proposent de modéliser explicitement la covariance entre le test i et le test j en ajoutant un terme (µij) par rapport au calcul de la probabilité en cas d’indépen- dance, conduisant aux équations suivantes, pour la SeD (les mêmes équations peuvent

4. PERFORMANCES DIAGNOSTIQUES DES TESTS BIOLOGIQUES être écrites pour la SpD) :

P(Ti+∩ Ti+|C+) = SeDi∗ SeDj+ µij P(Ti+∩ Tj-|C+) = SeDi∗ (1 − SeDj) − µij

(16)

Si les deux tests fournissent la même réponse, la covariance µij est ajoutée; dans l’autre cas elle est retranchée.

Qu et al. (1996) et Georgiadis et al. (2003) définissent quant à eux la covariance ρijentre le test i et le test j comme suit dans le cas de la SeD(les mêmes relations valent pour la SpD) : ρij= P(Ti+∩ Tj+|C+) − SeD∗ SeDj p SeDi(1 − SeDi)SeDj(1 − SeDi) (17) L’équation précédente peut être ré-écrite comme suit :

P(Ti+∩ Tj+|C+) = SeDi∗ SeDj+ ρij∗ q SeDi(1 − SeDi)SeDj(1 − SeDj) (18) soit : µij= ρij∗ q SeDi(1 − SeDi)SeDj(1 − SeDj) (19) L’équation (19) permet de mieux comprendre la différence de paramétrisation entre les deux approches permettant de modéliser la covariance. La paramétrisation par µ est plus directe, facilitant la définition des bornes de l’intervalle des valeurs possibles. A l’in- verse ρ ne dépend pas des paramètres (SeDou SpD) des tests corrélés, permettant d’ob- tenir des estimateurs de covariance comparables entre études pour lesquelles les estima- teurs de SeDou SpDsont différents.

Le modèle complet, dit aussi modèle saturé, est celui qui tient compte d’une corréla- tion entre tous les paramètres de SeDainsi qu’entre tous les paramètres de SpDdes tests. Dans le cas de l’évaluation conjointe de j tests, cette paramétrisation ajoute le nombre de paramètres suivants à estimer au modèle :

j X i =2 Ã i j ! (20)

Dans le cas de l’évaluation conjointe de trois tests cela représente quatre paramètres pour la SeDet quatre pour la SpD.

Standardisation des rapports d’évaluation des performances diagnostiques des tests. Pour rationaliser les protocoles d’évaluation des tests et rendre comparables les estima- teurs obtenus, des standards ont émergé tout d’abord en médecine humaine (Bossuyt et al., 2003), puis en médecine vétérinaire, en prenant la paratuberculose comme exemple d’étude (Gardner et al., 2011). Cette standardisation des protocoles d’évaluation des per- formances diagnostiques des tests évite la production d’estimateurs biaisés (Lijmer et al., 1999). Une mise à jour spécifiquement dédiée à l’approche par modèles à classes latentes a été récemment proposée (Kostoulas et al., 2017).

La paratuberculose est emblématique des situations où le statut réel des individus est inconnu. En raison de la physiopathologie complexe de l’infection par Map, aucun test diagnostique ne peut en effet être considéré comme un test de référence parfait, qui assurerait la détection de toutes les cibles d’intérêt avec une SeD et une SpD par- faites. C’est pourquoi, les performances diagnostiques des tests appliqués pour le diag- nostic/dépistage de la paratuberculose ont fait l’objet de nombreuses études, difficile- ment comparables tant d’un point de vue des méthodes employées que des résultats ob- tenus.