• Aucun résultat trouvé

Cours 2 : Evaluation des examens diagnostiques

N/A
N/A
Protected

Academic year: 2022

Partager "Cours 2 : Evaluation des examens diagnostiques"

Copied!
14
0
0

Texte intégral

(1)

DFGSM3-MED606: Epidémiologie-LCA-ECN correcteur: Adrien A Dr Kanagaratnam Jallu Quentin/Pombourcq Edouard S6 : 10/03/21

Cours 2 : Evaluation des examens diagnostiques

PARTIE 1 : GENERALITES

Rappel : La différence entre dépistage et diagnostic

• Quand on voit un patient qui ne présente pas de symptômes mais qui présente des facteurs de risque pour la maladie, on va plutôt proposer un test de dépistage. Si le test de dépistage est positif, on va lui proposer un examen qui va confirmer la présence de la maladie. Et ensuite, s’il est malade : on lui propose alors une prise en charge thérapeutique.

• Si le patient arrive avec des symptômes, on n’est plus dans le cas d’un dépistage car maintenant le patient est malade, on va lui proposer d’emblée un examen diagnostique. Et ensuite, s’il est positif : le patient aura une prise en charge thérapeutique.

En fonction des valeurs de sensibilité et de spécificité, on fera un choix en évaluant les performances diagnostiques d’un test diagnostic ou de dépistage.

1) Le dépistage

Le dépistage correspond à la prévention secondaire : on met en place le test dans une population de sujets qui ne présentent pas de symptômes, ce sont des personnes en bonne santé et on va regarder chez ces patients s’ils ont la maladie ou pas. La définition est donc : Recherche d’une maladie chez une personne en bonne santé apparente avant l’apparition de tout symptôme.

a) Les avantages

Découvrir la maladie le plus tôt possible, au cours de son évolution, au moment où le patient n’est pas symptomatique dans le but de le traiter le plus tôt possible. Par exemple, il existe plusieurs tests de dépistage pour les cancers : sein, colorectal… Il existe plein d’autres causes de dépistage en dehors des cancers.

➢ Améliorer le pronostic d’une maladie dont l’individu ne connaît pas encore l’existence : diminuer mortalité et morbidité

➢ Cela permet de recourir à des traitements qui sont moins lourds.

➢ Dans l’exemple du cancer du sein ou colorectal, si l’on traite la tumeur quand elle est petite, cela permet de faire l’exérèse de la tumeur et ainsi éviter des traitements invasifs.

• L’objectif est aussi de rassurer les patients qui sont négatifs

Sensibiliser les professionnels de santé et les usagers à la maladie concernée

• Organiser une meilleure prise en charge.

➢ Pour reprendre l’exemple des cancers : il y a plusieurs plans cancers qui ont été mis en place justement pour améliorer la prise en charge des patients, dans le but de dépister les personnes malades le plus tôt possible, et ensuite il y a eu toute une information qui s’est mise en place dans la prise en charge de ces patients.

(2)

Page 2 sur 14 b) Les inconvénients

• Proposer un test à des personnes qui ne sont pas malades, et parfois il y a des effets

secondaires à cause du dépistage qui restent cependant extrêmement rares, et ce à cause du dépistage qui n’a pas fonctionné. Normalement, le test de dépistage ne doit pas être invasif.

Risque de diagnostics positifs erronés (faux positifs) où on dit que le patient est malade alors qu’il n’est pas malade, ou encore de sur-diagnostiquer (détection d’anomalies sans conséquences), exemple dans le cancer du sein :

➢ De nos jours, les appareils d’imagerie sont très performants, et permettent donc de diagnostiquer de toutes petites tumeurs. Ceci a pour conséquence que lorsque le médecin identifie une petite tumeur et qu’il ne sait pas si c’est malin ou bénin, il va proposer une biopsie… → notion de surdiagnostic

c) Les conditions

Pour proposer un test de dépistage, il faut :

• Que les avantages soient supérieurs aux inconvénients

• Mettre en place des études avec un très fort niveau de preuve scientifique.

➢ Même si dans les tests de dépistage, on a rarement des essais randomisés.

• Il y a aussi une obligation de résultats. Chez des personnes qui ne sont pas symptomatiques, il faut être sûr du résultat, ou du moins il faut qu’il n’y ait pas trop d’erreurs.

2) Différence entre test de dépistage et examen diagnostique

• Le test de dépistage est proposé à un sujet avant l’examen diagnostique, il est réalisé chez des personnes qui sont asymptomatiques, souvent chez un groupe d’individus à risque et en aucun cas le test de dépistage va aboutir à une prise en charge thérapeutique du patient.

➢ Si le test de dépistage est positif, on ne va pas tout de suite proposer un traitement, on va d’abord faire un examen diagnostique.

• L’examen diagnostique, quant à lui, doit confirmer la présence de la maladie, il est réalisé chez des personnes qui présentent des symptômes ou qui ont un test de dépistage positif. Il est essentiellement individuel, parce qu’on ne va pas proposer un examen diagnostique dans un groupe de patients à risque (on le propose en cas de symptômes ou de test de dépistage positif).

➢ Si l’examen diagnostique est positif, on va alors proposer une prise en charge thérapeutique.

(3)

Page 3 sur 14

3) Quelques exemples :

• Pour la tuberculose, les tests de dépistage sont la radio du thorax ou l’IDR

(intradermoréaction à la tuberculine), s’ils sont positifs : on va proposer un examen bactériologique des crachats par exemple.

• Pour le cancer du sein, le test de dépistage est la mammographie, s’il y a une tumeur objectivée : on va proposer une biopsie avec un examen anatomopathologique.

• Pour le cancer du colon, le test de dépistage est la recherche de sang dans les selles (Hemoccult), si c’est positif : on propose une coloscopie, une biopsie si présence de lésions avec un examen anatomopathologique.

4)

Les critères pour qu’une maladie soit éligible à un test de dépistage (OMS) :

• Tout d’abord, il faut que ce soit un problème de santé publique réel : fréquence (incidence), gravité, fort impact social et économique.

• Ensuite, il faut que ça touche une population bien ciblée : on propose certains tests de dépistage dans des populations déterminées.

• Il faut connaître l’évolution naturelle de la maladie car si on ne la connait pas, on ne sera pas capable de prendre en charge le patient.

• Il faut reconnaître la maladie à un stade où le patient n’est pas symptomatique (pré- symptomatique).

• Il faut que le test de dépistage soit validé, il y a plusieurs critères au niveau international, répondant à des critères d’acceptabilité, d’efficacité (validité) et de coût pour le patient.

• Il faut aussi qu’il y ait une prise en charge thérapeutique efficace, soit qui va permettre de favoriser la guérison, soit qui va améliorer la qualité de vie des patients ou la prévention, sinon on ne propose pas un test de dépistage.

(4)

Page 4 sur 14

5)

Les critères de qualité d’un bon test de dépistage :

• Tout d’abord, il faut qu’il soit acceptable pour une population qui ne présente pas de symptômes.

• Il faut qu’il soit capable d’identifier des personnes qui n’ont pas de symptômes et donc des états pré-pathologiques (avant l’apparition des symptômes)

• Il faut qu’il soit valide : capable d’isoler les sujets malades et les sujets sains, ce qui renvoie à la notion de sensibilité pour les malades et de spécificité pour les non-malades.

• Il faut qu’il soit évalué par une procédure d’assurance qualité : il y a beaucoup de tests comme la mammographie où il y a une double relecture pour être sûr qu’il n’y ait pas d’erreurs. S’il y a une discordance entre les 2 : on demande l’avis d’un troisième radiologue.

• Il faut qu’il soit reproductible car si le test est positif et peu de temps après il est négatif, il y a un problème de reproductibilité car le test ne donne pas le même résultat en fonction du moment où on le réalise.

• Il faut qu’il soit facile à faire (interprétation facile) et que le résultat soit stable, facile à mettre en place dans la population mais aussi qu’il soit peu coûteux (= coût de la recherche des cas non disproportionné par rapport au coût global des soins médicaux).

6) Les différents types de dépistage :

• Le dépistage systématique = le dépistage de masse : on va le mettre en place dans une population recrutée qui n’est pas sélectionnée, qui est généralisé par exemple à toute une tranche d’âge.

➢ C’est par exemple le cas du test pour le cancer du sein ou colo-rectal, proposé aux personnes âgées de plus de 50 ans.

• On a le dépistage sélectif = ciblé qui est proposé uniquement chez des personnes qui présentent des facteurs de risque (critères spécifiques de recrutement), par exemple la coloscopie chez des personnes qui ont des antécédents familiaux de cancer colorectal.

• Le dépistage organisé = communautaire qui concerne toute la population (recrutement par campagne, participation volontaire). Il peut se recouper avec le dépistage de masse.

• Le dépistage opportuniste : Recrutement à l’occasion d’un recours aux soins

➢ Exemple : un patient diabétique qui va voir le médecin du travail, celui-ci va évaluer l’état des pieds, essayer de rechercher des complications liées à sa maladie

• Le dépistage multiple : recherche simultanée de plusieurs pathologies.

7)

Quelques exemples de dépistage en France

(à ne pas retenir) :

• Cancers : du sein, colorectal, col de l’utérus

• Maladies transmissibles ou chroniques : VIH, Tuberculose, hépatites B et C, diabète de type 2 (chez certains patients à risque), saturnisme…

• Dépistages néonataux : phénylcétonurie, hypothyroïdie congénitale, hyperplasie congénitale des surrénales, drépanocytose, mucoviscidose, surdité bilatérale congénitale, dysplasie congénitale de la hanche

• Dépistages prénataux : rubéole, toxoplasmose, agglutinines irrégulières, trisomie 21

• Examens périodiques de santé : population générale ou populations spécifiques (santé scolaire, PMI, jeunes en formation, travail, dons d’organes ou de sang), bilans buccodentaires

(5)

Page 5 sur 14

PARTIE 2 : METHODOLOGIE

1) Le schéma de la recherche/de l’étude

Quand on met en place une étude pour évaluer l’efficacité ou les performances d’un examen de dépistage ou de diagnostic, il y a 4 types d’étude :

Étude transversale où le patient fait les 2 tests (test de référence et nouveau test) en même temps, on recueille les résultats des deux tests et on les évalue.

Étude de cohorte : on inclut le patient et on lui fait le nouveau test (test au moment de l’inclusion), il sera suivi pendant plusieurs années et à la fin du suivi, on va savoir si le patient était vraiment malade ou pas. Par exemple dans la maladie d’Alzheimer où c’est le suivi qui va déterminer le statut malade ou sain.

Étude cas-témoins : on prend des patients malades et des patients non-malades. Par exemple, des patients atteints de cancer et d’autres non, on leur fait passer le test et on regarde s’il est bien pour pouvoir dépister. Attention, quand on a un article qui évalue les performances diagnostiques d’un test de dépistage ou de diagnostic, si c’est une étude cas- témoins : on va fixer les pourcentages (prévalence) de malades et de non malades et derrière il y a des paramètres qu’on ne va pas pouvoir calculer pour évaluer les performances.

Étude interventionnelle : Test non utilisé dans le cadre de la prise en charge habituelle.

Si on reprend l’exemple du test Hemoccult qu’on compare à un autre test : est-ce que Hemoccult permet de réduire la mortalité chez les personnes qui ont eu ce test ? On peut faire une étude randomisée : on utilise un nouveau test dans un groupe et une prise en charge habituelle dans l’autre groupe, on fait un suivi et on regarde si le nouveau test permet de réduire la mortalité dans la population par exemple.

2) Population d’étude

Pour la population d’étude, il va falloir définir :

• Les critères d’inclusion (quels patients va-t-on inclure dans l’étude ?)

• Les critères de non-inclusion (quels patients ne vont pas être inclus dans l’étude ?) Pour reprendre l’exemple du cancer colorectal, il y a de plus en plus d’études où on évalue un marqueur dans les prises de sang pour savoir si le patient est atteint ou pas d’un cancer colorectal.

Dans cette étude, on inclura des patients qui sont à risque de ce cancer : patients qui ont plus de 50 ans ou qui ont des antécédents familiaux de cancer colorectal, ainsi on définit les critères d’inclusion.

3) Test étudié

Le test étudié correspond au nouveau test (exemple d’un test sanguin pour le cancer colorectal).

• Il faut que le nouveau test ne soit pas ou peu invasif si c’est un test de dépistage.

• Il faut qu’il soit peu coûteux et réalisable, simple à utiliser en pratique.

• L’inconvénient correspond au risque d’erreur car on peut avoir des faux-positifs : dire que la personne est malade alors qu’elle ne l’est pas, ou des faux-négatifs : dire que la personne n’est pas malade alors qu’elle l’est.

• Le nouveau test peut donner :

➢ Soit un résultat quantitatif (valeur numérique) : CRP (inflammation), D-dimères (thrombose) …

➢ Soit un résultat qualitatif (positif ou négatif) : malade/pas malade

(6)

Page 6 sur 14

4) Test de référence = « Gold Standard »

• Il donnera toujours un résultat qui sera binaire : c’est-à-dire si le patient est malade ou s’il n’est pas malade.

• L’avantage est que c’est un diagnostic de certitude (aboutit à une conclusion diagnostique).

➢ Exemples vus avant : pour la tuberculose, c’est l’examen bactériologique des crachats, pour le cancer colorectal, c’est la biopsie des lésions et l’examen anatomopathologique.

• L’inconvénient : c’est qu’il peut être invasif, (exemple des cancers où cela nécessite des biopsies) ainsi que son coût (il coûte plus cher qu’un test de dépistage par exemple).

5) Nouveau test et Gold Standard

En pratique, quand on veut évoluer les performances diagnostiques d’un nouveau test, tous les patients vont avoir le nouveau test et le test de référence. Ensuite, il y a aura un tableau de contingence qui sera construit à partir de ces résultats, cela permettra de calculer différents paramètres.

• Le Gold Standard va permettre de classer les sujets en malades / non malades.

Le nouveau test va permettre de classer les sujets en positifs ou négatifs.

A partir de cela, on va classer les sujets en :

Vrais positifs : ce sont des sujets qui sont malades et qui ont été diagnostiqués positifs

Faux positifs : ils ont un test positif mais ne sont pas malades.

Vrais négatifs : des sujets non malades qui ont un test négatif.

Faux négatifs : des sujets malades qui ont un test négatif.

Sur le plan statistique, le principe est de comparer les résultats d’un nouveau test à ceux d’un test de référence. Lorsqu’on compare le test de référence au nouveau test, il y a 2 risques d’erreur :

Faux positifs : conclure à tort qu’une personne non malade est atteinte de la maladie.

Faux négatifs : conclure à tort qu’un malade n’est pas atteint.

6) Les paramètres que l’on peut calculer pour évaluer les performances diagnostiques

Dans l’exemple d’un test qualitatif binaire : on a le nouveau test qui indique si le patient est malade ou pas malade. On a aussi le gold standard (=le test de référence) qui va nous dire si le sujet est malade ou pas malade. Et on va comparer les résultats grâce au tableau de contingence.

(7)

Page 7 sur 14

Il y a 4 paramètres (dont la valeur varie entre 0 et 1 soit 0 et 100%) à connaître qui sont souvent utilisés dans les articles pour pouvoir évaluer les performances diagnostiques d’un test :

a) La sensibilité (Se)

• C’est le nombre de sujets positifs divisé par l’ensemble de sujets malades (vrais positifs et faux négatifs). Donc, plus la sensibilité est élevée, meilleur est le test.

• L’information apportée par la sensibilité est l’aptitude du nouveau test à identifier correctement les sujets malades par un résultat positif.

➢ Pourcentage de malades (M+) reconnus comme tels soit p(T+/M+)

➢ Par exemple : si on a une sensibilité de 99% (Se = 0,99), cela veut dire que 99% des malades sont bien reconnus comme malades par le nouveau test évalué.

• La sensibilité est une caractéristique intrinsèque car la sensibilité ne dépend pas de la prévalence de la maladie.

b) La spécificité (Sp)

• C’est le nombre de vrais négatifs divisé par l’ensemble des sujets non malades (vrais négatifs et faux positifs). Idem : plus la spécificité est élevée, meilleur est le test.

• L’information apportée par la spécificité est l’aptitude du nouveau test à identifier correctement les sujets non-malades par un résultat négatif.

➢ Pourcentage de non malades (M-) reconnus comme tels soit p (T-/M-)

➢ Par exemple : si on a une spécificité de 70% (Se = 0,7), cela veut dire que 70% des personnes indemnes de la maladie sont bien reconnues comme non malades par le nouveau test évalué.

• La spécificité est une caractéristique intrinsèque car la spécificité ne dépend pas de la prévalence de la maladie.

Exemple dans ce tableau de contingence : le nombre de vrais positifs est de 65, le nombre de faux négatifs est de 0, si on calcule la sensibilité : Se = 65/65+0 = 100%. Cela veut dire que lorsqu’on a une sensibilité de 100 pourcents, on n’a pas de faux négatifs (test - = sujet non malade).

Exemple : Si on calcule la spécificité à partir de ce tableau de contingence, le nombre de vrais négatifs est égal à 80, le nombre de faux positifs est égal à 0, donc Sp = 80/0+80 soit une spécificité de 1, ce qui équivaut à 100 pourcents, on n’a pas de faux positifs (test + = sujet malade)

(8)

Page 8 sur 14 c) La valeur prédictive positive (VPP)

• C’est le nombre de vrais positifs divisé par l’ensemble des patients ayant un test positif (vrais positifs et faux positifs)

• La VPP est la probabilité d’être malade lorsque le sujet a un test positif.

➢ Pourcentage de malades parmi les sujets ayant un test positif soit p(M+/T+)

➢ Par exemple, si la VPP est de 0,8 alors si le test est positif : la probabilité d’être malade est de 80 pourcents.

• C’est une caractéristique extrinsèque, on parle aussi de probabilité post-test.

Ne doit pas être calculée dans les études cas-témoins

On peut déduire la probabilité post-test d’être malade sachant que le test est positif à partir de la Se, de la Sp et de la prévalence de la maladie (formule pas à connaître) grâce au théorème de Bayes :

d) La valeur prédictive négative (VPN)

• C’est le nombre de vrais négatifs divisé par l’ensemble des patients ayant un test négatif (vrais négatifs et faux négatifs)

• La VPN est la probabilité de ne pas être malade lorsque le sujet a un test négatif.

➢ Proportion des non malades parmi les sujets ayant un test négatif soit p(M-/T-)

➢ Exemple : VPN = 0,8 : si le test est négatif alors la probabilité de ne pas être malade est de 80%

• C’est une caractéristique extrinsèque (probabilité post-test).

Ne doit pas être calculée dans les études cas-témoins

A partir de la spécificité, de la sensibilité et de la prévalence, on peut aussi déduire la valeur de VPN :

A partir du théorème de Bayes, on remplace les différents termes par leurs équivalents :

• VN = P(non malade) x P(test négatif sachant qu’on n’est pas malade) = (1- prévalence) x spécificité

• FN = P(malade) x P(test négatif sachant qu’on est malade) = prévalence x (1 – sensibilité)

(9)

Page 9 sur 14 e) Propriétés des valeurs prédictives

En pratique, les valeurs intéressantes pour un médecin sont la VPP et la VPN car c’est son point de vue : le test revient positif ou négatif, quelle est la probabilité qu’il dise vrai ? (probabilité post-test).

Contrairement à la Se et à la Sp, la VPP et la VPN sont sensibles au changement de prévalence de la maladie dépistée.

Pour comprendre, il faut simplement regarder les formules vues au-dessus.

+ prévalence ↗ + la VPP ↗ + prévalence ↗ + la VPN ↘

Conséquences : On peut conclure à tort de la qualité d’un test en s’intéressant qu’aux valeurs prédictives. La comparaison de plusieurs tests doit non seulement regarder les valeurs prédictives mais aussi la prévalence de la maladie. D’une part, le médecin s’intéresse à la VPP et VPN et d’autre part, si lors des études, la population étudiée est à risque (la prévalence dans l’étude est donc élevée et donc la VPP évaluée est élevée, et peut ne pas être représentative de la population générale).

Dans les études cas-témoins : prévalences fixées de malades / de non malades dans l’échantillon et donc les VPP / VPN ne sont pas interprétables (les articles ne présenteront pas ces valeurs)

7) Autres indicateurs pouvant être utilisés pour évaluer les performances diagnostiques d’un test

a) Rapports de vraisemblance positif et négatif (RV+ et RV-)

C’est plus ou moins une autre manière de présenter les résultats de sensibilité/spécificité (un peu différemment) car Se et Sp ne donnent pas une information très parlante au praticien sur ce que peut lui apporter un test dans sa pratique.

RV+ et RV- décrivent l’apport d’un test au diagnostic.

RV+ : autre manière de présenter les résultats par rapport à la sensibilité

➢ Mesure de la vraisemblance d’avoir un test positif si on est malade

➢ RV+ varie de 0 à +∞

➢ Apport nul si RV+ = 1 < apport mineur ≤ 10 < apport important (utilisable en dépistage) Exemple : RV+ = 2

➢ Le test est 2 fois plus souvent positif chez les malades que chez les non malades

RV+ = probabilité que le test soit positif sachant qu’il est malade / la probabilité que le test soit positif sachant qu’il n’est pas malade.

(10)

Page 10 sur 14

RV- : autre manière de présenter les résultats par rapport à la spécificité

➢ RV- varie de 0 à +∞

➢ Plus il est proche de 0, meilleur est le test

Exemple : RV- = 0,01

➢ Un sujet a 0,01 fois plus de risque d’avoir un test négatif quand il est malade par rapport à un sujet non malade (autrement dit 100 fois moins de risque).

RV- = Probabilité d’avoir un test négatif sachant que le patient est malade / la probabilité d’avoir un test négatif sachant que le patient n’est pas malade

b) Indice de Youden (J)

➢ Varie de -1 à +1

➢ Indice de Youden = Se + Sp – 1

➢ Si J ≤ 0, le test n’a aucune valeur informationnelle

➢ Le test est d’autant meilleur que l’indice de Youden est proche de 1 c) % de bien classés

➢ % BC = (VP + VN) / (VP+FP+FN+VN) = « Vrais résultats »/ TOTAL

Exemple : si % BC = 80% alors 80% de patients sont bien classés avec le nouveau test

8) Nomogramme de Fagan

• Probabilité pré-test (1ère ligne du nomogramme)

➢ C’est la prévalence de la maladie dans la population étudiée

• RV (2ème ligne du nomogramme)

• Probabilité post-test (3ème ligne du nomogramme)

À partir de la probabilité pré- test (= prévalence de la maladie dans la population) et du RV, on peut en déduire la probabilité post-test sur le nomogramme de Fagan Exemple 1 :

Prévalence de 60%

Rapport de vraisemblance positif : 20 Probabilité post-test VPP déterminée à partir de la droite qu’on a tracé Cela illustre le lien entre tous les paramètres.

Pareil pour la VPN avec le rapport de vraisemblance négatif (droites en pointillés), attention : la valeur lue en post-test sera donc 1 – VPN

Exemple 2 :

Même principe avec une prévalence différente

(11)

Page 11 sur 14

9) Test quantitatif

Jusqu’à présent, on s’est attaché à décrire un test qualitatif (positif/négatif) mais on peut aussi avoir un test quantitatif avec plusieurs valeurs numériques mais pas de + ou – (≠qualitatif)

Quand on évalue un test quantitatif, par exemple les D-Dimères (dans l’embolie pulmonaire), on calcule la Se et la Sp pour chaque valeur de D-Dimères (pour chaque seuil, on fait un tableau contingent de spécificité et sensibilité). Ces calculs sont automatisés pour chaque valeur.

Exemple : 100 µg/L → Se = 1 et Sp = 0,011 etc.

Plus les D-dimères sont élevées, plus la sensibilité diminue et la spécificité augmente.

Il faut déterminer un seuil.

En pratique, on va rarement avoir un test avec une sensibilité ET une spécificité proches de 100%.

(note ronéiste : pour comprendre, on sait qu’il y a une bonne VPN pour les D-dimères à 99% au seuil où on l’utilise soit 500, donc sachant que le patient a une embolie, on est presque sûr qu’il a plus de 500 d’où une grande sensibilité et donc une faible spécificité de cet examen. C’est pourquoi cet examen est utilisé pour exclure une embolie. Si on élève le seuil, on regagne en spécificité car on veut être sûr que le patient ait bien une embolie et que le test ne se positive pas dû à sa grande sensibilité)

a)

Courbe ROC : Aire sous la courbe

• En ordonnée : Se

• En abscisse : 1 – Sp

Plus l’aire sous la courbe (ASC) est grande (proche de 1), meilleur est le test

Chaque point de la courbe, obtenu via un tableau de contingence, correspond à un seuil du tableau quantitatif.

Courbe linéaire correspond à une aire sous la courbe de 0,5 : il se trompe 1 fois sur 2, c’est pile ou face… → aucun intérêt diagnostique

2ème courbe : environ 60%/70% → médiocre

3ème courbe : bon test avec une grande aire sous la courbe

(12)

Page 12 sur 14

On rappelle qu’il est très rare d’être très proche de 1 (sensibilité ET spécificité proches de 100%).

b) Distribution des valeurs de la variable X chez les malades (M+) et non malades (M-)

On voit sur le schéma ci-dessous la distribution des malades en rouge et des non malades en noir :

➢ Seuil S1 : test très sensible mais peu spécifique (identifie correctement les malades)

➢ Seuil S2 : test très spécifique mais peu sensible (identifie correctement les non malades)

➢ Seuil S3 : meilleur rapport entre sensibilité et spécificité

Exemple : est-ce que la fièvre est un bon marqueur diagnostique de la grippe ?

➢ S1 = 38° : moitié des non malades considérés comme malades → mauvaise Sp Mais tous les malades sont bien considérés comme malades → 100% Se

➢ S2 = 40° : tous les non malades ne sont pas considérés comme malades → 100% Sp Mais la moitié des malades ne sont pas considérés comme malades → mauvaise Se

➢ S3 = 39° : la majorité des malades et des non malades sont bien identifiés.

c) Choix du seuil :

• Nécessité d’arbitrer entre faux positifs et faux négatifs

➢ Et donc en fonction des valeurs de sensibilité et de spécificité

• L’interprétation du test dépend du seuil choisi

➢ Cf. l’exemple précédent avec les différentes températures comme seuils

• Dépend de l’objectif fixé :

Choisir plutôt un test sensible si : - La maladie est grave.

- La maladie est curable.

- L’existence d’un faux-positif n’entraine pas de traumatisme grave.

- Exemple : paludisme (maladie grave et à traiter rapidement). Donner un traitement antipaludique (si ce dernier n’a pas d’EI graves) à quelqu’un de non infecté n’est pas très gênant alors que ne pas traiter un patient impaludé est beaucoup + grave.

(13)

Page 13 sur 14

Choisir plutôt un test spécifique si :

- La maladie est sérieuse mais difficilement curable.

- Les résultats faussement positifs peuvent être psychologiquement ou économiquement traumatisants pour les sujets dépistés.

- Exemple : cancer. Mieux vaut ne pas donner de chimiothérapie à une personne non malade. Le cancer est une annonce de maladie grave, et difficilement curable → traumatisant et traitement onéreux.

Remarque : dans les tests de dépistage, on privilégie la sensibilité parce qu’on sait que dans tous les cas, le patient aura un examen diagnostique de confirmation après un test de dépistage positif.

10)

Mesurer la concordance entre deux mesures

Jusqu’à présent, on s’est attaché à illustrer la comparaison d’un test à un gold standard. Cependant, il y a certaines maladies où il n’y a pas de gold standard. En l’absence de ce gold standard de référence, quand on veut évaluer un nouveau test : on ne peut pas calculer les paramètres qu’on a vu (Se, Sp, VPP/N, RV+/- …). Dans ce cas-là, on utilise le test utilisé dans la prise en charge habituelle du patient mais qui n’est pas un gold standard. On peut quand même calculer la concordance :

• Si tests avec résultats qualitatifs (malade / pas malade)

Coefficient Kappa de Cohen

+ K est proche de 1 + les tests sont concordants → > 0,8 (accord presque parfait) est l’idéal

• Si tests, avec résultats quantitative (ex : débit cardiaque mesuré par 2 outils différents)

Coefficient de corrélation intra-classe

+ ICC proche de 1 + les deux outils sont en concordance → > 0,75 (ou 0,8 selon les auteurs) : très bonne concordance

L’intérêt de ces paramètres de concordance est de privilégier les tests non invasifs vis-à-vis des tests invasifs lorsqu’ils sont concordants (donnent le même résultat)

(14)

Page 14 sur 14

11)

Les biais

Il faut faire attention à certains biais :

• Biais de sélection : surviennent au moment de l’inclusion des patients

➢ La prévalence des malades peut être différente (et donc les probabilités post-test aussi)

➢ Toujours comparer les valeurs prédictives de différentes études en fonction de la prévalence de la maladie

• Biais de classement :

➢ Test subjectif, dépend de l’expérience du praticien

Evaluation en aveugle et indépendamment du test de référence +++

➢ L’investigateur ne doit pas connaitre le statut de la personne étudiée

➢ Exemple : mammographie/examen histologique : le radiologue et l’anatomopathologiste ne savent pas le résultat de l’autre test (ex : le radiologue ne connaît pas la conclusion de l’examen de la biopsie en anatomopathologie).

• Biais d’incorporation :

➢ Résultat du test diagnostique évalué inclus dans le résultat donné par la méthode de référence

➢ Survient notamment lorsque la méthode de référence repose sur plusieurs examens du fait de l’inexistence d’un examen de référence unique

➢ Exemple : Si le test de référence est une association de 2 examens. On veut comparer 1 des 2 examens associés de référence par rapport à l’association des 2 examens pour voir s’il est efficace seul. → Il y a un biais d’incorporation avec risque de surestimer la Se et la Sp (note correcteur : car on va comparer un test à lui-même quasiment donc forcément les valeurs seront très concordantes dans le tableau)

Références

Documents relatifs

Consultation de Neurogénétique – Département Neurologie CHU d’Angers – 4 rue Larrey – 49033 ANGERS cedex 01

On dispose d'un test pour détecter une maladie présente dans la population avec une fréquence q. Avec ce test, la probabilité d'obtenir un résultat positif sur une personne malade est

Cela signifie que sur 100 personnes malades qui subissent le test, le test donnera environ une réponse fausse : un test négatif et sur 100 personnes saines testées, une sera

• Si un membre de votre foyer a subi un test de dépistage covid-19 et qu’il présente des symptômes typiques du covid-19 tels que perte de goût/d’odorat, votre enfant doit

[r]

Proposition d'expérience: A l'aide d'un texte et d'un croquis (avec légende), propose une expérience qui permettrait de savoir si les deux échantillons à

Complication la plus dramatique Problème fonctionnel et infectieux Problème vital..

Français interactif 2010 • University of Texas at Austin