EVALUATION DES TESTS DE DIAGNOSTIC. Vray M Institut Pasteur 1

(1)

EVALUATION DES TESTS EVALUATION DES TESTS

DE DIAGNOSTIC

(2)

Plan de la pr

Plan de la pr é é sentation sentation

Introduction Introduction

–– DDééfinition Dfinition Déépistage, Diagnostiquepistage, Diagnostique

Les Les ¾ ¾ phases de d phases de d é é veloppement d veloppement d ’ ’ un test un test

–– Phases 1, 2, 3 et 4Phases 1, 2, 3 et 4

Les indices de performances Les indices de performances

–– ReproductibilitéReproductibilité (Indice Kappa de Cohen, diagramme (Indice Kappa de Cohen, diagramme de de BlandBland et Altman, CCI)et Altman, CCI)

–– ValiditValiditéé (Se, (Se, SpSp, VPP, VPN, LR+, LR-, VPP, VPN, LR+, LR-)) –– Courbes RocCourbes Roc

Les principaux biais

(3)

Les Les crit crit è è res res diagnostiques diagnostiques

Ce Ce sont sont des des marqueurs marqueurs dont dont les les r r é é sultats sultats permettent

permettent d d ’ ’ orienter orienter la la d d é é cision cision m m é é dicale dicale Deux Deux niveaux niveaux : :

– – Les tests de Les tests de d d é é pistage pistage – – Les tests de diagnostic Les tests de diagnostic

Comprennent Comprennent

Test m

Test m é é dical, signes cliniques, crit dical, signes cliniques, crit è è res res bact bact é é riens, images radiologiques, tests riens, images radiologiques, tests biochimiques ..

biochimiques ..

(4)

Un test peut être

Un test peut être tr tr è è s simple s simple par exemple par exemple une culture bact

une culture bact é é rienne rienne pour pour é é valuer une valuer une infection

infection

Ou Ou plus compliqu plus compliqu é é par exemple un par exemple un score score clinique

clinique à à partir d partir d ’ ’ un questionnaire ou un questionnaire ou la la s s é é quence de proc quence de proc é é dures sp dures sp é é cifiques cifiques

selon un protocole

(5)

D D é é pistage et diagnostic pistage et diagnostic

Dépistage

Complications exposition Phase

pré-clinique

Phase clinique

Diagnostic

(6)

Diagnostic et D

Diagnostic et D é é pistage pistage

Le diagnostic

Le diagnostic se distingue du se distingue du dé d é pistage pistage par une caract

par une caract é é ristique fondamentale : ristique fondamentale : La motivation de l

La motivation de l’ ’examen examen

R R é é alis alis é é en raison de l en raison de l ’é ’é tat clinique (sujet tat clinique (sujet malade)

malade)

diagnostic diagnostic

R R é é alis alis é é ind ind é é pendamment de l pendamment de l ’é ’é tat clinique tat clinique (sujet apparemment sain)

(sujet apparemment sain)

d d é é pistage pistage

(7)

Sp Sp é é cificit cificit é é des tests de des tests de « « d d é é pistage pistage » »

S S ’ ’ appliquent appliquent à à des sujets sains des sujets sains Sur une large

Sur une large é é chelle chelle

Doivent être non invasifs (sans danger et Doivent être non invasifs (sans danger et

facile

facile à à administrer) et peu chers administrer) et peu chers

En gé En g é n n é é ral, ils sont suivis par d ral, ils sont suivis par d ’ ’ autres tests autres tests avant de prendre la d

avant de prendre la d é é cision de traiter cision de traiter

Le traitement avant les symptômes doit avoir Le traitement avant les symptômes doit avoir

une meilleure efficacit

une meilleure efficacit é é comparé compar é e e à à un un traitement donn

traitement donn é é apr apr è è s le d s le d é é but des but des symptômes : d

symptômes : dé é pistage cancer col ut pistage cancer col ut é é rin, rin, cancer du poumon?

cancer du poumon?

(8)

D D é é pistage versus Diagnostic pistage versus Diagnostic

Int Int é é rêt de tester des populations saines rêt de tester des populations saines pour traiter pr

pour traiter pr é é cocement cocement

Ex Ex : : Cancer du sein et mammographie Cancer du sein et mammographie Cholest

Cholest é é rol rol é é mie et HTA pour maladies CV mie et HTA pour maladies CV Maladies infectieuses avec traitement

Maladies infectieuses avec traitement

disponible (avantage individuel et collectif)

(9)

L L ’é ’é valuation statistique est identique valuation statistique est identique que que ce soit pour

ce soit pour un Test de

un Test de « « d d é é pistage pistage » » ou ou

un Test de

un Test de « « diagnostic diagnostic » »

(10)

Crit Crit è è res pour un test m res pour un test m é é dical dical

« « int int é é ressant ressant » »

Il doit y avoir un b

Il doit y avoir un b é é né n é fice fice à à diagnostiquer la diagnostiquer la maladie

maladie

Avant de mettre en place un test il y a des crit Avant de mettre en place un test il y a des crit è è res res à à v v é é rifier rifier

La maladie doit être

La maladie doit être grave grave conséconséquences sur la survie ouquences sur la survie ou La qualit

La qualitéé de viede vie

La maladie doit être

La maladie doit être «« importanteimportante »» prpréévalence valence éélevlevéée danse dans la population cibl

la population cibléée ou contexte e ou contexte éépidpidéémiquemique

La maladie peut

La maladie peut être traitêtre traitééee (gu(guéérison ou ralentissement)rison ou ralentissement)

(11)

Si le traitement existe,

Si le traitement existe, les malades y ont accles malades y ont accèèss (PED)(PED) DDééfinir le bfinir le béénnééficefice apportapportéé par le test au patient par le test au patient

Le test ne doit

Le test ne doit pas être douloureuxpas être douloureux

(b(béénnééfices > inconvfices > inconvéénients: conients: coûût, dt, dééplacement, inconfort placement, inconfort moral, physique etc..)

moral, physique etc..)

Evaluer comment le test va

Evaluer comment le test va s’s’intintéégrer dans la prise en grer dans la prise en charge de la maladie

charge de la maladie Le test doit être

Le test doit être performant performant permet de bien classer les permet de bien classer les sujets en Malades et Non malades

sujets en Malades et Non malades

Eviter les faux Positifs Eviter les faux Positifs traittraitéés s àà torttort

Eviter les faux NéEviter les faux Négatifs gatifs non traitnon traitéés às à torttort

(12)

Les 3/4 phases de Les 3/4 phases de

d d é é veloppement d veloppement d ’ ’ un test un test diagnostique

diagnostique

(13)

La phase I (proof

La phase I (proof - - of of - - concept) concept)

LL’’objectif de cette phase exploratoire est de vobjectif de cette phase exploratoire est de véérifier que les rrifier que les réésultats dusultats du test sont diff

test sont difféérents chez les malades et les non malades (conditionsrents chez les malades et les non malades (conditions

«« de laboratoirede laboratoire »»))

VVéérification du rification du «« mméécanismecanisme »» dd’’actionaction Test dans conditions diff

Test dans conditions difféérentesrentes (temp(tempéératures, humiditratures, humiditéé..), conditions..), conditions de recueil

de recueil

Test chez sujets ou

Test chez sujets ou ééchantillons diffchantillons difféérentsrents (diff(difféérents niveaux derents niveaux de

sséévvééritritéé de maladie ou de quantitde maladie ou de quantitéé de bactde bactéériesries…….) y compris des sujets.) y compris des sujets non malades mais avec des symptômes proches de ceux des sujets

non malades mais avec des symptômes proches de ceux des sujets malades

malades

Test de la reproductibilit Test de la reproductibilitéé

(14)

Exemple: Bandelettes pour diagnostiquer des Exemple: Bandelettes pour diagnostiquer des

shigelles

shigelles à à partir de selles partir de selles

-- VVéérifier rifier

-- bandelettes + dans prébandelettes + dans préllèèvements contenant des vements contenant des shigellesshigelles -- Bandelettes Bandelettes -- dans prdans prééllèèvements sans vements sans shigellesshigelles

-- DDééfinir les conditions de recueil des selles (dfinir les conditions de recueil des selles (déélai de lai de recueil et conditions de st

recueil et conditions de stéérilitrilitéé..)..)

-- VVéérifier drifier déélai et conditions de lecture (mode dlai et conditions de lecture (mode d’’emploi)emploi)

-- VVéérifier la reproductibilitrifier la reproductibilitéé de la lecture (utiliser 2 de la lecture (utiliser 2 bandelettes, lues par deux lecteurs diff

bandelettes, lues par deux lecteurs difféérents)rents)

-- Faire varier les conditions de stockage des bandelettes Faire varier les conditions de stockage des bandelettes (humidit

(humiditéé, temp, tempéérature)rature)

(15)

Cette phase permet de savoir si le test Cette phase permet de savoir si le test semble

semble suffisamment suffisamment « « fiable fiable » » pour pour pouvoir être utilis

pouvoir être utilis é é dans les conditions dans les conditions souhait

souhait é é es es

Une Une bonne reproductibilit bonne reproductibilit é é est n est n é é cessaire cessaire

(16)

La phase II (Etude cas

La phase II (Etude cas - - t t é é moins) moins)

L’L’objectif de cette phase de validation est de montrer queobjectif de cette phase de validation est de montrer que

-- la probabilitéla probabilité d’d’avoir un ravoir un réésultat + est supsultat + est supérieure chez les malades érieure chez les malades

-- la probabilitéla probabilité d’d’avoir un ravoir un réésultat sultat –– est supéest supérieure chez les non malades rieure chez les non malades

ValiditValiditéé du test dans conditions contrôlédu test dans conditions contrôléeses ((≠≠ conditions de terrain) conditions de terrain)

-- SéSélectionner les cas et les tlectionner les cas et les téémoins, les moins, les éévaluateursvaluateurs (m(médecins, infirmiers, édecins, infirmiers, radiologues..) qui peuvent diff

radiologues..) qui peuvent difféérer du terrainrer du terrain

-- DéDéfinir dans un PROTOCOLE finir dans un PROTOCOLE les conditions d’les conditions d’utilisation du testutilisation du test (en (en essayant d

essayant d’éviter les biais)’éviter les biais)

-

- Tester diffTester différentesérentes conditionsconditions de recueil (tempde recueil (tempéératures, humiditratures, humiditéé..) ..)

-- Estimer le % de faux positifs et de faux néEstimer le % de faux positifs et de faux négatifs gatifs (calcul du NSN et (calcul du NSN et estimations des valeurs acceptables)

estimations des valeurs acceptables)

-- Pour les tests quantitatifs, dPour les tests quantitatifs, dééfinir le finir le cutcut-off (-off (Courbes Roc), identifier les Courbes Roc), identifier les facteurs ayant un impact sur le test (ou ceux qui le rendent ini

facteurs ayant un impact sur le test (ou ceux qui le rendent ininterprnterpréétable)table)

(17)

Les Les é é tudes de phases I et II sont des tudes de phases I et II sont des é é tudes tudes r r é é trospectives trospectives r r é é alis alis é é es es

uniquement dans un but de recherche uniquement dans un but de recherche

Le statut du malade est d

Le statut du malade est d é é termin termin é é avant avant par d

par d ’ ’ autres moyens autres moyens

(18)

La phase III (Etude prospective) La phase III (Etude prospective)

Objectif principal:

Objectif principal: DéDéterminer les performances du test dans lesterminer les performances du test dans les conditions o

conditions oùù il sera utiliséil sera utilisé

vévérifier que chez les patients chez lesquels il est cliniquementrifier que chez les patients chez lesquels il est cliniquement pertinent, les r

pertinent, les réésultats du test permettent de distinguer les maladessultats du test permettent de distinguer les malades des non malades

des non malades

Les performances pourront être compar

Les performances pourront être comparéées es àà celles d’celles d’autres testsautres tests

RéRéalisaliséée dans les e dans les conditions pratiques dconditions pratiques d’utilisation du test’utilisation du test

S’S’adresse adresse àà des sujets dont on ne connaîdes sujets dont on ne connaît pas t pas àà ll’avance l’avance l’é’état tat (Malade ou Non Malade)

(Malade ou Non Malade)

(19)

Phase IV ? Phase IV ?

Id Id é é alement, il est int alement, il est int é é ressant de comparer, par ressant de comparer, par un essai randomis

un essai randomis é é , l , l ’ ’ impact de l impact de l ’ ’ introduction introduction du test par rapport

du test par rapport à à une prise en charge sans une prise en charge sans test, dans la pratique courante, sur des

test, dans la pratique courante, sur des

crit crit è è res de res de morbi morbi - - mortalit mortalit é é (qualit (qualit é é de vie) et de vie) et de co

de co ûts û ts

Permet de savoir si les sujets Permet de savoir si les sujets « « test test é é s s » » se se

« « portent mieux portent mieux » » que les sujets « que les sujets « non testé non test é s s » »

(20)

Relation entre le Taux de peptide

Relation entre le Taux de peptide natriur natriur é é tique tique (PN) (PN) et hypertrophie ventriculaire gauche (HVG)

et hypertrophie ventriculaire gauche (HVG)

Phase I Phase I

Les patients avec une HVG ont

Les patients avec une HVG ont--ils des concentrationsils des concentrations de PN sup

de PN supéérieures rieures àà celles observécelles observées chez des sujetses chez des sujets normaux?

normaux?

Patients HVG + Patients HVG Patients HVG + Patients HVG --

PN (pgPN (pg/ml)/ml)

mémédianediane 493.5493.5 129.4129.4 range

range (248.9(248.9-909.0)-909.0) (53.6-(53.6-159.7) 159.7)

(21)

Relation entre le Taux de peptide

Relation entre le Taux de peptide natriur natriur é é tique tique (PN) (PN) et hypertrophie ventriculaire gauche (HVG)

et hypertrophie ventriculaire gauche (HVG)

Phase II Phase II

Les patients avec des concentrations de PN

Les patients avec des concentrations de PN éélevlevéées ontes ont ils plus souvent une HVG que ceux avec des

ils plus souvent une HVG que ceux avec des concentrations faibles ?

concentrations faibles ?

PN (pgPN (pg/ml)/ml)

C C

as (Avec HVG) Téas (Avec HVG) Témoins (Sans HVG)moins (Sans HVG) Valeurs

Valeurs éélevlevééeses n=39n=39 n=2 n=2 Valeurs normales

Valeurs normales n=1n=1 n=25n=25

Se= 98% (87Se= 98% (87--100) 100) VPP=95% (84VPP=95% (84--99)99) SpSp= 92% (77-= 92% (77-98) 98) VPN=95% (84VPN=95% (84--99)99)

LR+= 13 (3.5LR+= 13 (3.5--50.0)50.0) LR-LR-= 0.03 (0.0003= 0.03 (0.0003--0.19) 0.19)

(22)

Relation entre le Taux de peptide

Relation entre le Taux de peptide natriur natriur é é tique tique (PN) (PN) et hypertrophie ventriculaire gauche (HVG)

et hypertrophie ventriculaire gauche (HVG) Phase III

Phase III

Parmi les sujets chez qui une suspicion clinique de HVG Parmi les sujets chez qui une suspicion clinique de HVG

existe, les taux de PN sont

existe, les taux de PN sont--ils diffils difféérents entre ceux quirents entre ceux qui ont une HVG (Echo) et ceux qui n

ont une HVG (Echo) et ceux qui n’’en nen n’’ont pas ?ont pas ?

PN (PN (pgpg/ml)/ml) Sujets Sujets HHVG + Sujets VG + Sujets HHVG VG --

Valeurs

Valeurs éélevlevéées (>=18)es (>=18) n=35n=35 n=57n=57

Valeurs normales (<18)

Valeurs normales (<18) n=5n=5 n=29n=29

Se Se = 88% (74-= 88% (74-94) 94) VPP=38% (29VPP=38% (29--48)48) SpSp = 34% (25= 34% (25--44) 44) VPN=85% (70VPN=85% (70--94)94) LR+= 1.3 (1.1LR+= 1.3 (1.1--1.6)1.6) LR-LR- = 0.4 (0.2-= 0.4 (0.2-0.9)0.9)

(23)

Relation entre le Taux de peptide

Relation entre le Taux de peptide natriur natriur é é tique tique (PN) (PN) et hypertrophie ventriculaire gauche (HVG)

et hypertrophie ventriculaire gauche (HVG)

Phase IV Phase IV

Les sujets chez qui une suspicion clinique de HVG existe Les sujets chez qui une suspicion clinique de HVG existe et chez qui un dosage de PN a

et chez qui un dosage de PN a ééttéé rrééalisaliséé ont ont -- ils ils «« unun meilleur

meilleur éétat de santtat de santéé »» que les sujets qui nque les sujets qui n’’ont pas ont pas ééttéé testtestéés ?s ?

(24)

Indices de performances

Reproductibilité

Validité (Accuracy)

(25)

Protocole pour

Protocole pour é é valuer la reproductibilit valuer la reproductibilit é é de la mesure

de la mesure

D D é é finir la population finir la population à à analyser : analyser : repr repr é é senter senter toute toute l l ’é ’é tendue tendue des des

mesures mesures

Au moins 2 r Au moins 2 r é é p p é é titions titions

R R é é sultats ind sultats ind é é pendants ( pendants ( é é valuation valuation en insu)

en insu)

(26)

Type de crit

Type de crit è è res res

1) Variable discr

1) Variable discr è è te (2 ou K classes) te (2 ou K classes) Coefficient Kappa

Coefficient Kappa de Cohen de Cohen

2) Variable quantitative 2) Variable quantitative

Diagramme de

Diagramme de Bland Bland et Altman et CV ou CCI et Altman et CV ou CCI

(27)

Crit Crit è è res qualitatifs res qualitatifs

Coefficient Kappa de Coefficient Kappa de

Cohen

(28)

Le coefficient Kappa Le coefficient Kappa

L’ L ’accord accord observ observ é é entre entre des des jugements jugements qualitatifs, r

qualitatifs, r é é sulte sulte de de la la somme somme d d ’ ’ une une composante

composante « « al al é é atoire atoire » » et d’ et d ’une composante une composante d d ’ ’ accord accord « « v v é é ritable ritable » »

Le coefficient Kappa

Le coefficient Kappa propose de chiffrer propose de chiffrer l l ’ ’ intensit intensit é é ou la qualit ou la qualit é é de l de l ’ ’ accord r accord r é é el el

entre des jugements qualitatifs appari

entre des jugements qualitatifs appari é é s s

(29)

Accord entre 2

Accord entre 2 é é valuations valuations (Exemple : N= 81 sujets

(Exemple : N= 81 sujets é é valu valu é é s) s)

8 . 5 0

. 0 1

5 . 0 9 . 0

1 =

−

= −

−

= −

e e o

P P Kappa P

4141

(24.95) (24.95) 22

(18.05) (18.05)

66

(22.05) (22.05) 32 32

(15.95) (15.95) ++

Evaluation 2 Evaluation 2

--

Evaluation 1 Evaluation 1

++

- -

Po = (32+41) / 81 = 0.9

Pe = (15.95 +24.95) / 81 = 0.5

Po = 0.9 Pe = 0.5 (chance)

1 - Pe = 0.5 Po –Pe = 0.4

07 . ) 0 1

( ) 1

(

) 1

( =

−

= −

e e

o kappa o

P P

n

P SE P

kappa

SE Kappa

IC ₉₅_%= ±1.96×

14 . 0 8 . 0 07 . 0 96 . 1 8 .

% 0

95 = ± × = ±

IC

(30)

Il exprime une diff

Il exprime une difféérence relative entre la proportion rence relative entre la proportion d’d’accord observaccord observéée e PoPo et la proportion det la proportion d’’accord accord alalééatoire atoire PePe (la (la valeur valeur attendue attendue sous sous HO HO d’d’indindéépendance des jugements) divispendance des jugements) diviséée par la quantite par la quantitéé

disponible au

disponible au--deldelàà de lde l’’accord alaccord alééatoireatoire

K est un pourcentage de lK est un pourcentage de l’’accord maximumaccord maximum corrigcorrigéé de ce qu

de ce qu’’il serait sous le simple effet du hasardil serait sous le simple effet du hasard

Le coefficient

Le coefficient KappaKappa est un nombre rest un nombre rééel, sans el, sans dimension, compris entre

dimension, compris entre --1 et +11 et +1

Chi-Chi-2 de Mac 2 de Mac NemarNemar (qui teste (qui teste s’s’il y ail y a concordanceconcordance) ) nn’’est pas appropriest pas appropriéé dans ce contexte dans ce contexte

Utilisation du Kappa pour

Utilisation du Kappa pour éévaluer la reproductibilitvaluer la reproductibilitéé mais aussi la validit

mais aussi la validitéé (quand le test et le Gold standard(quand le test et le Gold standard ont le même nombre de cat

ont le même nombre de catéégories, notamment 2)gories, notamment 2)

(31)

Concordance et Kappa Concordance et Kappa

«« Valeurs de réValeurs de réfféérencerence »» (Landis(Landis--Koch, 1977)Koch, 1977)

Kappa peut être test

Kappa peut être testéé (Ho: Kappa= 0) mais ce test a peu d’(Ho: Kappa= 0) mais ce test a peu d’intintéérêt en rêt en pratique: le kappa s

pratique: le kappa s’’utilise davantage comme un indicateur utilise davantage comme un indicateur descriptif descriptif de concordance

de concordance

(32)

Concordance et Kappa Concordance et Kappa Cas Cas à à K K ≥≥≥≥ ≥≥≥≥ 2 cat 2 cat é é gories gories

Lecture du frottis cervico-utérin chez 761 sujets, méthode Papanicolaou (J. Coste et al, BMJ 2003)

79 . 761 0

8 86 33

25 448 + + + + =

=

P

o

0 . 48

761 7 . 5 14 . 6 0 . 8 5

. 5 4 .

336 + + + + =

= Pe

59 . 48 0

. 0 1

48 . 0 79 . 0

1 − − = − − =

=

e e o

P P Kappa P

336.4

5.5

7.5

14.6

0.8

(33)

Concordance et Kappa:

Les deux paradoxes Les deux paradoxes

D D épendance lourde de Kappa vis é pendance lourde de Kappa vis - - à à - - vis de la fr vis de la fr équence é quence ( ( biais de biais de pr pr é é valence = PI valence = PI ) des r ) des r é é ponses positives ponses positives (plus (plus

une cat

une cat égorie est rare, plus le kappa est bas) é gorie est rare, plus le kappa est bas) Probl

Probl ème du è me du biais (BI) biais (BI) lorsque les 2 observateurs lorsque les 2 observateurs

Diff Diff è è rent dans leur jugement rent dans leur jugement

(34)

Exemple

Exemple (1/2) : Probl(1/2) : Problèèmeme

de de pr pr é é valence valence (PI) (PI)

4545 66

--

99 4040

++ Clinicien

Clinicien 22

-- ++

Clinicien Clinicien 11

8080 1010

--

55 55

++ Clinicien

Clinicien 22

-- ++

Clinicien Clinicien 11

Kappa = 0.7 Kappa = 0.32

A concordance constante (ici 85%), le Kappa est d’autant plus grand que le pourcentage de diagnostics positifs (ou négatifs) parmi les concordants est proche de 50%

Déséquilibre entre les taux de concordance + et - Kappa diminue

Tableau 1 Tableau 2

(35)

Exemple

Exemple (2/2): (2/2): Biais Biais d d ’ ’ interpr interpr é é tation tation entre entre lecteurs lecteurs

1515 2525

--

1515 4545

++ Clinicien

Clinicien 22

-- ++

Clinicien Clinicien 11

3535 55

--

3535 2525

++ Clinicien

Clinicien 22

-- ++

Clinicien Clinicien 11

Kappa = 0.13 Kappa = 0.26

Dans le tableau 1, les deux cliniciens portent le diagnostic avec une fréquence proche (70% pour le clinicien 1 et 60% pour le clinicien 2)

Dans le tableau 2, le clinicien 1 porte le diagnostic dans 30% des cas contre 60% pour le clinicien 2.

Le Kappa est plus élevé dans le tableau 2 alors que les cliniciens sont le plus en désaccord.

Tableau 1 Tableau 2

(36)

C C onclusions onclusions

Calculer

Calculer Kappa, BI, PI Kappa, BI, PI

Si BI important Si BI important il faut essayer de comprendre il faut essayer de comprendre pourquoi les 2 lecteurs ne cotent

pourquoi les 2 lecteurs ne cotent pas de la même pas de la même fa fa ç ç on on

Si PI important

Si PI important et BI faible et BI faible il est n il est n é é cessaire de cessaire de fournir les valeurs de concordances positives et fournir les valeurs de concordances positives et n n é é gatives gatives P P

_neg_neg

et P et P

_pos_pos

Ces donn

Ces donn é é es sont particuli es sont particuli è è rement importantes rement importantes quand on veut comparer les r

quand on veut comparer les r é é sultats de plusieurs sultats de plusieurs

é é tudes tudes

(37)

Crit Crit è è res quantitatifs res quantitatifs

Diagramme de

Diagramme de Bland Bland et Altman et Altman Coefficient de corr

Coefficient de corr é é lation intra lation intra - - classe

classe (CCI) (CCI)

(38)

Résultats de la régression linéaire

Pente = 1

Surestimation systématique d’amplitude b Y

X b

Y

X b

Pente = 1

Sous estimation systématique d’amplitude b Y

Pente ≠ 1 X

Surestimation jusqu’à un seuil

(39)

Une pente = 1 et/ou un coefficient de corrélation entre les deux séries de mesures (x et y) permet de juger d’une

liaison entre les deux méthodes

Les deux méthodes mesurant (a priori) la même chose, on doit observer une liaison

Mais ne renseigne pas sur la qualité des deux mesures (ne quantifie pas les écarts entre les 2 méthodes)

(40)

Etape 2 : Méthode de Altman & Bland

Etude du nuage de points avec

en abscisse : la moyenne des 2 mesures (x+y)/2 en ordonnée : la différence des 2 mesures (x-y)

Cette méthode fait l’hypothèse que les différences sont distribuées normalement :

d : moyenne des différence (x-y) s_d : écart-type des différences (x-y)

⇒

⇒ Compare les différences observées à la distribution statistique attendue

Condition d’application : nombre de mesures par méthodes n ≥≥≥≥ ³⁰

(41)

Les Les diff diff é é rentes rentes é é tapes tapes

Y a-t-il une liaison entre les deux mesures ?

Coefficient de corrélation

Oui Non

Fin d’analyse Y a-t-il concordance ?

Y a-t-il indépendance entre la variabilité et le niveau de la

mesure ?

Diagramme de Bland & Altman

Oui Non

Coefficient de Corrélation Coefficient de

(42)

Comment juger si la nouvelle méthode est acceptable ? C’est-à-dire peut remplacer l’ancienne, ou si les 2 lecteurs donnent les mêmes résultats

- La différence entre les méthodes n’augmente pas lorsque les valeurs augmentent (ou diminuent)

- La différence entre deux mesures est peu éloignée de la moyenne 00

DifféDifférence rence (x-(x-y)y)

Valeurs moyennes (x+y)/2 Valeurs moyennes (x+y)/2

dd

d + 1.96 d + 1.96 ss_d_d

d -d - 1.96 s1.96 s_d_d

(43)

DiffDifféérence rence (x-(x-y)y)

00

dd

00

dd DifféDifférence rence

(x-(x-y)y)

Indépendance entre la variabilité et le niveau de la

mesure

Dépendance entre la variabilité et le niveau de la mesure

(effet entonnoir)

(x+y)/2 (x+y)/2

(44)

Spécificité de la Reproductibilité d’une mesure continue Pour vérifier la reproductibilité d’une mesure, on répète la mesure (≥≥≥≥ 2) sur les mêmes échantillons :

- les mesures doivent être indépendantes (TAS) - éviter les facteurs liés à l’ordre

Vérification de la cohérence en utilisant une régression linéaire :

→ pente = 1 (coefficient de corrélation élevé) doit être observé(e),

→ mais ne renseigne pas sur la reproductibilité

⇒Coefficient de corrélation intra-classe (>0.9)

⇒ ou Coefficient de variation (<0.1)

(45)

Validit

Validit é é d d ’ ’ un test par rapport un test par rapport

à à un Gold Standard un Gold Standard

(46)

D D é é finition du Gold Standard finition du Gold Standard

Caractéristiques des critères permettant d’affirmer l’existence d’une maladie

Un critère indiscutable: tuberculose et BK ? Tuberculose et IDR+?

Critères histo-pathologiques à partir de Biopsies

(47)

Difficult

Difficult é é s du Gold Standard s du Gold Standard

Pas de gold standard : aucun critère vraiment satisfaisant

Ex= test rapide de bandelettes pour diagnostiquer shigelles chez enfants atteints de diarrhée sévère (Coproculture peu sensible, PCR non spécifique)

Quand un nouveau test ferait mieux que le standard actuel

Ex: bandelettes plus sensibles si lues rapidement

Un gold standard ne doit comporter dans sa

définition, ni le signe, ni le résultat du test

dont on évalue les propriétés diagnostiques

(48)

Le test

Les critères de positivité d’un test doivent être connus précisément

Décrire les conditions dans lesquelles ils sont mesurés et les règles de conclusion

Exemples

Utilisation d’une bandelette pour diagnostiquer des

shigelles dans les selles lecture dans les 15 minutes … Mesure de la glycémie: à jeun, post prandiale

Examen direct BK (conditions de lecture : nombre de champs microscopiques?)

(49)

Evaluation d

Evaluation d ’ ’ un nouveau test diagnostic un nouveau test diagnostic et crit

et crit è è res de performances res de performances

On peut distinguerOn peut distinguer

-- Les tests binairesLes tests binaires (oui/non ou positif/n(oui/non ou positif/négatif ou prégatif ou présent/absent) ésent/absent) Ex: Pr

Ex: Préésence de sang dans les urines, ssence de sang dans les urines, séérologie VIH positive ourologie VIH positive ou nnégative, BAAR + ou égative, BAAR + ou ––

-- Les tests quantitatifs: variable continue avec un seuilLes tests quantitatifs: variable continue avec un seuil

Ex:Ex: bilirubinébilirubinémie, cholestmie, cholestéérolroléémie, taux de PSAmie, taux de PSA, FibroScan, FibroScan

-- Les réLes réponses ordinales ponses ordinales Ex: degr

Ex: degréé de fibrose sur une lame de biopsie, images radiologiques, de fibrose sur une lame de biopsie, images radiologiques, échelle de BIRADS sur la mammographieéchelle de BIRADS sur la mammographie

analyse peut être abordéanalyse peut être abordée comme du quantitatife comme du quantitatif

En fonction du crit

En fonction du critère, la mère, la mééthodologie dthodologie d’é’évaluation seravaluation sera

(50)

Expressions des r

Expressions des r é é sultats d sultats d ’ ’ une une é é valuation valuation

Signe binaire

Signe binaire : Sensibilit : Sensibilit é é , sp , sp é é cificit cificit é é

Signe avec valeur continue

Signe avec valeur continue : Courbes ROC : Courbes ROC

(51)

Cas des variables binaires

(52)

Expression des résultats

Statut Résultat

malade M+

non malade M-

test +

Vrai Positif VP

Faux positif FP

test -

Faux Négatif FN

Vrai Négatif VN

On distingue 4 types de sujets -Les vrais positifs (VP)

-Les faux positifs (FP) -Les varis négatifs (VN) -Les faux négatifs (FN)

(53)

Qualités intrinsèques : sensibilité et spécificité

M+ M-

T + VP FP

T - FN VN

Sensibilité : probabilité

d’obtenir un test positif quand le sujet est malade

Valeur comprise entre 0 et 1

=> c’est l’aptitude d’un test à identifier correctement les individus malades grâce à une réponse positive

Se = P (T+ / M+) = VP / VP+FN

(54)

Qualités intrinsèques : sensibilité et spécificité

M+ M-

T + VP FP

T - FN VN

Spécificité : probabilité

d’obtenir un test négatif quand le sujet est non malade

Valeur comprise entre 0 et 1

=> c’est l’aptitude d’un test à identifier correctement les individus non malades grâce à une réponse négative

Sp = P (T- / M- ) = VN / VN+FP

(55)

ex : on souhaite déterminer la sensibilité et la spécificité d’un nouveau test de dépistage d’une maladie. 1000 sujets ont été soumis au test de référence (Gold Standard) supposé parfait : 900 ont fourni une réponse négative et 100 une réponse positive. Parmi les 100 sujets à réponse positive, 90 répondent positivement au nouveau test, et parmi le 900 à réponse négative, 30 ont donné une réponse positive au nouveau test.

référence +

référence -

T + 90 30 120

T - 10 870 880

100 900 1000

Se = 90/100 = 0,90 Sp = 870/900 = 0,97

(56)

Se calculée sur une population composée exclusivement de sujets malades

=> Se ne varie donc pas en fonction de la prévalence de la maladie

Sp calculée sur une population composée exclusivement de sujets non malades

=> Sp ne varie donc pas en fonction de la prévalence de la maladie

Pour un test donné : Se et Sp ne dépendent pas de la prévalence de la maladie

=> qualités « intrinsèques » = dépendant uniquement de facteurs

(57)

Relativité de la sensibilité et de la spécificité

M+ M –

VP FP

Seuil 1

FN VN

Se = 0,55 Sp = 0,95

Seuil 2

Se = 0,80 Sp = 0,75

Seuil 3

Se = 1 Sp = 0,50

FN Se

(58)

Ex: d

Ex: d é é pistage cancer du sein pistage cancer du sein

HIP BreastHIP Breast Cancer Screening Cancer Screening Project

Project

64810 femmes âg

64810 femmes âgéées de 40 es de 40 àà 64 ans

64 ans

Sensibilit

Sensibilité: 132/177 = é: 132/177 = 75%75%

SpéSpécificitcificitéé: 63650/64633 = : 63650/64633 = 99%99%

64810 64810 64633

64633 177177

63695 63695 63650

63650 4545

- -

11151115 983983

132132

+ +

Ex. Ex.

physique physique + mammo+ mammo..

- - + +

Cancer du sein Cancer du sein

(biopsie ou (biopsie ou aspiration) aspiration)

(59)