• Aucun résultat trouvé

clinicien et le patient.

3.2 La factorisation orient´ee patient

La factorisation orient´ee patient d´ecompose la distribution de probabilit´e conjointe du r´esultat du marqueur et du statut du patient en la probabilit´e de maladie sachant la valeur du marqueur, c’est `a dire le risque de maladie, multipli´ee par la probabilit´e de la valeur du marqueur dans la population (P (M|Y ) × P (Y )). Pour cette factorisation, l’int´erˆet porte sur le risque de maladie pr´edit en fonction de la valeur du marqueur.

3.2.1 Cas d’un marqueur binaire

Dans le cas d’un marqueur binaire, les performances sont calculables en termes de valeurs pr´edictives. La valeur pr´edictive positive, not´ee Vpp, correspond `a la probabilit´e qu’un individu soit malade sachant que le test associ´e au marqueur est positif (Vpp = P (M = 1|Y = 1)). La valeur pr´edictive n´egative, not´ee Vpn, correspond `a la probabilit´e qu’un individu soit non malade sachant que le test associ´e au marqueur est n´egatif (Vpn = P (M = 0|Y = 0)). Ces deux indicateurs int´eressent directement le clinicien et le patient, qui peuvent prendre une d´ecision `a partir de la probabilit´e de maladie pr´edite par le r´esultat du test.

Les valeurs pr´edictives d´ependent des caract´eristiques de la population et surtout de la pr´evalence. Ainsi, les r´esultats obtenus d’une population `a l’autre ne sont pas comparables si la pr´evalence n’est pas identique. Toutefois, si la sensibilit´e et la sp´ecificit´e du test ont ´et´e ´evalu´ees dans une population o`u la pr´evalence est de π1 et si la pr´evalence dans une autre population est connue (π2), alors les valeurs pr´edictives attendues dans la seconde population sont calculables `a l’aide du th´eor`eme de Bayes :

Vpp2 = P (Y = 1|M = 1)π2

P (Y = 1|M = 1)π2+ P (Y = 1|M = 0)(1 − π2)

Vpn2 = P (Y = 0|M = 0)(1 − π2)

P (Y = 0|M = 1)π2+ P (Y = 0|M = 0)(1 − π2)

3.2.2 Cas d’un marqueur quantitatif

Lorsque le marqueur prend des valeurs continues, les valeurs pr´edictives peuvent ˆetre calcul´ees pour les diff´erentes valeurs de seuil de positivit´e du marqueur, par exemple, Vpp(c) =

3.2. La factorisation orient´ee patient 45 P (M = 1|Y > c). D’apr`es l’´equation (2.1) : Vpp(c) 1 − Vpp(c) = P (Y > c|M = 1) P (Y > c|M = 0) | {z } (a) ×P (M = 1) P (M = 0) = Sen(c) 1 − Spe(c) × P (M = 1) P (M = 0) De mˆeme : 1 − Vpn(c) Vpn(c) = P (Y ≤ c|M = 1) P (Y ≤ c|M = 0) | {z } (b) ×P (M = 1) P (M = 0) = 1 − Sen(c) Spe(c) × P (M = 1) P (M = 0)

Les termes (a) et (b) correspondent aux ratios de vraisemblances positifs et n´egatifs ; c’est au travers de ces ratios que le marqueur apporte de l’information sur le risque de maladie en plus de l’information issue de la pr´evalence. Plus le ratio de vraisemblance positif est ´elev´e, plus le fait que le marqueur soit sup´erieur au seuil c accroˆıt la certitude du m´edecin que le patient est malade, en plus de la simple information contenue dans la pr´evalence. A l’inverse, plus le ratio de vraisemblance n´egatif est faible, plus le fait que le marqueur soit inf´erieur au seuil c accroˆıt la certitude du m´edecin que le patient n’est pas malade. Le marqueur apporte de l’information si la probabilit´e de ses valeurs est tr`es diff´erente dans les groupes malades et non malades ; l’information est donc contenue dans la probabilit´e des valeurs du marqueur sachant le statut du patient, donc d’une certaine fa¸con, dans la sensibilit´e et la sp´ecificit´e.

Si la courbe ROC est la g´en´eralisation des notions de sensibilit´e et de sp´ecificit´e aux cas de marqueurs quantitatifs, il n’existe pas vraiment de g´en´eralisation des valeurs pr´edictives aux cas de marqueurs prenant des valeurs quantitatives. Moskowitz et Pepe (2004) ont pro-pos´e de construire une courbe repr´esentant le risque de maladie en fonction des quantiles de la distribution du marqueur chez les malades ; une courbe similaire peut ˆetre construite chez les non malades, mais il est difficile de comparer plusieurs marqueurs `a partir de deux graphiques s´epar´es.

Lorsque les performances du marqueur sont analys´ees en termes de risque, une premi`ere approche peut simplement consister `a comparer les risques relatifs ou les rapports de cotes des marqueurs. Le risque relatif correspond au ratio des risques pour une augmentation d’une unit´e du marqueur ; plus il est sup´erieur `a 1, plus une augmentation de la valeur du marqueur augmente fortement le risque de maladie. L’estimation du risque de maladie n´ecessite que l’´etude r´ealis´ee soit prospective. Une cote (not´ee Cote) correspond au rapport de la probabilit´e de maladie sur la probabilit´e de non maladie pour un niveau donn´e du marqueur, le rapport de cotes (not´e

3.2. La factorisation orient´ee patient 46

RC) ´etant le ratio des cotes pour une augmentation d’une unit´e du marqueur. Plus le rapport de cotes est ´elev´e, plus l’augmentation des chances de maladie pour une augmentation d’une unit´e du marqueur est importante. Il peut ˆetre estim´e `a partir d’une ´etude de cohorte ou d’une ´etude cas t´emoins. Rapport de cotes et risque relatif sont des mesures tr`es souvent utilis´ees en recherche clinique et en ´epid´emiologie.

De nombreuses ´etudes se servent, `a tort, de l’estimation du rapport de cotes comme d’une mesure de la capacit´e du marqueur `a discriminer les patients. Le rapport de cotes est une mesure d’association et non une mesure de discrimination. S’il est vrai que, plus le rapport de cotes est ´elev´e, meilleure est l’AROC associ´ee, des rapports de cotes jug´es ´elev´es ne sont pas forc´ement associ´es `a des AROC ´elev´ees. La figure 3.4 repr´esente les densit´es de probabilit´e des valeurs de marqueurs chez les malades et les non malades lorsque celles-ci suivent des lois normales d’´ecart-type 0,5 dans les deux groupes et de moyenne 0 chez les non malades. La moyenne chez les malades d´epend du rapport de cotes choisi pour le marqueur. Sont ´egalement indiqu´ees les valeurs d’AROC associ´ees. Mˆeme pour des rapports de cotes de 2 ou 3, jug´es ´elev´es dans le cas de certaines maladies, le recoupement des densit´es de probabilit´e chez les malades et les non malades reste important, ce qui se traduit par des valeurs d’AROC relativement peu ´elev´ees. Pour un ´ecart-type de 0,5, il faut un rapport de cotes de plus de 60 – tr`es ´elev´e – afin d’obtenir une valeur d’AROC de 0,93, tr`es satisfaisante.

Cet exemple semble montrer une discordance entre l’AROC et le rapport de cotes. En r´ealit´e, lorsque ces crit`eres sont utilis´es pour comparer deux marqueurs, les conclusions sont toujours identiques : l’AROC et le rapport de cotes sont plus ´elev´es pour le marqueur qui discrimine le mieux les patients en deux groupes. Ceci est li´e au fait que ces deux crit`eres sont calcul´es `a partir de la mˆeme information, correspondant aux distributions de probabilit´e des valeurs de marqueurs chez les malades et les non malades. Pour autant, des valeurs de rapport de cotes relativement ´elev´ees ne sont pas forc´ement associ´ees `a des AROC ´elev´ees, ce qui cr´ee la confusion.

Le fait qu’un rapport de cotes soit jug´e pertinent d´epend en r´ealit´e du contexte. Dans l’exemple pr´ec´edent, pour un rapport de cotes de 3, si la pr´evalence est de 1 %, le risque de maladie lorsque le marqueur vaut 0 est de 0,8 % et passe `a 2,5 % pour une valeur de marqueur de 1. Lorsque la pr´evalence est de 10 %, le risque de maladie lorsque le marqueur vaut 0 est de 8 % et de 21 % lorsque le marqueur vaut 1. Ces deux sc´enarios peuvent avoir des cons´equences tr`es diff´erentes si un risque en dessous de 10 % est consid´er´e comme n´egligeable et un risque

3.2. La factorisation orient´ee patient 47

Valeur de marqueur Valeur de marqueur

Densité de probabilité Densité de probabilité Densité de probabilité −2 −1 0 1 2 3 RC=1.5 AROC=0.56 −2 −1 0 1 2 3 RC=2 AROC=0.6 −2 −1 0 1 2 3 RC=3 AROC=0.65 −2 −1 0 1 2 3 RC=9 AROC=0.78 −2 −1 0 1 2 3 RC=60 AROC=0.93 −2 −1 0 1 2 3 RC=350 AROC=0.98

Figure 3.4 – Densit´e de probabilit´e des valeurs de marqueurs chez les non malades (pointill´es) et chez les malades (traits pleins) associ´ees `a diff´erents rapports de cotes, lorsque le marqueur suit des lois normales de variances ´egales dans les deux groupes.

au dessus de 10 % non n´egligeable. En termes d’AROC, les deux sc´enarios sont identiques, car l’AROC ne d´epend pas de la pr´evalence ; dans les deux cas, la capacit´e du marqueur `a discriminer les patients est moyenne (AROC de 0,65). En termes de risque, dans le cas d’une pr´evalence de 10 %, le marqueur peut avoir un int´erˆet non pas pour classer les patients en deux groupes, mais pour identifier les patients les plus `a risque dans une population et ne proposer un suivi renforc´e qu’`a une partie de la population. Pour Huang et al. (2007), de nombreux marqueurs seraient rejet´es s’ils n’´etaient ´evalu´es qu’au travers de l’AROC, alors qu’ils peuvent pr´esenter un int´erˆet si l’objectif est d’identifier une partie de la population la plus `a risque.

En r´ealit´e, le fait de choisir une valeur au dessus de laquelle le risque est jug´e pertinent revient indirectement `a donner un coˆut aux faux positifs et faux n´egatifs et un b´en´efice aux vrais positifs et vrais n´egatifs. Une valeur seuil de risque de 10 % indique que le coˆut des faux positifs est n´egligeable devant le b´en´efice associ´e aux vrais positifs, car beaucoup de personnes subiront des examens compl´ementaires pour rien. La courbe ROC donne le mˆeme poids `a la sensibilit´e et `a la sp´ecificit´e et suppose donc des coˆuts et b´en´efices identiques ; la valeur de l’AROC ne doit donc pas ˆetre analys´ee de mani`ere absolue, mais relativement aux b´en´efices et aux coˆuts de

3.2. La factorisation orient´ee patient 48 l’action r´ealis´ee suite `a la mesure du marqueur. Il en va de mˆeme pour les valeurs pr´edites de risque.

Lorsqu’une action bien d´efinie est envisag´ee suite `a la mesure du marqueur, l’objectif est de discriminer les patients. La courbe ROC est un outil utile dans ce cas. Le fait de vouloir s´electionner une partie de la population `a un niveau de risque donn´e – en faisant appel au rapport de cotes ou au risque relatif et `a la pr´evalence – revient ´egalement `a faire de la discrimination, mais en introduisant indirectement des b´en´efices et des coˆuts attendus si l’action est r´ealis´ee via la valeur seuil au del`a de laquelle le risque est jug´e significatif. D´efinir une valeur limite de risque est jug´e parfois plus simple que de d´efinir explicitement des coˆuts et des b´en´efices ; c’est pourquoi les m´ethodes reli´ees `a l’analyse du risque sont plus souvent utilis´ees dans ce cas. Il sera montr´e par la suite qu’il est ´egalement possible d’introduire l’utilit´e attendue de l’action dans les m´ethodes reli´ees `a l’analyse de la courbe ROC, sans pour autant d´efinir de mani`ere explicite les coˆuts et les b´en´efices.

Lorsqu’aucune action pr´ecise n’est envisag´ee `a l’avance, suite `a la mesure du marqueur, mais qu’un m´edecin souhaite am´eliorer sa connaissance sur l’´etat de sant´e d’un patient pour pouvoir prendre une d´ecision, les m´ethodes li´ees `a l’analyse du risque sont tr`es appropri´ees pour choisir un marqueur. Il ne faut pas analyser les risques relatifs ou les rapports de cotes, mais les valeurs absolues de risque pr´edit, qui tiennent compte de la pr´evalence. L’objectif est alors que le risque pr´edit pour un niveau donn´e du marqueur corresponde bien au risque r´eel du patient. Ceci revient `a analyser la calibration du marqueur et non sa capacit´e `a discriminer les patients.

3.2.3 La calibration et ses limites

La calibration est une mesure de l’ad´equation entre le risque pr´edit pour un niveau du marqueur et le vrai risque des patients `a ce niveau (Hand, 1997). La calibration est importante, car en fonction des coˆuts et des b´en´efices de l’action envisag´ee suite `a la mesure du marqueur, le risque de maladie pr´edit permet de prendre une d´ecision. Pour un risque pr´edit de 20 %, si le b´en´efice attendu `a ˆetre trait´e par rapport `a ne pas ˆetre trait´e lorsque le patient est r´eellement malade est tr`es petit par rapport au coˆut du traitement `a tort d’un patient non malade, alors il vaut mieux ne pas ˆetre trait´e. Si le b´en´efice attendu par rapport aux coˆuts est tr`es ´elev´e, il vaut mieux ˆetre trait´e. Ainsi, si le risque pr´edit par le marqueur ne correspond pas au vrai risque du patient, la d´ecision prise risque d’ˆetre ´eronn´ee, d’o`u l’utilit´e de la calibration.

Le vrai risque `a un niveau donn´e du marqueur est inconnu, mais l’´echantillon de population consid´er´e en est repr´esentatif. Une solution souvent adopt´ee pour mesurer l’ad´equation consiste

3.3. Int´egrer discrimination et calibration 49