2.3 Approches directes de la mesure du bénéfice moyen

2.3.1 Approche par courbe ROC du bénéfice individuel

L’objectif d’un marqueur prédictif est de permettre l’identification de sous-groupes de pa-tients qui retirent plutôt un bénéfice de l’un des deux traitements, tandis que d’autres sous-groupes retirent un bénéfice du deuxième traitement. Dans cette optique, cela revient à discri-miner les patients de l’essai en les catégorisant soit dans un groupe qui retire un bénéfice du traitement innovant, soit dans un groupe qui retire un bénéfice du traitement de référence. Une telle problématique fait naturellement penser à une approche par courbe ROC, et c’est d’ailleurs ce qui a été proposé par Huang et al. (2012).

Pour rappel, le Tableau 2.1 permettait de définir quatre classes de patients en se basant sur les réponses individuelles à chacun des traitements. Comme expliqué précédemment, il n’est pas possible de savoir à quelle classe appartient un patient donné car on ne connaît pas les réponses individuelles à chaque traitement. Les auteurs effectuent donc plusieurs hypothèses constituant le « potential outcomes framework », ainsi qu’une hypothèse supplémentaire qui permettra d’estimer la bénéfice individuel. Les quatre hypothèses sont décrites ci-après : Hypothèse (A-2.1). L’unité de traitement est stable et consistante (SUTVA).

Cette hypothèse signifie que pour un même patient Y(0)et Y(1)sont indépendants de l’allocation de traitement des autres patients, et Y = Y(Z) le critère de jugement réellement observé chez les patients.

Hypothèse (A-2.2). L’allocation de traitement peut être ignorée : (Y(0),Y(1),X)⊥ Z.

Cette hypothèse signifie que la valeur de marqueur X ne dépend pas du fait que le patient soit traité avec le traitement de référence ou innovant, et que le critère de jugement potentiel ne dépend pas non plus du fait que le patient ait réellement été traité avec le traitement de référence ou innovant.

Hypothèse (A-2.3). L’effet du traitement est monotone : Y(0)≥ Y(1).

Cette hypothèse signifie que le traitement innovant sera systématiquement au moins aussi effi-cace que le traitement de référence pour tous les patients.

Hypothèse (A-2.4). E[Y(Z)|X] peut être modélisée grâce un modèle linéaire généralisé.

L’hypothèse (A-2.3) est l’hypothèse la plus forte, et c’est celle qui va permettre de quantifier le nombre de patients dans chaque classe. Cette hypothèse revient à dire que la proportion

q4 est égale à 0, et donc qu’aucun patient ne retire un bénéfice du traitement de référence car le traitement innovant est toujours au moins aussi efficace que le traitement de référence. Typiquement, ce genre d’hypothèse pourrait s’envisager dans la comparaison d’une nouvelle thérapie à un placebo, en supposant toutefois que cette thérapie n’ait aucun effet délétère. Fixer la proportion de patients dans l’une des quatre classes rend identifiables les proportions de patients dans chacune des autres classes en suivant le même principe que celui présenté dans la section 2.1.

Huang et al. (2012) proposent une approche par courbe ROC dans le but de discriminer les patients qui retirent un bénéfice du traitement innovant de ceux qui n’en retirent aucun.

Notations

On définit B =1(Y(0)>Y(1)) l’indicatrice permettant de savoir si le patient retire un bénéfice de la stratégie thérapeutique innovante (B = 1) ou bien si le traitement innovant n’est pas plus efficace que le traitement de référence (B = 0). Dans l’exemple qui suit, on considèrera que des valeurs élevées de X sont synonymes d’un meilleur bénéfice du traitement innovant. Il est alors possible d’écrire :

E(B|X) = P(Y(0)= 1,Y(1)= 0|X)

= P(Y(0)= 1|X) − P(Y(0)= 1,Y(1)= 1|X)

= P(Y(0)= 1|X) − P(Y(0)= 1|Y(1)= 1, X)P(Y(1)= 1|X)

= P(Y(0)= 1|X) − [1 − P(Y(0)= 0|Y(1)= 1, X)]P(Y(1)= 1|X)

= P(Y(0)= 1|X) − P(Y(1)= 1|X)

où le résultat est obtenu grâce à l’hypothèse (A-2.3) qui permet de dire que P(Y(0) = 0|Y(1)= 1, X) = 0. Le principe d’une courbe ROC est de tracer les couples (Se(c), 1− Sp(c)) pour

l’en-semble des seuils c possibles. On complète les notations définies précédemment en définissant la sensibilité (Se(c)) comme :

Se(c) = P(X > c|B = 1) = P(B = 1, X > c) P(B = 1) = E[B× 1(X > c)] E(B) = E[E(B|X) × 1(X > c)] E[E(B|X)] = E{[ρ0(X)− ρ1(X)]× 1(X > c)} E[ρ0(X)− ρ1(X)] .

Sur le même principe, on peut exprimer le complément de la spécificité (1− Sp(c)) sous la

forme suivante :

1− Sp(c) = P(X > c|B = 0)

=E{[1 − ρ0(X) +ρ1(X)]× 1(X > c)}

E[1− ρ0(X) +ρ1(X)] .

Pour pouvoir estimer la sensibilité et la spécificité, il est donc nécessaire de calculerρ0(X) et ρ1(X). Pour ce faire les auteurs proposent d’utiliser un modèle logistique.

Le modèle de risque

Les hypothèses formulées par Huang et al. (2012) font que la sensibilité et la spécificité sont estimables à partir des paramètres d’un modèle de régression logistique modélisant simplement le risque de survenue de l’évènement étudié (donnée observée dans les essais) en fonction du traitement, du marqueur et de l’interaction marqueur-traitement :

log  P(Y = 1|X,Z) P(Y = 0|X,Z)  =β0+βX× X + βZ× Z + βI× XZ . (2.5) On note que sous l’hypothèse (A-2.3), ρ0(X)≥ ρ1(X)⇔ δ(X) ≤ 0 pour tout X. Cependant,

lors de l’estimation des paramètres du modèle de régression logistique (2.5), rien ne garantit que cette contrainte sera respectée. Pour qu’elle le soit, les auteurs proposent de maximiser la vraisemblance du modèle logistique (notée L) en imposant la contrainte de l’hypothèse (A-2.3). On définit la log-vraisemblance du modèle de la manière suivante :

l = log(L) =

n

i=1

La maximisation de cette log-vraisemblance sous les contraintes définies peut se faire à l’aide d’un algorithme d’optimisation de type Nelder-Mead (Nelder and Mead, 1965).

Les estimateurs de la sensibilité et de la spécificité sont alors calculés naturellement en utili-sant les estimateurs deρ0(X) et deρ1(X) (notés respectivementρ0(X) etρ1(X)) obtenus grâce

au modèle de régression logistique (2.5) :

 Se(c) = + c 0(x)− ρ1(x) d F(x) +∞ −∞ 0(x)− ρ1(x) d F(x), 1− Sp(c) = +∞ c 1− ρ0(x) +ρ1(x) d F(x) + −∞ 1− ρ0(x) +ρ1(x) d F(x),

où F(.) est la fonction de répartition empirique du marqueur X.

Compléments et illustration de l’approche

L’aire sous la courbe ROC de Huang (notéeθH) indique la capacité du marqueur à discriminer les patients qui tirent un bénéfice du traitement innovant de ceux qui n’en tirent aucun. Etant donné que la sensibilité et la spécificité sont bornées entre 0 et 1,θH est également bornée entre 0 et 1. Plus θH est proche de 1, plus le pouvoir discriminant du marqueur est important (et donc plus sa capacité prédictive est importante également). LorsqueθH se rapproche de 0.5, le marqueur n’a aucune capacité prédictive. Ce point, non cité par les auteurs, peut être démontré de la manière suivante.

Lorsqu’un modèle de risque est utilisé pour évaluer la capacité diagnostique (ou pronostique) d’un marqueur, il a été démontré qu’une correspondance existait entre la courbe de risque et l’aire sous la courbe ROC liée au marqueur étudié (Viallon and Latouche, 2011) :

θ =

+

−∞ F(x)ρ(x) dF(x) −ρ22 ρ(1 − ρ) ,

θ est l’aire sous la courbe ROC pour un marqueur diagnostique (ou pronostique), ρ(X) =

P(Y = 1|X), et ρ = P(Y = 1). Dans le cas des marqueurs prédictifs, il est donc possible d’étendre

ces démonstrations et d’exprimer θH comme une fonction des courbes de risque dans chaque bras de traitement : θH = + −∞ F(x)[ρ0(x)− ρ1(x)]dF(x)−(ρ0−ρ1)2 2 (ρ0− ρ1)(1− ρ0+ρ1) . (2.6)

Si la différence de risques entre les deux bras de traitement est constante alors la formule se récrit de la manière suivante :

θH= ρ0−ρ1 2 (ρ0−ρ1)2 2 (ρ0− ρ1)(1− ρ0+ρ1) = 0.5×(ρ0− ρ1)− (ρ0− ρ1)2 (ρ0− ρ1)− (ρ0− ρ1)2

= 0.5 .

S’il n’existe aucune variation de la différence de risques entre les deux bras, en fonction des valeurs du marqueur, alors le marqueur n’a aucun intérêt prédictif selon cette méthode. Cette lo-gique va dans le sens de la définition donnée précédemment d’un marqueur prédictif. A

contra-rio, plus les variations deδ(X) sont importantes, plus le marqueur a une valeur de θH élevée. Dans l’équation (2.6), les variations deδ(X) sont évaluées dans l’intégrale. On constate que

plus la différence de risques marginale est faible, plus de faibles variations deδ(X) sont

suffi-santes pour avoir une valeur deθH élevée. A contrario, avec une différence de risques marginale élevée, il faut de plus grandes variations deδ(X) pour atteindre une valeur de θH élevée.

On peut néanmoins nuancer l’interprétation qu’on donne àθH. En effet les auteurs se placent dans un cas très particulier fixé par l’hypothèse (A-2.3), puisque l’objectif n’est plus d’iden-tifier un sous-groupe de patients bénéficiant plus du traitement innovant ou du traitement de référence, mais plutôt d’identifier un sous-groupe de patients pour lequel la thérapie innovante n’est pas plus efficace qu’un placebo afin d’éviter les effets indésirables potentiels d’une telle thérapie. Cette question peut donc trouver son intérêt dans certaines situations, mais elle est peu envisageable lorsque le traitement de référence n’est pas un placebo.

Huang et al. (2012) se limitent donc à l’évaluation de marqueurs pour lesquels une interaction quantitative existe (excluant de fait les interactions qualitatives). Il s’agit là de la principale limite de cette approche.

La Figure 2.5 présente les courbes de risque en fonction des valeurs du marqueur étudié permettant d’atteindre une valeur deθH de 1 avec la méthode proposée ci-dessus avec un risque moyen égal à 0.82 et 0.12 dans les bras référence et innovant, respectivement. On constate ici que la définition du marqueur parfait, sous l’hypothèse (A-2.3) n’est qu’un cas particulier de celle qui avait été retenue dans la sous-section 2.1.2.

0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0

Fonction de répartition du marqueur

Risque de sur

ven

ue de l'é

vènement

FIGURE2.5 – Exemple de courbes de risque pour obtenir une valeur deθHégale à 1

Dans le document Méthodologie de l’évaluation des biomarqueurs prédictifs quantitatifs et de la détermination d’un seuil pour leur utilisation en médecine personnalisée (Page 41-46)