• Aucun résultat trouvé

5.1 Utilit´e esp´er´ee : entre risque et incertitude

5.1.4 Incertitude et seuil optimal

∂ˆc ∂µ1 2 Var(µ1) +  ∂ˆc ∂µ0 2 Var(µ0) +  ∂ˆc ∂σ1 2 Var(σ1) +  ∂ˆc ∂σ0 2 Var(σ0) Cette m´ethode peut ˆetre ´etendue aux cas de lois log normales (Leeflang et al., 2008), de lois normales apr`es transformation de Box-Cox (Fluss et al., 2005 ; Schisterman et al., 2008) et de lois gamma, mais, dans ce dernier cas, uniquement pour certaines plages de valeurs de param`etres. Elle est appel´ee la m´ethode du plug-in. L’inconv´enient est que l’approximation normale de la distribution de l’estimateur du seuil optimal n’est valable que de mani`ere asymptotique, or les ´etudes sur les marqueurs diagnostiques ou pronostiques sont souvent r´ealis´ees sur des ´echantillons de taille limit´ee.

5.1.3 Cas g´en´eral

Pour certaines lois de probabilit´e, il n’existe pas forc´ement de formule explicite du seuil optimal. Dans ce cas, le seuil optimal peut ˆetre obtenu par maximisation num´erique de la fonction d’utilit´e, par exemple par un algorithme de type Newton-Raphson. Il n’y a alors plus de formule explicite du seuil optimal ; la seule solution propos´ee actuellement pour construire un intervalle de confiance consiste `a utiliser la m´ethode du bootstrap. La probabilit´e de couverture de l’intervalle de confiance ainsi construit n’est pas toujours acceptable (Schisterman et Perkins, 2007), d’o`u la n´ecessit´e de d´evelopper de nouvelles m´ethodes.

5.1.4 Incertitude et seuil optimal

5.1.4.1 Le risque et l’incertitude

Dans la partie pr´ec´edente, l’estimation ponctuelle du seuil optimal est effectu´ee comme si les param`etres de distribution des marqueurs ´etaient connus de mani`ere exacte, alors qu’ils r´esultent d’une estimation sur un ´echantillon de population. L’incertitude sur les estimations des param`etres n’intervient que dans la construction de l’intervalle de confiance, au travers des

5.1. Utilit´e esp´er´ee : entre risque et incertitude 105 variances des estimateurs. L’estimation ponctuelle tient compte uniquement de la variabilit´e entre individus, retranscrite par la sensibilit´e et la sp´ecificit´e. Cette variabilit´e entraˆıne que tous les malades – ou les non malades – n’ont pas la mˆeme valeur de marqueur. Comme indiqu´e dans l’introduction sur la th´eorie de la d´ecision (partie 2.2.5), c’est cette variabilit´e qui est `a l’origine de la prise de d´ecision en situation de risque. Sans cette variabilit´e, il n’y aurait aucun risque `a prendre une d´ecision.

Deux sources de variabilit´e ont donc ´et´e recens´ees :

– le risque, li´e aux variations des caract´eristiques des patients au sein des deux groupes de la population, se traduisant par des variations des valeurs de marqueur ;

– et l’incertitude, qui est due au fait que les param`etres de distribution des marqueurs dans les deux groupes, ainsi que la pr´evalence, ne sont pas connus de mani`ere exacte, mais estim´es `a partir d’un ´echantillon de la population.

Bien que ces deux sources de variabilit´e aient des causes tr`es diff´erentes, elles peuvent ˆetre caract´eris´ees toutes deux par des distributions de probabilit´e. Le risque, not´e Pa(z|θ), est ca-ract´eris´e par la sensibilit´e, la sp´ecificit´e et la pr´evalence, θ d´enotant l’ensemble de ces trois param`etres. L’incertitude peut ˆetre caract´eris´ee par la distribution a posteriori des param`etres de distribution du marqueur dans les deux groupes et de la pr´evalence ; elle est not´ee ici P (θ|y). D’apr`es le th´eor`eme de Bayes, cette distribution a posteriori des param`etres est reli´ee `a la vrai-semblance des donn´ees et `a la probabilit´e a priori des param`etres : P (θ|y) ∝ P (y|θ) × P (θ). L’information a priori sur les param`etres peut ´eventuellement ˆetre non informative.

L’estimation ponctuelle du seuil optimal pr´esent´ee dans la partie pr´ec´edente tient compte du risque, mais pas de l’incertitude. La th´eorie de la d´ecision Bay´esienne permet de r´econcilier ces deux aspects.

5.1.4.2 Th´eorie de la d´ecision Bay´esienne

La th´eorie de la d´ecision Bay´esienne vise `a prendre des d´ecisions optimales en tenant compte de toutes les formes de variabilit´e dans le calcul de l’utilit´e esp´er´ee, c’est `a dire du risque et de l’incertitude. Cette th´eorie remonte `a Savage (Savage, 1954) ; une bonne introduction en est faite par Dorfman (Dorfman, 1997) et Berger (Berger, 1980). L’utilit´e esp´er´ee ne tient plus compte uniquement du risque (Pa(z|θ)) et des utilit´es (u(z)) comme dans l’´equation (2.3), mais ´egalement de l’incertitude (P (θ|y)), en int´egrant cette incertitude sur l’ensemble des valeurs

5.1. Utilit´e esp´er´ee : entre risque et incertitude 106 possibles des param`etres :

U(a) = Z Z Z Θ u(z)Pa(z|θ)P (θ|y) dzdθ (5.3)

Ceci rend les calculs d’utilit´e esp´er´ee nettement plus complexes, mais des solutions seront envi-sag´ees via les m´ethodes MCMC.

Selon Dorfman (1997), le “ principe d’´equivalence des certitudes ” stipule que le fait de ne pas tenir compte de l’incertitude dans le calcul de l’utilit´e esp´er´ee conduit `a prendre des d´ecisions similaires `a celles obtenues en en tenant compte si et seulement si la distribution a posteriori des param`etres est normale, ainsi que si la fonction `a optimiser est lin´eaire-quadratique selon les param`etres incertains. La seconde condition est rarement valable dans le cas de l’estimation du seuil optimal d’un marqueur. Ainsi, l’incertitude li´ee `a l’estimation des param`etres n’a pas un impact uniquement sur l’intervalle de confiance du seuil optimal, mais ´egalement sur l’estimation ponctuelle de ce seuil. Selon Bradlaw et al. (2004), le fait de ne pas tenir compte correctement de l’incertitude sur les param`etres entraˆıne une surestimation de la quantit´e d’information contenue dans les donn´ees et, en g´en´eral, une sur´evaluation des utilit´es. N´eanmoins, lorsque la quantit´e de donn´ees augmente, les ´ecarts entre les deux m´ethodes deviennent minimes (Berger, 1980). Par la suite, la m´ethode int´egrant l’incertitude quant `a l’estimation des param`etres de distribution sera appel´ee la m´ethode pr´edictive ; la premi`ere m´ethode sera appel´ee la m´ethode plug-in.

Consid´erons le calcul de la sensibilit´e dans le cas o`u le marqueur suit une loi normale chez les malades et o`u un a priori non informatif est retenu pour les param`etres de la distribution (P (µ1, σ12) = 1/σ2

1). Sachant les valeurs de marqueurs y1 mesur´ees dans l’´echantillon de patients malades, la distribution pr´edite pour la valeur de marqueur d’un nouveau malade, ˜y1, est donn´ee par :

P (˜y1|y1) ∝Z Θ

P (˜y11) × P (θ1|y1) dθ o`u θ1= {µ1, σ2

1}. Dans ce cas pr´ecis, la distribution pr´edite est une distribution de Student : P (˜y1|y1) ,→ t   1 n1 n1 X j=1 y1j,n1 Pn1 j=1(y1j − ¯y1)2 (n1+ 1)(n1− 1)  

Ainsi, la sensibilit´e n’est plus obtenue par la fonction de r´epartition d’une loi normale, mais par celle d’une loi de Student. Le mˆeme r´esultat est obtenu pour la sp´ecificit´e. Le seuil optimal, dans le cas o`u les nombres de malades et de non malades sont ´egaux, o`u la pr´evalence est de 0,5 et

5.1. Utilit´e esp´er´ee : entre risque et incertitude 107

o`u le ratio b´en´efice net sur coˆut net est de 1 est donn´e par :

c? = µ0(νb2− 1) − a + bpνa2+ (1 − ν)(n − 1)(n + 1)σ2

0(νb2− 1)/n νb2− 1

avec ν = (σ01)2/(n−1). Cette expression est diff´erente de celle obtenue avec la m´ethode plug-in (´equation (5.2)). Quand le nombre de patients par groupe tend vers l’infini, la loi de Student tend vers la loi normale ; les ´ecarts entre le seuil optimal obtenu avec la m´ethode pr´edictive et la m´ethode plug-in deviennent minimes. Un exemple est donn´e dans la figure 5.3, en prenant µ0 = 0, µ1 = 1, σ0 = 0, 1 et σ1 = 0, 2. ●●●● ●●●●●●●● ●●●●●●●●●●●●●●●●●●●●●●●●●●● ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● 0 500 1000 1500 2000 2500 3000 0.3470 0.3480 0.3490 0.3500 nombre de patients Seuil optimal méthode plug−in méthode prédictive

Figure 5.3 – Seuil optimal en fonction du nombre de patients par groupe obtenu avec la m´ethode pr´edictive et la m´ethode plug-in.

Cet exemple montre l’int´erˆet de tenir compte, au moins d’un point de vue conceptuel, de l’incertitude sur les estimations des param`etres dans l’estimation ponctuelle du seuil optimal. Pour l’intervalle de confiance, la m´ethode Delta pourrait `a nouveau ˆetre utilis´ee.

Une des principales limites de l’approche pr´ec´edente est que, dans certains cas, l’infor-mation a priori sur les param`etres n’est pas conjugu´ee avec la vraisemblance. Il n’y a donc plus d’expression explicite de la distribution pr´edictive a posteriori des valeurs de marqueurs ; d’autres solutions que les solutions analytiques sont `a envisager. L’int´erˆet des m´ethodes MCMC dans ce type de probl`eme est explor´e par la suite, avec deux approches diff´erentes.