• Aucun résultat trouvé

La distribution a posteriori du seuil optimal est obtenue alors qu’aucune distribution a priori n’a ´et´e fix´ee pour ce dernier. En r´ealit´e, une fois le ratio b´en´efice net sur coˆut net et la pr´evalence fix´es, le seuil optimal est enti`erement d´etermin´e par la donn´ee de la sensibilit´e et de la sp´ecificit´e du marqueur ; or la sensibilit´e est directement obtenue `a partir des param`etres de distribution du marqueur chez les malades ; de mˆeme, la sp´ecificit´e est obtenue `a partir des param`etres de distribution chez les non malades. Ici, les seules variables al´eatoires sont donc les param`etres de distribution du marqueur dans les deux groupes. L’information a priori utilis´ee pour caract´eriser la distribution de ces variables se transmet par des liens logiques au seuil optimal. La distribution a priori du seuil est donc fix´ee par l’information a priori attribu´ee aux param`etres de distribution du marqueur.

Cette m´ethode de d´etermination du seuil optimal et de son intervalle de cr´edibilit´e est tr`es simple `a utiliser une fois que des valeurs ont ´et´e ´echantillonn´ees dans la distribution a posteriori des param`etres de distribution du marqueur. Les seules contraintes sont donc de savoir ´echantillonner dans la distribution a posteriori de ces param`etres, ainsi que de connaˆıtre la distribution du marqueur dans les deux groupes. La m´ethode propos´ee sera appel´ee par la suite m´ethode Bay´esienne d’estimation du seuil et de son intervalle de confiance ; celle qui repose sur la maximisation de la moyenne des fonctions d’utilit´e sera appel´ee m´ethode de Wang et Geisser (WG). La figure 5.4 repr´esente sch´ematiquement la diff´erence entre ces deux m´ethodes :

– l’une calcule les fonctions d’utilit´e, en d´etermine la moyenne, puis estime la valeur qui maximise cette fonction moyenne (m´ethode de Wang et Geisser) ;

– l’autre calcule les fonctions d’utilit´e, d´etermine les valeurs de seuil optimal pour chacune d’entre elles, puis retient la moyenne – ou le mode ou encore la m´ediane – des seuils obtenus (m´ethode Bay´esienne d’estimation du seuil).

5.3 Estimation du seuil optimal pour un marqueur dynamique

5.3.1 M´ethode et application aux donn´ees de PSA

Dans le cas d’un marqueur dynamique, les valeurs mesur´ees y ne correspondent pas direc-tement au marqueur. Ces valeurs de marqueur, par exemple le nadir de PSA, sont ´echantillonn´ees dans la distribution a posteriori du nadir de chaque patient d’apr`es les valeurs de PSA. A chaque it´eration de la chaˆıne MCMC, les valeurs de nadir de PSA ´echantillonn´ees chez les malades sui-vaient une loi log normale de param`etre θ1i = {µ1i, σ21i}, ainsi que chez les non malades, de

5.3. Estimation du seuil optimal pour un marqueur dynamique 114 θ11, θ01 +P (˜y0≤ c|θ01)R P (˜y1> c|θ11) +P (˜y0≤ c|θ02)R P (˜y1> c|θ12) +P (˜y0≤ c|θ03)R P (˜y1> c|θ13) c1 c2 c3 θ12, θ02 θ13, θ03 ! i

P (˜y1> c|θ1i) + P (˜y0≤ c|θ0i)R

θ11, θ01 θ12, θ02 θ13, θ03 c! Fonction d’utilité par itération Seuil optimal par itération Distribution a posteriori du seuil optimal Paramètres de distribution du marqueur par itération

Paramètres de distribution du marqueur par itération Moyenne des fonctions d’utilité sur l’ensemble des itérations Estimation ponctuelle du seuil optimal c! c!1−α/2 c!α/2 Estimation ponctuelle du seuil optimal Intervalle de crédibilité du seuil optimal Méthode Bayésienne d’estimation du seuil Méthode de Wang et Geisser

Figure 5.4 – Comparaison de la m´ethode Bay´esienne d’estimation du seuil et de la m´ethode de Wang et Geisser.

param`etre cette fois θ0i = {µ0i, σ0i2}. En utilisant des a priori non informatifs pour ces pa-ram`etres (P (µj, σ2

j) = 1/σ2

j, j = 0, 1), une valeur de chaque param`etre a ´et´e ´echantillonn´ee `a chaque it´eration dans la distribution a posteriori ; celle-ci est donn´ee pour une it´eration i par :

1/σ2 ji|nadirji ,→ χ 2 nj−1 Pnj k=1 

ln(nadirjik) − ln(nadirji)2

µji|nadirji ,→ Nln(nadirji), σ2 ji/nj avec ln(nadirji) = Pnj

k=1ln(nadirjik). nadirji correspond aux nj valeurs de nadirs du groupe j ´echantillonn´ees `a l’it´eration i de la chaˆıne MCMC. La sensibilit´e et la sp´ecificit´e du nadir de PSA ont ainsi pu ˆetre calcul´ees, permettant `a chaque it´eration la construction de la fonction d’utilit´e et la d´etermination du seuil optimal de l’it´eration en question. Les 3000 valeurs de seuils ´echantillonn´ees constituaient la distribution a posteriori du seuil optimal du logarithme du nadir de PSA.

Pour le groupe des malades, pour des valeurs de logarithme de nadir sup´erieures `a 1, l’ajustement entre une loi log normale et les valeurs de nadir ´echantillonn´ees ´etait moins ad´equat. En r´ealit´e, l’intersection entre les courbes de densit´e de probabilit´e chez les non malades et les

5.3. Estimation du seuil optimal pour un marqueur dynamique 115

malades avait lieu en dessous de 1 sur l’´echelle du logarithme du nadir. Ainsi, il fallait accorder beaucoup d’importance `a la mod´elisation correcte de la distribution des valeurs de nadirs en dessous de 1 chez les malades, la zone au dessus ´etant moins importante. L’ad´equation entre la distribution des logarithmes de nadirs chez les malades `a chaque it´eration et une loi normale a donc ´et´e test´ee `a partir d’un test d’ad´equation partielle, pour des valeurs inf´erieures `a 1. Hand (1997) recommande d’ailleurs d’accorder beaucoup d’importance `a la mod´elisation des distributions dans les zones o`u elles se recoupent dans les deux groupes, car ce sont dans ces r´egions que les probl`emes se posent.

La m´ethode pr´esent´ee ci-dessus tient compte, dans l’estimation des seuils, de l’incertitude quant `a l’estimation des valeurs de nadirs de PSA, puisque ces valeurs sont ´echantillonn´ees dans leur distribution a posteriori d’apr`es les mesures de PSA. Ainsi, l’estimation ponctuelle et l’intervalle de cr´edibilit´e du seuil optimal tiennent compte du fait que les marqueurs ne sont pas mesur´es, mais estim´es avec une certaine pr´ecision. Ceci n’aurait pas ´et´e directement possible avec les m´ethodes d’estimation de seuil existant actuellement.

5.3.2 Un mod`ele, deux param´etrisations

Le mod`ele utilis´e pour construire les profils de PSA des patients (´equation 4.7) est pa-ram´etr´e en termes de valeurs d’effets al´eatoires {r1, r2, r3, r4}, en utilisant des distributions souples pour les effets al´eatoires r1 et r4; ce mod`ele est appel´e par la suite mod`ele 1. Il est repr´esent´e de mani`ere simplifi´ee sur la figure 5.5. Pour ne pas alourdir la figure, la variance des r´esidus est repr´esent´ee comme ´etant constante, mˆeme si ce n’est pas le cas pour le vrai mod`ele impl´ement´e. C’est `a partir des estimations de {r1, r2, r3, r4} par patient que le nadir a ´et´e ensuite calcul´e.

En r´ealit´e, ´etant donn´e que l’analyse a port´e principalement sur le nadir de PSA, il aurait ´et´e utile de construire un mod`ele faisant intervenir directement dans ses param`etres le nadir des patients, en utilisant des distributions souples pour le nadir et les autres param`etres (figure 5.6). Ce mod`ele est appel´e par la suite mod`ele 2. C’est un mod`ele purement conceptuel, car il n’est pas possible d’obtenir un mod`ele ´equivalent au mod`ele 1, en termes de courbes pr´edites, en introduisant le nadir comme un des param`etres. Des distributions souples ´etant utilis´ees dans les deux mod`eles pour d´ecrire les distributions des param`etres sur l’ensemble des patients, les distributions a posteriori des nadirs calcul´es `a partir des param`etres {r1, r2, r3, r4} du mod`ele 1

5.3. Estimation du seuil optimal pour un marqueur dynamique 116 yij r1i r2i r3i r4i ¾2 Gr1 Gr2 Gr3 Gr4 i = 1,...,n j = 1,...,mi nadiri

Figure 5.5 – Repr´esentation sch´ematique du mod`ele 1 (G : distributions de param`etres sur l’ensemble des patients).

ou directement ´echantillonn´es pour le mod`ele 2 devraient ˆetre similaires. Ainsi, par la suite, les mod`eles 1 et 2 sont consid´er´es comme ´equivalents d’un point de vue conceptuel.

L’estimation du seuil optimal n´ecessite de pouvoir ´echantillonner dans la distribution a posteriori des param`etres de distribution du nadir dans les deux groupes. Ainsi, il serait utile d’´echantillonner les valeurs de nadir dans deux distributions selon le statut des patients et donc d’introduire ce statut ainsi que des param`etres de distribution du marqueur pour les deux groupes (µ0, σ02 et µ1, σ12). Ceci correspond au mod`ele 3 (figure 5.7). Encore une fois, d’un point de vue technique, ce mod`ele n’est pas constructible, il n’est donc consid´er´e que d’un point de vue conceptuel. Ce dernier mod`ele permettrait d’obtenir directement des ´echantillons de valeurs issues de la distribution a posteriori des param`etres de distribution du marqueur dans les deux groupes et non de les recalculer apr`es coup comme avec le mod`ele 1. Si la param´etrisation du mod`ele 2 (et donc du mod`ele 1) est suffisamment souple au niveau de la distribution du nadir, alors la distribution ainsi obtenue doit reconstituer la distribution des nadirs du mod`ele 3, constitu´ee d’un m´elange de deux distributions selon le statut des patients (M), et ceci, bien que le statut des patients n’ait pas ´et´e introduit dans le mod`ele 2. Ainsi, dans la chaˆıne MCMC, l’´echantillonnage des valeurs de nadir par patient selon Gnadir et les donn´ees de PSA (mod`ele 2), ou selon le statut des patients, µ1, µ0, σ1, σ0 et les donn´ees de PSA (mod`ele 3) doit ˆetre