• Aucun résultat trouvé

4.4 Bilan du chapitre 4

Dans cette partie il a ´et´e montr´e que, lorsque l’objectif est de comparer les performances diagnostiques ou pronostiques de marqueurs refl´etant la cin´etique d’un biomarqueur, il est conseill´e de calculer les valeurs de marqueurs `a partir de la mod´elisation des profils du biomar-queur. Ceci est d’autant plus vrai lorsque les valeurs de marqueurs sont sensibles `a la fr´equence des mesures et `a la pr´esence de valeurs aberrantes.

Une m´ethode robuste a ´et´e propos´ee pour mod´eliser les profils de biomarqueurs longi-tudinaux, combinant la loi de Student et les processus de Dirichlet. Cette m´ethode n’est pas sp´ecifique aux donn´ees de PSA. Dans de nombreux cas, lorsque des biomarqueurs longitudinaux sont mod´elis´es grˆace `a un mod`ele `a effets mixtes, les effets al´eatoires ne suivent pas des distri-butions gaussiennes, d’o`u l’int´erˆet des processus de Dirichlet. La pr´esence de valeurs aberrantes aussi marqu´ees que celles observ´es dans les donn´ees de PSA n’est peut ˆetre pas fr´equente, mais il est rare qu’il n’y ait pas d’erreurs de mesure, d’o`u l’int´erˆet de la loi de Student.

D’autres lois auraient pu ˆetre utilis´ees pour assouplir l’hypoth`ese de normalit´e des r´esidus, comme la loi normale contamin´ee ou la distribution dite “ slash distribution ” (Rosa et al., 2003). Le choix de la loi d´epend en partie de la proportion de valeurs aberrantes et de leur amplitude, mais la loi de Student reste toujours une bonne solution par rapport `a la loi normale et est relativement facile `a impl´ementer.

De mˆeme, les processus de Dirichlet ne constituent pas la seule solution pour assouplir l’hypoth`ese de normalit´e des effets al´eatoires. Les lois normales et de Student asym´etriques auraient pu ˆetre envisag´ees (Lee et Thompson, 2008), mais elles contraignent plus la distribution des effets al´eatoires que les processus de Dirichlet. Une critique souvent formul´ee `a l’´egard de ces processus est qu’ils conduisent `a une distribution de probabilit´e discr`ete avec une probabilit´e 1 (Muller et Quintana, 2004). Des m´ethodes non param´etriques ou semi-param´etriques, mais qui conduisent `a des distributions de probabilit´e continues, sont les m´elanges de processus de Dirichlet (MacEachern et M¨uller, 1998 ; Ohlssen et al., 2007) ou les arbres Polya (Lavine, 1992, 1994). N´eanmoins, le fait que les processus de Dirichlet conduisent `a des distributions de probabilit´e discr`etes ne modifie pas forc´ement l’ordre relatif des valeurs de marqueurs des malades et des non malades ; or c’est uniquement cet ordre qui est utilis´e pour la construction des courbes ROC et non les valeurs r´eelles des marqueurs. De plus, les arbres Polya sont tr`es demandeurs d’un point de vue calculatoire ; c’est pourquoi les processus de Dirichlet ont ´et´e privil´egi´es.

4.4. Bilan du chapitre 4 97 Il est rare qu’un mod`ele mixte assouplisse `a la fois la distribution des r´esidus et celle des effets al´eatoires. A notre connaissance, ce cas n’avait ´et´e consid´er´e auparavant que par Pinheiro et al. (2001) qui avaient utilis´e une distribution de Student `a la fois pour les r´esidus et les effets al´eatoires. Dans le cadre des donn´ees de PSA, `a l’exception de Proust-Lima et Taylor (2009) qui avaient consid´er´e un m´elange de lois normales afin de caract´eriser la distribution des effets al´eatoires, c’est la premi`ere fois qu’autant d’attention est apport´ee `a la mod´elisation de ce type de donn´ees. Le travail r´ealis´e a montr´e l’impact que ceci peut avoir au niveau des conclusions. Les r´esultats obtenus avec le mod`ele Student/Dirichlet privil´egient l’utilisation du nadir de PSA pour discriminer les patients selon le r´esultat attendu des biopsies.

Le statut des patients n’a pas ´et´e introduit dans la mod´elisation des profils du biomarqueur. En r´ealit´e, il est difficile de savoir exactement sur quels param`etres le statut agit, mˆeme s’il semble avoir un effet sur le nadir et la date du nadir. Plutˆot que de rajouter des contraintes suppl´ementaires au mod`ele, en n’´etant pas sˆur de l’endroit o`u il faut les rajouter, il a ´et´e pr´ef´er´e d’utiliser des mod`eles souples – avec l’utilisation de processus de Dirichlet – pouvant reproduire n’importe quel type de profil, ind´ependamment du statut du patient. L’hypoth`ese est que le mod`ele est suffisamment souple ; ainsi, les r´esultats obtenus en termes de comparaison des performances des marqueurs sont les mˆemes que ceux qui auraient pu ˆetre obtenus en introduisant correctement l’effet du statut des patients dans le mod`ele. Le type d’analyse propos´e est uniquement descriptif et ne permet pas, contrairement aux mod`eles biologiques, de mieux comprendre l’effet de la maladie sur les PSA.

Troisi`eme partie

D´efinition de seuils de marqueurs

Chapitre

5

Estimation du seuil optimal

et de son intervalle de confiance

La partie pr´ec´edente a montr´e que le nadir est le meilleur marqueur issu de la cin´etique des PSA, parmi la date du nadir et la v´elocit´e, pour discriminer les patients selon le r´esultat attendu des biopsies (il faut tout de mˆeme garder `a l’esprit que ses performances diagnostiques restent limit´ees). Les courbes ROC des diff´erents marqueurs ´etaient emboˆıt´ees. Ainsi, quel que soit le niveau de sp´ecificit´e consid´er´e, le nadir de PSA a une meilleure sensibilit´e que les autres marqueurs. Pour tout seuil de nadir de PSA retenu, l’utilit´e esp´er´ee en utilisant ce test pour prendre une d´ecision est meilleure que celle des autres marqueurs, quel que soit le seuil retenu pour ces derniers. N´eanmoins, il reste `a d´efinir une valeur seuil du nadir de PSA au dessus de laquelle les cliniciens ont int´erˆet `a r´ealiser une biopsie. Ceci a fait l’objet du second article de th`ese et de travaux compl´ementaires pr´esent´es dans cette partie.