• Aucun résultat trouvé

4.4 Discussion et conclusion

5.3.1 Inuence du nombre de patients

Les résultats ont été obtenus avec un nombre total de gènes p= 1000xé, pour un nombre variable de gènes sousH1, p1 ={5,10,20}.

Comparaison de ρ2train et ρ¯2test, ∆T rT e : La gure 5.3 montre ∆T rT e (diérence entre ρ2train et ρ2test) en fonction du nombre de patients, pour les modèles transcriptomiques et cliniques.

Pour le modèle transcriptomique,∆T rT ediminue quandnaugmente, sans jamais atteindre zéro, et ceci quelle que soit la valeur de p1. La largeur des intervalles de conance est globalement constante quel que soit le nombre de patients. La taille de l'intervalle de conance pour 400 patients et p1 = 20 s'explique par le fait qu'avec ce jeu de paramètres, la méthode du gradient converge pour moins de jeux de données.

En ce qui concerne le modèle clinique, ∆T rT e est très proche de zéro, et ceci d'autant plus que le nombre de patients augmente. La largeur des intervalles de conance diminue avec n et est nettement plus faible que pour le modèle transcriptomique.

Ces résultats indiquent que le pouvoir prédictif des gènes sélectionnés sur un jeu de données est surestimé par rapport au pouvoir prédictif qu'ils auraient sur un autre jeu de données. Pour les variables cliniques en revanche, cette surestimation est quasiment nulle. Selon la nature des variables, les deux modèles ont un comportement très diérent ; ils ne peuvent donc pas être interprétés de la même manière. Les mêmes résultats ont été obtenus pour le modèle ajusté.

Fig. 5.3: Évolution de ∆T rT e en fonction du nombre de patients n pour les modèles trans-criptomique (à gauche), et clinique (à droite) - p = 1000 gènes. Les intervalles de conance sont représentés par les segments.

Comparaison de ρ2train et ρ2exp, ∆T rExp : La gure 5.4 montre ∆T rExp pour les deux types de variables dans le modèle ajusté. Pour les variables transcriptomiques, ∆T rExp tend vers zéro quand le nombre de patients augmente, le pouvoir prédictif observé sur le jeu de travail tendant alors vers celui qui est attendu. Ces résultats indiquent que si les jeux de données sont trop petits, le pouvoir prédictif qu'on croit être contenu dans les gènes sélectionnés est en réalité surestimé. La méthode du gradient conduit à sélectionner un nombre de gènes supérieur à p1; ces faux positifs font goner ρ2train, donnant l'illusion que le pouvoir prédictif des gènes sélectionnés augmente alors que cette augmentation est due à du bruit.

Cette fois, le nombre de gènes sousH1 a un eet :∆T rExpest d'autant plus grand quep1 est petit. Par nature,ρ2 dépend du nombre de variables introduites dans le modèle. De ce fait,ρ2exp augmente avecp1. Par contre, le nombre de gènes sélectionnés ne dépend que très peu dep1, et reste de l'ordre de la dizaine.∆T rExpest donc d'autant plus grand que p1 est petit puisque dans ce cas, le modèle obtenu sur le jeu de travail contient plus de variables que le modèle théorique.

Les résultats pour les variables cliniques sont très diérents ; le pouvoir prédictif des modèles est cette fois sous-estimé, ceci d'autant plus quep1 est grand. Cette observation s'explique par le biais dû aux covariables manquantes quand les modèles sont mal spéciés [114]. En eet, l'omission de variables explicatives dans un modèle conduit à sous-estimer l'eet des variables non omises. Le nombre de vrais positifs étant faible quel que soit le nombre de gènesp1 reliés à la survie, il manque d'autant plus de gènes dans le modèle que p1 est grand. Cette propriété a également des eets sur le comportement du modèle transcriptomique. La méthode du gradient manque certains gènes d'intérêt. Puisque le nombre de gènes sélectionnés varie peu, elle en manque d'autant plus que p1 augmente. Par contre, l'introduction de faux positifs n'introduit pas de biais dans l'estimation de l'eet des vrais positifs.

Fig. 5.4: Évolution de ∆T rExp en fonction du nombre de patients n pour les variables trans-criptomiques (à gauche), et cliniques (à droite) des modèles ajustés-p= 1000gènes.

Les intervalles de conance sont représentés par les segments.

Comparaison de ρ¯2test et ρ2exp, ∆T eExp : Les résultats de la gure 5.5 montrent que sur les jeux tests, les gènes sélectionnés sur le jeu de travail sont incapables de restituer l'information

prédictive théorique du jeu de données. En eet, hormis pour 50 patients, les valeurs de∆T eExp

sont négatives, et ceci d'autant plus que le nombre de gènes p1 reliés à la survie est grand.

En eet, la valeur de ρ2 dépend du nombre de covariables sélectionnées et introduites dans le modèle, et le nombre de gènes sélectionnés ne dépendant pas dep1, il manque d'autant plus de variables que p1 est petit. Avec 200 et 400 patients, le nombre de vrais positifs augmente, ce qui explique la légère augmentation de ∆T eExp.

Comme pour les variables issues du transcriptomique, les résultats obtenus pour les variables cliniques sont atypiques pour 50 patients. Pour un nombre de patients plus important, la sous-estimation de l'eet des variables cliniques s'explique à nouveau par le biais déjà évoqué ci-dessus.

Les valeurs positives observées pour 50 patients signient que les coecients estimés sur les jeux tests sont plus élevés que ceux attendus, alors même que l'on s'attend à ce que les gènes sélectionnés soient des faux positifs. Ceci peut s'expliquer par la forte variance des estimateurs des paramètres du modèle due à la petite taille de l'échantillon sur lequel ils sont estimés.

Fig. 5.5: Évolution de ∆T eExp en fonction du nombre de patients n pour les variables trans-criptomique (à gauche), et cliniques (à droite) dans le modèle ajusté-p= 1000gènes.

Les intervalles de conance sont représentés par les segments.

Rôle des vrais positifs Nous avons également voulu étudier l'optimisme relatif aux vrais positifs (VP). Pour cela, nous avons comparé l'évolution desρ2 calculés sur les VP d'une part, et à tous les gènes sélectionnés d'autre part. Les résultats obtenus pourp= 1000etp1 = 10gènes

sont présentés sur la gure 5.6. Sur les jeux de travail, quandn augmente,ρ2train calculé à partir de l'ensemble des gènes sélectionnés varie peu (hormis pour n = 50), tandis que ρ2train calculé uniquement sur les VP augmente. Les ρ2train observés sur les jeux de travail correspondent donc à du bruit. En utilisant un seul jeu de données pour une étude, cela ne peut pas être mis en évidence, mais peut conduire à une mauvaise interprétation des résultats. Sur les jeux test,

¯

ρ2test est du même ordre de grandeur selon qu'il est calculé à partir de l'ensemble des gènes ou uniquement des VP, puisque les faux positifs n'apportent pas d'information. Avec trop peu de patients (50 ou 100), la méthode ne détecte aucun VP, d'où l'absence d'intervalles de conance pour ces valeurs. Dans ce dernier cas, les valeurs deρ2trainetρ2testsemblent anormalement hautes, particulièrement pour 50 patients. Comme énoncé précédemment, ceci s'explique par la forte variance des estimateurs due à des échantillons de taille modeste.

Fig. 5.6: Évolution de ρ2train (à droite) et ρ¯2test (à gauche) en fonction de n calculés sur l'en-semble des gènes sélectionnés ou uniquement les vrais positifs - p= 1000 et p1 = 10 gènes. Les intervalles de conance sont représentés par les segments.