Universit´e Joseph Fourier Master Statistique
UE Biostatistique
Devoir ` a la maison
Exercice 1
On s’int´eresse `a un essai clinique sur le traitement du cancer du poumon chez des soldats am´ericains v´et´erans. On cherche `a comparer l’efficacit´e de deux traitements, l’un standard, et l’autre en phase de test, sur la survie des individus.
La base de donn´ees s’appelle ”poumon.txt”. Cette base de donn´ees contient les infor- mations suivantes sur n = 137 individus :
– trt : traitement avec 1 = standard et 2 = test
– celltype : type de cellule canc´ereuse : squamous (cellule squameuse), smallcell (petite cellule), adeno (cellule ad´enome), large (grande cellule)
– cellule : codage des valeurs de celltype par 0, 1, 2 et 3
– time : dur´ee observ´ee avant l’´ev`enement d’int´erˆet ou la censure – status : statut de l’observation (0 = censur´ee)
– karno : score de performance de Karnofsky (100 = bon)
– diagtime : nombre de mois ´ecoul´es entre le diagnostic du cancer et la randomisation dans l’´etude
– age : en ann´ees
– prior : 0 si aucune prise de th´erapie avant l’essai, 1 sinon
1. Pr´esenter la base de donn´ees `a l’aide de statistiques descriptives univari´ees. Etudier les liens entre les diff´erentes covariables de la base.
2. Analyser la survie globale des individus de la base.
3. Tester l’effet du nouveau traitement sur la survie des patients. Vous prendrez soin de d´ecrire le test que vous utilisez en donnant les hypoth`esesH0etH1, la statistique de test et sa loi sous H0.
4. Tester l’effet des autres covariables sur la survie des patients. Y a-t-il une diff´erence d’efficacit´e du traitement quand on stratifie sur l’une de ces covariables ?
5. Proposer un mod`ele de r´egression pour ´etudier l’influence des diff´erentes variables sur la survie des patients. Vous prendrez soin de d´ecrire toutes les quantit´es appa- raissant dans le mod`ele.
6. Quel est le rapport des risques en terme de risque instantan´e de d´ec`es entre les individus prenant le traitement standard et ceux prenant le nouveau traitement ? 7. Y a-t-il une influence du type de cellule canc´ereuse ? Vous justifierez avec soin le
choix de param´etrisation utilis´e.
8. Y a-t-il une influence de l’ˆage ?
9. Construire un mod`ele de r´egression le plus complet possible, en interpr´etant les variables qui ont un effet significatif sur le risque instantan´e de d´ec`es.
10. Conclure sur l’´etude.