STATISTIQUES POUR PHARMACIEN-NE-S
SEMESTRE D’AUTOMNE 2014
Michael Amiguet
Institut universitaire de m´edecine sociale et pr´eventive (IUMSP) Unit´e de statistique (US)
Biopˆole 2 (2e ´etage, bureau 143) Route de la Corniche 10
CH-1010 Lausanne
Tel: +41 (0)21 314 31 47 [email protected]
Plan du cours
Cours
– Le cours est largement bas´e sur le polycopi´e de biostatistiques du Prof. Marazzi
– Le polycopi´e comporte 23 chapitres sur 4 parties. Seuls les chapitres 1-12 sont concern´es par ce cours.
Exercices
– 12 s´eries d’exercices, une par chapitre, sont propos´ees, avec leurs solutions. Chaque semaine a lieu une s´eance d’exercices au cours de laquelle deux personnes seront pr´esentes pour r´epondre `a vos questions et vous aider `a r´esoudre les probl`emes.
– Les probl`emes propos´es sont similaires aux probl`emes qui vous seront pos´es `a l’examen.
– Parfois je ferai quelques rappels et donnerai des instructions lors des s´eances d’exercices.
– En r`egle g´en´erale les ´etudiant(e)s qui participent aux s´eances d’exercices s’en sortent mieux `a l’examen.
Mat´ eriel
– Slides: un jeu par cours
– Polycopi´e: chapitres 1-12, Tables, index – Exercices et solutions (12 s´eries)
– Exemples d’examens
Vous trouverez ce mat´eriel (et quelques autres documents) sur http://www.iumsp.ch/fr/enseignement/biostatistique.
Un lien vers ce site se trouve sur MyUNIL.
Objectifs
Introduction aux techniques statistiques ´el´ementaires:
– Techniques permettant d’explorer des donn´ees et de les repr´esenter graphiquement, afin de rep´erer des structures, des tendances.
→ Statistique exploratoire: Chapitres 1 `a 3 du polycopi´e
– Techniques permettant de tester si une structure observ´ee pourrait ˆetre le simple fait du hasard, ou si elle correspond `a un ph´enom`ene r´eel.
→ Statistique inf´erentielle: Chapitres 8 `a 12 du polycopi´e
Les chapitres 4 `a 7 pr´esentent les outils de calcul de probabilit´es n´ecessaires `a l’inf´erence.
Les chapitres les plus importants sont les chapitres 10-12 (tests statistiques)
En guise d’introduction, les slides qui suivent pr´esentent quelques exemples de probl`emes statistiques dans les sciences m´edicales et biologiques. A la fin de ce cours, vous serez capables de r´esoudre ces probl`emes.
1. Effet de la conservation sur des ´ echantillons de sang
Question: est-ce que la concentration de triglyc´erides change si un
´echantillon de sang est conserv´e pendant un certain temps? Dans une
´etude men´ee par Wood (1973), les ´echantillons de 30 sujets ont ´et´e analys´es imm´ediatement apr`es la prise de sang et 8 mois apr`es.
On appelle ce type de donn´ees des donn´ees appari´ees, car elles vont par
paires.
Les donn´ees obtenues sont les suivantes (en mg/100 ml):
Avant le stockage: 74 80 75 136 104 102 177 88 85 267
Apr`es 8 mois: 66 85 71 132 103 103 185 96 76 273
Diff´erence: -8 5 -4 -4 -1 1 8 8 -9 6
Avant le stockage: 71 174 126 72 301 99 97 71 83 79
Apr`es 8 mois: 73 172 133 69 302 106 94 67 81 74
Diff´erence: 2 -2 7 -3 1 7 -3 -4 -2 -5
Avant le stockage: 124 42 145 131 228 115 83 211 169 84 Apr`es 8 mois: 129 48 148 127 227 129 81 212 182 84
Diff´erence: 5 6 3 -4 -1 14 -2 1 13 0
Moyenne des diff´erences: 1.17 mg/100ml
→ Dans notre ´echantillon de 30 sujets, la concentration de triglyc´erides a augment´e en moyenne de 1.17 mg/100ml apr`es un stockage de 8 mois.
→ Cette augmentation pourrait-elle ˆetre le simple fait du hasard, ou correspond-elle `a un effet r´eel de la conservation?
→ La statistique permet de r´epondre `a cette question.
Les donn´ees obtenues sont les suivantes (en mg/100 ml):
Avant le stockage: 74 80 75 136 104 102 177 88 85 267
Apr`es 8 mois: 66 85 71 132 103 103 185 96 76 273
Diff´erence: -8 5 -4 -4 -1 1 8 8 -9 6
Avant le stockage: 71 174 126 72 301 99 97 71 83 79
Apr`es 8 mois: 73 172 133 69 302 106 94 67 81 74
Diff´erence: 2 -2 7 -3 1 7 -3 -4 -2 -5
Avant le stockage: 124 42 145 131 228 115 83 211 169 84 Apr`es 8 mois: 129 48 148 127 227 129 81 212 182 84
Diff´erence: 5 6 3 -4 -1 14 -2 1 13 0
Moyenne des diff´erences: 1.17 mg/100ml
→ Dans notre ´echantillon de 30 sujets, la concentration de triglyc´erides a augment´e en moyenne de 1.17 mg/100ml apr`es un stockage de 8 mois.
→ Cette augmentation pourrait-elle ˆetre le simple fait du hasard, ou correspond-elle `a un effet r´eel de la conservation?
→ La statistique permet de r´epondre `a cette question.
Les donn´ees obtenues sont les suivantes (en mg/100 ml):
Avant le stockage: 74 80 75 136 104 102 177 88 85 267
Apr`es 8 mois: 66 85 71 132 103 103 185 96 76 273
Diff´erence: -8 5 -4 -4 -1 1 8 8 -9 6
Avant le stockage: 71 174 126 72 301 99 97 71 83 79
Apr`es 8 mois: 73 172 133 69 302 106 94 67 81 74
Diff´erence: 2 -2 7 -3 1 7 -3 -4 -2 -5
Avant le stockage: 124 42 145 131 228 115 83 211 169 84 Apr`es 8 mois: 129 48 148 127 227 129 81 212 182 84
Diff´erence: 5 6 3 -4 -1 14 -2 1 13 0
Moyenne des diff´erences: 1.17 mg/100ml
→ Dans notre ´echantillon de 30 sujets, la concentration de triglyc´erides a augment´e en moyenne de 1.17 mg/100ml apr`es un stockage de 8 mois.
→ Cette augmentation pourrait-elle ˆetre le simple fait du hasard, ou correspond-elle `a un effet r´eel de la conservation?
→ La statistique permet de r´epondre `a cette question.
Les donn´ees obtenues sont les suivantes (en mg/100 ml):
Avant le stockage: 74 80 75 136 104 102 177 88 85 267
Apr`es 8 mois: 66 85 71 132 103 103 185 96 76 273
Diff´erence: -8 5 -4 -4 -1 1 8 8 -9 6
Avant le stockage: 71 174 126 72 301 99 97 71 83 79
Apr`es 8 mois: 73 172 133 69 302 106 94 67 81 74
Diff´erence: 2 -2 7 -3 1 7 -3 -4 -2 -5
Avant le stockage: 124 42 145 131 228 115 83 211 169 84 Apr`es 8 mois: 129 48 148 127 227 129 81 212 182 84
Diff´erence: 5 6 3 -4 -1 14 -2 1 13 0
Moyenne des diff´erences: 1.17 mg/100ml
→ Dans notre ´echantillon de 30 sujets, la concentration de triglyc´erides a augment´e en moyenne de 1.17 mg/100ml apr`es un stockage de 8 mois.
→ Cette augmentation pourrait-elle ˆetre le simple fait du hasard, ou correspond-elle `a un effet r´eel de la conservation?
→ La statistique permet de r´epondre `a cette question.
Les donn´ees obtenues sont les suivantes (en mg/100 ml):
Avant le stockage: 74 80 75 136 104 102 177 88 85 267
Apr`es 8 mois: 66 85 71 132 103 103 185 96 76 273
Diff´erence: -8 5 -4 -4 -1 1 8 8 -9 6
Avant le stockage: 71 174 126 72 301 99 97 71 83 79
Apr`es 8 mois: 73 172 133 69 302 106 94 67 81 74
Diff´erence: 2 -2 7 -3 1 7 -3 -4 -2 -5
Avant le stockage: 124 42 145 131 228 115 83 211 169 84 Apr`es 8 mois: 129 48 148 127 227 129 81 212 182 84
Diff´erence: 5 6 3 -4 -1 14 -2 1 13 0
Moyenne des diff´erences: 1.17 mg/100ml
→ Dans notre ´echantillon de 30 sujets, la concentration de triglyc´erides a augment´e en moyenne de 1.17 mg/100ml apr`es un stockage de 8 mois.
→ Cette augmentation pourrait-elle ˆetre le simple fait du hasard, ou correspond-elle `a un effet r´eel de la conservation?
→ La statistique permet de r´epondre `a cette question.
2. Propri´ et´ es d’un test diagnostique
Lors de l’application d’un test de d´epistage d’une maladie, il peut arriver que le r´esultat soit erron´e, par exemple que le test soit positif alors que le patient n’est pas atteint de la maladie.
Lors de l’´elaboration d’un nouveau test, il convient de quantifier la
probabilit´e d’erreur. Pour cela on applique le test ` a un ´echantillon de
patients, puis on d´etermine pour chaque patient s’il est atteint ou non de
la maladie ` a l’aide d’un test de r´ef´erence (appel´e gold standard) dont le
r´esultat est consid´er´e comme sˆ ur. On obtient alors des donn´ees du type
suivant:
Atteints Non atteints Total
Test positif 215 16 270
Test n´egatif 15 114 22
Total 230 130 360
En g´en´eral, on quantifie en fait la probabilit´e d’un r´esultat correct.
→ Quelle est la probabilit´e que le test soit positif si on l’applique `a un patient atteint (appel´ee sensibilit´e du test)?
→ Quelle est la probabilit´e que le test soit n´egatif si on l’applique `a un patient non atteint (appel´ee sp´ecificit´e du test)?
→ Quelle est la probabilit´e qu’un patient soit atteint si son test est positif (appel´ee valeur pr´edictive positive du test)?
→ Quelle est la probabilit´e qu’un patient soit non atteint si son test est n´egatif (appel´ee valeur pr´edictive n´egative du test)?
→ Avec quelle pr´ecision peut-on estimer les quantit´es ci-dessus `a l’aide des donn´ees r´ecolt´ees?
3. D´ eficit alimentaire et myopie
Question: Le d´eficit alimentaire prot´eique est-il associ´e `a la myopie? Dans une ´etude publi´ee par Young, Leary, Zimmerman et Strobel (1973), les chercheurs ont nourri un groupe de singes avec une di`ete `a faible contenu prot´eique et un autre groupe avec une di`ete `a haut contenu prot´eique. Au bout de plusieurs mois, ils ont mesur´e la r´efraction oculaire des singes. Voici un sous-ensemble des donn´ees obtenues:
Niveau prot´eique faible:
1.27 -4.98 -0.50 1.25 -0.25 0.75 -2.75 0.75 1.00 3.00 2.25 0.53 1.25 -1.50 -5.00 0.75 1.50 0.50 1.75 1.50 Niveau prot´eique ´elev´e:
-6.00 0.25 1.25 -2.00 3.14 2.00 0.75 1.75 0.00 0.75 0.75 0.25 1.25 1.25 1.00 0.50 -2.25
La myopie est caract´eris´ee par une r´efraction oculaire n´egative.
→ Ces mesures soutiennent-elles l’hypoth`ese que le d´eficit alimentaire prot´eique est associ´e `a la myopie?
4. Etude exp´ erimentale sur le risque d’attaque cardiaque apr` es administration d’apirine
Dans une ´etude publi´ee en 1987 (Hennekens et al.) portant sur un ´echantillon de 22071 personnes, les auteurs ont attribu´e, au hasard, un traitement `a l’aspirine `a la moiti´e des participants et un placebo `a l’autre moiti´e (ce processus s’appelle la randomisation).
Ils ont ensuite observ´e les participants pendant une certaine p´eriode et ont obtenu les r´esultats suivants:
Attaque Pas d’attaque Total
Traitement 104 10933 11037
Placebo 189 10845 11034
Total 293 21778 22071
→ Comment mesurer l’effet du traitement?
→ Diff´erence de risque d’attaque: P(Attaque|P lacebo)− P(Attaque|T raitement) = 189/11034 − 104/11037 = 0.0077 = 0.77%
→ Rapport des risques d’attaque: P(Attaque|T raitement)/P(Attaque|P lacebo) =
189/11034
104/11037 = 0.55
→ Cette diminution du risque d’attaque pourrait-elle ˆetre le simple fait du hasard, ou correspond-elle `a un effet r´eel de l’aspirine?
4. Etude exp´ erimentale sur le risque d’attaque cardiaque apr` es administration d’apirine
Dans une ´etude publi´ee en 1987 (Hennekens et al.) portant sur un ´echantillon de 22071 personnes, les auteurs ont attribu´e, au hasard, un traitement `a l’aspirine `a la moiti´e des participants et un placebo `a l’autre moiti´e (ce processus s’appelle la randomisation).
Ils ont ensuite observ´e les participants pendant une certaine p´eriode et ont obtenu les r´esultats suivants:
Attaque Pas d’attaque Total
Traitement 104 10933 11037
Placebo 189 10845 11034
Total 293 21778 22071
→ Comment mesurer l’effet du traitement?
→ Diff´erence de risque d’attaque: P(Attaque|P lacebo)− P(Attaque|T raitement) = 189/11034 − 104/11037 = 0.0077 = 0.77%
→ Rapport des risques d’attaque: P(Attaque|T raitement)/P(Attaque|P lacebo) =
189/11034
104/11037 = 0.55
→ Cette diminution du risque d’attaque pourrait-elle ˆetre le simple fait du hasard, ou correspond-elle `a un effet r´eel de l’aspirine?
4. Etude exp´ erimentale sur le risque d’attaque cardiaque apr` es administration d’apirine
Dans une ´etude publi´ee en 1987 (Hennekens et al.) portant sur un ´echantillon de 22071 personnes, les auteurs ont attribu´e, au hasard, un traitement `a l’aspirine `a la moiti´e des participants et un placebo `a l’autre moiti´e (ce processus s’appelle la randomisation).
Ils ont ensuite observ´e les participants pendant une certaine p´eriode et ont obtenu les r´esultats suivants:
Attaque Pas d’attaque Total
Traitement 104 10933 11037
Placebo 189 10845 11034
Total 293 21778 22071
→ Comment mesurer l’effet du traitement?
→ Diff´erence de risque d’attaque: P(Attaque|P lacebo)− P(Attaque|T raitement) = 189/11034 − 104/11037 = 0.0077 = 0.77%
→ Rapport des risques d’attaque: P(Attaque|T raitement)/P(Attaque|P lacebo) =
104/11037
189/11034 = 0.55
→ Cette diminution du risque d’attaque pourrait-elle ˆetre le simple fait du hasard, ou correspond-elle `a un effet r´eel de l’aspirine?
4. Etude exp´ erimentale sur le risque d’attaque cardiaque apr` es administration d’apirine
Dans une ´etude publi´ee en 1987 (Hennekens et al.) portant sur un ´echantillon de 22071 personnes, les auteurs ont attribu´e, au hasard, un traitement `a l’aspirine `a la moiti´e des participants et un placebo `a l’autre moiti´e (ce processus s’appelle la randomisation).
Ils ont ensuite observ´e les participants pendant une certaine p´eriode et ont obtenu les r´esultats suivants:
Attaque Pas d’attaque Total
Traitement 104 10933 11037
Placebo 189 10845 11034
Total 293 21778 22071
→ Comment mesurer l’effet du traitement?
→ Diff´erence de risque d’attaque: P(Attaque|P lacebo)− P(Attaque|T raitement) = 189/11034 − 104/11037 = 0.0077 = 0.77%
→ Rapport des risques d’attaque: P(Attaque|T raitement)/P(Attaque|P lacebo) =
104/11037
189/11034 = 0.55
→ Cette diminution du risque d’attaque pourrait-elle ˆetre le simple fait du hasard, ou correspond-elle `a un effet r´eel de l’aspirine?