1
120 130 140 150 160 170
40 60 80
Age (année)
Pression (mm Hg)
0 20 40 60
44 73 103 132 161
concentration en fer sérique (ug/dl)
fréquence
44 73 103 132 161 Concentration en fer sérique (ug/dl)
De ces 4 types de graphiques, l’usage retient essentiellement l’histogramme (en haut à droite) pour représenter une dimension et le diagramme de dispersion (en bas à gauche) pour représenter 2 dimensions
2 Afin d'étudier la relation qui pourrait exister entre l'âge et la
pression sanguine, un médecin mesure sur 12 femmes d'âges différents la pression sanguine systolique (mm Hg).
y = 1,138x + 80,778 R2 = 0,8031
115 125 135 145 155 165 175
35 45 55 65
Age (années)
Pression systolique (mmHg)
La droite des moindres carrés modélise la relation entre X et Y par une équation simple Ym = B1X+Bo
3 Afin d'étudier la relation qui pourrait exister entre l'âge et la
pression sanguine, un médecin mesure sur 12 femmes d'âges différents la pression sanguine systolique (mm Hg).
y = 1,138x + 80,778 R2 = 0,8031
115 125 135 145 155 165 175
35 45 55 65
Age (années)
Pression systolique (mmHg)
€ ye
2 i=1
n
∑
Dans la droite des moindres carrés la valeur des paramètres B1 et Bo est obtenue en minimisant globalement les écarts en Y (ordonnée). Ces écarts s’écrivent Yo-Ym=Ye, Yo étant la valeur mesurée dans l’expérience, Ym=B1X+Bo et Ye l’écart entre les deux valeurs. La valeur optimale du couple (B1,Bo) correspond à la valeur minimale de la somme des carrés des écarts au modèle. Ce modèle implique que les valeurs de X ne soient pas aléatoires.
4
y = 1,138x + 80,778 R2 = 0,8031
115 125 135 145 155 165 175
35 45 55 65
Age (années)
Pression systolique (mmHg)
X Yo Ym Ye
56 147 144,5 2,5
42 125 128,6 -3,6
72 160 162,7 -2,7
36 118 121,7 -3,7
63 149 152,5 -3,5
47 128 134,3 -6,3
55 150 143,4 6,6
49 145 136,5 8,5
38 115 124,0 -9,0
42 140 128,6 11,4
68 152 158,2 -6,2
60 155 149,1 5,9
SCE 2500,7 2008,2 492,5 R2 0,8031
Variabilité = information + bruit SCE Yo = SCE Ym + SCE Ye 2500,7 = 2008,2 + 492,5
R2 = = = = 0, 8031 Variabilité
information
SCE Yo
SCE Ym 2008,2
2500,7 X non aléatoire
La variabilté de Yo est décomposée en deux SCE additives: la variabilité expliquée par le modèle et la variabilité inexpliquée par le modèle (bruit).
Le coefficient de détermination R2 exrpime la proportion de la variabilité de Yo qui est expliquée par le modèle. Il mesure la qualité du modèle.
5 Pour 39 individus adultes, un endocrinologue a noté l'âge et la
concentration urinaire d'un stéroïde particulier.
y = -0,0594x + 8,1318 R2 = 0,1039
0 1 2 3 4 5 6 7 8 9 10
50 55 60 65 70 75 80
Age (années)
[Stéroïde]
La qualité du modèle linéaire est médiocre : il explique seulement 10% de la variabilité de Yo
6 Un physiologiste a mesuré la quantité d'énergie métabolisée en
10 heures (calories) par un moineau soumis à différentes températures (° Celsius).
y = -0,358x + 25,506 R2 = 0,9383
10 12 14 16 18 20 22 24
0 10 20 30 40
Température (°C)
Energie (calorie)
La qualité du modèle linéaire est bonne (93% de la variabilité expliquée)
7 Une étude est menée en vue de déterminer l'influence de l'alcool sur
le comportement humain. Huit individus prélevés au hasard reçoivent chacun une dose (ml) de whisky. Après une demi-heure, le temps
(secondes) mis par chaque sujet pour réaliser un test est mesuré.
y = 1,2976x + 85,679 R2 = 0,9204
80 90 100 110 120 130 140 150
0 10 20 30 40 50
dose (ml)
Temps (min)
La qualité du modèle linéaire est bonne (92% de la variabilité expliquée)
8 Un neurophysiologiste étudie le passage de différents alcools
du sang vers le cerveau en fonction de leur lipophilicité (mesurée par le coefficient de partage). Il injecte à 10 patients des alcools différents et note, pour chaque patient, la
lipophilicité de l'alcool et sa concentration dans le cerveau.
y = -0,1412x + 2,0023 R2 = 0,1045
0 0,5 1 1,5 2 2,5 3
-1 0 1 2 3 4 5
Lipophilicité
[alcool] cerveau
La qualité du modèle linéaire est médiocre : il explique seulement 10% de la variabilité de Yo
9 Un neurophysiologiste étudie le passage de différents alcools
du sang vers le cerveau en fonction de leur lipophilicité (mesurée par le coefficient de partage). Il injecte à 10 patients des alcools différents et note, pour chaque patient, la
lipophilicité de l'alcool et sa concentration dans le cerveau.
y = -0,3161x2 + 0,9222x + 1,8345 R2 = 0,9772
0 0,5 1 1,5 2 2,5 3
-1 0 1 2 3 4 5
Lipophilicité
[alcool] cerveau
La qualité du modèle quadratique est bonne : il explique 97% de la variabilité de Yo
La référence de R2 est le modèle, qui n’est pas nécessairement linéaire
10 Des écologistes ont capturé des truites (Salmo Trutta Fario)
dans le Samson et ont mesuré la longueur à la fourche (mm) et le poids (gr) de chaque animal.
y = 1,1485x - 115 R2 = 0,8653
-100 -50 0 50 100 150 200 250 300 350 400 450
0 100 200 300 400
longueur (mm)
Poids (gr)
La qualité du modèle linéaire est bonne (86% de la variabilité expliquée). CE R2 élevé n’est pas la preuve que le modèle linéaire est le plus adéquat.
11 Des écologistes ont capturé des truites (Salmo Trutta Fario)
dans le Samson et ont mesuré la longueur à la fourche (mm) et le poids (gr) de chaque animal. La droite des moindres rectangles serait plus adaptée, bien que l’on puisse considérer que la taille est constante durant Δt tandis que le poids est variable dans ce même Δt.
y = 1E-05x2,9557 R2 = 0,9984
0 50 100 150 200 250 300 350 400 450
0 100 200 300 400
longueur (mm)
Poids (gr)
La qualité du modèle puissance est meilleure que celle du modèle linéaire : il explique 97% de la variabilité de Yo
La référence de R2 est le modèle, qui n’est pas nécessairement linéaire
12 Longueur du corps (cm) et profondeur de poitrine (cm)
de 22 vaches laitières.
y = 0,1639x + 41,887 R2 = 0,6783
64 65 66 67 68 69 70 71 72
140 145 150 155 160 165 170
longueur (cm)
Profondeur (cm)
13 Un biochimiste a déterminé les vitesses initiales (micromoles/min)
d'une enzyme pour différentes concentrations en substrat (millimolaires).
y = 0,0377x + 1,1716 R2 = 0,8883
0 0,5 1 1,5 2 2,5 3
0 10 20 30 40 50
[Substrat] milimolaire
Vit.init. (micromole/min)
14 Les statistiques suivantes reprennent, pour 9 pays , en
moyenne par hectare, les quantités d'engrais déversées et les quantités de céréales récoltées.
y =33.89 + 0,049x R2 = 0,34 R = 0.58
30 35 40 45 50 55 60
100 150 200 250 300 350
Engrais (Kg/ha)
Céréales (100kg/ha)
15 Une physiologiste s'intéresse à l'influence d'une drogue sur la
pression sanguine. Elle décide de mesurer la pression sanguine de 9 individus ayant reçu chacun une quantité différente de drogue.
y = 109.38 + 0,57x R2 = 0,98 R = 0.99
120 125 130 135 140 145 150
20 30 40 50 60 70
Drogue (mg/Kg)
Pression (mm Hg)
16 L'étude de la croissance d'une population de campagnols des
champs (Microtus Arvalis) a fourni pour le nombre d'individus en fonction du temps les résultats suivants.
y = 20,673x - 56,833 R2 = 0,7728
-100 -50 0 50 100 150 200 250 300 350
0 5 10 15
Mois
Nombre d'individus
17 L'étude de la croissance d'une population de campagnols des
champs (Microtus Arvalis) a fourni pour le nombre d'individus en fonction du temps les résultats suivants.
y = 2,5149e0,3581x R2 = 0,9868
0 50 100 150 200 250 300 350 400
0 5 10 15
Mois
Nombre d'individus
18 Un chimiste a mesuré, à différentes températures, la concentration
de bromure de potassium (KBr) dissout dans 100 gr d'eau.
y = 0,52x + 54,2 R2 = 0,9996
0 20 40 60 80 100 120
0 20 40 60 80 100
Température (°C)
[KBr]
19 Un écologiste a mesuré la longueur et le poids de 20 coquilles
vides pour une même espèce de mollusque marin.
La droite des moindres rectangles serait plus adaptée.
y = -13.68+7,9631x R2 = 0,52 R = 0,72
0 2 4 6 8 10 12 14 16
2 2,5 3 3,5
longueur (cm)
Poids (gr)
20 Un physiologiste a mesuré la quantité d'énergie métabolisée en
10 heures (calories) par un moineau soumis à différentes températures (° Celsius).
y = 25.5-0,358x R2 = 0,94 R = -0.97
0 5 10 15 20 25 30
0 10 20 30 40
T° (°C)
Energie (calorie)
21 Les statistiques suivantes reprennent, pour 9 pays , en
moyenne par hectare, les quantités d'engrais déversées et les quantités de céréales récoltées.
y =33.89 + 0,049x R2 = 0,34 R = 0.58
30 35 40 45 50 55 60
100 150 200 250 300 350
Engrais (Kg/ha)
Céréales (100kg/ha)
22
0,E+0 1,E+5 2,E+5 3,E+5 4,E+5 5,E+5
0 10 20 0
5 10 15
0 2 4
0 2 4 68 10 1214
0 10 20
0,00 0,05 0,10 0,15 0,20 0,25 0,30
0 1 2
y = ax b
y x Log(y) Log(x) Log(y) x 1/y 1/x log(y)=log(a)+blog(x)
Fonction puissance (ex: taille, poids)
23 y x Log(y) Log(x) Log(y) x 1/y 1/x
Fonction exponentielle (ex: croissance de population)
0 250 500 750 1000
0 10 20
0 2 4 6 8
0 2 4
0 2 4 6 8
0 10 20
0,00 0,05 0,10 0,15 0,20
0,0 1,0 2,0
y = ae bx
log( y) = log(a) + bx
24 y x Log(y) Log(x) Log(y) x 1/y 1/x
Fonction hyperbolique (ex: cinétique enzymatique)
0 1 2 3 4
0 10 20
0 0,2 0,40,6 0,81 1,2 1,4
0 2 4
0 0,2 0,4 0,6 0,8 1 1,2 1,4
0 10 20
0 0,2 0,4 0,6 0,8
0,0 1,0 2,0
1 y=1
a+b a 1 x