STATISTIQUES A DEUX VARIABLES
I) RAPPELS UTILES POUR CE CHAPITRE : faire ex « pour prendre un bon départ. » 1) Statistiques à une variable.
Soit une série statistique où les xi sont les caractères et les ni les effectifs
valeur x1 x2 …... xp
Effectifs n1 n2 …... np
L'effectif total est N = n1 + n2+ …... + np
Moyenne
x = n1×x1+n2×x 2+...+np×xp
N =
∑
i=1 i=pni×xi N Variance :
La variance v(x) = 1
N
∑
i=1 i=p
ni(xi−x)2 = 1
N
∑
i=1 i=n
ni×xi2 - x2 L’écart-type est (x) =
√
v(x)2) Equation de la droite (AB).
Propriété :
Dans un repère on donne les point A(xA; yA) et B(xB;yB) alors la droite (AB) a pour équation y=m(x−xA)+yA où m=yB−yA
xB−xA .
II) STATISTIQUES A DEUX VARIABLES.
1) Généralités Faire ex 15 p 263 Définition :
Lorsque l'on étudie conjointement deux caractères x et y sur une même population de taille n, on associe à chaque individu de la population un couple (xi; yi) où i est un nombre entre 1 et n.
L'ensemble de ces couples s'appelle une série statistique double.
Exemple : une équipe de météorologues envoie un ballon sonde et relève les températures en fonctions de l'altitude.
Altitude x en km 0,1 0,4 0,7 1 1,5 2 2,5
Température y en °C 25 22 20 17,5 10,5 5 1
Définition :
L'ensemble des points M(xi; yi), s'appelle le nuage de points et le point G(x ; y) s'appelle le point moyen de cette série statistique double.
Dans notre exemple :
x = 0,1+0,4+0,7+1+1,5+2+2,5
7 =1,2 et
y = 25+22+20+17,5+10,5+5+1
7 =14,4
Donc G(1,2 ;14,4)
On cherche s'il existe un lien entre ces deux variables.
On va essayer de trouver une courbe qui « approche au mieux » le nuage. On dit que l'on fait un ajustement.
Si cette courbe est une droite, on dit que c'est un ajustement affine mais ce n'est pas toujours une droite.
2) Covariance faire ex 2
Définition :
Soit la série statistique double (x;y) d'effectif n. On appelle covariance de cette série le réel cov(x,y) =
∑
i=1 i=n(xi−x)(yi−y)
n =
∑
i=1 i=nxiyi
n - x . y Interprétation de la covariance selon la forme du nuage :
3) La droite des moindre carrés ou droite de régression.
Le principe :
Soit (Mi) le nuage de points d'une série double.
Lorsque que l'on considère que l'on peut faire un ajustement affine,
le critère choisi pour la méthode de moindres carrés est de trouver la droite d pour que
∑
i=1 i=n
MiAi2 soit minimum où Ai sont les points de d d'abscisse xi. Propriété :
La droite des moindres carrés (ou droite droite de régression) :
passe par le point moyen et d a pour équation y = m ( x – x ) + y où m = cov(x , y) v(x) . Exercice : 5 p 259 ( voir feuille de présentation)
4) Coefficient de corrélation
Pour l'instant, la décision d'ajuster un nuage de points par une droite s'est prise à la seule vue du nuage.
Les statisticiens ont éprouvé le besoin de quantifier cette prise de décision.
Voici comment : Définition :
Le coefficient de corrélation linéaire d'une série double est r=cov(x , y) σ(x)σ(y) .
Propriété :
-1 r 1
si | r | = 1 alors les points sont alignés.
Plus | r | est proche de 1, plus l'ajustement affine a un sens.
Plus | r | est proche de 0, moins l'ajustement affine a un sens.
EXERCICE 1 : POUR PRENDRE UN BON DEPART
1) On donne la série statistique des notes obtenues à un devoir de 20 élèves.
Calculer de deux manière différentes, à l'aide des tableaux suivants, sa moyenne, sa variance et son écart-type.
Puis retrouver ses résultats à l'aide de la calculatrice . xi ni ni×xi ni(xi−x)2
10 4
12 3
15 7
16 4
18 2
Total x = v(x) =
(x) =
xi ni ni×xi ni×xi2
10 4
12 3
15 7
16 4
18 2
Total x = v(x) =
(x) =
2) Dans un repère, on donne la droite d'équation D : y=2 x−3 . a) les points A(1;-2) et B( 5;7) sont-ils sur D ?
b) Tracer D.
3) Dans un repère, on donne les point A(1;−4) et B(−3;−16). Déterminer une équation de la droite (AB).
EXERCICE 2 :
Soit la série double donnée par les deux tableaux suivants où x représente la note d'écrit et y la note d'oral à une épreuve d'anglais.
Deux manières de calculer la covariance.
xi yi xi−x yi−y (xi−x)(yi−y)
7 8
10 9
11 12
13 12
16 13
Total
x = y =
cov(x,y) =
∑
i=1 i=n(xi−x)(yi−y)
n =
xi yi xiyi
7 8
10 9
11 12
13 12
16 13
Total
x = y = cov(x,y) = 1
n
∑
i=1 i=n
xiyi - x . y
ex 5 p 259
Deux présentations des calculs dans un tableau :
Afin d'orienter ses investissements, une chaîne d'hôtel réalise des analyses sur le montant des frais de publicité ( en milliers d'euros ) par rapport au taux d'occupation des chambres ( en % )
xi yi xi−x yi−y (xi−x)2 (xi−x)(yi−y)
22 48
24 32
25 55
27 45
30 52
Total
xi yi xi2 xiyi
22 48
24 32
25 55
27 45
30 52
Total
Correction ex 15 p 263 Correction ex 27 p 265