Corrigé de l’Examen de L1-Statistiques 2017-2018
EXERCICE 1. Il s’agit d’une variable continue dont les valeurs sont regroupées enclasses ouintervalles.
Classes [0,20[ [20,40[ [40,60[ [60,80[ [80,100]
Effectifs(ni) 1000 5000 10000 30000 13000
Effectifs cumulés(Ni) 1000 6000 16000 46000 59000 Fréquences cumulées Fi%
1.695 10.169 27.119 77.966 100
Centres de classes(ci) 10 30 50 70 90
(a) Pour le calcul de la moyenne, on utilise les centres de classesci:
m(X) = 1 59000
5
X
i=1
nici =3930000
59000 = 66.610 .
(b) L’effectif total estN = 59 000, donc l’effectif moitié est N
2 = 59000
2 = 29500.Laclasse médianeest celle dont l’effectif cumulé est immédiatement supérieur à l’effectif moitié. C’est donc la classe [60,80[. Dans cette classe, on trouve la médiane en résolvant l’équation “rapport des chemins médians = rapport des chemins complets” :
x−60
29500−16000 = 80−60 46000−16000, ce qui donnex= med (X) = 69.
Nous donnons ci-dessous le polygône des fréquences cumulées, et la détermination graphique de la médiane, en inter- sectant la droite de hauteur 50% avec ce polygône :
EXERCICE 2.
1. Il s’agit d’ungrand échantillondont nous regroupons dans le tableau suivant les valeurs en un tableau de dénombrement valeurs-effectifs, en ordonnant naturellement les valeurs par ordre croissant :
Valeurs (heure de marche) (xi) 0 1 2 3 4 5 6 7 N
Effectifs(ni) 1 1 2 4 5 7 9 6 35
Effectifs cumulés(Ni) 1 3 4 8 13 20 29 35
1
2. On représente ces données par un diagramme en bâtons : les valeurs (heures de marche) xi sont en abscisse et les effectifsni sont en ordonnée :
3. Attention, la variableX prend 8valeurs, et pas7. Donc :
m(X) = 1 35
8
X
i=1
nixi=168 35 = 4.8.
4. La médiane sépare l’échantillon en deuxblocs médians d’effectifs égaux. Or N 2 =35
3 = 17.5 .Lavaleur médiane est celle dont l’effectif cumulé dépasse immédiatement 17.5. On a donc m´ed (X) = 5. De même les quartiles Q1 et Q3
sont les valeurs deX dont les effectifs cumulés dépassent immédiatement N
4 = 8.75et 3N
4 = 26.25. On a doncQ1= 4 et Q3= 6.
5. Le mode est la valeur deX qui a le le plus grand effectif, donc mode = 6
L’étendue est la différence entre les valeurs extrêmes. Etend (X) = 7−0 = 7.
6. V (x) =m X2
−m(X)2= 1 N
P8
i=1nix2i −m(X)2= 918
35 −4.82= 3.188.
σ(X) =p
V(X) =√
3.188 = 1.786. 7. p= 7 + 9 + 6
35 ×100 = 62.857%.
EXERCICE 3. Relation entre la densité de la population et le taux de criminalité dans les régions métropolitaines.
(a) Nuage statistique, voir plus bas.
(b) Pour la droite de Mayer, attention, les absisses(xi)ne sont pas ordonnées dans l’énoncé : il faut donc avant tout les ordonner (et de donc réordonner les (yi)de façon correspondante), ce qui donne le tableau suivant.
(xi) 2.2 3.5 3.7 4 4 5.8 7.5 7.5 7.7 8.6 10.3 11.5
(yi) 4 2.5 4 3 5 9 10 11 12 10 11 15
Pour la droite de Mayer, puisqu’il y a un nombre pair de points, on calcule le barycentreG1= (x1, y1)des6premiers points, et le barycentre G2= (x2, y2)des 6 derniers points. On a
G1= (3.866,4.583) etG2= (8.85,11.5). La droite de Mayer a pour équation : y= y2−y1
x2−x1
(x−x1) +y1= 1.388×(X−3.866) + 4.583.
2
(c) Les calculs directs donnent :
m(X) = 6.358, V(X) = 7.947, σ(X) =p
V (X) = 2.819, m(Y) = 8.042, V(Y) = 15.686, σ(Y) =p
V (Y) = 3.961 . (d) Cov (X, Y) =m(XY)−m(X)m(Y) = 1
12 P12
i=1xiyi−m(X)m(Y) = 738.25
12 −6.358×8.042 = 10.389. r(X, Y) = Cov (X, Y)
σ(X)σ(Y) = 10.389
2.819×3.960 = 0.9305 . Le coefficientrest proche de 1, donc il y a une forte corrélation linéaire entre les variablesX etY.
(e) DY /X :y=ax+b aveca=Cov (X, Y)
V (X) et b=m(Y)−a×m(X). On trouvey= 1.307×y−0.2702. DX/Y :x= ˆay+ ˆb avecˆa=Cov (X, Y)
V(Y) etbb=m(X)−ba×m(Y). On trouvex= 0.662×y+ 1.032 .
3