LICENCE 1 2014-2015 PARCOURS GESTION ET CFA FSEG -ISEA
TRAVAUX DIRIGES DE STATISTIQUES 1 STATISTIQUE UNIVARIEE
Série 1 : Organisation des données, représentations graphiques et indicateurs de tendance centrale (ch. 1
→ ch. 3)
Exercice 1
Soit une population de 7 individus pour lesquels la variable X prend les valeurs suivantes :
i 1 2 3 4 5 6 7
xi 3 5 2 5 6 1 1
Sachant que a=5 et que b=10, calculez : a)
7 1
i i
x
∑
= b) 7 2 1i i
x
∑
= c) 7 1( i )
i
ax b
=
∑
+ d) 71 i i
ax b
=
∑
+ e) 41 i i
x
∑
=f)
7 2
5
( i )
i
x b
=
∑
+ g) 5 22 2
i i
x
∑
= h) 3 3 3 i ix b
=
∑
+Exercice 2
Le tableau suivant reprend les informations concernant le type de baccalauréat présenté, le taux de réussite et la répartition filles/garçons pour l’ensemble de la France en 2004.
Total % filles Ensemble Garçons Filles
Baccalauréat général 316 619 57,9 82,5 79,9 84,4
Baccalauréat technologique 186 267 50,8 76,9 75,3 78,5
Baccalauréat professionnel 122 225 42,0 76,9 75,6 78,7
Ensemble 625 111 52,7 79,7 77,4 81,8
Champ : France métropolitaine et Dom.
Source : ministère de l’Éducation nationale, de l'Enseignement supérieur et de la Recherche, Dep.
Session 2004
Présentés Taux de réussite
a) Quelles sont les différentes variables statistiques présentées dans ce tableau ? De quel type sont-elles ? b) Vous pouvez représenter toute l’information contenue dans ce tableau à l’aide d’un seul graphique.
Lequel ? Expliquez comment vous pourriez le construire.
Exercice 31 : Vous disposez des données suivantes 2,3,5,7,13. Déterminez la médiane.
Exercice 4 : Vous disposez des données suivantes 2,3,5,7,13,14. Déterminez la médiane.
Exercice 5 :Vous disposez des données suivantes présentées dans un tableau de dénombrement. Calculez la médiane.
Observation Fréquence
2 2
3 3
4 4
6 2
7 2
Total 13
Exercice 6 :Vous disposez des données suivantes présentées dans un tableau de dénombrement. Calculez la médiane.
Observation Fréquence
2 2
3 3
4 4
6 2
7 3
Total 14
Exercice 72: Vous disposez des données suivantes sur des tailles, regroupées en classes. Calculez la médiane.
Taille (cm) Fréquence (f) 150 -< 155 4
155 -< 160 7 160 -< 165 18 165 -< 170 11 170 -< 175 6 175 -< 180 4
Exercice 8
Le tableau suivant fournit la quantité de poisson pêchée dans différents pays en 2003.
Pays Captures
(millions de tonnes)
Chine 16.76
Pérou 6.09
Pays de l'UE 5.84
États-Unis 4.94
Indonésie 4.68
Japon 4.60
Chili 3.62
Autres pays 43.70
Total mondial 90.22
Source : INSEE
a) Représentez la répartition de la quantité de poisson pêchée en 2003.
b) De quel type est la variable statistique considérée ?
c) Calculez (si cela est possible) le mode et la médiane associés à cette variable statistique (indice : en 2003, on estimait le nombre de pays dans le monde à 227).
2 Statistique Canada.
Exercice 9
Le tableau ci-dessous recense le nombre de pièce des logements des habitants d’une ville de 150000 habitants.
Habite dans un logement ni
de…pièces (xi)
1 1200
2 28000
3 44000
4 40000
5 25000
6 et + 11800
TOTAL 150000
a) Déterminez les individus, la population, le caractère et les modalités de la variable statistique étudiée.
b) De quel type est la variable statistique analysée ?
c) Calculez, pour chacune des modalités, les effectifs cumulés (croissants), les fréquences et les fréquences cumulées (croissantes).
d) Représentez la fonction de répartition associée à cette distribution statistique.
e) Déterminez le mode, la médiane et la moyenne de la distribution décrite ci-dessus.
Exercice 10
Dans le but de déterminer les heures les plus chargées de la journée, une agence de voyage décide de relever le nombre d’appels téléphoniques reçus au cours des différents moments d’une journée. L’information est résumée dans le tableau suivant :
xi ni
Début de matinée 34
Fin de matinée 58
Temps de midi 65
Début d'après midi 54
Fin d'après midi 114
Total 325
a) Déterminez les individus, la population, le caractère et les modalités de la variable statistique étudiée.
b) De quel type est la variable statistique analysée ?
c) Calculez, pour chacune des modalités, les effectifs cumulés croissants, les fréquences et les fréquences cumulées croissantes.
d) Quel(s) type(s) de graphique(s) vous permettrai(en)t d’illustrer la distribution du nombre d’appels pendant la journée?
e) Déterminez le mode et la médiane de la distribution décrite ci-dessus.
Exercice 11
Le tableau ci-dessous vous donne l’âge des 200 invités d’un mariage.
xi ni
[0,20[ 30
[20,30[ 50
[30,50[ 75
[50,80] 45
Total 200
a) Déterminez les individus, la population, le caractère et les modalités de la variable statistique étudiée.
b) De quel type est la variable statistique analysée ?
c) Calculez, pour chacune des modalités, les effectifs cumulés (croissants), les fréquences et les fréquences cumulées (croissantes).
d) Représentez l’histogramme et la fonction de répartition de cette variable statistique.
e) Déterminez le mode, la médiane et la moyenne arithmétique de cette distribution.
f) Déterminez les quartiles, le 6ème et le 9ème décile ainsi que le 87ème centile de cette distribution. Interprétez ces valeurs.
Série 2 : Les indicateurs de tendance centrale (ch. 3) Exercice 1
Le montant que vous avez placé sur votre compte de dépôt, il y a 4 ans, vous a rapporté 8% la 1ère année, 4% la 2ème année, 6 % la 3ème année et 5,5% la 4ème année. Quel a été le taux d’intérêt moyen sur les quatre années ? Exercice 2
Une population est composée d’individus qui sont soit petits (=1,60m) soit grands (=1,80m). Déterminez la proportion de petits si la taille moyenne de la population est de 1,6715 m.
Exercice 3
Le tableau suivant vous donne l’évolution du prix d’un baril de pétrole durant ces 5 dernières années.
Année Variation du prix
2000 20%
2001 -10%
2002 -5%
2003 40%
2004 50%
a) Déterminez l’évolution moyenne du prix du baril d’essence durant ces 5 années.
b) Vous apprenez par ailleurs que le prix du baril d’essence a augmenté en moyenne de 5% entre 1995 et 2000, déterminez l’évolution moyenne du prix entre 1995 et 2005.
Exercice 4
Une enquête vise à déterminer le temps que les 18-25 ans passent quotidiennement au téléphone. Le tableau suivant fournit la fréquence cumulée croissante associée à la variable « temps passé au téléphone» par cette population.
Temps (en minutes) Fréquence passé au téléphone cumulée
[0,10[ 20%
[10,20[ 45%
[20,30[ 55%
[30,40[ 75%
[40,50[ 100%
a) Représentez l’histogramme et la fonction de répartition de cette variable statistique.
b) Quel est le temps moyen passé au téléphone par ces individus ? Avez-vous dû faire une hypothèse particulière pour répondre à cette question ? Si oui, laquelle ?
c) Vous pouvez déterminer la médiane de cette distribution en faisant une hypothèse. Quelle est cette hypothèse ?
d) Vous obtenez une information supplémentaire, à savoir que le temps passé par les 10% d’individus situés dans la tranche [20,30[ est généralement proche des 30 minutes. Comment cela affecte-t-il votre réponse à la question c) ? Expliquez.
e) Une autre information - contradictoire avec celle spécifiée au point d) – vous est fournie au sujet des 10% d’individus situés dans la tranche [20,30[ : ils passent tous exactement 24 minutes par jour au téléphone. Déterminez dans ce cas la moyenne et la médiane associées à cette distribution statistique.
Série 3 : Les indicateurs de tendance centrale et de dispersion (ch.3 et ch.4) Exercice 1
Nicolas et ses copains ont obtenu les notes suivantes à leur dictée :
Nicolas 13
Eudes 16
Agnan 18
Alceste 8
Geoffroy 8
Maixent 8
Clotaire 16 Cyrille 17
Joachim 13
Rufus 13
Total 130
Elève Note sur 20
a) Le tableau ci-dessus est-il un tableau de dénombrement ? Expliquez.
b) Calculez l’écart-type de cette série.
Exercice 2
La distribution selon le nombre d’enfants des 110 familles inscrites sur la liste d’attente d’un office HLM est la suivante.
Nombre Nombre de d'enfants familles
0 18
1 27
2 27
3 18
4 15
5 5
Total 110
a) Le tableau ci-dessus est-il un tableau de dénombrement ? Expliquez.
b) Calculez le nombre moyen d’enfants par famille.
c) Déterminez l’étendue, l’écart interquartile, l’écart interdécile, la variance et l’écart-type de cette distribution.
Exercice 3
Le tableau ci-dessous reprend les notes (sur un maximum de 20 points) obtenues à un test de statistique par 15 étudiants.
12 17 9 4 16
13 6 18 13.5 14
18 4 15 13 7.5
a) Déterminez la note de l’étudiant médian.
b) Déterminez la moyenne arithmétique des notes obtenues par ces étudiants.
c) Que vous indique la comparaison des valeurs de la médiane et de la moyenne obtenues en a) et b) sur la distribution des notes ?
d) Déterminez l’étendue de cette distribution.
e) Calculez l’écart absolu moyen de la variable statistique « note » par rapport à la moyenne arithmétique et par rapport à la médiane.
f) Calculez la variance et l’écart-type de cette variable statistique.
g) Vérifiez votre réponse f) à l’aide du théorème de Koenig
Exercice 4
Le tableau suivant vous donne les salaires attribués à 4 employés d’une entreprise avant le 1er janvier 2002 (salaires sont exprimés FF) et après le 1er janvier 2002 (salaires exprimés en €). Calculez la moyenne arithmétique, la variance, l’écart-type et le coefficient de variation de cette distribution. Lequel de ces trois derniers instruments vous donne une meilleure idée de la dispersion de la distribution ?
Salaire (FF) Salaire (€)
500 76.22
200 30.49
1000 152.44
400 60.98
Exercice 5
Un compagnie aérienne qui assure les vols Paris-Sydney (durée moyenne: 24 heures) et Paris-Rome (durée moyenne: 2 heures) décide d’évaluer l’écart-type des temps de trajets associés aux deux vols. L’écart-type associé à la première variable (temps du Paris-Sydney) est de 2 heures alors que l’écart-type associé à la seconde variable (temps du Paris-Rome) est de 20 minutes. En concluez-vous que la dispersion des observations de la première variable est plus prononcée ?
Exercice 6
Au cours du premier semestre, 7 observations d’une certaine variable quantitative ont donné une moyenne égale à 5 et une variance égale à 6. Au second semestre, 13 observations de la même variable donnent une moyenne égale à 6 et une variance égale à 8. Déterminez la moyenne et la variance de cette variable statistique sur l’ensemble de l’année.
Exercice 7
Le tableau suivant nous donne les effectifs d’une population (en milliers) par tranche d’âge pour deux régions A et B:
âge nA nB
[0,15[ 296 201
[15,30[ 298 225
[30,50[ 247 279
[50,70[ 123 201
[70,90[ 36 94
Total 1000 1000
Calculez la moyenne, la variance, l’écart-type et le coefficient de variation de cette distribution. Parmi les trois indices de dispersion que vous venez de calculer, lequel est le plus approprié pour une comparaison des dispersions entre ces deux régions ?
Exercice 8
Le tableau suivant donne la répartition de 600 salariés d’une entreprise selon la durée, exprimée en minute, du trajet domicile-travail.
Durée du trajet (min.) ni
xi
[0,10[ 151
[10,20[ 104
[20,30[ 135
[30,40[ 70
[40,50[ 84
[50,60[ 56
a) Calculez le temps moyen consacré au trajet domicile-travail par ces employés.
b) L’écart-type est-il, selon vous, plutôt proche de 15, 25 ou 35 ? Vous pouvez répondre à cette question sans effectuer de calcul.
c) Calculez la variance, l’écart-type et le coefficient de variation associés à cette distribution.
d) Calculez l’écart interquartile et l’écart interdécile Exercice 9
Soient les deux distributions (xi et yi) suivantes :
xi ni yi ni
0 100 0 0
10 20 10 75
20 5 20 100
30 250 30 150
40 5 40 100
50 20 50 75
60 100 60 0
Déterminez l'écart interquartile et l'écart-type de ces deux distributions. Laquelle est, selon vous, la plus dispersée? Commentez la différence entre la façon dont les variables xi et yi sont dispersées autour de leurs moyennes respectives en utilisant les quatre indices que vous venez de calculer.
Série 4 : Les propriétés de la moyenne et de la variance (ch.3 et ch.4) Exercice 1
Une voiture consomme 7 litres d’essence aux 100 kilomètres. Le tableau suivant vous indique le nombre de kilomètres effectués annuellement par le propriétaire de cette voiture au cours de ces 5 dernières années.
année distance (km)
2000 10000
2001 15000
2002 13000
2003 18000
2004 11000
Déterminez sa consommation d’essence moyenne au cours de ces 5 dernières années. Déterminez ensuite la variance et l’écart-type de cette consommation d’essence.
Exercice 2
Le lien qui existe entre les variables x et y est donné par la relation yi = +10 0.5xi Calculez y, σ2y et σy si x =50 et σx2 =25.
Exercice 3
Soit le tableau de l’exercice 7 de la 3ème série reproduit ci-dessous. Il vous donne les effectifs de la population (en milliers) par tranche d’âge pour deux régions A et B.
âge nA nB
[0,15[ 296 201
[15,30[ 298 225
[30,50[ 247 279
[50,70[ 123 201
[70,90[ 36 94
Total 1000 1000
Utilisez les résultats que vous avez obtenus à l’exercice de la série précédente pour déterminer l’âge moyen de la population d’un pays qui serait composé uniquement des régions A et B. Déterminez aussi la variance et l’écart-type de cette variable.
Série 5 : Les indicateurs de forme (ch. 5) Exercice 1
Déterminez les deux indices d’asymétrie (d et γ1) et l’indice d’aplatissement (γ2) associés à la variable « note à l’interrogation de statistique» dont le tableau élémentaire - reproduit ci-dessous - correspond à l’exercice 3 de la 3ème série
.
12 17 9 4 16
13 6 18 13.5 14
18 4 15 13 7.5
Exercice 2
Déterminez les deux indices d’asymétrie (d et γ1) et l’indice d’aplatissement (γ2) associés à la variable
«nombre d’enfants des familles inscrites sur la liste d’attente d’un office HLM» dont le tableau de dénombrement - reproduit ci-dessous - correspond à l’exercice 2 de la 3ème série.
Nombre Nombre de d'enfants familles
0 18
1 27
2 27
3 18
4 15
5 5
Série 6 : Les indicateurs de concentration (ch. 6) Exercice 1
Soit les données suivantes sur des salaires :
Salaire mensuel (€) ni
[800,900[ 25
[900,1000[ 30
[1000,1100[ 28
[1100,1500[ 25
[1500,2000[ 10
Total 118
a) Calculez l’écart médiale-médiane.
b) Calculez l’indice de Gini.
Il faut commencer par déterminer les fréquences, fréquences cumulées, valeurs globales et valeurs globales relative. Cela vous conduit au tableau suivant :
Salaire ni fi Fi Valeur Val. Globale V.G.R. cumul.
mensuel (€) ni globale (ni*xi) relative qi (%) croissante Qi(%) [800,900[ 25 0,211864 0,211864 21250 0,16453736 0,16453736 [900,100[ 30 0,254237 0,466102 28500 0,220673635 0,385210995 [1000,1100[ 28 0,237288 0,70339 29400 0,227642276 0,612853271 [1100,1500[ 25 0,211864 0,915254 32500 0,251645374 0,864498645
[1500,2000[ 10 0,084746 1 17500 0,135501355 1
Total 118 1 129150
Pour vous permettre de vérifier, Indice de Gini= 0.117 Exercice 2
Sur base du tableau de traitement suivant qui nous renseigne sur la distribution du revenu entre les 1000 salariés d’une entreprise :
Revenu annuel (€) ni
[0,10000[ 100
[10000,15000[ 190 [15000,20000[ 260 [20000,30000[ 300 [30000,50000[ 120 [50000,100000[ 30
Total 1000
a) Calculez l’écart médiale-médiane. En quoi cet indice vous donne une information sur l’inégalité dans la répartition du revenu ?
b) Tracez la courbe de concentration et calculez l’indice de Gini.
Exercice 3
Le tableau suivant vous donne le nombre de bonbons distribués durant une semaine par des parents à leurs 9 enfants.
Annabelle Agathe Axel Adrien Aurélie Astrid Ariane Anthony Amélie
10 15 7 8 5 4 20 6 5
a) Déterminez et évaluez deux indices qui font apparaître l’inégalité dans la répartition des bonbons aux enfants de cette famille.
b) Cette inégalité vous semble-elle plus prononcée chez les filles ou chez les garçons ? Expliquez.
Exercice 4
Déterminez l’écart médiale-médiane et l’indice de concentration (indice de Gini) de la répartition du revenu (xi) suivante:
xi ni
0 99
1000 1
Série 7 : Indices (ch. 7)
Exercice 1 (indices élémentaires)
En 2010 le PIB d’une économie est passé de l’indice 80 à l’indice 100. Quel est le taux de variation du PIB ? Exercice 2 (indices élémentaires)
Vous disposez des données suivantes. Complétez le tableau
Région Salaire Indice (base 100 région Centre)
Centre 100
Bretagne 228 45
Alsace 150
Aquitaine 80
Exercice 2 (indices synthétiques)
1980 1981
p0 q0 p1 q1 Rapport des prix
Pétrole 15 150 18 140
Gaz 10 36 9 72
a) Déterminez les rapports des prix entre les deux années.
b) Calculez l’indice des prix de Laspeyres.
c) Calculez l’indice des prix de Paasche.
d) Calculez l’indice de Fisher. Interpréter le résultat.