LFM – Mathématiques – Classe de 3
ème 1Ch 11 : Statistiques
Introduction
Dans sa vie quotidienne, l'homme moderne est constamment assailli d'informations en tous genres. Parmi celles-‐ci, nombreuses sont celles qui se présentent sous la forme d'observations numériques.
Ainsi, pour remédier à l'incapacité de l'esprit humain d'intégrer instantanément un nombre important de données, le statisticien propose différentes solutions : une première catégorie de solutions est constituée de toutes les représentations graphiques possibles (diagrammes,
histogrammes, etc.) ; dans une seconde catégorie, on retrouve l'ensemble des résumés numériques, c'est à dire les données qui cherchent à représenter une caractéristique donnée d'une série considérée (moyenne, mode, étendue...).
Le besoin statistique, c'est à dire l'activité humaine de recueil de données chiffrées, remonte à la plus haute Antiquité. Les premiers recensements ont été effectués par les Sumériens, 5000 ans avant notre ère. Par la suite, tous les états forts d'un système administratif puissant ont eu recours au dénombrement (Romains, Incas, Indiens...) afin de connaître leurs effectifs militaires, leurs puissances économiques etc.
Mais les recensements coûtent cher, et au Moyen-‐âge le
Marquis de Vauban, un proche de Colbert, a préconisé l'utilisation d'échantillons pour estimer au mieux les capacités. C'était le début de l'extrapolation...
La statistique, c'est-‐à-‐dire la science qui étudie les statistiques (les données) se divise en deux sous catégories :
• les statistiques descriptives
• les statistiques inférentielles (sondages, prévisions, etc.)
En classe de 3°, nous ne travaillerons, pour l'instant, qu'avec des statistiques descriptives.
Quelques exemples de diagrammes :
1/ Tableaux statistiques et diagrammes :
Les tableaux statistiques et les diagrammes permettent d'organiser et de présenter les données recueillies. Le caractère étudié peut être qualitatif ou quantitatif.
Un caractère quantitatif peut être
• discret : il ne peut prendre que des valeurs isolées ;
• continu : il peut prendre toutes les valeurs d'un intervalle.
Dans le cas d'une répartition en classes, on utilise un histogramme pour représenter graphiquement les effectifs (ou les fréquences) : les aires des rectangles sont proportionnelles aux effectifs (ou aux fréquences).
Pour tracer le polygone des effectifs cumulés croissants, on place les points dont :
• l'abscisse est la limite supérieure d'une classe ;
• l'ordonnée est l'effectif cumulé croissant de cette classe.
Exemple : Les élèves d'une classe de Bac Pro réalisent trois enquêtes dont les informations sont données dans les tableaux suivants :
• Tableau 1 :
Notes obtenues par les 31 élèves de la classe de Bac Pro
lors de l'évaluation de français Diagramme en bâtons Note xi Effectif ni
3 6 8 9 10 11 12 13 14 15 16
1 2 3 7 5 4 3 1 2 2 1 31
La notation est un caractère quantitatif (mesurable) discret (il prend des valeurs isolées).
• Tableau 2 : temps consacré chaque semaine par les élèves du lycée à regarder la télévision.
Population interrogée : les 620 élèves du lycée.
Intervalle unitaire (IU) : 4 heures
On calcule les Eff/IU. La hauteur des rectangles correspond à l'effectif par intervalle unitaire.
Histogramme Durée
h
Effectif ni
Effectif/UI [0 ; 4[
[4 ; 8[
[8 ; 12[
[12 ; 20[
[20 ; 28[
40 80 160 200 140
40 80 160 100 70 620
stat_1var
Colonne B 0
10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160
Durée (heures)
Eff/UI
Séries statistiques à une variable
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 18 19 20
0 0,5 1 1,5 2 2,5 3 3,5 4 4,5 5 5,5 6 6,5 7
Titre principal
Note
Effectif
USA Europe Japon Chine
0 500 1000 1500 2000 2500 3000 3500 4000
P G C
LFM – Mathématiques – Classe de 3
ème 2
I – Vocabulaire : rappels
Lorsque l'on mène une étude statistique :
✔ On doit d'abord définir le caractère que l'on veut étudier. Ce caractère peut être qualitatif (qualité), comme la couleur des yeux, ou quantitatif (quantité) comme la taille par exemple.
✔ On doit délimiter la population étudiée, c'est-‐à-‐dire l'ensemble des individus qui ont participé à l'enquête.
✔ On doit déterminer l'effectif total, c'est-‐à-‐dire le nombre total d'individus qui ont participé, puis les effectifs selon chaque valeur proposée.
✔ On peut préciser la fréquence de chaque valeur, qui est égale au quotient :
total effectif
valeur la
de effectif
_ _ _
_
1/ Tableaux statistiques et diagrammes :
Les tableaux statistiques et les diagrammes permettent d'organiser et de présenter les données recueillies. Le caractère étudié peut être qualitatif ou quantitatif.
Un caractère quantitatif peut être
• discret : il ne peut prendre que des valeurs isolées ;
• continu : il peut prendre toutes les valeurs d'un intervalle.
Dans le cas d'une répartition en classes, on utilise un histogramme pour représenter graphiquement les effectifs (ou les fréquences) : les aires des rectangles sont proportionnelles aux effectifs (ou aux fréquences).
Pour tracer le polygone des effectifs cumulés croissants, on place les points dont :
• l'abscisse est la limite supérieure d'une classe ;
• l'ordonnée est l'effectif cumulé croissant de cette classe.
Exemple : Les élèves d'une classe de Bac Pro réalisent trois enquêtes dont les informations sont données dans les tableaux suivants :
• Tableau 1 :
Notes obtenues par les 31 élèves de la classe de Bac Pro
lors de l'évaluation de français Diagramme en bâtons Note xi Effectif ni
3 6 8 9 10 11 12 13 14 15 16
1 2 3 7 5 4 3 1 2 2 1 31
La notation est un caractère quantitatif (mesurable) discret (il prend des valeurs isolées).
• Tableau 2 : temps consacré chaque semaine par les élèves du lycée à regarder la télévision.
Population interrogée : les 620 élèves du lycée.
Intervalle unitaire (IU) : 4 heures
On calcule les Eff/IU. La hauteur des rectangles correspond à l'effectif par intervalle unitaire.
Histogramme Durée
h
Effectif ni
Effectif/UI [0 ; 4[
[4 ; 8[
[8 ; 12[
[12 ; 20[
[20 ; 28[
40 80 160 200 140
40 80 160 100 70 620
stat_1var
Colonne B 0
10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160
Durée (heures)
Eff/UI
Séries statistiques à une variable
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 18 19 20
0 0,5 1 1,5 2 2,5 3 3,5 4 4,5 5 5,5 6 6,5 7
Titre principal
Note
Effectif
• Tableau 3 : la musique préférée des élèves du lycée. On calcule les angles des secteurs correspondants aux effectifs ni.
Diagramme circulaire
Type de musique Effectif
ni Angle
Rock Rap/Raï
Techno Variété française Variété étrangère
Autre
180 120 80 120
80 40
105°
70°
46°
700 46°
23°
620 360°
Le caractère étudié est un caractère qualitatif (non mesurable).
• Mode et étendue statistique :
o On appelle mode d'une distribution statistique la valeur de la variable qui a le plus grand effectif. Dans le cas d'une distribution en classes, on appelle classe modale la classe qui a le plus grand effectif par intervalle unitaire. Le centre de la classe modale est appelé mode.
Exemple : dans le tableau 1 : la note qui a été le plus attribuée est 9.
9 est le mode de cette série statistique.
o L'étendue d'une série statistique est la différence entre les valeurs extrêmes du caractère. Dans le tableau 1, la note minimum est 3, la maximum est 16. L'étendue est donc 16-3 = 13
2/ Les indicateurs de l'analyse statistique
a) La moyenne d'une série statistique, notée x est obtenue par :
x=n1x1n2x2...npxp
N =
∑
i=1 i=p
nixi N
avec
N=
∑
i=1 i=p
ni et N effectif total
xi : valeur du caractère ou centre des classes
ni: effectif de xi ou de la classe de centre xi
p : nombre de classes ou de valeurs différentes du caractère.
Exemple : dans le tableau 1, la note moyenne est calculée par :
b) Variance et écart type d'une série statistique :
La variance
V=
∑
i=1 i=p
ni
xi−x
2N =
∑
i=1 i=p
nixi2 N −x2
stat_1var
Rock Rap/Raï Techno Variété française Variété étrangère Autre
x=1×32×63×87×95×104×113×121×132×142×151×16
31 =10,06
LFM – Mathématiques – Classe de 3
ème 3 Exemple : dans un élevage de souris, on s’intéresse à la couleur du pelage. Il peut être gris (G), noir (N), blanc (Bl), roux (R) ou brun (Br). On a les résultats suivants :N ; N ; Bl ; G ; Br ; G ; N ; Bl ; G ; G ; Br ; R ; N ; R Br ; Br ; Bl ; G ; N ; Bl ; G ; R ; R ; Br ; N ; N ; G ; Bl
Compléter les renseignements suivants sur cette série statistique : Population étudiée : ………
Caractère étudié : ………
Effectif total : ……….
Effectif de la valeur « gris » : ………
Fréquence de la valeur « roux » : ………..
II -‐ Moyennes
1) Moyenne arithmétique non pondérée
Règle : pour calculer la moyenne M d’une série statistique : 1. On additionne toutes les valeurs du caractère de la série ; 2. On divise cette somme par l’effectif total de la série
𝑀=𝑥!+𝑥!+⋯+𝑥! 𝑝
Application : Léa a calculé le temps qu’elle a passé devant la télévision la semaine dernière :
Jour Lundi Mardi Mercredi Jeudi Vendredi Samedi Dimanche
Temps
(min) 62 57 110 60 46 122 131
Calcule le temps moyen que Léa a passé par jour devant la télévision la semaine dernière.
𝑀=
Léa a donc passé en moyenne ……… par jour devant la télévision.
2) Moyenne arithmétique pondérée
Règle : pour calculer la moyenne pondérée M d’une série statistique : 1. On additionne les produits des valeurs par leur coefficient ;
2. On divise cette somme par la somme des coefficients
𝑀=𝑥!×𝑛!+𝑥!×𝑛!+⋯+𝑥!×𝑛! 𝑛!+𝑛!+⋯+𝑛!
LFM – Mathématiques – Classe de 3
ème 4Application : chaque élève de la classe de 3°1 du collège Lucie Aubrac a indiqué le nombre de livres qu’il a lus durant le mois de septembre :
Nombre de livre lus 0 1 2 3 7 8 15
Effectif 12 4 3 3 1 1 1
Calcule le nombre de livres lus en moyenne par les élèves de cette classe au cours du mois de septembre.
………
………
………
En moyenne, les élèves de cette classe ont lu ………… livres au cours du mois de septembre.
III – Médiane, quartiles
1. Médiane d’une série statistique
Définition 1 : les données d’une série étant rangées par ordre croissant, on appelle médiane de cette série une valeur qui partage cette série en deux parties de même effectif.
Application 1 : lorsque le nombre de valeurs est impair
Déterminer la médiane de la série statistique suivante : 25 – 54 – 34 – 32 – 63 – 21 – 12 D'abord on ordonne les valeurs : ……….
Il y a ………. valeurs => ………. : 2 = ………..
La médiane sera la ……….. valeur, c'est-‐à-‐dire ………….
Ainsi trois valeurs lui sont inférieures, et trois valeurs lui sont supérieures.
Application 2 : lorsque le nombre de valeurs est pair
Déterminer la médiane de la série statistique suivante : 45 – 4 – 40 – 69 – 90 – 21 – 9 – 71 D'abord on ordonne les valeurs : ……….
Il y a ………. valeurs => ………. : 2 = ………..
La médiane va se situer entre la ……….. valeur et la ……… valeur, c'est-‐à-‐dire entre …….. et …….
La médiane est donc …………
On remarque que la médiane n'appartient pas forcément à la série.
LFM – Mathématiques – Classe de 3
ème 52. Etendue d’une série statistique Définition :
l’étendue d’une série statistique est la différence entre la plus grande et la plus petite valeur.
Exercice : on donne la répartition des notes d'une classe à un contrôle.
Notes /20 7 8 9 10 11 12 13 14 15
Effectifs 2 3 5 2 1 6 1 3 2
1. Déterminer la note moyenne ce cette série statistique
………
………
………
………
………
2. Interpréter ce résultat
………
………
3. Déterminer l’étendue de cette série statistique. Interpréter ce résultat.
………
………
4. Déterminer la note médiane de cette série statistique. Interpréter le résultat.
………
………
………
………
………