date
Sta's'que descrip've Analyse de données
Séquence 7 :
Revoir :
-‐ C a l c u l e r u n e f r é q u e n c e , u n pourcentage
-‐ Lire un graphique -‐ Calculer une moyenne
-‐ Déterminer et interpréter une médiane -‐ Déterminer et interpréter un quar'le
Capacités aAendues :
-‐ Déterminer et interpréter des résumés d’une série sta's'que
-‐ U'liser un logiciel ou une calculatrice pour étudier une série sta's'que
-‐ Passer des effec'fs aux fréquences, calculer les caractéris'ques (ou paramètres) d’une série définie par effec'fs ou fréquences
-‐ Calculer des effec'fs cumulés, des fréquences cumulées
-‐ Représenter une série sta's'que graphiquement (nuage de points, histogramme, courbe des fréquences
I) Vocabulaire
Une étude statistique commence par le recueil de données concernant un caractère sur les individus d’une population.
Exemple : Listons la taille des élèves de la classe de 2nde.
# La population d’une série statistique est l’ensemble des éléments
« individus » sur lesquels porte l’étude : personnes, plantes, objets …
…
# Un caractère est une particularité étudiée chez les individus : taille, forme des feuilles de plantes…
Un caractère est dit quantitatif quand on peut le mesurer : l’âge, la taille, le nombre de frères et sœurs, note obtenue au DM…
(Sinon, le caractère est dit qualitatif : couleur des yeux…)
# Les données sont les réponses concernant le caractère étudié : taille en cm des élèves : 175 – 180 – 160 – 168 – 175 – …
II) Présentation d’une série statistique
1) Effectifs cumulés, fréquences cumulées Définitions :
# L’effectif d’une valeur du caractère est le nombre de fois où cette valeur apparaît dans la série.
# L’effectif cumulé croissant (respectivement décroissant) d’une valeur est la somme des effectifs des valeurs qui lui sont inférieures (respectivement supérieures) ou égales.
Exemple : Nombre de frères et sœurs pour les élèves de 2nde… Données :
Interprétations :
# élèves ont frères ou sœurs.
# Chez élèves le nbr de frères et sœurs est inférieur ou égal à . (ou élèves ont frères et sœurs ou moins,
ou élèves ont au plus frères ou sœurs).
Nombre de frères
et sœurs (
x
i) 0 1 2 3 4Effec1fs (
n
i)Effec1fs cumulés croissants
Définitions :
# La fréquence d’une valeur du caractère est le quotient de l’effectif de cette valeur par l’effectif total :
Fréquence d’une valeur
(Fréquences peuvent s’exprimer en fraction, en %, en décimal)
# La fréquence cumulée croissante (respectivement décroissante) d’une valeur est la somme des fréquences des valeurs qui lui sont inférieures (respectivement supérieures) ou égales.
Propriété (admise) :
La somme des fréquences est égale à 1.
= effectif de la valeur effectif total
Vue en 5ème
Exemple : Une enquête sur le temps de travail personnel quotidien des élèves de 2nde donne les résultats suivants :
Interprétations :
# 47 % des élèves travaillent de 1h à 2h (exclue) par jour.
# 85 % des élèves travaillent un temps supérieur ou égal à 1h par jour.
(Ou 85 % des élèves travaillent plus de 1h par jour, ou 85 % des élèves travaillent au moins 1h par jour)
Temps de travail (en h) [0;1[ [1;2[ [2;3[ [3;4[ Total
Effec1fs 9 29 22 2 62
Fréquences
0,15 0,47 0,35 0,03 1
Fréquences cumulées
décroissantes 1 0,85 0,38 0,03 1
Décroissant alors on commence par la dernière fréquence
Temps de travail (en h) [0;1[ [1;2[ [2;3[ [3;4[ Total
Effec1fs 9 29 22 2
Fréquences (
f
i)
Fréquences cumulées décroissantes
2) Représentations graphiques
# Nuage de points
0 1
10
2 20
3 4
30 40
Effectif
Nombre de frères et sœurs
0
# Histogramme
Quand les valeurs sont regroupées en classes.
0 1
0,1
2 0,2
3 4
0,3 0,4
Fréquence
Temps de travail en h
0
0,5 47 % des élèves travaillent
de 1h à 2h par jour
# Courbe de fréquences cumulées (ou diagramme cumulatif)
0 1
0,2
2 0,4
3 4
0,6 0,8
Fréquences cumulées
Temps de travail en h
0
1 Les points sont reliés
par des segments
85 % des élèves travaillent un temps supérieur ou égal à 1h par jour
III) Paramètres de position et de dispersion (ou Indicateurs de…) 1) Mesures de tendance centrale (ou Indicateurs de position) Définition :
La moyenne d’une série statistique, notée est :
Propriété (admise) :
On peut calculer la moyenne à partir des fréquences :
Remarque :
Pour une série regroupée en classes, il faut prendre pour
x
i les centres (ou milieux) des classes.x
x = somme des n
i× x
isomme des n
i= n
1x
1+ n
2x
2+ ... + n
px
pn
1+ n
2+ ... + n
p"
#
$ $
%
&
' '
ni est l’effectif de la valeur xi
x = somme des f
i× x
i( = f1x
1+ f
2x
2 + ... + f
px
p)
fi est la fréquence
de la valeur xi
Exemple :
Pour l’enquête sur le temps de travail, calculons la moyenne : Avec les effectifs :
Avec les fréquences :
x = 9 × 0,5 + 29 × 1,5 + 22 × 2,5 + 2 × 3,5
9 + 29 + 22 + 2 = 110
62 ≈ 1,8
x = 0,15 × 0,5 + 0,47 × 1,5 + 0,35 × 2,5 + 0,03 × 3,5 ≈ 1,8
Centre de la classe [0;1[
Définition :
La médiane
Me
d’une série statistique d’une série statistique de n valeurs rangées dans l’ordre croissant est :# si n est impair,
Me
est la valeur « centrale »,# si n est pair :
Me
est la demi-somme des deux valeurs centrales .Interprétation : La médiane
Me
partage ces valeurs en deux groupes de même effectif :# les valeurs inférieures ou égales à
Me
,# les valeurs supérieures ou égales à
Me
.Exemples :
# Pointures de 7 personnes :
Valeurs rangées : 38 38 40 40 41 42 42 Le nombre de valeurs est impair : 7,
la médiane est donc la valeur centrale,
Me
=Interprétation : La moitié des personnes ont une pointure de 40 ou moins (ou de 40 ou plus).
# Pointures de 8 personnes :
Valeurs rangées : 38 38 40 40 41 42 42 45 Le nombre de valeurs est pair : 8, la médiane est donc la demi- somme des deux valeurs centrales,
Me
=Interprétation : La moitié des personnes ont une pointure de 40,5 ou 40.
(40 + 41) : 2 = 40,5.
Définitions :
Soit une série statistique dont les valeurs sont rangées dans l’ordre croissant.
# On appelle premier quartile Q1 la plus petite valeur de la série telle que au moins 25% des valeurs sont inférieures ou égales à Q1.
# On appelle troisième quartile Q3 la plus petite valeur de la série telle que au moins 75% des valeurs sont inférieures ou égales à Q3.
Exemples :
A partir d’une liste de valeurs ordonnées :
35 37 38 39 40 40 41 42 43 45 45 L’effectif total est de 11 pointures.
1er quartile :
3ème quartile :
Q1=11× 25
100 = 2,75 valeur de la série ordonnée, soit 38.
Interprétation : au moins 25%
des valeurs de la série sont inférieures ou égales à 38
Q3 =11× 75
100 = 8,25 ≈ 9èmevaleur de la série ordonnée, soit 43.
Interprétation : au moins 75%
des valeurs de la série sont non entier,
alors on prend la valeur approchée entière par excès
≈ 3ème
25%
75%
2) Mesures de dispersions (ou Indicateurs de dispersions) Définitions :
# L’étendue d’une série statistique est la différence entre la plus grande et la plus petite valeur de cette série.
# L’écart interquartile est la différence : Q3 – Q1 .
Résumé des indicateurs de position et de dispersion :
Fin de la séquence
Médiane Plus
petite donnée
Plus grande donnée
Q1 Q3
Au moins 50% des données Au moins 50% des données
Au moins 25%
des données
Au moins 25%
des données Au moins 50%
des données
Etendue
Ecart interquartile