S
TATISTIQUES DESCRIPTIVES UNIDIMENSIONNELLESJulie Scholler - Bureau B246
Octobre-novembre 2020
I. Les données
Données brutes - extrait
annee bac genre note_totalesur_estimationeco_n_justeeco_note hist1 geo1 eco1 L1 Bac ES F 10.50 -10 9 17 Le griffon Cuba Taxe
L1 Bac S F 7.50 7 5 10 Le sphinx Cuba Taux
L1 Bac ES H 6.33 -2 5 10 Le griffon Cuba Taxe
L1 Bac ES F 8.17 -10 8 16 Le griffon Panama Taxe
L1 Bac ES F 8.00 -1 5 9 Le sphinx Cuba Taxe
L2 Bac ES H 13.50 -1 7 14 Le sphinx Cuba Taxe
L1 Bac S F 9.83 1 6 12 Le griffon Cuba Taxe
L2 Bac S H 11.67 -4 9 19 Le sphinx Cuba Taxe
L2 Bac S H 12.17 -4 8 15 Le griffon Cuba Taxe
L3 Bac S H 12.50 -2 9 18 Le sphinx Cuba Taxe
L1 Bac S F 9.00 8 8 16 Le griffon Cuba Taxe
L3 Bac ES H 10.33 -21 9 18 Le griffon Cuba Taxe L3 Bac ES H 10.83 -5 8 17 Le sphinx Panama Taxe L3 Bac S H 13.00 -11 9 17 Le griffon Cuba Taxe
L1 Bac S H 14.83 -3 9 17 Le griffon Cuba Taxe
Description des variables
Variable Type Exemples
annee quali. ord. L1, L2, L3
bac quali. nom. Bac ES, Bac S, Bac STMG, Bac professionnel
genre quali. nom. F, M
note_totale quantitative 10.5, 7.5, 6.33, 8.17, 8,. . . sur_estimation quantitative -10, 7, -2, -10, -1, 1, -4, -2,. . . eco_n_juste quantitative 9, 5, 5, 8, 5, 7, 6, 9, 8, 9,. . .
***_n_juste quantitative 5, 3, 4, 4, 4, 8, 5, 3, 6, 7,. . .
eco_note quantitative 17, 10, 10, 16, 9, 14, 12, 19, 15, 18,. . .
***_note quantitative 9, 6, 8, 8, 8, 18, 8, 7, 11, 13, . . . eco1 (2, . . . ,10) quali. nom. ex : Tarif, Taux, Taxe, Taxification
***1 (2, . . . ,10) Réponses à la question
econ quantitative 4, 6, 5, 4, 5, 6, 8, 7, 7, 8,. . .
***n quantitative 6, 5, 4, 4, 5, 10, 6, 5, 8, 7, . . . avec
• *** parmi eco, geo, hist, sport, mat, litt
• quali. od. : qualitative ordinale
• quali.nom. : qualitative nominale
I. Les données
Type de variables qualitatives
*
Illustration de Allison Horst
Listes des données des variables
Année L1, L1, L1, L1, L1, L2, L1, L2, L2, L3, L1, L3, L3, L3, L3, L1, L1, L2, L2, L1, L1, L2, L2, L2, L2, L1, L2, L2, L2, L2, L2, L3, L1, L1, L1, L1, L3, L2, L1, L1, L2, . . . Bac Bac ES, Bac S, Bac ES, Bac ES, Bac ES, Bac ES,
Bac S, Bac S, Bac S, Bac S, Bac S,Bac ES, Bac ES, Bac STMG, Bac ES, Bac ES, Bac ES, Bac S, Bac professionnel, . . .
eco_note 17, 10, 10, 16, 9, 14, 12, 19, 15, 18, 16, 18, 17, 18, 15, 19, 17, 16, 10, 6, 18, 18, 13, 12, 8, 15, 17, 13, 15, 17, 17, 13, 15, 12, 7, 18, 18, 10, 7, . . .
estimation -10, 7, -2, -10, -1, -1, 1, -4, -4, -2, 8, -21, -5, -8, -11, -3, -12, 2, 2, 9, -3, 7, -11, 7, -5, 4, 12, -6, 0, -5, -4, 14,
14, 1 8, 6, 0, 0, 5, 4, -7, . . .
Note 10.5, 7.5, 6.33, 8.17, 8, 13.5, 9.83, 11.67, 11.17, 11, 10, 14.83, 4.5, 8.83, 11.17, 10.17, 7, 8.17, 6.83, 12.5, 5, 10.83, 10, 14.33, 7.83, 8.67, 10.67, 12, 12, 10.33, 12.5, 9, 8.5, 10.67, . . .
II. Tableaux synthétiques
Tableaux synthétiques des effectifs
• n : taille de la population
• M : nombre de modalités de la variable considérée
• mi : ie modalités de la variable, pour i entre 1 et M
• ni : nombre d’individus prenant la modalité mi pour cette variable, pour i entre 1 et M
Remarque
M
X
i=1
ni = n
Variable Effectif
m1 n1
m2 n2
... ...
mM nM
Variables qualitatives nominales
Série du bac Effectif
Bac ES 70
Bac professionnel 1
Bac S 55
Bac STMG 3
Série du bac Effectif
Bac ES 70
Bac S 55
Bac STMG 3
Bac professionnel 1 À défaut d’ordre ou de groupement inhérent aux modalités, ordonner par effectif est un choix judicieux.
II. Tableaux synthétiques
Tableaux synthétiques des fréquence
• fi : fréquence de la ie modalité parmi les individus ou proportion d’individus ayant la ie modalité Remarque fi = ni
n et
M
X
i=1
fi = 1
Variable Fréquences
m1 f1
m2 f2
... ...
mM fM
Série du bac Fréquence
Bac ES 0.543
Bac S 0.426
Bac STMG 0.023
Bac professionnel 0.008
Série du bac Fréquence en %
Bac ES 54.3
Bac S 42.6
Bac STMG 2.3
Bac professionnel 0.8
II. Tableaux synthétiques
Variable qualitative ordinale
Année Effectif Fréquence
L1 66 51.2 %
L2 34 26.4 %
L3 29 22.5 %
Variable qualitative ordinale
Question de maths/physique numéro 7 :
Quelle est la position de Neptune dans le système solaire ? Réponse Effectif Fréquence
5e 14 0.11
6e 34 0.27
7e 37 0.29
8e 41 0.33
II. Tableaux synthétiques
Type de variables quantitatives
*
Variable quantitative discrète
Question de sport et loisirs :
Combien y a-t-il de pions au total dans un plateau de jeu d’échecs ? Réponse Effectif Fréquence en %
8 7 5.7
12 18 14.8
16 66 54.1
24 31 25.4
II. Tableaux synthétiques
Variable quantitative discrète
Réponses Effectif Fréquence en %
0 2 1.6
1 5 3.9
2 5 3.9
3 13 10.1
4 26 20.2
5 27 20.9
6 23 17.8
7 14 10.9
8 11 8.5
10 3 2.3
Réponse 0 1 2 3 4 5 6 7 8 10
Effectif 2 5 5 13 26 27 23 14 11 3
Fréquence 0.02 0.04 0.04 0.10 0.20 0.21 0.18 0.11 0.09 0.02
Variable quantitative discrète ou continue
Thème sport et loisirs
Note 0 1 2 3 4 5 6 7 8 9 . . .
Effectif 2 2 3 3 5 9 10 11 12 13 . . .
. . . 10 11 12 13 14 15 16 17 18 19 20
. . . 17 8 6 6 8 8 2 0 1 0 3
II. Tableaux synthétiques
Variable quantitative continue
Note finale 4.33 4.5 5 5.5 6 6.17 6.33 6.5 6.83 7 7.33 7.5 7.67 7.83 . . .
Effectif 1 3 1 1 1 1 1 1 1 2 1 2 1 1 . . .
. . . 8 8.17 8.33 8.5 8.67 8.83 9 9.17 9.33 9.5 9.67 9.83 10 10.17 . . .
. . . 4 4 1 2 1 4 5 1 1 1 5 4 5 7 . . .
. . . 10.33 10.5 10.67 10.83 11 11.17 11.33 11.5 11.67 11.83 12 . . .
. . . 3 1 4 3 3 4 1 1 2 2 3 . . .
. . . 12.17 12.33 12.5 12.83 13 13.17 13.33 13.5 13.67 14.17 14.33 . . .
. . . 1 2 6 1 3 5 1 5 1 2 3 . . .
. . . 14.67 14.83 15 15.33 19.33
. . . 1 3 1 2 2
Tableau des effectifs regroupés en classes
• b0 < b1 < . . . < br : bornes des classes avec b0 6 mini∈
J1,MK(mi) et br > maxi∈
J1,MK(mi)
• [b0,b1[, [b1,b2[, . . ., [br−1,br] : les classes de modalité
• nek : nombre d’individus dont la modalité est dans la ke classe Remarque
r
X
k=1
nek = n
Variable Effectif [b0,b1[ en1
[b1,b2[ en2 ... ... [br−1,br] ner
II. Tableaux synthétiques
Note Effectif [0,3[ 0 [3,6[ 6 [6,9[ 28 [9,12[ 53 [12,15[ 37 [15,18[ 3 [18,20] 2
Note Effectif [0,2[ 0 [2,4[ 0 [4,6[ 6 [6,8[ 12 [8,10[ 33 [10,12[ 36 [12,14[ 28 [14,16[ 12 [16,18[ 0 [18,20] 2
Note Effectif [0,4[ 0 [4,6[ 6 [6,8[ 12 [8,10[ 33 [10,11[ 23 [11,13[ 26 [13,15[ 24 [15,16[ 3 [16,19[ 0 [19,20] 2
Types de graphiques
Histogrammes
• pour variables quantitatives continues Diagramme en bâtons
• pour les variables quantitatives discrètes
• pour les variables qualitatives ordinales
• pour les variables qualitatives nominales
III. Représentations graphiques
Histogramme
Notes au QCM de culture générale
Effectifs
0 5 10 15 20
0 10 20 30 40 50
Histogramme
Notes au QCM de culture générale
Effectifs
0 5 10 15 20
0 2 4 6 8 10 12 14
III. Représentations graphiques
Histogramme
Notes au QCM de culture générale
Effectifs
0 5 10 15 20
0 5 10 15 20 25 30 35
Note Effectif [0,3[ 0 [3,6[ 6 [6,9[ 28 [9,12[ 53 [12,15[ 37 [15,18[ 3 [18,20] 2
Note Effectif [0,2[ 0 [2,4[ 0 [4,6[ 6 [6,8[ 12 [8,10[ 33 [10,12[ 36 [12,14[ 28 [14,16[ 12 [16,18[ 0 [18,20] 2
Note Effectif [0,4[ 0 [4,6[ 6 [6,8[ 12 [8,10[ 33 [10,11[ 23 [11,13[ 26 [13,15[ 24 [15,16[ 3 [16,19[ 0 [19,20] 2
III. Représentations graphiques
Notes au QCM de culture générale
Effectifs
0 5 10 15 20
0 5 10 15 20 25 30 35
FAUX
Principe de l’histogramme
• les surfaces des rectangles sont proportionnelles aux effectifs dans les classes.
Amplitude d’une classe ak = bk −bk−1
Cas où les amplitudes des classes ne sont pas toutes identiques
• les hauteurs des rectangles ne peuvent plus être les effectifs des classes.
• densité d’effectif : dk = enk ak
• aire du rectangle :dk × ak = enk
ak × ak = enk
III. Représentations graphiques
Notes au QCM de culture générale
Densitéd’effectifs
0 5 10 15 20
0.00 0.05 0.10 0.15
Diagramme en bâtons
Principe
• des bâtons de longueurs proportionnelles aux effectifs
• pas de notions de largeur donc pas de gros rectangles Règles d’usages
• variables quantitatives discrètes
• respecter l’échelle
• variables qualitatives ordonnées
• respecter l’ordre
• équidistance des modalités
• variables qualitatives non ordonnées
• s’il existe des regroupements, les respecter
• équidistance des modalités
• par défaut, ordonner selon les effectifs décroissants
III. Représentations graphiques
0 20 40 60
L1 L2 L3
Effectif
Année de licence
0 5 10 15
0 5 10 15 20
Effectif
Note du thème histoire
III. Représentations graphiques
0 20 40 60
Bac ES Bac S Bac STMG Bac professionnel
Effectif
Série de baccalauréat
Bac pro.
Bac STMG Bac S Bac ES
0 20 40 60
Effectif
Série de baccalauréat
III. Représentations graphiques
54.3%
42.6%
2.3%
0.8%
Bac pro.
Bac STMG Bac S Bac ES
0 20 40 60
Effectif
Série de baccalauréat
Diagramme circulaire
Principe
• l’angle et la surface des parts sont proportionnels aux effectifs À éviter
• s’il y a trop de modalités, c’est illisible
• s’il y en a peu, un tableau synthétique est plus précis
• en 3D, cela n’a pas de sens
III. Représentations graphiques
Diagramme circulaire - à éviter
L’Ukraine La Grèce La Russie La Turquie
Quel pays a sa capitale en Asie et sa ville principale en Europe ?
Don Giovanni Fidelio
l’hymne à la joie La lettre à Élise
Laquelle de ces composition n’est pas de Beethoven ?
Diagramme circulaire - à éviter
Genre
FH
Genre des répondants
36 % de répondantes contre
64 % de répondants
III. Représentations graphiques
0 5 10 15 20
a b c d e
0 5 10 15 20
a b c d e
0 5 10 15 20
a b c d e
“The only worse design than a pie chart is several of them.”
Edward Tufte, The Visual Display of Quantitative Information, Graphics Press, 1983, p. 178.
“There is no data that can be displayed in a pie chart that cannot be displayed better in some other type of chart.”
John Wilder Tukey (1915–2000)
III. Représentations graphiques
Autre graphique trompeur
Autres exemples :
• https://www.reddit.com/r/dataisugly/
• https://viz.wtf/, https://twitter.com/wtfviz