• Aucun résultat trouvé

Type de variables qualitatives

N/A
N/A
Protected

Academic year: 2022

Partager "Type de variables qualitatives"

Copied!
19
0
0

Texte intégral

(1)

S

TATISTIQUES DESCRIPTIVES UNIDIMENSIONNELLES

Julie Scholler - Bureau B246

Octobre-novembre 2020

I. Les données

Données brutes - extrait

annee bac genre note_totalesur_estimationeco_n_justeeco_note hist1 geo1 eco1 L1 Bac ES F 10.50 -10 9 17 Le griffon Cuba Taxe

L1 Bac S F 7.50 7 5 10 Le sphinx Cuba Taux

L1 Bac ES H 6.33 -2 5 10 Le griffon Cuba Taxe

L1 Bac ES F 8.17 -10 8 16 Le griffon Panama Taxe

L1 Bac ES F 8.00 -1 5 9 Le sphinx Cuba Taxe

L2 Bac ES H 13.50 -1 7 14 Le sphinx Cuba Taxe

L1 Bac S F 9.83 1 6 12 Le griffon Cuba Taxe

L2 Bac S H 11.67 -4 9 19 Le sphinx Cuba Taxe

L2 Bac S H 12.17 -4 8 15 Le griffon Cuba Taxe

L3 Bac S H 12.50 -2 9 18 Le sphinx Cuba Taxe

L1 Bac S F 9.00 8 8 16 Le griffon Cuba Taxe

L3 Bac ES H 10.33 -21 9 18 Le griffon Cuba Taxe L3 Bac ES H 10.83 -5 8 17 Le sphinx Panama Taxe L3 Bac S H 13.00 -11 9 17 Le griffon Cuba Taxe

L1 Bac S H 14.83 -3 9 17 Le griffon Cuba Taxe

(2)

Description des variables

Variable Type Exemples

annee quali. ord. L1, L2, L3

bac quali. nom. Bac ES, Bac S, Bac STMG, Bac professionnel

genre quali. nom. F, M

note_totale quantitative 10.5, 7.5, 6.33, 8.17, 8,. . . sur_estimation quantitative -10, 7, -2, -10, -1, 1, -4, -2,. . . eco_n_juste quantitative 9, 5, 5, 8, 5, 7, 6, 9, 8, 9,. . .

***_n_juste quantitative 5, 3, 4, 4, 4, 8, 5, 3, 6, 7,. . .

eco_note quantitative 17, 10, 10, 16, 9, 14, 12, 19, 15, 18,. . .

***_note quantitative 9, 6, 8, 8, 8, 18, 8, 7, 11, 13, . . . eco1 (2, . . . ,10) quali. nom. ex : Tarif, Taux, Taxe, Taxification

***1 (2, . . . ,10) Réponses à la question

econ quantitative 4, 6, 5, 4, 5, 6, 8, 7, 7, 8,. . .

***n quantitative 6, 5, 4, 4, 5, 10, 6, 5, 8, 7, . . . avec

*** parmi eco, geo, hist, sport, mat, litt

quali. od. : qualitative ordinale

quali.nom. : qualitative nominale

I. Les données

Type de variables qualitatives

*

Illustration de Allison Horst

(3)

Listes des données des variables

Année L1, L1, L1, L1, L1, L2, L1, L2, L2, L3, L1, L3, L3, L3, L3, L1, L1, L2, L2, L1, L1, L2, L2, L2, L2, L1, L2, L2, L2, L2, L2, L3, L1, L1, L1, L1, L3, L2, L1, L1, L2, . . . Bac Bac ES, Bac S, Bac ES, Bac ES, Bac ES, Bac ES,

Bac S, Bac S, Bac S, Bac S, Bac S,Bac ES, Bac ES, Bac STMG, Bac ES, Bac ES, Bac ES, Bac S, Bac professionnel, . . .

eco_note 17, 10, 10, 16, 9, 14, 12, 19, 15, 18, 16, 18, 17, 18, 15, 19, 17, 16, 10, 6, 18, 18, 13, 12, 8, 15, 17, 13, 15, 17, 17, 13, 15, 12, 7, 18, 18, 10, 7, . . .

estimation -10, 7, -2, -10, -1, -1, 1, -4, -4, -2, 8, -21, -5, -8, -11, -3, -12, 2, 2, 9, -3, 7, -11, 7, -5, 4, 12, -6, 0, -5, -4, 14,

14, 1 8, 6, 0, 0, 5, 4, -7, . . .

Note 10.5, 7.5, 6.33, 8.17, 8, 13.5, 9.83, 11.67, 11.17, 11, 10, 14.83, 4.5, 8.83, 11.17, 10.17, 7, 8.17, 6.83, 12.5, 5, 10.83, 10, 14.33, 7.83, 8.67, 10.67, 12, 12, 10.33, 12.5, 9, 8.5, 10.67, . . .

II. Tableaux synthétiques

Tableaux synthétiques des effectifs

n : taille de la population

M : nombre de modalités de la variable considérée

mi : ie modalités de la variable, pour i entre 1 et M

ni : nombre d’individus prenant la modalité mi pour cette variable, pour i entre 1 et M

Remarque

M

X

i=1

ni = n

Variable Effectif

m1 n1

m2 n2

... ...

mM nM

(4)

Variables qualitatives nominales

Série du bac Effectif

Bac ES 70

Bac professionnel 1

Bac S 55

Bac STMG 3

Série du bac Effectif

Bac ES 70

Bac S 55

Bac STMG 3

Bac professionnel 1 À défaut d’ordre ou de groupement inhérent aux modalités, ordonner par effectif est un choix judicieux.

II. Tableaux synthétiques

Tableaux synthétiques des fréquence

fi : fréquence de la ie modalité parmi les individus ou proportion d’individus ayant la ie modalité Remarque fi = ni

n et

M

X

i=1

fi = 1

Variable Fréquences

m1 f1

m2 f2

... ...

mM fM

(5)

Série du bac Fréquence

Bac ES 0.543

Bac S 0.426

Bac STMG 0.023

Bac professionnel 0.008

Série du bac Fréquence en %

Bac ES 54.3

Bac S 42.6

Bac STMG 2.3

Bac professionnel 0.8

II. Tableaux synthétiques

Variable qualitative ordinale

Année Effectif Fréquence

L1 66 51.2 %

L2 34 26.4 %

L3 29 22.5 %

(6)

Variable qualitative ordinale

Question de maths/physique numéro 7 :

Quelle est la position de Neptune dans le système solaire ? Réponse Effectif Fréquence

5e 14 0.11

6e 34 0.27

7e 37 0.29

8e 41 0.33

II. Tableaux synthétiques

Type de variables quantitatives

*

(7)

Variable quantitative discrète

Question de sport et loisirs :

Combien y a-t-il de pions au total dans un plateau de jeu d’échecs ? Réponse Effectif Fréquence en %

8 7 5.7

12 18 14.8

16 66 54.1

24 31 25.4

II. Tableaux synthétiques

Variable quantitative discrète

Réponses Effectif Fréquence en %

0 2 1.6

1 5 3.9

2 5 3.9

3 13 10.1

4 26 20.2

5 27 20.9

6 23 17.8

7 14 10.9

8 11 8.5

10 3 2.3

Réponse 0 1 2 3 4 5 6 7 8 10

Effectif 2 5 5 13 26 27 23 14 11 3

Fréquence 0.02 0.04 0.04 0.10 0.20 0.21 0.18 0.11 0.09 0.02

(8)

Variable quantitative discrète ou continue

Thème sport et loisirs

Note 0 1 2 3 4 5 6 7 8 9 . . .

Effectif 2 2 3 3 5 9 10 11 12 13 . . .

. . . 10 11 12 13 14 15 16 17 18 19 20

. . . 17 8 6 6 8 8 2 0 1 0 3

II. Tableaux synthétiques

Variable quantitative continue

Note finale 4.33 4.5 5 5.5 6 6.17 6.33 6.5 6.83 7 7.33 7.5 7.67 7.83 . . .

Effectif 1 3 1 1 1 1 1 1 1 2 1 2 1 1 . . .

. . . 8 8.17 8.33 8.5 8.67 8.83 9 9.17 9.33 9.5 9.67 9.83 10 10.17 . . .

. . . 4 4 1 2 1 4 5 1 1 1 5 4 5 7 . . .

. . . 10.33 10.5 10.67 10.83 11 11.17 11.33 11.5 11.67 11.83 12 . . .

. . . 3 1 4 3 3 4 1 1 2 2 3 . . .

. . . 12.17 12.33 12.5 12.83 13 13.17 13.33 13.5 13.67 14.17 14.33 . . .

. . . 1 2 6 1 3 5 1 5 1 2 3 . . .

. . . 14.67 14.83 15 15.33 19.33

. . . 1 3 1 2 2

(9)

Tableau des effectifs regroupés en classes

b0 < b1 < . . . < br : bornes des classes avec b0 6 mini

J1,MK(mi) et br > maxi

J1,MK(mi)

[b0,b1[, [b1,b2[, . . ., [br−1,br] : les classes de modalité

nek : nombre d’individus dont la modalité est dans la ke classe Remarque

r

X

k=1

nek = n

Variable Effectif [b0,b1[ en1

[b1,b2[ en2 ... ... [br−1,br] ner

II. Tableaux synthétiques

Note Effectif [0,3[ 0 [3,6[ 6 [6,9[ 28 [9,12[ 53 [12,15[ 37 [15,18[ 3 [18,20] 2

Note Effectif [0,2[ 0 [2,4[ 0 [4,6[ 6 [6,8[ 12 [8,10[ 33 [10,12[ 36 [12,14[ 28 [14,16[ 12 [16,18[ 0 [18,20] 2

Note Effectif [0,4[ 0 [4,6[ 6 [6,8[ 12 [8,10[ 33 [10,11[ 23 [11,13[ 26 [13,15[ 24 [15,16[ 3 [16,19[ 0 [19,20] 2

(10)

Types de graphiques

Histogrammes

pour variables quantitatives continues Diagramme en bâtons

pour les variables quantitatives discrètes

pour les variables qualitatives ordinales

pour les variables qualitatives nominales

III. Représentations graphiques

Histogramme

Notes au QCM de culture générale

Effectifs

0 5 10 15 20

0 10 20 30 40 50

(11)

Histogramme

Notes au QCM de culture générale

Effectifs

0 5 10 15 20

0 2 4 6 8 10 12 14

III. Représentations graphiques

Histogramme

Notes au QCM de culture générale

Effectifs

0 5 10 15 20

0 5 10 15 20 25 30 35

(12)

Note Effectif [0,3[ 0 [3,6[ 6 [6,9[ 28 [9,12[ 53 [12,15[ 37 [15,18[ 3 [18,20] 2

Note Effectif [0,2[ 0 [2,4[ 0 [4,6[ 6 [6,8[ 12 [8,10[ 33 [10,12[ 36 [12,14[ 28 [14,16[ 12 [16,18[ 0 [18,20] 2

Note Effectif [0,4[ 0 [4,6[ 6 [6,8[ 12 [8,10[ 33 [10,11[ 23 [11,13[ 26 [13,15[ 24 [15,16[ 3 [16,19[ 0 [19,20] 2

III. Représentations graphiques

Notes au QCM de culture générale

Effectifs

0 5 10 15 20

0 5 10 15 20 25 30 35

FAUX

(13)

Principe de l’histogramme

les surfaces des rectangles sont proportionnelles aux effectifs dans les classes.

Amplitude d’une classe ak = bkbk−1

Cas où les amplitudes des classes ne sont pas toutes identiques

les hauteurs des rectangles ne peuvent plus être les effectifs des classes.

densité d’effectif : dk = enk ak

aire du rectangle :dk × ak = enk

ak × ak = enk

III. Représentations graphiques

Notes au QCM de culture générale

Densitéd’effectifs

0 5 10 15 20

0.00 0.05 0.10 0.15

(14)

Diagramme en bâtons

Principe

des bâtons de longueurs proportionnelles aux effectifs

pas de notions de largeur donc pas de gros rectangles Règles d’usages

variables quantitatives discrètes

respecter l’échelle

variables qualitatives ordonnées

respecter l’ordre

équidistance des modalités

variables qualitatives non ordonnées

s’il existe des regroupements, les respecter

équidistance des modalités

par défaut, ordonner selon les effectifs décroissants

III. Représentations graphiques

0 20 40 60

L1 L2 L3

Effectif

Année de licence

(15)

0 5 10 15

0 5 10 15 20

Effectif

Note du thème histoire

III. Représentations graphiques

0 20 40 60

Bac ES Bac S Bac STMG Bac professionnel

Effectif

Série de baccalauréat

(16)

Bac pro.

Bac STMG Bac S Bac ES

0 20 40 60

Effectif

Série de baccalauréat

III. Représentations graphiques

54.3%

42.6%

2.3%

0.8%

Bac pro.

Bac STMG Bac S Bac ES

0 20 40 60

Effectif

Série de baccalauréat

(17)

Diagramme circulaire

Principe

l’angle et la surface des parts sont proportionnels aux effectifs À éviter

s’il y a trop de modalités, c’est illisible

s’il y en a peu, un tableau synthétique est plus précis

en 3D, cela n’a pas de sens

III. Représentations graphiques

Diagramme circulaire - à éviter

L’Ukraine La Grèce La Russie La Turquie

Quel pays a sa capitale en Asie et sa ville principale en Europe ?

Don Giovanni Fidelio

l’hymne à la joie La lettre à Élise

Laquelle de ces composition n’est pas de Beethoven ?

(18)

Diagramme circulaire - à éviter

Genre

FH

Genre des répondants

36 % de répondantes contre

64 % de répondants

III. Représentations graphiques

0 5 10 15 20

a b c d e

0 5 10 15 20

a b c d e

0 5 10 15 20

a b c d e

(19)

“The only worse design than a pie chart is several of them.”

Edward Tufte, The Visual Display of Quantitative Information, Graphics Press, 1983, p. 178.

“There is no data that can be displayed in a pie chart that cannot be displayed better in some other type of chart.”

John Wilder Tukey (1915–2000)

III. Représentations graphiques

Autre graphique trompeur

Autres exemples :

https://www.reddit.com/r/dataisugly/

https://viz.wtf/, https://twitter.com/wtfviz

Références

Documents relatifs

Commenter le rôle de la métrique du χ 2 dans le cadre de l’AFC en comparant les résultats avec ceux de l’ACP des taux de suffrage exprimés pour chacun des candidats. Interpréter

[r]

Ensuite, nous calculons des bornes pour certains indices de dissimilarité, et nous vérifions les axiomes de distance.. Ceux-ci sont ensuite utilisés pour la

Dans la section 2, nous introduisons brièvement les modèles loglinéaires pour variables qualitatives ; une attention spéciale est portée sur les modèles graphiques qui

contingence (X X | X X-j ,.|X X ), cette dernière pratique n'étant équivalente à l'analyse discriminante sur variables qualitatives que dans le cas où les p variables explicatives

X est ici le tableau logique ( p x n ) des indicatrices (rangées en lignes) des modalités de x ; les poids associés aux n individus ont tous été pris égaux à 1 ; la

(e) Ajuster un modèle de régression linéaire multiple avec interaction permettant d’expliquer la variable logclaimcst0 en fonction des variables gender et agecat, considérée comme

le dosage du fer sérique ne doit pas être prescrit pour la détection d’une carence en fer chez les personnes asymptomatiques. Seul le dosage de la ferritine