• Aucun résultat trouvé

I. Séries de données et représentation graphique 1. Vocabulaire

N/A
N/A
Protected

Academic year: 2022

Partager "I. Séries de données et représentation graphique 1. Vocabulaire"

Copied!
5
0
0

Texte intégral

(1)

2Chapitre Statistiques :

I. Séries de données et représentation graphique 1. Vocabulaire

Une série statistique traite de données de différents types : effectifs, pourcentages, indices, …

Le caractère quantitatif étudié peut être discret quand il ne prend que des valeurs isolées ( nombres d’enfants : 1 ou 2) ou continu quand il prend ses valeurs dans des intervalles appelés classes (taille en centimètres d’individus dans des classes ([150 ; 170 [, [170 ; 190[).

Le caractère peut être qualitatif, on étudie alors des modalités : couleur des yeux.

2. Histogramme

Pour représenter un caractère prenant ses valeurs dans des classes, on construit des rectangles dont les aires sont proportionnelles aux effectifs. La représentation ainsi obtenue s’appelle un histogramme.

Exemple : Répartition des notes au dernier devoir :

Notes [8;11[ [11; 14[ [14;17[ [17; 20]

Effectifs 9 11 10 3

Dans ce cas, tous les intervalles sont de même amplitude (3 : largeur d’une classe), la hauteur des rectangles est proportionnelle à l’effectif.

0 2 4 6 8 10 12

[8;11[ [11; 14[ [14;17[ [17; 20]

Regroupons des classes :

Notes [8;11[ [11; 14[ [14;20]

Effectifs 9 11 13

hauteur 9 11 6.5

La dernière classe a doublée de largeur donc sa hauteur doit être divisée par deux.

8 11 14 17 20

3. Série chronologique

Lorsque l’on relève les valeurs d’une variable à certains instants ( minute, jour, mois, an,...) on obtient une série chronologique.

Exemple : température moyenne annuelle entre 1960 et 1979.

1

unité d’aire :

1 unitée d’aire :

Remarque : l’axe des ordonnées peut prêter à confusion, on ne le met plus.

Exercices : 19 ; 22, 23, 25 page 48

puis 27,

(2)

4. Quartiles

Le but est de facilité la représentation d’une série statistique : la médiane n’est qu’une seule donnée, elle ne permet pas de représenter la disparité des valeur d’une série. On représentera les valeurs trouvées dans un

graphiques pour facilité la lecture, l’interprétation et la comparaison de séries.

On considère une série statistique prenant d’effectif n, on peut alors ranger ces valeurs par ordre croissant : x

1

≤ x

2

≤ … ≤ x

n

.

Définition :

− Le premier quartile Q

1

de la série est la valeur x

i

dont l’indice i est le plus petit entier supérieur ou égal à

4 n

.

− Le deuxième quartile Q

2

de la série est la médiane soit valeur x

i

dont l’indice i est : n+1

2 si n est impair et x

n/2

+ x

n/2+1

2 si n est pair.

− Le troisième quartile Q

3

de la série est la valeur x

i

dont l’indice i est le plus petit entier supérieur ou égal à

3

4 n

.

Remarque : ceci est une définition approximative, pour une définition exacte, aller sur le site de Gilles Constantini/1 S.

on peut prendre comme médiane

la valeur x i dont l’indice i est le plus petit entier supérieur ou égal à n 2

Exemples : Avec des séries de notes d’élèves représentés par A, B, C et D.

Pour A : 5 ; 5 ; 6 ; 9 ; 10 ; 12 ;13 ;13. Soit 8 notes.

Pour B : 2 ; 3 ; 5 ; 6 ; 8 ; 9 ; 9 ; 10 ; 10. Soit 9 notes.

Pour C : 6 ; 6 ; 10 ; 12 ; 12 ; 13 ; 14 ;15 ;16 ; 16. Soit 10 notes.

Pour D : 0 ; 0 ; 1 ; 4 ; 5 ; 8 ; 10 ; 12 ; 13 ; 16 ; 17. Soit 11 notes.

Réalisation avec un tableur :

Q1 5,75 5 10,5 2,5

médiane 9,5 8 12,5 8

Q3 12,25 9 14,75 12,5

Notre calcul :

A B C D

n/4 2 2.25 2.5 2.75

Q1 5 5 10 1

n/2 4 4.5 5 5.5

médiane 9.5 ou 10 8 12.5 ou 13 8

3n/2 6 6.75 7.5 8.25

Q3 12 9 15 13

5. Diagramme en boîtes

Aussi appelé diagramme à moustache, le diagramme en boîte permet de représenter une série statistique par cinq valeurs : les valeurs extrême (minimum et maximum de la série) , les deux quartiles Q1 et Q2 et la médiane.

Interprétation :

25% ( au moins) des valeurs se trouvent entre le minimum et Q1. 25% ( au moins) des valeurs se trouvent entre le Q1 et Me.

25% ( au moins) des valeurs se trouvent entre le Me et Q3.

25% ( au moins) des valeurs se trouvent entre le Q3 et le maximum.

50% ( au moins) des valeurs se trouvent entre le Q1 et Q3 .

ex : 33, 38, 34, 35, activité 1, 2, 4.

(3)

II. Lissage par moyenne mobile

Définition : On considère une série chronologique prenant les valeurs x1 , x2 , …, xn aux dates d1 , d2 , …, dn . Lisser la série par les moyennes mobiles d’ordre 3 revient à remplacer les termes xi

(pour 2 ≤ i ≤ n- 1) par xi-1 + xi + xi+1

3 .

III. Dispersion autour de la moyenne

1. La moyenne

La moyenne d'une série statistique est le quotient de la somme de toutes les valeurs de cette série par l'effectif total.

• On considère la série (x1 , x2 , …, xn).

L’effectif total est n.

La moyenne est x = x1 + x2 + …+ xn

n . =

i=1 n

xi n

• On considère la série

valeur x1 x2 … xp total

effectif n1 n2 … np N

L’effectif total est N = n1 + … + np on le note

1 n

i i

N n

=

= ∑

.

Les fréquences sont notées fi

− La moyenne est donnée par la relation :

( n x n x n

p

x

p

)

x = N 1

1

×

1

+

2

×

2

+ L + ×

1

" "

p

i i

i

n x somme des produits effectif valeur x

N effectif total

=

×

= ∑ =

ou

1 p

i i

i

x f x

=

= ∑

Exemple : cas des notes au dernier devoir : 0

2 4 6 8 10 12 14 16 18

Séries A B C D

Exercices sur ordinateur +28 et 29 page 49

(4)

Il faut prendre le centre des classes : la série des donc donnée par :

valeur 9,5 12,5 15,5 18,5

effectif 9 11 10 3

La moyenne est donc x = 9x 9,5 + 11x12,5 + 10x 15,5 + 3x 18,5

33 ≈ 13, 2

2. Ecart-type

• On considère la série

valeur x1 x2 … xp total

effectif n1 n2 … np N

La variance est la moyenne des carrés des écarts à la moyenne. C’est un nombre positif.

On note N = n1 + … + np l’effectif total et fi la fréquence

V =

n1x1 - x 2 + … + npxp - x 2

N =

i=1 p

nixi - x 2

N ou V =

i=1 p

fixi - x 2; Pour simplifier les calculs de la variance on préfère utiliser les formules :

V = n1x x12

+ … + npx xp2

N - x

2

=

i=1 p

xi ni2 N - x

2

ou V =





i=1 p

fi xi 2 - x

2

La variance a pour unité le carré de l’unité du caractère, pour avoir la même unité, on utilise :

L’écart type d’une série est égal à la racine carrée de la variance s = V

Exemple : avec les notes du dernier devoir : V ≈ 9x 9,52 + 11x12,52 + 10x 15,52 + 3x 18,52

33 - 13,22 ≈ 6,37

s ≈ 6,37 ≈ 2,52

A vérifier à la calculatrice !

(5)

IV. Tableaux à double entrées

On va répartir dans un tableau une même population par rapport à deux variables qualitatives.

1. Etude fréquentielle

Pour étudier la répartition des 250 élèves de 1ère du lycée, suivant leur série et leur lieu de déjeuné, on donne le tableau à double entrées :

L ES S Total

Lycée 40 30 110 180

Autre 30 10 30 70

Total 70 40 140 250

La ligne total et la colonne total sont les marges du tableau.

Tableau des fréquences ( par rapport à l’ensemble).

Les pourcentages sont calculés par rapport à l’effectif total.

L ES S Total

Lycée 0,16 0,12 0,44 0,72

Autre 0,12 0,04 0,12 0,28

Total 0,28 0,16 0,56 1

Signification des marges du tableau : elles représentent la distribution des fréquences de chaque série.

La distribution du lieu de déjeuné est en colonne et celle du type de série est en ligne.

2. Fréquence conditionnelle

On pourrait faire d’autres tableau : par rapport au lieu ou par rapport à la série.

Répartition des fréquences du type de série selon le lieu du déjeuné :

L ES S Total

Lycée 22,2% 16,7% 61,1% 100,0%

Autre 42,9% 14,3% 42,9% 100,0%

Total 28,0% 16,0% 56,0%

Attention : la distribution des fréquences du type de série n’a pas changée, il n’est pas obligatoire ! Vocabulaire : parmi les élèves déjeunant au lycée , la fréquence du nombre de lycéens de 1ère ES est

30

180 ≈ 16,7%. Cette fréquence est appelée fréquence conditionnelle on la note flycée(ES).

Remarque : fES(lycée) = 30

40 = 75 %.

3. Représentation en arbre

Références

Documents relatifs

Pour comprendre la différence avec ce que tu avais l’habitude d’observer, on va se servir d’un générateur avec deux sorties : une sortie tension continue ( ) et une sortie

Instruction Y ( Touche F1 ) suivie du numéro de la fonction à utiliser (pour notre exemple Y1 ).. Valider avec

Pour ette série, 4 valeurs sur 5 (soit 80%) sont inférieures ou égales à

Dans le cas d’une série portant sur un caractère quantitatif discret, la médiane est alors par convention : - la valeur centrale de la série cad la valeur située au rang N + 1.. 2

Le nb 12 dans la ligne des effectifs cumulés croissants représente le nb d’ éléves ayant eu une note inférieure ou égale à 7.. Le nb 24 dans la ligne des effectifs

Il s’agit encore de calculer la somme cumulée des termes de la suite u, mais ici on ne sait pas à quel rang

Quand Mme Abdou prepare à manger pour ses enfants, elle prend soin que chacun ait autant de bananes et de mabawas et que rien ne soit jeté.. Aujourd’hui pour le repas de ses

Une étude qualitative 2 , réalisée auprès de 15 contributeurs « actifs » du forum d’entraide officiel du fournisseur d’accès à Internet dont quelques salariés, et auprès