• Aucun résultat trouvé

Définition 2 : Caractère – Qualitatif/Quantitatif – Discret/Continu

N/A
N/A
Protected

Academic year: 2022

Partager "Définition 2 : Caractère – Qualitatif/Quantitatif – Discret/Continu"

Copied!
9
0
0

Texte intégral

(1)

Chapitre II Statistiques

5 otobre 2011

Table des matières

1 Voabulaire . . . 2

2 Indiateurs d'une série statistique . . . 4

2.1 Indiateurs de position . . . 4

2.2 Indiateurs de dispersion . . . 5

2.3 Caluls des indiateurs . . . 5

2.4 Exemples . . . 6

3 Programme . . . 7

Faire des statistiques , 'estreueillir,organiser, synthétiser, représenter etexploiter desdonnées,numériquesounon,dansunbutdeomparaison,deprévision,deonstat...

Les plus gros onsommateurs de statistiques sont les assureurs (risques d'a- idents, de maladie des assurés), les médeins (épidémiologie), les démographes

(populationsetleurdynamique),les éonomistes (emploi,onjonture éonomique),

les météorologues ...

(2)

1.

Voabulaire

Définition 1 : Population - Individu

Une étude statistique est un ensemble de valeur qui est reueilli pour étudier

ertains ritères.

La population d'uneétude statistiqueest l'ensemble des individus surlesquels

portent ette étude.

Exemple :L'ensembledes élèvesdelalassedeseonde 1peut-êtrelapopulationétudiée;

Chaque élève de ettelasse sera un individu de ette étude.

Définition 2 : Caractère – Qualitatif/Quantitatif – Discret/Continu

Le aratère (ou variable ) d'une série statistique est l'information étudiée.

Lorsque le aratère ne prend que des valeurs (ou modalités ) numériques, il est quantitatif :

disret s'il ne peut prendre que des valeurs isolées (notes, âge ...)

ontinu dans le as ontraire (poids, taille ...). Dans e as on eetue

souvent un regroupement des valeurs par lasses .

Sinon, on dit qu'il est qualitatif (ouleur des yeux, sport pratiqué ...) : le

aratère n'est pas mesuré par des nombres.

Exemples : Dans la populationdes élèves de seonde 1du lyée de Sens :

1

. avoir le brevet est un aratère (ou variable) qualitatif prenant deux valeurs : oui

ou non;

2

. lenombrede frèreetdesoeurd'unélèveestun aratère quantitatifdisret;ilpeut prendre lesvaleurs 0,1,2,3, ... ;

3

. la taille des élèves est un aratère quantitatif ontinu. Il peut prendre toutes les valeurs omprises entre 1,50 m et 1,80m. On peut regrouper es valeurs dans des

lasses d'étendue (ou amplitude)10 m :

[1, 50; 1, 60[

puis

[1, 60; 1, 70[

,...

Définition 3 : Effectif - Fréquence - Distribution des fréquences

Ahaquevaleur (oulasse) du aratère estassoiéeun eetif

n

: 'estlenom-

bre d'individus assoiés à ette valeur.

On peut aussi assoier à haque valeur de l'étude une fréquene : 'est la pro-

portion (pourentage) que repésente ette valeur au seinde l'étude.

Le tableau donnant les fréquenes de toutes les valeurs du aratère d'une série

statistique est appelé distribution des fréquenes .

Remarques :

Lafréquene d'une valeurd'un aratère est un nombrerationnelomprisentre 0et1.

Lasommedes fréquenesd'unesérie statistiquedoit toujoursêtre égaleà1.Unelégère impréision peut être observée si on utilise des valeurs approhées au lieu des valeurs

exates.

Lesfréquenespeuventêtredonnées sous formefrationnelle,déimaleouen pourent- age. Parexemple,

1

22 = 0, 0455 = 4, 55%

.

(3)

Frequencies

The frequeny of an event

i

is the number

n i

of times the event ourred in the

experiment or the study. We speak of absolute frequenies , when the ounts

n i

themselves are given and of (relative) frequenies , when those are divided by the

totalnumberofevents.Sometimesalltherelativefrequeniesaregatherina frequeny

table .

Exemple : On onsidère la série statistique onstituée par l'ensemble des notes des 22

élèves d'une lasse de seonde à un devoir. Le tableau des eetifs préise le nombre

d'élèves orrespondant ayant obtenu haque note entière.

Note 4 6 9 10 11 12 13 14 15 16 17 19

Eetif 1 1 2 1 1 3 5 1 2 1 2 2

Le aratère étudié est dans e as la note à un devoir, 'est un aratère qualitatif.

L'eetif total est de 22. A titre d'exemple, l'eetifde lanote

13

est

5

.

Les fréquenes des notes sont données i-dessous :

Note Fréquene Note Fréquene Note Fréquene

4

1

22 = 0, 0455

11

22 1 = 0, 0455

15

22 2 = 0, 0909

6

1

22 = 0 , 0455

12

22 3 = 0 , 1364

16

22 1 = 0 , 0455

9

2

22 = 0, 0909

13

22 5 = 0, 2273

17

22 2 = 0, 0909

10

1

22 = 0 , 0455

14

22 1 = 0 , 0455

19

22 2 = 0 , 0909

Définition 4 : Effectif cumulé croissant

L'

deneetifumuléroissant(ECC)orrespondantàunevaleur

x i

d'unaratère

est la somme des eetifs des valeurs inférieures ou égales à

x i

.

On dénit de manière analogue les fréquenes umulées roissantes .

Exemple : Reprenons l'exemple des notes d'une lasse de 22 élèves. Les eetifs umulés

roissantssontdonnésdansletableausuivant.Ilestimportantd'yfairegurerlesvaleurs

dont l'eetifest nul,ar e n'est pas le as pour l'ECC.

Note 1 2 3 4 5 6 7 8 9 10

E. 0 0 0 1 0 1 0 0 2 1

ECC 0 0 0 1 1 2 2 2 4 5

Note 11 12 13 14 15 16 17 18 19 20

E. 1 3 5 1 2 1 2 0 2 0

ECC 6 9 14 15 17 18 20 20 22 22

Cumulative frequency

The umulative frequeny orresponding to a partiular value is the sum of all the

frequenies up to and inludingthat value.

(4)

2.

Indiateurs d'une série statistique

2.1.

Indiateurs de position

Définition 5 : Moyenne, Médiane, Quartiles

La moyenne d'une série statistique à aratère quantitatif est la valeur que

prendraient les valeurs de ette série si elles étaient toutes égales.

La médiane d'une série statistique dont lesvaleurs sont rangées par ordre rois-

santest la valeur,notée Med , tel que50% des individus au moinsont une valeur

inférieure ou égale à Med et tel que 50% des individus au moins ont une valeur

supérieure ou égaleà Med.

Le premier quartile d'une série statistique est la plus petite valeur de la série

statistique telle qu'au moins 25% des valeurs soient inférieures ou égales à ette

valeur. On le note

Q 1

.

Le troisième quartile d'une série statistique est la plus petite valeur tellequ'au

moins75% des valeurssoient inférieures ou égales àette valeur.On le note

Q 3

.

Remarques :

Lesdénitions préédentes n'ontauunsens sionne peut pas lasseres valeurs. C'est

pouquoi es indiateurs ne sont alulablesque pour des séries à aratère quantitatif.

On pourraitroire qu'une médianeoupeune série statistiqueen deux parties de taille égale mais e n'est pas toujours le as. Par exemple, la médianede la série : 2 3 3

3 4est 3.Pour ettesérie, 4 valeurs sur 5 (soit 80%)sont inférieuresou égalesà la

médiane. La proportion de valeurssupérieures ouégales à lamédianeest lamême.

Arithmetic mean

The arithmetimean (usuallyalled the average )an be easilyomputed: totalthe

items and the divide by the number of item. When one or a number of items is used

several times,thoseitemshavemoreweight.Inthis ase,youomputethe weighted

mean by multiplingeahvaluebyitsabsolutefrequeny andthendivide theresultby

the number of item. There is a third way to ompute, this one from the frequenies :

multiplyeah value by itsfrequeny and add allthe results.

Median

Intuitively,a median isanumberseparatingapopulationintwohalves.Themedianof

anitelistofnumbers anbefoundbyarrangingallthe observationsfromlowestvalue

tohighestvalueand pikingthe middleone. Ifthereisaneven numberofobservations,

the median is not unique, so one often takes the mean of the two middle values. At

mosthalfthe populationhavevaluesless thanthe medianand atmosthalfhavevalues

greater than the median.

Quartiles

In desriptive statistis, a quartile is any of the three values whih divide the sorted

data set into four equal parts, so that eah part represents one fourth of the sampled

population.

(5)

2.2.

Indiateurs de dispersion

Définition 6 : Étendue, écart inter-quartile

L' étendue ou amplitude d'une série statistique est la diérene entre la plus

grande et laplus petite des valeurs prises par ette série.

L' éart interquartile est égal à la diérene

Q3 − Q1

.

Le mode (ou la lasse modale ) d'une série statistique est la valeur (ou la

lasse) de la série qui orrespond au plus grand eetif.

2.3. Caluls des indiateurs

Théorème 1 : Calcul de la moyenne

Il existe trois façons de aluler la moyenne d'une série statistique. Ils dépendent

de la façon dont les données sont fournies :

alul à partir de la liste des données brutes

x 1

,

x 2

, ...,

x p

.

x = x 1 + x 2 + · · · + x p p

alul à partir du tableaux des eetifs :

Caratères

x 1 x 2 · · · x q

Eetifs

n 1 n 2 · · · n q x = n 1 x 1 + n 2 x 2 + ... + n q x q

n 1 + n 2 + ... + n q

alul de lamoyenne à partir de la distribution des fréquenes.

Caratères

x 1 x 2 · · · x q

Fréquenes

f 1 f 2 · · · f q x = f 1 x 1 + f 2 x 2 + · · · + f q x q

Remarques :

Lorsquelasérieest regroupéeen lasses,onalulelamoyenneen prenantpourvaleurs

x i

le entre de haque lasse; e entre est obtenuen faisantla moyenne des deux

extrémités de lalasse.

On appelle moyenne élaguée d'une série statistique une moyenne qui ne tient pas ompte des valeurs non représentatives de la série. Par exemple, dans une enquete

sur lenombre d'enfants des personnes interrogés, on ne tient pas ompte des réponses

supérieuresà

30

.

Démonstration :

1

. Celarésultedeladénitionarladivisiondutotaldesvaleursdelasérieindiquelepartage

en partieségales.

2

. Cela résultede laformulepréédente danslaquelleon a remplaé

x k + x k + · · · + x k

par

x k × n k

.

3

. Partons delaformulepréédente.

x = n 1 x 1 + n 2 x 2 + · · · + n q x q

n 1 + n 2 + · · · + n q

(6)

D'après lesrègles dealulsur lesfrations,lamoyenne estégale à:

x = n 1

p x 1 + n 2

p x 2 + · · · + n q

p x q

Or, par dénition, ona

f i = n i

p

.Ondéduit diretement l'égalitédu théorème.

Théorème 2 : Calcul de la valeur médiane

Soit une série statistique ordonnée dont les

p

valeurs sont

x 1 6 x 2 6 · · · 6 x p

Si

p

est impair , la diane de lasérie est lavaleur quiest située au rang

p +1 2

,

Si

p

est pair , lamédiane de la série est une valeur omprise entre

x p

2

et

x p

2 +1

.

Le plus souvent on prend la moyenne de es deux valeurs, mais ela n'a rien

d'obligatoire.

Théorème 3 : Calcul des quartiles

Pourdéterminerlepremierquartile d'unesériede

N

valeursordonnées,on alule

N

4

puis on détermine le premier entier

p

supérieur ou égal à

N 4

; et entier

p

est le

rang de

Q1

.

Pour

Q 3

, on fait de même en remplaçant

N 4

par

3 4 N

.

2.4.

Exemples

(7)

Exerie résolu 1 :

Déterminer la moyenne, la médiane, les quartiles, l'éart interquartile et l'étendue de

haune des séries statistiques suivantes :

1

.

2 − 5 − 6 − 8 − 9 − 9 − 10 2

.

8 − 2 − 9 − 6 − 5 − 8

3

. Taille [1,5; 1,6[ [1,6;1,7 [ [1,7;1,8[ [1,8; 1,9[

Eetifs 5 16 9 2

Solution :

1

.

Lamoyenne est

x = 2+5+6+8+9+9+10

7 = 7

Il ya 7valeurs.

7+1 2 = 4

.Lamédianeest laquatrièmevaleur de lasérie, 'est à

dire 8.

• 7

4 = 1, 75

. Lepremier quartile est ladeuxième valeur don

Q1 = 5

.

• 3 × 7

4 = 5, 25

.Le troisièmequartile est lasixième valeur don

Q3 = 9

.

L'éartinterquartileest

Q3 − Q1 = 9 − 5 = 4

.

L'étendue est

10 − 2 = 8

.

2

.

• x = 8+2+9+6+5+8

6 = 6, 3

Attention, il fautommener par lasser lesvaleurs par ordre roissant.

Ily a 6valeurs.

6

2 = 3

.La médianeest une valeursituée entre latroisièmeetla

quatrièmevaleur. On peut hoisir par exemple

7

ommemédiane.

• 6

4 = 1, 5

. Le premierquartile est la deuxièmevaleur don

Q1 = 5

.

• 3 × 6

4 = 4, 5

. Letroisièmequartile est lainquième valeur don

Q3 = 8

.

L'éartinterquartileest

Q3 − Q1 = 8 − 5 = 3

.

L'étendue est de

9 − 2 = 7

.

3

.

• x = 1 , 55×5+1 , 65×16+1 32 , 75×9+1 , 85×2 = 1, 675

.

Il y a

5 + 16 + 9 + 2 = 32

valeurs.

32 2 = 16

. La médiane est la lasse entre la

seizièmeet dix-septième valeur soit[1,6; 1,7[

• 32

4 = 8

. Le premier quartile est la huitième valeur don il se trouve dans la

lasse [1,6; 1,7[

3 × 8

4 = 24

.Letroisièmequartileest lavingt-quatrièmevaleurdonilsetrouve dans lalasse [1,7;1,8 [.

L'étendue est de

1, 9 − 1, 5 = 0, 4

.

Remarque: C'est un abus de language de parler d'étendue. En eet, rien dans

letableau ne permet d'armer que lesvaleursextrêmes sont

1 , 5

et

1 , 9

.

3.

Programme

Rappel des notions vues lors des années précédentes

(8)

Classe de sixième Représentations usuelles :

• diagrammes en bâtons ;

• diagrammes circulaires ou demi-circulaires,

• graphiques cartésiens.

Lire, utiliser et interpréter des informations à partir d’une représentation graphique simple.

Classe de cinquième

• Calculer des effectifs.

• Calculer des fréquences.

• Regrouper des données en classe d’égale amplitude.

Les élèves sont entraînés à lire, interpréter et représenter des données en utilisant un vocabulaire adéquat dans des con- textes qui leur sont familiers.

Le calcul d’effectifs cumulés n’est pas un attendu.

Les écritures 10 4 , 2 5 , 0, 4, 40% sont utilisées pour désigner une fréquence : elles permettent d’insister sur les diverses représen- tations d’un même nombre.

• Lire et interpréter des informations à partir d’un tableau ou d’une représentation graphique diagrammes divers, his- togramme).

• Présenter des données sous la forme d’un tableau, les représenter sous la forme d’un diagramme ou d’un his- togramme (dans ce cas les classes sont toujours de même amplitude).

Classe de quatrième

• Moyennes pondérées : Calculer la moyenne d’une série de données.

• Créer, modifier une feuille de calcul, insérer une formule.

• Créer un graphique à partir des données d’une feuille de cal- cul.

Les élèves sont confrontés à des situations familières où deux procédés de calcul différents de la moyenne sont mis en œu- vre :

• somme des n données divisée par n ;

• moyenne pondérée des valeurs par leurs effectifs.

Les élèves doivent savoir calculer, pour de petits effectifs, une

moyenne par la procédure de leur choix. Pour des effectifs plus

grands, cette procédure est basée sur l’usage du tableur ou de

la calculatrice.

(9)

Classe de troisième

• Caractéristiques de position.

• Approche de caractéristiques de dispersion.

Une série statistique étant donnée (sous forme de liste ou de tableau ou par une représentation graphique) :

• déterminer une valeur médiane de cette série et en donner la signification ;

• déterminer des valeurs pour les premier et troisième quartiles et en donner la signification ;

• déterminer son étendue.

Le travail est conduit aussi souvent que possible en liaison avec les autres disciplines dans des situations où les données sont ex- ploitables par les élèves.

L’utilisation d’un tableur permet d’avoir accès à des situations plus riches que celles qui peuvent être traitées « à la main ».

La notion de dispersion est à relier, sur des exemples, au prob- lème posé par la disparité des mesures d’une grandeur, lors d’une activité expérimentale, en particulier en physique et chimie.

Programme de seconde

Caractéristiques de position et de dispersion : médiane, quar- tiles, moyenne.

• Utiliser un logiciel (par exemple, un tableur) ou une calcula- trice pour étudier une série statistique.

• Passer des effectifs aux fréquences, calculer les caractéris- tiques d’une série définie par effectifs ou fréquences.

• Calculer des effectifs cumulés, des fréquences cumulées.

• Représenter une série statistique graphiquement (nuage de points, histogramme, courbe des fréquences cumulées).

L’objectif est de faire réfléchir les élèves sur des données réelles,

riches et variées (issues, par exemple, d’un fichier mis à dis-

position par l’INSEE), synthétiser l’information et proposer des

représentations pertinentes.

Références

Documents relatifs

Ce lot est donc fiable. b) Vrai

Le premier quartile

Le troisième quartile q 3 de la série est la plus petite valeur de la série telle qu’au moins les trois quarts des valeurs de la série lui sont inférieures ou

• Le premier quartile d’une série statistique est la plus petite valeur de la série, notée Q 1 , telle qu’au moins 25% des valeurs de la série sont inférieures ou égales à

La médiane M d’une série de données est la valeur prise par le caractère telle que : - au moins la moitié (50%) des valeurs de la série sont inférieures à M. - au moins

Lorsque les valeurs sont rangées par ordre croissant ou décroissant, une médiane d'une série statistique est un nombre M tel qu'au moins 50 % des valeurs de la série

C'est la 12ième valeur (ainsi il y en a 11 qui sont inférieures ou égales et 11 qui sont supérieures ou égales). Dans la cas où l'on a un nombre pair de valeurs, par exemple si on en

Le troisième Quartile Q 3 est la plus petite valeur de la série telle qu’au moins 75% des valeurs de celle-ci lui sont inférieures ou égales..