Chapitre II Statistiques
5 otobre 2011
Table des matières
1 Voabulaire . . . 2
2 Indiateurs d'une série statistique . . . 4
2.1 Indiateurs de position . . . 4
2.2 Indiateurs de dispersion . . . 5
2.3 Caluls des indiateurs . . . 5
2.4 Exemples . . . 6
3 Programme . . . 7
•
Faire des statistiques , 'estreueillir,organiser, synthétiser, représenter etexploiter desdonnées,numériquesounon,dansunbutdeomparaison,deprévision,deonstat...•
Les plus gros onsommateurs de statistiques sont les assureurs (risques d'a- idents, de maladie des assurés), les médeins (épidémiologie), les démographes(populationsetleurdynamique),les éonomistes (emploi,onjonture éonomique),
les météorologues ...
1.
Voabulaire
Définition 1 : Population - Individu
Une étude statistique est un ensemble de valeur qui est reueilli pour étudier
ertains ritères.
La population d'uneétude statistiqueest l'ensemble des individus surlesquels
portent ette étude.
Exemple :L'ensembledes élèvesdelalassedeseonde 1peut-êtrelapopulationétudiée;
Chaque élève de ettelasse sera un individu de ette étude.
Définition 2 : Caractère – Qualitatif/Quantitatif – Discret/Continu
Le aratère (ou variable ) d'une série statistique est l'information étudiée.
•
Lorsque le aratère ne prend que des valeurs (ou modalités ) numériques, il est quantitatif :⋄
disret s'il ne peut prendre que des valeurs isolées (notes, âge ...)⋄
ontinu dans le as ontraire (poids, taille ...). Dans e as on eetuesouvent un regroupement des valeurs par lasses .
•
Sinon, on dit qu'il est qualitatif (ouleur des yeux, sport pratiqué ...) : learatère n'est pas mesuré par des nombres.
Exemples : Dans la populationdes élèves de seonde 1du lyée de Sens :
1
. avoir le brevet est un aratère (ou variable) qualitatif prenant deux valeurs : ouiou non;
2
. lenombrede frèreetdesoeurd'unélèveestun aratère quantitatifdisret;ilpeut prendre lesvaleurs 0,1,2,3, ... ;3
. la taille des élèves est un aratère quantitatif ontinu. Il peut prendre toutes les valeurs omprises entre 1,50 m et 1,80m. On peut regrouper es valeurs dans deslasses d'étendue (ou amplitude)10 m :
[1, 50; 1, 60[
puis[1, 60; 1, 70[
,...Définition 3 : Effectif - Fréquence - Distribution des fréquences
Ahaquevaleur (oulasse) du aratère estassoiéeun eetif
n
: 'estlenom-bre d'individus assoiés à ette valeur.
On peut aussi assoier à haque valeur de l'étude une fréquene : 'est la pro-
portion (pourentage) que repésente ette valeur au seinde l'étude.
Le tableau donnant les fréquenes de toutes les valeurs du aratère d'une série
statistique est appelé distribution des fréquenes .
Remarques :
•
Lafréquene d'une valeurd'un aratère est un nombrerationnelomprisentre 0et1.•
Lasommedes fréquenesd'unesérie statistiquedoit toujoursêtre égaleà1.Unelégère impréision peut être observée si on utilise des valeurs approhées au lieu des valeursexates.
•
Lesfréquenespeuventêtredonnées sous formefrationnelle,déimaleouen pourent- age. Parexemple,1
22 = 0, 0455 = 4, 55%
.Frequencies
The frequeny of an event
i
is the numbern i
of times the event ourred in theexperiment or the study. We speak of absolute frequenies , when the ounts
n i
themselves are given and of (relative) frequenies , when those are divided by the
totalnumberofevents.Sometimesalltherelativefrequeniesaregatherina frequeny
table .
Exemple : On onsidère la série statistique onstituée par l'ensemble des notes des 22
élèves d'une lasse de seonde à un devoir. Le tableau des eetifs préise le nombre
d'élèves orrespondant ayant obtenu haque note entière.
Note 4 6 9 10 11 12 13 14 15 16 17 19
Eetif 1 1 2 1 1 3 5 1 2 1 2 2
Le aratère étudié est dans e as la note à un devoir, 'est un aratère qualitatif.
L'eetif total est de 22. A titre d'exemple, l'eetifde lanote
13
est5
.Les fréquenes des notes sont données i-dessous :
Note Fréquene Note Fréquene Note Fréquene
4
1
22 = 0, 0455
1122 1 = 0, 0455
1522 2 = 0, 0909
6
1
22 = 0 , 0455
1222 3 = 0 , 1364
1622 1 = 0 , 0455
9
2
22 = 0, 0909
1322 5 = 0, 2273
1722 2 = 0, 0909
10
1
22 = 0 , 0455
1422 1 = 0 , 0455
1922 2 = 0 , 0909
Définition 4 : Effectif cumulé croissant
L'
deneetifumuléroissant(ECC)orrespondantàunevaleur
x i
d'unaratèreest la somme des eetifs des valeurs inférieures ou égales à
x i
.On dénit de manière analogue les fréquenes umulées roissantes .
Exemple : Reprenons l'exemple des notes d'une lasse de 22 élèves. Les eetifs umulés
roissantssontdonnésdansletableausuivant.Ilestimportantd'yfairegurerlesvaleurs
dont l'eetifest nul,ar e n'est pas le as pour l'ECC.
Note 1 2 3 4 5 6 7 8 9 10
E. 0 0 0 1 0 1 0 0 2 1
ECC 0 0 0 1 1 2 2 2 4 5
Note 11 12 13 14 15 16 17 18 19 20
E. 1 3 5 1 2 1 2 0 2 0
ECC 6 9 14 15 17 18 20 20 22 22
Cumulative frequency
The umulative frequeny orresponding to a partiular value is the sum of all the
frequenies up to and inludingthat value.
2.
Indiateurs d'une série statistique
2.1.
Indiateurs de position
Définition 5 : Moyenne, Médiane, Quartiles
La moyenne d'une série statistique à aratère quantitatif est la valeur que
prendraient les valeurs de ette série si elles étaient toutes égales.
La médiane d'une série statistique dont lesvaleurs sont rangées par ordre rois-
santest la valeur,notée Med , tel que50% des individus au moinsont une valeur
inférieure ou égale à Med et tel que 50% des individus au moins ont une valeur
supérieure ou égaleà Med.
Le premier quartile d'une série statistique est la plus petite valeur de la série
statistique telle qu'au moins 25% des valeurs soient inférieures ou égales à ette
valeur. On le note
Q 1
.Le troisième quartile d'une série statistique est la plus petite valeur tellequ'au
moins75% des valeurssoient inférieures ou égales àette valeur.On le note
Q 3
.Remarques :
•
Lesdénitions préédentes n'ontauunsens sionne peut pas lasseres valeurs. C'estpouquoi es indiateurs ne sont alulablesque pour des séries à aratère quantitatif.
•
On pourraitroire qu'une médianeoupeune série statistiqueen deux parties de taille égale mais e n'est pas toujours le as. Par exemple, la médianede la série : 2 3 33 4est 3.Pour ettesérie, 4 valeurs sur 5 (soit 80%)sont inférieuresou égalesà la
médiane. La proportion de valeurssupérieures ouégales à lamédianeest lamême.
Arithmetic mean
The arithmetimean (usuallyalled the average )an be easilyomputed: totalthe
items and the divide by the number of item. When one or a number of items is used
several times,thoseitemshavemoreweight.Inthis ase,youomputethe weighted
mean by multiplingeahvaluebyitsabsolutefrequeny andthendivide theresultby
the number of item. There is a third way to ompute, this one from the frequenies :
multiplyeah value by itsfrequeny and add allthe results.
Median
Intuitively,a median isanumberseparatingapopulationintwohalves.Themedianof
anitelistofnumbers anbefoundbyarrangingallthe observationsfromlowestvalue
tohighestvalueand pikingthe middleone. Ifthereisaneven numberofobservations,
the median is not unique, so one often takes the mean of the two middle values. At
mosthalfthe populationhavevaluesless thanthe medianand atmosthalfhavevalues
greater than the median.
Quartiles
In desriptive statistis, a quartile is any of the three values whih divide the sorted
data set into four equal parts, so that eah part represents one fourth of the sampled
population.
2.2.
Indiateurs de dispersion
Définition 6 : Étendue, écart inter-quartile
L' étendue ou amplitude d'une série statistique est la diérene entre la plus
grande et laplus petite des valeurs prises par ette série.
L' éart interquartile est égal à la diérene
Q3 − Q1
.Le mode (ou la lasse modale ) d'une série statistique est la valeur (ou la
lasse) de la série qui orrespond au plus grand eetif.
2.3. Caluls des indiateurs
Théorème 1 : Calcul de la moyenne
Il existe trois façons de aluler la moyenne d'une série statistique. Ils dépendent
de la façon dont les données sont fournies :
•
alul à partir de la liste des données brutesx 1
,x 2
, ...,x p
.x = x 1 + x 2 + · · · + x p p
•
alul à partir du tableaux des eetifs :Caratères
x 1 x 2 · · · x q
Eetifs
n 1 n 2 · · · n q x = n 1 x 1 + n 2 x 2 + ... + n q x q
n 1 + n 2 + ... + n q
•
alul de lamoyenne à partir de la distribution des fréquenes.Caratères
x 1 x 2 · · · x q
Fréquenes
f 1 f 2 · · · f q x = f 1 x 1 + f 2 x 2 + · · · + f q x q
Remarques :
•
Lorsquelasérieest regroupéeen lasses,onalulelamoyenneen prenantpourvaleursx i
le entre de haque lasse; e entre est obtenuen faisantla moyenne des deuxextrémités de lalasse.
•
On appelle moyenne élaguée d'une série statistique une moyenne qui ne tient pas ompte des valeurs non représentatives de la série. Par exemple, dans une enquetesur lenombre d'enfants des personnes interrogés, on ne tient pas ompte des réponses
supérieuresà
30
.Démonstration :
1
. Celarésultedeladénitionarladivisiondutotaldesvaleursdelasérieindiquelepartageen partieségales.
2
. Cela résultede laformulepréédente danslaquelleon a remplaéx k + x k + · · · + x k
parx k × n k
.3
. Partons delaformulepréédente.x = n 1 x 1 + n 2 x 2 + · · · + n q x q
n 1 + n 2 + · · · + n q
D'après lesrègles dealulsur lesfrations,lamoyenne estégale à:
x = n 1
p x 1 + n 2
p x 2 + · · · + n q
p x q
Or, par dénition, ona
f i = n i
p
.Ondéduit diretement l'égalitédu théorème.Théorème 2 : Calcul de la valeur médiane
Soit une série statistique ordonnée dont les
p
valeurs sontx 1 6 x 2 6 · · · 6 x p
•
Sip
est impair , la médiane de lasérie est lavaleur quiest située au rangp +1 2
,•
Sip
est pair , lamédiane de la série est une valeur omprise entrex p
2
et
x p
2 +1
.Le plus souvent on prend la moyenne de es deux valeurs, mais ela n'a rien
d'obligatoire.
Théorème 3 : Calcul des quartiles
Pourdéterminerlepremierquartile d'unesériede
N
valeursordonnées,on aluleN
4
puis on détermine le premier entierp
supérieur ou égal àN 4
; et entierp
est lerang de
Q1
.Pour
Q 3
, on fait de même en remplaçantN 4
par3 4 N
.2.4.
Exemples
Exerie résolu 1 :
Déterminer la moyenne, la médiane, les quartiles, l'éart interquartile et l'étendue de
haune des séries statistiques suivantes :
1
.2 − 5 − 6 − 8 − 9 − 9 − 10 2
.8 − 2 − 9 − 6 − 5 − 8
3
. Taille [1,5; 1,6[ [1,6;1,7 [ [1,7;1,8[ [1,8; 1,9[Eetifs 5 16 9 2
Solution :
1
.•
Lamoyenne estx = 2+5+6+8+9+9+10
7 = 7
•
Il ya 7valeurs.7+1 2 = 4
.Lamédianeest laquatrièmevaleur de lasérie, 'est àdire 8.
• 7
4 = 1, 75
. Lepremier quartile est ladeuxième valeur donQ1 = 5
.• 3 × 7
4 = 5, 25
.Le troisièmequartile est lasixième valeur donQ3 = 9
.•
L'éartinterquartileestQ3 − Q1 = 9 − 5 = 4
.•
L'étendue est10 − 2 = 8
.2
.• x = 8+2+9+6+5+8
6 = 6, 3
•
Attention, il fautommener par lasser lesvaleurs par ordre roissant.Ily a 6valeurs.
6
2 = 3
.La médianeest une valeursituée entre latroisièmeetlaquatrièmevaleur. On peut hoisir par exemple
7
ommemédiane.• 6
4 = 1, 5
. Le premierquartile est la deuxièmevaleur donQ1 = 5
.• 3 × 6
4 = 4, 5
. Letroisièmequartile est lainquième valeur donQ3 = 8
.•
L'éartinterquartileestQ3 − Q1 = 8 − 5 = 3
.•
L'étendue est de9 − 2 = 7
.3
.• x = 1 , 55×5+1 , 65×16+1 32 , 75×9+1 , 85×2 = 1, 675
.•
Il y a5 + 16 + 9 + 2 = 32
valeurs.32 2 = 16
. La médiane est la lasse entre laseizièmeet dix-septième valeur soit[1,6; 1,7[
• 32
4 = 8
. Le premier quartile est la huitième valeur don il se trouve dans lalasse [1,6; 1,7[
3 × 8
4 = 24
.Letroisièmequartileest lavingt-quatrièmevaleurdonilsetrouve dans lalasse [1,7;1,8 [.•
L'étendue est de1, 9 − 1, 5 = 0, 4
.Remarque: C'est un abus de language de parler d'étendue. En eet, rien dans
letableau ne permet d'armer que lesvaleursextrêmes sont
1 , 5
et1 , 9
.3.
Programme