Chapitre II
Statistiques
1 er
otobre 2010
Table des matières
1 Voabulaire . . . 2
2 Indiateurs d'une série statistique . . . 4
a ) Indiateurs de position . . . 4
b ) Indiateurs de dispersion . . . 5
) Caluls des indiateurs . . . 5
d ) Exemples . . . 6
3 Programme . . . 7
•
Faire des statistiques, 'est reueillir, organiser, synthétiser, représenter et exploiter desdonnées,numériquesounon,dansunbutdeomparaison,deprévision,deonstat...•
Lesplusgrosonsommateursdestatistiquessontlesassureurs(risquesd'aidents, demaladiedesassurés),lesmédeins(épidémiologie),lesdémographes(populationsetleur dynamique),leséonomistes(emploi,onjontureéonomique),lesmétéoro-
logues ...
1 Voabulaire
Dénition 1 : Population - Individu
Une étude statistique est un ensemble de valeur qui est reueilli pour étudier ertains
ritères.
La population d'une étude statistique est l'ensemble des individus sur lesquels portent
ette étude.
Exemple:L'ensembledesélèvesdelalassedeseonde17peut-êtrelapopulationétudiée;
Chaque élève de ettelasse sera un individu de ette étude.
Dénition 2 : Caratère Qualitatif/Quantitatif Disret/Continu
Le aratère (ouvariable) d'une série statistique est l'information étudiée.
•
Lorsquelearatère neprendquedes valeurs(oumodalités) numériques,ilest quan- titatif :⋄
disret s'ilne peut prendre que des valeursisolées (notes, âge ...)⋄
ontinu dans le as ontraire (poids, taille ...). Dans e as on eetue souvent unregroupement des valeurs par lasses.
•
Sinon, on dit qu'il est qualitatif (ouleur des yeux, sport pratiqué ...) : le aratèren'est pas mesuré par des nombres.
Exemples : Dans la populationdes élèves de seonde 17du lyée de Sens :
1
. avoir le brevet est un aratère (ou variable) qualitatif prenant deux valeurs : ouiou non;
2
. lenombrede frèreetdesoeurd'unélèveestun aratère quantitatifdisret;ilpeut prendre lesvaleurs 0,1,2,3, ... ;3
. la taille des élèves est un aratère quantitatif ontinu. Il peut prendre toutes les valeurs omprises entre 1,50 m et 1,80m. On peut regrouper es valeurs dans deslasses d'étendue (ou amplitude)10 m :
[1, 50; 1, 60[
puis[1, 60; 1, 70[
,...Dénition 3 : Eetif - Fréquene - Distribution des fréquenes
A haque valeur (ou lasse) du aratère est assoiée un eetif
n
: 'est le nombred'individus assoiés à ette valeur.
On peut aussi assoier à haque valeur de l'étude une fréquene : 'est la proportion
(pourentage) que repésente ette valeur au seinde l'étude.
Le tableau donnant lesfréquenes de toutes lesvaleursdu aratère d'unesérie statistique
est appelé distribution des fréquenes.
Remarques :
•
Lafréquene d'une valeurd'un aratère est un nombrerationnelomprisentre 0et1.•
Lasommedes fréquenesd'unesérie statistiquedoit toujoursêtre égaleà1.Unelégère impréision peut être observée si on utilise des valeurs approhées au lieu des valeursexates.
•
Lesfréquenespeuventêtredonnées sous formefrationnelle,déimaleouen pourent- age. Parexemple,1
22 = 0, 0455 = 4, 55%
.Frequencies
Thefrequeny ofanevent
i
isthe numbern i
of timesthe event ourred intheexper-imentorthe study.Wespeak of absolute frequenies,whenthe ounts
n i
themselvesare given and of (relative) frequenies, when those are divided by the total number
of events. Sometimes allthe relative frequenies are gatherin a frequeny table.
Exemple : On onsidère la série statistique onstituée par l'ensemble des notes des 22
élèves d'une lasse de seonde à un devoir. Le tableau des eetifs préise le nombre
d'élèves orrespondant ayant obtenu haque note entière.
Note 4 6 9 10 11 12 13 14 15 16 17 19
Eetif 1 1 2 1 1 3 5 1 2 1 2 2
Le aratère étudié est dans e as la note à un devoir, 'est un aratère qualitatif.
L'eetif total est de 22. A titre d'exemple, l'eetifde lanote
13
est5
.Les fréquenes des notes sont données i-dessous :
Note Fréquene Note Fréquene Note Fréquene
4
1
22 = 0, 0455
1122 1 = 0, 0455
1522 2 = 0, 0909
6
1
22 = 0, 0455
1222 3 = 0, 1364
1622 1 = 0, 0455
9
2
22 = 0, 0909
1322 5 = 0, 2273
1722 2 = 0, 0909
10
1
22 = 0, 0455
1422 1 = 0, 0455
1922 2 = 0, 0909
Dénition 4 : Eetif umulé roissant
L'
deneetif umulé roissant (ECC) orrespondant à une valeur
x i
d'un aratère estla somme des eetifs des valeurs inférieures ou égales à
x i
.On dénit de manière analogueles fréquenes umulées roissantes.
Exemple : Reprenons l'exemple des notes d'une lasse de 22 élèves. Les eetifs umulés
roissantssontdonnésdansletableausuivant.Ilestimportantd'yfairegurerlesvaleurs
dont l'eetifest nul,ar e n'est pas le as pour l'ECC.
Note 1 2 3 4 5 6 7 8 9 10
E. 0 0 0 1 0 1 0 0 2 1
ECC 0 0 0 1 1 2 2 2 4 5
Note 11 12 13 14 15 16 17 18 19 20
E. 1 3 5 1 2 1 2 0 2 0
ECC 6 9 14 15 17 18 20 20 22 22
Cumulative frequency
The umulative frequeny orresponding to a partiular value is the sum of all the
frequeniesup toand inluding that value.
2 Indiateurs d'une série statistique
a ) Indiateurs de position
Dénition 5 : Moyenne, Médiane, Quartiles
La moyenne d'une série statistique à aratère quantitatif est la valeur que prendraient
les valeurs de ette série si elles étaient toutes égales.
La médiane d'une série statistique dont les valeurs sont rangées par ordre roissant est
la valeur, notée Med, tel que 50% des individus au moins ont une valeur inférieure ou
égale à Med et tel que 50% des individus au moins ont une valeur supérieure ou égale à
Med.
Lepremier quartiled'unesériestatistique estlaplus petitevaleur de lasérie statistique
telle qu'au moins 25% des valeurs soient inférieures ou égales à ette valeur. On le note
Q1
.Le troisième quartile d'une série statistique est la plus petite valeur telle qu'au moins
75% des valeurs soient inférieures ou égales à ette valeur. On le note
Q3
.Remarques :
•
Lesdénitions préédentes n'ontauunsens sionne peut pas lasseres valeurs. C'estpouquoi es indiateurs ne sont alulablesque pour des séries à aratère quantitatif.
•
On pourraitroire qu'une médianeoupeune série statistiqueen deux parties de taille égale mais e n'est pas toujours le as. Par exemple, la médianede la série : 2 3 33 4est 3.Pour ettesérie, 4 valeurs sur 5 (soit 80%)sont inférieuresou égalesà la
médiane. La proportion de valeurssupérieures ouégales à lamédianeest lamême.
Arithmetic mean
The arithmeti mean (usually alled the average) an be easily omputed : total the
items and the divide by the number of item. When one or a number of items is used
several times, those itemshave moreweight.In this ase, youompute the weighted
meanby multiplingeah value by its absolutefrequeny and then divide the result by
the number of item. There is a third way to ompute, this one from the frequenies :
multiplyeahvalue by its frequeny and add all the results.
Median
Intuitively,amedianisanumberseparating apopulationintwohalves.Themedianof
anitelistofnumbers an befound byarranging allthe observations fromlowest value
tohighestvalue andpikingthe middleone. Ifthereisaneven numberof observations,
the median is not unique, so one often takes the mean of the two middle values. At
mosthalfthe populationhavevalues less thanthe medianand atmost halfhave values
greaterthan the median.
Quartiles
In desriptive statistis, a quartile is any of the three values whih divide the sorted
data set into four equal parts, so that eah part represents one fourth of the sampled
population.
b ) Indiateurs de dispersion
Dénition 6 : Étendue, éart inter-quartile
L'étendue ou amplitude d'une série statistique est la diérene entre la plus grande et
laplus petite des valeurs prises par ette série.
L'éart interquartile est égalà ladiérene
Q3 − Q1
.Le mode (ou la lasse modale) d'une série statistique est la valeur (ou la lasse) de la
série qui orrespond au plus grand eetif.
) Caluls des indiateurs
Théorème 1 : Calul de la moyenne
Il existetroisfaçonsde aluler lamoyenne d'unesérie statistique. Ilsdépendent dela
façon dont les données sont fournies:
•
alul à partir de la liste des données brutesx 1
,x 2
, ...,x p
.x = x 1 + x 2 + · · · + x p p
•
alul à partir du tableaux des eetifs :Caratères
x 1 x 2 · · · x q
Eetifs
n 1 n 2 · · · n q x = n 1 x 1 + n 2 x 2 + ... + n q x q
n 1 + n 2 + ... + n q
•
alul de lamoyenne à partir de la distribution des fréquenes.Caratères
x 1 x 2 · · · x q
Fréquenes
f 1 f 2 · · · f q x = f 1 x 1 + f 2 x 2 + · · · + f q x q
Remarques :
•
Lorsquelasérieest regroupéeen lasses,onalulelamoyenneen prenantpourvaleursx i
le entre de haque lasse; e entre est obtenu en faisant la moyenne des deuxextrémités de lalasse.
•
On appelle moyenne élaguée d'une série statistique une moyenne qui ne tient pas ompte des valeurs non représentatives de la série. Par exemple, dans une enquetesur lenombre d'enfants des personnes interrogés, on ne tient pas ompte des réponses
supérieuresà
30
.Démonstration :
1
. Celarésultedeladénitionarladivisiondutotaldesvaleursdelasérieindiquelepartageen partieségales.
2
. Cela résultede laformulepréédente danslaquelleon a remplaéx k + x k + · · · + x k
parx k × n k
.3
. Partons delaformulepréédente.x = n 1 x 1 + n 2 x 2 + · · · + n q x q
n 1 + n 2 + · · · + n q
D'après lesrègles dealulsur lesfrations,lamoyenne estégale à:
x = n 1
p x 1 + n 2
p x 2 + · · · + n q p x q
Or, par dénition, ona
f i = n i
p
.Ondéduit diretement l'égalitédu théorème.♣
Théorème 2 : Calul de la valeur médiane
Soit une série statistique ordonnée dont les
p
valeurs sontx 1 6 x 2 6 · · · 6 x p
•
Sip
est impair, la médiane de lasérie est la valeur qui est située au rangp+1 2
,•
Sip
est pair,lamédianede lasérieestunevaleur ompriseentrex p
2
et
x p
2 +1
. Leplussouvent on prend la moyenne de es deuxvaleurs, mais ela n'a rien d'obligatoire.
Théorème 3 : Calul des quartiles
Pour déterminerle premier quartiled'une série de
N
valeurs ordonnées,on aluleN 4
puis on détermine le premier entier
p
supérieur ou égal àN 4
; et entierp
est le rangde
Q1
.Pour
Q3
, on fait de même en remplaçantN 4
par3 4 N
.d ) Exemples
Exerie 1 : Déterminer la moyenne, la médiane, les quartiles, l'éart interquartile et
l'étenduedehaunedessériesstatistiquessuivantes:
1
.2 − 5 − 6 − 8 − 9 − 9 − 10 2
.8 − 2 − 9 − 6 − 5 − 8
3
. Taille [1,5;1,6 [ [1,6;1,7[ [1,7;1,8[ [1,8;1,9[Eetifs 5 16 9 2
Solution 1 :
1
.•
Lamoyenneestx = 2+5+6+8+9+9+10
7 = 7
•
Ily a 7valeurs.7+1 2 = 4
. Lamédiane est laquatrième valeur de lasérie, 'est à dire8.• 7
4 = 1 , 75
.Lepremierquartileest ladeuxièmevaleurdonQ 1 = 5
.• 3 × 7
4 = 5 , 25
.LetroisièmequartileestlasixièmevaleurdonQ 3 = 9
.•
L'éartinterquartileestQ 3 − Q 1 = 9 − 5 = 4
.•
L'étendueest10 − 2 = 8
.2
.• x = 8+2+9+6+5+8 6 = 6 , 3
•
Attention,ilfautommenerparlasserlesvaleursparordreroissant.Il ya 6valeurs.
6
2 = 3
. La médianeest une valeursituée entre la troisième et la quatrièmevaleur.Onpeuthoisirparexemple7
ommemédiane.• 6
4 = 1 , 5
.LepremierquartileestladeuxièmevaleurdonQ 1 = 5
.• 3 × 6
4 = 4 , 5
.Le troisièmequartile estlainquièmevaleurdonQ 3 = 8
.•
L'éartinterquartileestQ 3 − Q 1 = 8 − 5 = 3
.•
L'étendueest de9 − 2 = 7
.3
.• x = 1,55×5+1,65×16+1,75×9+1,85×2
32 = 1 , 675
.•
Ilya5 + 16 + 9 + 2 = 32
valeurs.32
2 = 16
.Lamédianeestlalasseentrelaseizième etdix-septièmevaleursoit[1,6;1,7[• 32
4 = 8
.Le premierquartileest lahuitièmevaleurdonilsetrouvedanslalasse [1,6;1,7[3 × 8
4 = 24
. Le troisième quartile est la vingt-quatrième valeurdon il setrouve danslalasse[1,7;1,8[.•
L'étendueest de1 , 9 − 1 , 5 = 0 , 4
.Remarque : C'est unabusde languagedeparlerd'étendue. En eet, riendans le
tableaunepermetd'armerquelesvaleursextrêmessont
1 , 5
et1 , 9
.3 Programme