• Aucun résultat trouvé

Chapitre II

N/A
N/A
Protected

Academic year: 2022

Partager "Chapitre II"

Copied!
8
0
0

Texte intégral

(1)

Chapitre II

Statistiques

1 er

otobre 2010

Table des matières

1 Voabulaire . . . 2

2 Indiateurs d'une série statistique . . . 4

a ) Indiateurs de position . . . 4

b ) Indiateurs de dispersion . . . 5

) Caluls des indiateurs . . . 5

d ) Exemples . . . 6

3 Programme . . . 7

Faire des statistiques, 'est reueillir, organiser, synthétiser, représenter et exploiter desdonnées,numériquesounon,dansunbutdeomparaison,deprévision,deonstat...

Lesplusgrosonsommateursdestatistiquessontlesassureurs(risquesd'aidents, demaladiedesassurés),lesmédeins(épidémiologie),lesdémographes(populations

etleur dynamique),leséonomistes(emploi,onjontureéonomique),lesmétéoro-

logues ...

(2)

1 Voabulaire

Dénition 1 : Population - Individu

Une étude statistique est un ensemble de valeur qui est reueilli pour étudier ertains

ritères.

La population d'une étude statistique est l'ensemble des individus sur lesquels portent

ette étude.

Exemple:L'ensembledesélèvesdelalassedeseonde17peut-êtrelapopulationétudiée;

Chaque élève de ettelasse sera un individu de ette étude.

Dénition 2 : Caratère Qualitatif/Quantitatif Disret/Continu

Le aratère (ouvariable) d'une série statistique est l'information étudiée.

Lorsquelearatère neprendquedes valeurs(oumodalités) numériques,ilest quan- titatif :

disret s'ilne peut prendre que des valeursisolées (notes, âge ...)

ontinu dans le as ontraire (poids, taille ...). Dans e as on eetue souvent un

regroupement des valeurs par lasses.

Sinon, on dit qu'il est qualitatif (ouleur des yeux, sport pratiqué ...) : le aratère

n'est pas mesuré par des nombres.

Exemples : Dans la populationdes élèves de seonde 17du lyée de Sens :

1

. avoir le brevet est un aratère (ou variable) qualitatif prenant deux valeurs : oui

ou non;

2

. lenombrede frèreetdesoeurd'unélèveestun aratère quantitatifdisret;ilpeut prendre lesvaleurs 0,1,2,3, ... ;

3

. la taille des élèves est un aratère quantitatif ontinu. Il peut prendre toutes les valeurs omprises entre 1,50 m et 1,80m. On peut regrouper es valeurs dans des

lasses d'étendue (ou amplitude)10 m :

[1, 50; 1, 60[

puis

[1, 60; 1, 70[

,...

Dénition 3 : Eetif - Fréquene - Distribution des fréquenes

A haque valeur (ou lasse) du aratère est assoiée un eetif

n

: 'est le nombre

d'individus assoiés à ette valeur.

On peut aussi assoier à haque valeur de l'étude une fréquene : 'est la proportion

(pourentage) que repésente ette valeur au seinde l'étude.

Le tableau donnant lesfréquenes de toutes lesvaleursdu aratère d'unesérie statistique

est appelé distribution des fréquenes.

Remarques :

Lafréquene d'une valeurd'un aratère est un nombrerationnelomprisentre 0et1.

Lasommedes fréquenesd'unesérie statistiquedoit toujoursêtre égaleà1.Unelégère impréision peut être observée si on utilise des valeurs approhées au lieu des valeurs

exates.

Lesfréquenespeuventêtredonnées sous formefrationnelle,déimaleouen pourent- age. Parexemple,

1

22 = 0, 0455 = 4, 55%

.

(3)

Frequencies

Thefrequeny ofanevent

i

isthe number

n i

of timesthe event ourred intheexper-

imentorthe study.Wespeak of absolute frequenies,whenthe ounts

n i

themselves

are given and of (relative) frequenies, when those are divided by the total number

of events. Sometimes allthe relative frequenies are gatherin a frequeny table.

Exemple : On onsidère la série statistique onstituée par l'ensemble des notes des 22

élèves d'une lasse de seonde à un devoir. Le tableau des eetifs préise le nombre

d'élèves orrespondant ayant obtenu haque note entière.

Note 4 6 9 10 11 12 13 14 15 16 17 19

Eetif 1 1 2 1 1 3 5 1 2 1 2 2

Le aratère étudié est dans e as la note à un devoir, 'est un aratère qualitatif.

L'eetif total est de 22. A titre d'exemple, l'eetifde lanote

13

est

5

.

Les fréquenes des notes sont données i-dessous :

Note Fréquene Note Fréquene Note Fréquene

4

1

22 = 0, 0455

11

22 1 = 0, 0455

15

22 2 = 0, 0909

6

1

22 = 0, 0455

12

22 3 = 0, 1364

16

22 1 = 0, 0455

9

2

22 = 0, 0909

13

22 5 = 0, 2273

17

22 2 = 0, 0909

10

1

22 = 0, 0455

14

22 1 = 0, 0455

19

22 2 = 0, 0909

Dénition 4 : Eetif umulé roissant

L'

deneetif umulé roissant (ECC) orrespondant à une valeur

x i

d'un aratère est

la somme des eetifs des valeurs inférieures ou égales à

x i

.

On dénit de manière analogueles fréquenes umulées roissantes.

Exemple : Reprenons l'exemple des notes d'une lasse de 22 élèves. Les eetifs umulés

roissantssontdonnésdansletableausuivant.Ilestimportantd'yfairegurerlesvaleurs

dont l'eetifest nul,ar e n'est pas le as pour l'ECC.

Note 1 2 3 4 5 6 7 8 9 10

E. 0 0 0 1 0 1 0 0 2 1

ECC 0 0 0 1 1 2 2 2 4 5

Note 11 12 13 14 15 16 17 18 19 20

E. 1 3 5 1 2 1 2 0 2 0

ECC 6 9 14 15 17 18 20 20 22 22

Cumulative frequency

The umulative frequeny orresponding to a partiular value is the sum of all the

frequeniesup toand inluding that value.

(4)

2 Indiateurs d'une série statistique

a ) Indiateurs de position

Dénition 5 : Moyenne, Médiane, Quartiles

La moyenne d'une série statistique à aratère quantitatif est la valeur que prendraient

les valeurs de ette série si elles étaient toutes égales.

La médiane d'une série statistique dont les valeurs sont rangées par ordre roissant est

la valeur, notée Med, tel que 50% des individus au moins ont une valeur inférieure ou

égale à Med et tel que 50% des individus au moins ont une valeur supérieure ou égale à

Med.

Lepremier quartiled'unesériestatistique estlaplus petitevaleur de lasérie statistique

telle qu'au moins 25% des valeurs soient inférieures ou égales à ette valeur. On le note

Q1

.

Le troisième quartile d'une série statistique est la plus petite valeur telle qu'au moins

75% des valeurs soient inférieures ou égales à ette valeur. On le note

Q3

.

Remarques :

Lesdénitions préédentes n'ontauunsens sionne peut pas lasseres valeurs. C'est

pouquoi es indiateurs ne sont alulablesque pour des séries à aratère quantitatif.

On pourraitroire qu'une médianeoupeune série statistiqueen deux parties de taille égale mais e n'est pas toujours le as. Par exemple, la médianede la série : 2 3 3

3 4est 3.Pour ettesérie, 4 valeurs sur 5 (soit 80%)sont inférieuresou égalesà la

médiane. La proportion de valeurssupérieures ouégales à lamédianeest lamême.

Arithmetic mean

The arithmeti mean (usually alled the average) an be easily omputed : total the

items and the divide by the number of item. When one or a number of items is used

several times, those itemshave moreweight.In this ase, youompute the weighted

meanby multiplingeah value by its absolutefrequeny and then divide the result by

the number of item. There is a third way to ompute, this one from the frequenies :

multiplyeahvalue by its frequeny and add all the results.

Median

Intuitively,amedianisanumberseparating apopulationintwohalves.Themedianof

anitelistofnumbers an befound byarranging allthe observations fromlowest value

tohighestvalue andpikingthe middleone. Ifthereisaneven numberof observations,

the median is not unique, so one often takes the mean of the two middle values. At

mosthalfthe populationhavevalues less thanthe medianand atmost halfhave values

greaterthan the median.

Quartiles

In desriptive statistis, a quartile is any of the three values whih divide the sorted

data set into four equal parts, so that eah part represents one fourth of the sampled

population.

(5)

b ) Indiateurs de dispersion

Dénition 6 : Étendue, éart inter-quartile

L'étendue ou amplitude d'une série statistique est la diérene entre la plus grande et

laplus petite des valeurs prises par ette série.

L'éart interquartile est égalà ladiérene

Q3 − Q1

.

Le mode (ou la lasse modale) d'une série statistique est la valeur (ou la lasse) de la

série qui orrespond au plus grand eetif.

) Caluls des indiateurs

Théorème 1 : Calul de la moyenne

Il existetroisfaçonsde aluler lamoyenne d'unesérie statistique. Ilsdépendent dela

façon dont les données sont fournies:

alul à partir de la liste des données brutes

x 1

,

x 2

, ...,

x p

.

x = x 1 + x 2 + · · · + x p p

alul à partir du tableaux des eetifs :

Caratères

x 1 x 2 · · · x q

Eetifs

n 1 n 2 · · · n q x = n 1 x 1 + n 2 x 2 + ... + n q x q

n 1 + n 2 + ... + n q

alul de lamoyenne à partir de la distribution des fréquenes.

Caratères

x 1 x 2 · · · x q

Fréquenes

f 1 f 2 · · · f q x = f 1 x 1 + f 2 x 2 + · · · + f q x q

Remarques :

Lorsquelasérieest regroupéeen lasses,onalulelamoyenneen prenantpourvaleurs

x i

le entre de haque lasse; e entre est obtenu en faisant la moyenne des deux

extrémités de lalasse.

On appelle moyenne élaguée d'une série statistique une moyenne qui ne tient pas ompte des valeurs non représentatives de la série. Par exemple, dans une enquete

sur lenombre d'enfants des personnes interrogés, on ne tient pas ompte des réponses

supérieuresà

30

.

Démonstration :

1

. Celarésultedeladénitionarladivisiondutotaldesvaleursdelasérieindiquelepartage

en partieségales.

2

. Cela résultede laformulepréédente danslaquelleon a remplaé

x k + x k + · · · + x k

par

x k × n k

.

3

. Partons delaformulepréédente.

x = n 1 x 1 + n 2 x 2 + · · · + n q x q

n 1 + n 2 + · · · + n q

(6)

D'après lesrègles dealulsur lesfrations,lamoyenne estégale à:

x = n 1

p x 1 + n 2

p x 2 + · · · + n q p x q

Or, par dénition, ona

f i = n i

p

.Ondéduit diretement l'égalitédu théorème.

Théorème 2 : Calul de la valeur médiane

Soit une série statistique ordonnée dont les

p

valeurs sont

x 1 6 x 2 6 · · · 6 x p

Si

p

est impair, la médiane de lasérie est la valeur qui est située au rang

p+1 2

,

Si

p

est pair,ladianede lasérieestunevaleur ompriseentre

x p

2

et

x p

2 +1

. Leplus

souvent on prend la moyenne de es deuxvaleurs, mais ela n'a rien d'obligatoire.

Théorème 3 : Calul des quartiles

Pour déterminerle premier quartiled'une série de

N

valeurs ordonnées,on alule

N 4

puis on détermine le premier entier

p

supérieur ou égal à

N 4

; et entier

p

est le rang

de

Q1

.

Pour

Q3

, on fait de même en remplaçant

N 4

par

3 4 N

.

d ) Exemples

Exerie 1 : Déterminer la moyenne, la médiane, les quartiles, l'éart interquartile et

l'étenduedehaunedessériesstatistiquessuivantes:

1

.

2 − 5 − 6 − 8 − 9 − 9 − 10 2

.

8 − 2 − 9 − 6 − 5 − 8

3

. Taille [1,5;1,6 [ [1,6;1,7[ [1,7;1,8[ [1,8;1,9[

Eetifs 5 16 9 2

Solution 1 :

1

.

Lamoyenneest

x = 2+5+6+8+9+9+10

7 = 7

Ily a 7valeurs.

7+1 2 = 4

. Lamédiane est laquatrième valeur de lasérie, 'est à dire8.

• 7

4 = 1 , 75

.Lepremierquartileest ladeuxièmevaleurdon

Q 1 = 5

.

• 3 × 7

4 = 5 , 25

.Letroisièmequartileestlasixièmevaleurdon

Q 3 = 9

.

L'éartinterquartileest

Q 3 − Q 1 = 9 − 5 = 4

.

L'étendueest

10 − 2 = 8

.

2

.

• x = 8+2+9+6+5+8 6 = 6 , 3

Attention,ilfautommenerparlasserlesvaleursparordreroissant.

Il ya 6valeurs.

6

2 = 3

. La médianeest une valeursituée entre la troisième et la quatrièmevaleur.Onpeuthoisirparexemple

7

ommemédiane.

• 6

4 = 1 , 5

.Lepremierquartileestladeuxièmevaleurdon

Q 1 = 5

.

• 3 × 6

4 = 4 , 5

.Le troisièmequartile estlainquièmevaleurdon

Q 3 = 8

.

L'éartinterquartileest

Q 3 − Q 1 = 8 − 5 = 3

.

L'étendueest de

9 − 2 = 7

.

3

.

• x = 1,55×5+1,65×16+1,75×9+1,85×2

32 = 1 , 675

.

Ilya

5 + 16 + 9 + 2 = 32

valeurs.

32

2 = 16

.Lamédianeestlalasseentrelaseizième etdix-septièmevaleursoit[1,6;1,7[

(7)

• 32

4 = 8

.Le premierquartileest lahuitièmevaleurdonilsetrouvedanslalasse [1,6;1,7[

3 × 8

4 = 24

. Le troisième quartile est la vingt-quatrième valeurdon il setrouve danslalasse[1,7;1,8[.

L'étendueest de

1 , 9 − 1 , 5 = 0 , 4

.

Remarque : C'est unabusde languagedeparlerd'étendue. En eet, riendans le

tableaunepermetd'armerquelesvaleursextrêmessont

1 , 5

et

1 , 9

.

3 Programme

Rappel des notions vues lors des années précédentes

Classe de sixième Représentations usuelles :

• diagrammes en bâtons ;

• diagrammes circulaires ou demi-circulaires,

• graphiques cartésiens.

Lire, utiliser et interpréter des informations à partir d’une représentation graphique simple.

Classe de cinquième

• Calculer des effectifs.

• Calculer des fréquences.

• Regrouper des données en classe d’égale amplitude.

Les élèves sont entraînés à lire, interpréter et représenter des données en utilisant un vocabulaire adéquat dans des con- textes qui leur sont familiers.

Le calcul d’effectifs cumulés n’est pas un attendu.

Les écritures 10 4 , 2 5 , 0, 4, 40% sont utilisées pour désigner une fréquence : elles permettent d’insister sur les diverses représen- tations d’un même nombre.

• Lire et interpréter des informations à partir d’un tableau ou d’une représentation graphique diagrammes divers, his- togramme).

• Présenter des données sous la forme d’un tableau, les

représenter sous la forme d’un diagramme ou d’un his-

togramme (dans ce cas les classes sont toujours de même

amplitude).

(8)

Classe de quatrième

• Moyennes pondérées : Calculer la moyenne d’une série de données.

• Créer, modifier une feuille de calcul, insérer une formule.

• Créer un graphique à partir des données d’une feuille de cal- cul.

Les élèves sont confrontés à des situations familières où deux procédés de calcul différents de la moyenne sont mis en œu- vre :

• somme des n données divisée par n ;

• moyenne pondérée des valeurs par leurs effectifs.

Les élèves doivent savoir calculer, pour de petits effectifs, une moyenne par la procédure de leur choix. Pour des effectifs plus grands, cette procédure est basée sur l’usage du tableur ou de la calculatrice.

Classe de troisième

• Caractéristiques de position.

• Approche de caractéristiques de dispersion.

Une série statistique étant donnée (sous forme de liste ou de tableau ou par une représentation graphique) :

• déterminer une valeur médiane de cette série et en donner la signification ;

• déterminer des valeurs pour les premier et troisième quartiles et en donner la signification ;

• déterminer son étendue.

Le travail est conduit aussi souvent que possible en liaison avec les autres disciplines dans des situations où les données sont ex- ploitables par les élèves.

L’utilisation d’un tableur permet d’avoir accès à des situations plus riches que celles qui peuvent être traitées « à la main ».

La notion de dispersion est à relier, sur des exemples, au prob- lème posé par la disparité des mesures d’une grandeur, lors d’une activité expérimentale, en particulier en physique et chimie.

Programme de seconde

Caractéristiques de position et de dispersion : médiane, quar- tiles, moyenne.

• Utiliser un logiciel (par exemple, un tableur) ou une calcula- trice pour étudier une série statistique.

• Passer des effectifs aux fréquences, calculer les caractéris- tiques d’une série définie par effectifs ou fréquences.

• Calculer des effectifs cumulés, des fréquences cumulées.

• Représenter une série statistique graphiquement (nuage de points, histogramme, courbe des fréquences cumulées).

L’objectif est de faire réfléchir les élèves sur des données réelles,

riches et variées (issues, par exemple, d’un fichier mis à dis-

position par l’INSEE), synthétiser l’information et proposer des

représentations pertinentes.

Références

Documents relatifs

• Le premier quartile, noté Q 1 , est la plus petite valeur de la série telle qu’au moins 25% des valeurs lui soient inférieures ou égales.. • Le troisième quartile, noté Q 3

* , est la plus petite valeur de la série telle qu’au moins 25% des valeurs lui soient inférieurs ou égales.. 0 , est la plus petite valeur de la série telle qu’au moins 75%

• Le premier quartile d’une série statistique est la plus petite valeur de la série, notée Q 1 , telle qu’au moins 25% des valeurs de la série sont inférieures ou égales à

• Le premier quartile noté Q 1 de la série statistique est la plus petite valeur telle qu'au moins 25% des valeurs lui soient inférieures ou égale ;.. • le troisième

Le premier quartile d’une série statistique numérique est la plus petite valeur prise par le caractère telle qu’au moins 25 % des valeurs lui soient inférieures ou égales.

Le troisième quartile q 3 de la série est la plus petite valeur de la série telle qu’au moins les trois quarts des valeurs de la série lui sont inférieures ou

Le troisième Quartile Q 3 est la plus petite valeur de la série telle qu’au moins 75% des valeurs de celle-ci lui sont inférieures ou égales..

• Premier quartile q 1 : C’est la plus petite valeur de la série, telle qu’au moins 25% des données lui sont inférieures ou égales. • Deuxième quartile q 2 : C’est