INTRODUCTION A LA STATISTIQUE
I INTRODUCTION
II
TABLEAUX ET GRAPHES III
ANALYSE D'UNE DISTRIBUTION DE FREQUENCES IV
ANALYSE CO Μ BIN ΑΤΟΙ RE V
PRINCIPES G^NERAUX DU CALCUL DES PROBABILITES VI
LES LOIS DE PROBABILITG VII
LES TESTS STATISTIQUES
Emile Amzallag Norbert Piccioli
P R E M I E R S C Y C L E S U Ν I V Ε R S IΤ AI R Ε S
INTRODUCTION Α LA
STATISTIQUE
Exercices corriges
avec rappels detaillos de cours et exemples
A l ' u s a g e d e s e t u d i a n t s e n s c i e n c e s e c o n o m i q u e s , m e d e c i n e , p h a r m a c i e , e t c . a i n s i q u e d e s e l e v e s d e s s e c o n d s c y c l e s d e s l y c e e s e t d e s c l a s s e s p r e p a r a t o i r e s
a u x g r a n d e s e c o l e s s c i e n t i f i q u e s
Avec la collaboration de Francois Bry
Hermann - I L - Collection
Paris Meihodes
EMILE AMZALLAG, ne en 1932 au Maroc, I n g e n i e u r de l ' E c o l e s u p e r i e u r e d ' e l e c t r i c i t e , d o c t e u r es s c i e n c e s , e s t m a i t r e - a s s i s t a n t ä i ' U n i v e r - s i t e de P a r i s V I e t c h a r g e de c o u r s a L ' U n i v e r s i t e de P a r i s V.
NORBERT P I C C I O L I , ne en 1941 en A l g e r i e , d o c t e u r de 3e c y c l e , e s t m a t t r e - a s s i s t a n t a 1 ' U n i v e r s i t e de P a r i s V I .
Tous deux e f f e c t u e n t des r e c h e r c h e s s u r l e s p r o p r i e t e s o p t i q u e s des s e m i - c o n d u c t e u r s au L a b o r a t o i r e de p h y s i q u e des s o l i d e s de 1 ' U n i v e r - s i t e P i e r r e e t M a r i e C u r i e .
FRANCOIS ERY, ne e n 1956 a P a r i s , a passe l a m a i t r i s e de m a t h e m a t i q u e s en 1978 ; i l a f a i t ses e t u d e s a l'UER des m a t h e m a t i q u e s de l a d e c i - s i o n ä 1 ' U n i v e r s i t e P a r i s X I D a u p h i n e , ou i l s ' e s t i n i t i e a u x mathe- m a t i q u e s a p p l i q u e e s ä l ' e c o n o m i e avec I . E k e l a n d ; i l se c o n s a c r e ä p r e s e n t aux m a t h e m a t i q u e s p u r e s .
ISBN 2 7056 5889 0
1978, Hermann 293 r u e L e c o u r b e , 75015 P a r i s
Tous d r o i t s de r e p r o d u c t i o n , meme f r a g m e n t a i r e , sous q u e l q u e forme que ce s o i t , y c o m p r i s P h o t o g r a p h i e , m i c r o f i l m , bände m a g n e t i q u e , d i s q u e ou a u t r e , r e s e r v e s p o u r t o u s p a y s .
Table
CHAPITRE 1; INTRODUCTION 1 I . La s t a t i s t i q u e 1 II· Notions de base 1 I I I . La methode s t a t i s t i q u e 3
CHAPITRE 2; TABLEAUX ET GRAPHES 6
A. TABLEAUX 6 I . Tableau de frequences a un c a r a c t e r e 6
I I . Tableau de frequences cumulees 7 I I I . Tableau de frequences ä deux c a r a c t e r e s 8
IV. Cas d!une s e r i e q u a n t i t a t i v e c o n t i n u e 9
Β. REPRESENTATIONS GRAPHIQUES 11 I . Caractere d i s c o n t i n u . Diagramme en batons 11
I I . Caractere c o n t i n u . Histogramme 13 E x e r c i c e s : B. R e p r e s e n t a t i o n s graphiques 19 CHAPITRE 3: ANALYSE D1UNE DISTRIBUTION DE FREQUENCES 25
A. PARAMETRES DE POSITION 27
I . Les moyennes 27 I I . La mediane 33 I I I . Les p e r c e n t i l e s 36 IV. Mode ou dominante 37 V. Comparaison des d i f f e r e n t s parametres de
p o s i t i o n 37 Β. PARAMETRES DE DISPERSION 39
I . E c a r t moyen a r i t h m e t i q u e 40 I I . V a r i a n c e . E c a r t - t y p e 40 I I I . Moments d!une s e r i e s t a t i s t i q u e 43
E x e r c i c e s : A. Parametres de p o s i t i o n 44 Β. Parametres de d i s p e r s i o n 47 CHAPITRE 4: ANALYSE COMBINATOIRE 55
A. ARRANGEMENTS 57
I . D e f i n i t i o n . C a l c u l de AP 57
η
I I . Arrangements avec r e p e t i t i o n 58
Β. PERMUTATIONS 60 I . D e f i n i t i o n . C a l c u l de Ρ 60
η
I I . Permutations avec r e p e t i t i o n 61 I I I . Permutation c i r c u l a i r e 61
C. COMBINAISONS 63
I . D e f i n i t i o n . C a l c u l de CP 63
η
I I . Permutations avec r e p e t i t i o n s e t
combinaisons 64 I I I . Binome de Newton 65
IV. Combinaisons avec r e p e t i t i o n 66
E x e r c i c e s : A. Arrangements 67 B. Permutations 69 C. Combinaisons 71 CHAPITRE 5: CALCUL DES PROBABILITES 81
A. LOGIQUE DES ΕVEΝΕΜΕNTS 81
I . I n t r o d u c t i o n 81 I I . Notions de base 82 I I I . Logique des evenements 84
Β. PROBABILITE 87 I . P r o b a b i l i t e uniforme 87
I I . P r o b a b i l i t e e t frequence 88 I I I . D e f i n i t i o n dfune p r o b a b i l i t e 89
C. PROBABILITES TOTALES 93 I . Theoreme des p r o b a b i l i t e s t o t a l e s 94
I I . G e n e r a l i s a t i o n 94 D. PROBABILITES COMPOSEES ET THEOREME DE BAYES 96
I . D e f i n i t i o n d'une p r o b a b i l i t e composee 96
I I . Evenements independants 97 I I I . Theoreme de Bayes 97 Ε. EXEMPLES COMPLEMENTAIRES 101
I . L o i binömiale 101 I I . L o i hypergeometrique 102
E x e r c i c e s : A. Logique des evenements 104
B. P r o b a b i l i t e 109
Ce P r o b a b i l i t e s t o t a l e s 117
D. P r o b a b i l i t e s composees e t theoreme de Bayes 125
E. Exercices complementaires 135
CHAPITRE 6: LES LOIS DE PROBABILITE 141 A. VARIABLES ALEATOIRES 141
I . I n t r o d u c t i o n 141 I I . L o i de p r o b a b i l i t e , f o n c t i o n de r e p a r t i -
t i o n , d e n s i t e de p r o b a b i l i t e 143 I I I . Esperance mathematique e t moments 146
IV. I n e g a l i t e de Bienayme-Tchebycheff. L o i des
grands nombres 148 B. LOI BINOMIALE 151
I . D e f i n i t i o n 151 I I . Diagramme e t parametres c a r a c t e r i s t i q u e s 152
I I I . Approximations de l a l o i binömiale 153
C. LOI DE POISSON 154 I . D e f i n i t i o n 154 I I . Diagramme e t parametres c a r a c t e r i s t i q u e s 154
D. LOI NORMALE 158 I . D e f i n i t i o n 158 I I . Densite de p r o b a b i l i t e 159
I I I . F o n c t i o n de r e p a r t i t i o n 160 IV. Exemples d ' a p p l i c a t i o n 162 E x e r c i c e s : A. V a r i a b l e s a l e a t o i r e s 166
B. L o i binömiale 173 C. L o i de Poisson 184 D. L o i normale 192 CHAPITRE 7: LES TESTS STATISTIQUES 207
A. ECHANTILLONNAGE 209 I . D i s t r i b u t i o n des moyennes 209
I I . D i s t r i b u t i o n des frequences 211 I I I . Autres d i s t r i b u t i o n s d1e c h a n t i l l o n n a g e 212
B. ESTIMATION 214 I . E s t i m a t i o n p o n c t u e l l e 214
I I . E s t i m a t i o n par I n t e r v a l l e de c o n f i a n c e 216
I I I , N o r m a l i t e des f l u c t u a t i o n s d ' e c h a n t i -
llonnage 217 IV. I n t e r v a l l e de confiance d!une moyenne 221
V. I n t e r v a l l e de confiance d'une frequence 224
C. TESTS DE SIGNIFICATION 227 I . P r i n c i p e s des t e s t s d'hypothese 227
I I . Premiere a p p l i c a t i o n : l e s t e s t s de
c o n f o r m i t e 229 I I I . Deuxieme a p p l i c a t i o n : l e s t e s t s
d1homogeneite 235
D. TEST DU χ2 240
2
I . D i s t r i b u t i o n du χ 240 I I . C r i t e r e de Pearson 241 I I I . Test de c o n f o r m i t e 243
I V . Test d1homogeneite 246
E. AJUSTEMENT LINEAIRE - CORRELATION 249
I . I n t r o d u c t i o n 249 I I . D r o i t e de r e g r e s s i o n 251
I I I . C o e f f i c i e n t de c o r r e l a t i o n 251
I V . Tests d!hypothese 256
E x e r c i c e s : A. E c h a n t i l l o n n a g e 262 B. E s t i m a t i o n 269 C. Tests de s i g n i f i c a t i o n 277
D. Tests de χ2 289
Ε. Ajustement l i n e a i r e - c o r r e l a t i o n 301
NAISSANCE DU CALCUL DES PROBABILITES 311
TABLE 1 326 TABLE 2 328 TABLE 3 329 TABLE 4 330 TABLE 5 331 TABLE 6 332 TABLE 7 333 Index des symboles 335
Index 337
Avant-propos
Cet ouvrage e s t d e s t i n e aux e t u d i a n t s des premiers c y c l e s u n i - versitäres, aux eleves des classes p r e p a r a t o i r e s aux grandes ecoles s c i e n t i f i q u e s , a i n s i qu!ä tous ceux q u i d e s i r e n t s ' i n i t i e r au c a l c u l des p r o b a b i l i t e s e t a l a s t a t i s t i q u e . I I i n t e r e s s e r a specialement l e s e t u d i a n t s en sciences economiques e t ceux du premier c y c l e des etudes medicales e t d e n t a i r e s (P.C.E.M) ou de pharmacie.
C'est avant t o u t un l i v r e dfi n i t i a t i o n q u i v i s e a 1 ' a c q u i s i t i o n de techniques de base, plutöt qu'ä l1e t u d e de t h e o r i e s mathemati- ques f i n e s ou de problemes p h i l o s o p h i q u e s poses par l e s n o t i o n s de p r o b a b i l i t e ou d1i n d u c t i o n s t a t i s t i q u e . A f i n de repondre aux d i f f i c u l t e s que r e n c o n t r e n t l e s e t u d i a n t s pour passer du cours aux a p p l i c a t i o n s , 1Ouvrage r e u n i t des r a p p e l s d e t a i l l e s de cours v i s a n t ä f a m i l i a r i s e r l e l e c t e u r avec l e s n o t i o n s e s s e n t i e l l e s , de nombreux exemples d ' a p p l i c a t i o n , a i n s i qu'une c e n t a i n e d'exer- c i c e s c l a s s e s par o r d r e de d i f f i c u l t e c r o i s s a n t e e t s u i v i s de c o r r i g e s s u c c i n t s , p e r m e t t a n t de m e t t r e en p r a t i q u e e t de contrö- l e r l e s connaissances.
On expose d'abord l e s grandes l i g n e s de l a s t a t i s t i q u e d e s c r i p t i v e , oü i l s ' a g i t e s s e n t i e l l e m e n t de p r e s e n t e r l e s donnees sous une forme immediatement e x p l o i t a b l e , en l e s r e d u i s a n t ä quelques parametres c a r a c t e r i s t i q u e s . Apres des r a p p e l s d'analyse combi- n a t o i r e , on i n t r o d u i t l e s p r i n c i p e s generaux du c a l c u l des p r o - b a b i l i t e s , en m o n t r a n t l e s p o s s i b i l i t e s d ' u t i l i s a t i o n de l ' a l g e b r e des ensembles q u i e s t de p l u s en p l u s f a m i l i e r e aux e t u d i a n t s . Les d i f f e r e n t e s l o i s de p r o b a b i l i t e u s u e l l e s sont e n s u i t e e t u d i e e s e t l e u r s c o n d i t i o n s d ' a p p l i c a t i o n examinees. La d e r n i e r e p a r t i e de l'ouvrage i n t r o d u i t a l a s t a t i s t i q u e i n d u c t i v e q u i , grace ä
1 ' a s s i m i l a t i o n des o b s e r v a t i o n s experimentales aux l o i s t h e o r i q u e s e t a 1 ' a p p l i c a t i o n de t e s t s , f o u r n i t des elements de d e c i s i o n . Les e x e r c i c e s proposes se r a p p o r t e n t ä des domaines v a r i e s : economie, medecine, j e u x , e t c . . . De nombreux problemes proposes ces d e r n i e r e s annees aux concours de P.C.E.M sont donnes avec l e u r s c o r r i g e s .
1. Introduction
I . LA STATISTIQUE
De nombreux domaines de l a connaissance p r a t i q u e s'ap- p u i e n t sur 1'etude de c o l l e c t i o n s homogenes d * o b j e t s ou de personnes. La s t a t i s t i q u e e s t un ensemble de methodes permet- t a n t de degager l e s c a r a c t e r i s t i q u e s ou l a r e p a r t i t i o n de ces o b j e t s en f o n c t i o n de c r i t e r e s d!e t u d e determines.
Ces methodes t i r e n t l e u r j u s t i f i c a t i o n t h e o r i q u e de c e r - t a i n e s c o n s t r u c t i o n s mathematiques ( t h e o r i e des p r o b a b i l i t e s , algebre l i n e a i r e , e t c . ) , mais c!e s t l e domaine d* a p p l i c a t i o n q u i j u s t i f i e l e choix de l a methode e t 11 i n t e r p r e t a t i o n des r e s u l t a t s obtenus. I I e s t r e l a t i v e m e n t f r e q u e n t que des con- c l u s i o n s erronees s o i e n t t i r e e s dTune etude s t a t i s t i q u e p a r - f a i t e m e n t coherente en t h e o r i e ( c ' e s t souvent l e cas des sondages d1o p i n i o n en p e r i o d e e l e c t o r a l e ) . I I e s t done e s - s e n t i e l de ne pas r e d u i r e l a s t a t i s t i q u e ä 11 a p p l i c a t i o n meca- nique de formules.
I I . NOTIONS DE BASE
La c o l l e c t i o n d ' o b j e t s ou de personnes e t u d i e e e s t appe- lee p o p u l a t i o n ou u n i v e r s .
Un o b j e t ou une personne sur l e s q u e l s p o r t e lfe t u d e e s t appele i n d i v i d u ( i n d i v i d u s t a t i s t i q u e ) .
Les c r i t e r e s e t u d i e s c o n s t i t u e n t des c a r a c t e r e s . On peut p r e c i s e r ces n o t i o n s sur I'exemple s u i v a n t , ex- t r a i t d'une f e u i l l e de recensement r e l a t i v e aux logements occupes par l e s menages dans une commune i n d u s t r i e l l e du Nord de l a France.
2 I n t r o d u c t i o n
Type 4e logemettf; appartemettt ' - ; , maison, i n d i v i d u e l l e
•
a u t r e s n
Surface h a b i t a b l e «**•, *« , * *» *4·**ΨΦ***4ψΛ l ,
Nombre de,pieces d*Kabitatioti
•
Y a- t- i l une cuisi&£ t ouif p r i v i e Ο "
o u i , commune Π
•
S a l l e de bains ott douche ? o u i , p r i v g e
•
o u i , comime
•
ncm
•
Questionnaire (partiel) relatif aux logements occupes par les manages.
La p o p u l a t i o n s t a t i s t i q u e e s t c o n s t i t u t e i c i par 1'en
semble des menages de l a commune. Les c a r a c t e r e s , q u i c o r r e s pondent aux questions posees sont de deux types :
- on ne peut a s s o c i e r ä c e r t a i n s d'entre eux n i une v a l e u r numerique, n i un o r d r e n a t u r e l (par exemple : l e t y p e de logement). De t e l s c a r a c t e r e s sont appeles caracteres q u a l i t a t i f s ;
- c e r t a i n s c a r a c t e r e s prennent des v a l e u r s numeriques (par exemple : l e nombre de pieces d ' h a b i t a t i o n ) . Ce sont des c a r a c t e r e s q u a n t i t a t i f s .
Un caractere c o n t i n u e s t un c a r a c t e r e q u a n t i t a t i f q u i peut prendre toutes l e s v a l e u r s numeriques dfu n I n t e r v a l l e determine (par exemple : l a surface h a b i t a b l e ) .
Un caractere d i s c r e t (ou d i s c o n t i n u ) e s t un c a r a c t e r e q u i ne peut prendre que des v a l e u r s numeriques i s o l e e s dans un I n t e r v a l l e (par exemple : l e nombre de pieces d ' h a b i t a t i o n ) .
I n t r o d u c t i o n 3
Un t e l recensement peut e t r e g e n e r a l ( e t p o r t e r par exemple sur 1*ensemble des menages dfune grande v i l i e ) ou p a r t i e l (ne p o r t e r que sur une p a r t i e seulement de ces mena- ges). Dfune maniere g e n e r a l e , on a p p e l l e e c h a n t i l l o n l a p a r t i e de l a p o p u l a t i o n s t a t i s t i q u e sur l a q u e l l e p o r t e lfe n - quete.
L1e f f e c t i f ou frequence absolue associee ä une v a l e u r d*un c a r a c t e r e e s t l e nombre de f o i s oü c e t t e v a l e u r du c a r a c -
t e r e a ete observee.
La frequence r e l a t i v e associee ä une v a l e u r d'un c a r a c - t e r e e s t l e r a p p o r t , de l a frequence absolue correspondant ä c e t t e v a l e u r du c a r a c t e r e au nombre d ' i n d i v i d u s de 1'echan- t i l l o n .
Une s e r i e s t a t i s t i q u e , ou d i s t r i b u t i o n s t a t i s t i q u e , asso- ciee ä un c a r a c t e r e , e s t 1!ensemble des v a l e u r s du c a r a c t e r e , avec en r e g a r d , l e s frequences absolues ou r e l a t i v e s c o r r e s - pondantes.
Les s t a t i s t i q u e s d e s i g n e n t communement l e s donnees r e l a - t i v e s ä une meme c a r a c t e r i s t i q u e ou encore l e s r e s u l t a t s obtenu's ä p a r t i r de ces donnees. Par exemple : l e s s t a t i s t i - ques de l ^ m p l o i ou du chomage, l e s s t a t i s t i q u e s d'une c e r t a i n e maladie.
I I I . LA METHODE STATISTIQUE
D'une maniere g e n e r a l e , l a s t a t i s t i q u e considere des phe- nomenes q u i ne sont pas t o u j o u r s a c c e s s i b l e s ä 11 e x p e r i e n c e . Par s u i t e de l a m u l t i p l i c i t e des causes, on ne peut comme en physique par exemple, f i x e r un c e r t a i n nombre de parametres e t e t u d i e r d e v o l u t i o n du phenomene. La methode s t a t i s t i q u e comporte e s s e n t i e l l e m e n t t r o i s phases :
- une phase m a t e r i e l l e oü i l s ' a g i t de rassembler des
4 I n t r o d u c t i o n
donnees, de l e s regrouper e t de l e s p r e s e n t e r sous forme de t a b l e a u x ou graphes ;
- une phase änalytique q u i c o n s i s t e ä r e d u i r e l e s don- nees ä un nombre l i m i t e de parametres c a r a c t e r i s t i q u e s (mo- ments d!o r d r e 1, 2, 3, ...) s u s c e p t i b l e s de d e c r i r e l a s e r i e s t a t i s t i q u e . l/ensemble de ces deux phases c o n s t i t u e l ' o b j e t e s s e n t i e l de l a s t a t i s t i q u e d e s c r i p t i v e (ou d e d u c t i v e ) dont l e s r e s u l t a t s r e s t e n t l i m i t e s aux e c h a n t i l l o n s etucjies ;
- une phase i n t e r p r e t a t i v e , q u i e s t ä l a base de l a s t a t i s t i q u e i n d u c t i v e , e t q u i permet de d e d u i r e des r e s u l t a t s obtenus sur un e c h a n t i l l o n des c o n c l u s i o n s r e l a t i v e s ä lfe n - semble de l a p o p u l a t i o n d'oü e s t e x t r a i t c e t e c h a n t i l l o n . Ces c o n c l u s i o n s d o i v e n t t e n i r compte de l a marge d ' e r r e u r due au f a i t que l e s donnees sont seulement p a r t i e l l e s . Les metho- des u t i l i s e e s n'ont de sens que s i e l l e s sont j u s t i f i e e s par des r e s u l t a t s u l t e r i e u r s .
2. Tableaux et graphes
Une enqueue s t a t i s t i q u e comporte t o u j o u r s une phase i n i - t i a l e oü i l s ' a g i t de c o l l e c t e r des renseignements, s u i v i e d'un§ phase de d e p o u i l l e m e n t q u i c o n s i s t e ä passer des donnees b r u t e s ä des tableaux ou ä des graphes q u i se p r e t e n t mieux a.
lfa n a l y s e e t 1fi n t e r p r e t a t i o n .
La maniere dont l'enquete e s t e f f e c t u e e e s t evidemment t r e s i m p o r t a n t e . En p a r t i c u l i e r , s i l ' o n espere d e d u i r e des r e s u l t a t s obtenus sur un e c h a n t i l l o n des c o n c l u s i o n s r e l a t i - ves ä t o u t e l a p o p u l a t i o n , i l c o n v i e n t de s?a s s u r e r que lre - c h a n t i l l o n e s t b i e n r e p r e s e n t a t i f de c e t t e p o p u l a t i o n , ce q u i sera p r e c i s e dans l a t h e o r i e de 11e c h a n t i l l o n n a g e ( c f . chap. 7 ) . Cependant 1*objet du p r e s e n t c h a p i t r e sera l i m i t e ä lfe t u d e des d i f f e r e n t e s manieres de p r e s e n t e r une s e r i e s t a t i s t i q u e .
A. TABLEAUX
I . TABLEAU DE FREQUENCES A UN CARACTERE
Ce t a b l e a u e t a b l i t l a correspondance e n t r e deux s e r i e s de nombres, l'une c o n s t i t u t e par l e s v a l e u r s du c a r a c t e r e e t u d i e , 1'autre par l e s e f f e c t i f s correspondants (ou l e s f r e - quences r e l a t i v e s correspondantes).
, Exemple d'une serie quantitative discrete
L ' e c h a n t i l l o n e s t un irameuble de 64 f a m i l i e s , l e carac- t e r e e t u d i e e t a n t l e nombre dfe n f a n t s par f a m i l l e .
Nombre
d'enfants 0 1 2 ' 3 4 5 T o t a l
Nombre de
f a m i l i e s 16 18 14 1 1 3 2 64
Frequence
r e l a t i v e 0,250 0,281 0,218 0,172 0,047 0,031 1
Tableau 2.1
. Exemple dfune serie qualitative
L * e c h a n t i l l o n e s t l'immeuble de 64 f a m i l i e s de 1'exemple precedent, l e c a r a c t e r e e s t l a p r o f e s s i o n du chef de f a m i l l e , ä l a q u e l l e on a t t r i b u e un code dfune maniere a r b i t r a i r e .
La correspondance v a l e u r du c a r a c t e r e - e f f e c t i f c o r r e s - pondant, d e f i n i t une f o n c t i o n d i t e f o n c t i o n de d i s t r i b u t i o n , q u i sera developpee au c h a p i t r e 3.
A. Tableaux 7
P r o f e s s i o n Code E f f e c t i f Frequence r e l a t i v e
O u v r i e r s e t employes 1 24 0,375 Cadres moyens e t s u p e r i e u r s 2 9 0,140 ...
Commergants 3 10 0,156 ...
F o n c t i o n n a i r e s 4 15 0,234 ...
P r o f e s s i o n s l i b e r a l e s 5 6 0,093 ...
64 1
Tableau 2.2
I I . TABLEAU DE FREQUENCES CUMULEES
La s e r i e s t a t i s t i q u e du t a b l e a u 2.1 peut e t r e presentee sous une forme d i t e cumulee, des deux manieres s u i v a n t e s :
. Cumul par valeurs inferieures ou effectifs cumules croissants
Nombre d'enfants cumules
Moins de 1 e n f a n t 16 f a m i l i e s 2 e n f a n t s 16 + 18 = 34 It
3 II 34 + 14 = 48 II
4 II 48 + 11 -59 II
5 II 59 + 3 = 62 II
6 II 62 + 2 = 64 II
Tableau 2.3
8 C h a p i t r e 2
Cumul par valeurs superieures ou effectifs cumules decrois- sants
Nombre d'enfants E f f e c t i f s cumules 0 e n f a n t ou p l u s 64 f a m i l i e s . 1 e n f a n t " " 64 - 16 = 48
2 e n f a n t s " 48 - 18 = 30
3 If II It 30 - 14 = 16
4 II II II 1 6 - 1 1 = 5
5 It If It 5 - 3 = 2
Tableau 2.4
La correspondance v a l e u r du c a r a c t e r e - e f f e c t i f cumule c o r r e s p o n d a n t , d e f i n i t une f o n c t i o n d i t e de r e p a r t i t i o n , q u i s e r a egalement developpee au c h a p i t r e 3.
I I I . TABLEAU DE FREQUENCES A DEUX CARACTERES
Si lfo n sfi n t e r e s s e ä deux caracteres d i f f e r e n t s dans un meme e c h a n t i l l o n , i l e s t p o s s i b l e de r e p r e s e n t e r 1'ensemble des renseignements dans un meme t a b l e a u ( t a b l e a u ä double e n t r e e ) .
* ExemP^e de tableau de frequences a deux caracteres
L1e c h a n t i l l o n e s t l e meme que precedemment. Le c a r a c t e r e X e s t l e nombre de personnes v i v a n t dans un appartement, l e c a r a c t e r e Y e s t l e nombre de pieces par appartement. L * i n t e r - s e c t i o n dfune l i g n e e t d!une colonne du t a b l e a u e s t l e nombre de f o i s oü lfo n a observe X personnes v i v a n t dans un apparte- ment de Y p i e c e s . Par exemple, on a observe 7 f o i s 3 personnes v i v a n t dans un appartement de 3 pieces.
A. Tableaux 9
>ν Χ
Υ \ ν 2 3 4 6 T o t a l nombre
d1appartements
2 8 5 2 0 0 15
3 5 7 4 2 0 18
4 3 6 8 9 5 31
T o t a l nombre de f a m i l i e s
16 18 14 1 1 5 64
Tableau 2.5
IV. CAS D'UNE SERIE QUANTITATIVE CONTINUE
A f i n de rendre l a s e r i e s t a t i s t i q u e p l u s commode ä e t u d i e r , i l e s t necessaire de regrouper l e s v a l e u r s du c a r a c t e r e en i n t e r v a l l e s s u c c e s s i f s e t c o n t i g u s , t e l s que dans chaque I n t e r - v a l l e ou c l a s s e , on ne d i s t i n g u e pas l e s v a l e u r s du c a r a c t e r e q u i y sont comprises. Les nombres e n t r e l e s q u e l s sont comprises ces v a l e u r s c o n s t i t u e n t l e s l i m i t e s de c l a s s e . Dans chaque c l a s s e , on remplace l e s v a l e u r s du c a r a c t e r e observees par une v a l e u r unique, c e l l e du m i l i e u de 1TI n t e r v a l l e ou c e n t r e de classe.
. Exemple
Une enquete p o r t a n t sur l a t a i l l e des i n d i v i d u s dfu n e c e r - t a i n e c o l l e c t i v i t e de 80 personnes a permis de dresser l e t a b l e a u s u i v a n t oü lfo n a adopte un I n t e r v a l l e de classe de 0,05 m.
10 Chapitre 2
Centres E f f e c t i f s E f f e c t i f s Classes L i m i t e s de
c l a s s e
E f f e c t i f s cumules c r o i s s a n t s
cumules de- er o i s s a n t s
1 ,545 80
1 ,55-1,59
1,595
1,57 3
3 77
1,60-1,64
1 ,645
1 ,62 12
15 65
1,65-1,69
1 ,695
1 ,67 18
33 47
1,70-1,74
1,745
1,72 25
58 22
1,75-1,79
1 ,795
1,77 15
73 7
1 ,80-1,84
1,845
1 ,82 5
78 2
1,85-1,89
1 ,895
1 ,87 2
80
80
Tableau 2.6
On peut remarquer que l e s e f f e c t i f s cumules c r o i s s a n t s correspondent aux f r o n t i e r e s superieures des c l a s s e s , e t l e s e f f e c t i f s cumules d e c r o i s s a n t s aux f r o n t i e r e s i n f e r i e u r e s des c l a s s e s .
Β. REPRESENTATIONS GRAPHIQUES
Les r e p r e s e n t a t i o n s graphiques ont lTa v a n t a g e dfo f f r i r une m e i l l e u r e vue d1ensemble de l a s e r i e s t a t i s t i q u e que l e s t a bleaux. E l l e s p e r m e t t e n t par simple l e c t u r e , de v o i r l e s carac
t e r i s t i q u e s e s s e n t i e l l e s de l a s e r i e , e t a u s s i de comparer des s e r i e s d i f f e r e n t e s .
I . CARACTERE DISCONTINU. DIAGRAMME EN BATONS
Lorsque l e c a r a c t e r e e s t d i s c o n t i n u , on u t i l i s e l e d i a - gramme en batons : l e s v a l e u r s du c a r a c t e r e sont portees en a b s c i s s e s , l e s frequences correspondantes sont representees par des t r a i t s p l e i n s , en ordonnees.
Si l ' o n j o i n t l e s sommets des batons, on o b t i e n t l e p o l y - gone des frequences,.
Exemple 1
Diagramme en batons du t a b l e a u 2.1 r e p r i s en 2.7
Nombre d'enfants Frequences Frequences r e l a t i v e s
0 16 0,250
1 18 0,281
2 14 0,218
3 1 1 0,172
4 3 0,047
5 2 0,031
64 1
Tableau 2.7
12 C h a p i t r e 2
frequences
20
10
F i g u r e 2.1 _ 0 1 2 3 4 5
nombre d'enfants Exemple 2
Diagramme des frequences cumulees des t a b l e a u x 2.3 e t 2.4, r e p r i s en 2.8 e t 2.9.
Nombre d ' e n f a n t s
Frequences cumulees c r o i s s a n t e s
Nombre d'enfants
Frequences cumulees 4 e c r o i s ^ a n t e s
Möins de 1 16 0 ou p l u s 64
2 34 1 48
3 48 2 30
4 59 3 16
5 62 4 5
6 64 5 2
Tableau 2.8 Tableau 2.9
frequences r e l a t i v e s A
Le graphe des frequences cumulees (appele a u s s i diagramme i n t e g r a l ) ne met pas en evidence l e s d i f f e r e n c e s e t ne f a i t pas r e s s o r t i r l a frequence maximum ( f i g . 2.2).
Β. Representations graphiques 13
Pour chaque v a l e u r du c a r a c t e r e l a somme des frequences cumulees c r o i s s a n t e e t d e c r o i s s a n t e e s t evidemment egale ä l ' e f f e c t i f t o t a l .
Ces graphes e t a n t c o n s t i t u e s par un ensemble d i s c o n t i n u de p o i n t s ( l e s sommets des b a t o n s ) , 1 ' i n t e r p o l a t i o n e n t r e p o i n t s s u c c e s s i f s n'a pas de sens. On peut a u s s i b i e n adopter une frequence constante e n t r e l e s v a l e u r s d i s c r e t e s du c a r a c - t e r e ( f i g . 2.3).
k frequences cumulees 60
40-
20
c r o i s s a n t e s
vd e c r o i s s a n t e s
^frequences cumulees
c r o i s s a n t e s
, d e c r o i s s a n t e s
1/
0 1 1 3 4 5 6 0 1 2 > 5 6
nombre d'enfants F i g u r e 2.2
nombre d'enfants F i g u r e 2.3
I I . CARACTERE CONTINU. HISTOGRAMME
Dans l e cas d'un c a t a c t e r e c o n t i n u , on u t i l i s e 11h i s t o - gramme, q u i c o n s t i t u e une g e n e r a l i s a t i o n du diagramme en batons ä l a n o t i o n de c l a s s e .
a) Series ä classes egales
Chaque classe e s t representee par un r e c t a n g l e dont l a base e s t egale ä lf I n t e r v a l l e de l a c l a s s e e t d o n t l a hauteur
14 Chapitre 2
e s t egale ä l ' e f f e c t i f correspondant. LTh i s togramme e s t cons- t i t u e en f a i t par l e contour p o l y g o n a l enveloppant lfensemble de ces r e c t a n g l e s .
Le polygone des frequences absolues (ou des frequences r e l a t i v e s ) s ' o b t i e n t en j o i g n a n t l e s p o i n t s dont l e s abscisses sont l e s m i l i e u x des d i f f e r e n t e s classes e t dont l e s ordonnees sont l e s e f f e c t i f s (ou l e s frequences r e l a t i v e s ) correspon- d a n t s .
. Exemple
Histogramme r e l a t i f au t a b l e a u 2.6 ( r e p r i s en 2.10).
Clas L i m i t e s Centres
E f f e c t i f s E f f e c t i f s E f f e c t i f s Clas ses L i m i t e s
de classe
E f f e c t i f s
cumules c r o i s s a n t s
cumules de- c r o i s s a n t s
1 ,545 80
1,55- 1,59
1 ,595
1,57 3
3 77
1 ,60- 1 ,64
1 ,645
1 ,62 12
15 65
1,65- 1 ,69
1 ,695
1 ,67 18
33 47
1,70- 1,74 1,72 25
1,70-
1 ,745 58 22
1,75- 1,79
1 ,795
1,77 15
73 7
1,80- 1 ,84
1 ,845
1,82 5
78 2
1,85- 1,89
1 ,895
1,87 2
~8Ö
80
Tableau 2.10
Β. Representations graphiques 15
frequence absolue
frequence r e l a t i v e
0,50
- 0,25
3 £ 3 ί £ 3 £ 3 £ t a i l l e
L O t O v D v O Γ"- 00 00
histogramme
>polygone des frequences
Figure 2.4
. Aire de I rhistogramme
C'est l ' a i r e comprise e n t r e 1'histogramme e t 11 axe des
abscisses. Dans l e cas d'un histogramme des frequences a b s o l u e s , c e t t e a i r e e s t evidemment p r o p o r t i o n n e l l e au p r o d u i t de 1' I n t e r v a l l e de classe par l ' e f f e c t i f t o t a l . Dans l e cas d'un h i s togramme des frequences r e l a t i v e s , s i 1 ' I n t e r v a l l e de c l a s s e est p r i s comme u n i t e , lTa i r e e s t egale ä 1 ' u n i t e , puisque l a somme des frequences r e l a t i v e s e s t elle-meme egale ä 1 ' u n i t e . L ' a i r e comprise e n t r e l e polygone des frequences e t l'axe des abscisses e s t egale ä c e l l e de 1'histogramme, puisque, comme on peut l e v o i r sur l a f i g u r e 2.4, l e s s u r f a c e s non communes ä ces deux a i r e s se compensent deux par deux.
. Polygone des effectifs cumules
En observant que l e s e f f e c t i f s cumules c r o i s s a n t s c o r - respondent aux f r o n t i e r e s superieures des d i f f e r e n t e s c l a s s e s , e t l e s e f f e c t i f s cumules d e c r o i s s a n t s aux f r o n t i e r e s i n f e -
16 C h a p i t r e 2
r i e u r e s des c l a s s e s , on peut, ä l ' a i d e du t a b l e a u 2.10, c o n s t r u i r e l e s polygones des e f f e c t i f s cumules s u i v a n t s
^ frequences r e l a t i v e s
1
m m in 1 in m I in in m
<t ON ON ON ON m in r-- Γ - oo 00
Figure 2.5 On peut remarquer que pour chaque v a l e u r du c a r a c t e r e , l a somme des e f f e c t i f s c r o i s s a n t s e t des e f f e c t i f s d e c r o i s - sants e s t egale ä l ' e f f e c t i f t o t a l .
Remarque
L ' i n t e r e t de ces r e p r e s e n t a t i o n s cumulees a p p a r a i t r a un peu p l u s t a r d , ä lfo c c a s i o n de lTa n a l y s e des s e r i e s s t a t i s t i q u e s .
b) S e r i e s a classes i n e g a l e s
S i l ' o n veut que l ' a i r e de 1'histogramme s o i t t o u j o u r s p r o p o r t i o n n e l l e ä l ' e f f e c t i f , i l e s t necessaire de t e n i r compte de l ' i n e g a l i t e des c l a s s e s . On opere a l o r s de l a maniere s u i - v a n t e : une classe dont l'etendue e s t egale ä η f o i s 1 ' I n t e r v a l l e de c l a s s e fundamental, e s t representee avec une ordonnee egale ä l ' e f f e c t i f de c e t t e classe d i v i s e par n, de t e l l e s o r t e que l ' a i r e r e l a t i v e ä c e t t e classe söit b i e n p r o p o r t i o n - n e l l e ä son e f f e c t i f .
Β.. Representations graphiques 17
. Exemple
Une enquete p o r t a n t sur l e s s a l a i r e s mensuels pergus dans une c e r t a i n e e n t r e p r i s e a f o u r n i l e s renseignements s u i v a n t s :
S a l a i r e mensuel en F. E f f e c t i f s
Entre 2 000 e t 3 000 34
3 000 e t 4 000 52
4 000 e t 5 000 60
5 000 e t 6 000 20
6 000 e t 7 000 8
11 7 000 e t 11 000 6
180
Tableau 2.11
La d e r n i e r e c l a s s e , de 7 000 ä 11 000 F v a u t 4 i n t e r v a l l e s de c l a s s e , i l f a u t done reamenager sa p r e s e n t a t i o n a i n s i :
S a l a i r e mensuel en F. E f f e c t i f s
Entre 7 000 et 8 000 1,5
8 000 e t 9 000 1,5
9 000 e t 10 000 1,5
" 10 000 e t 1 1 000 1,5
Tableau 2.12
Cette r e p a r t i t i o n de l ' e f f e c t i f dans l a d e r n i e r e c l a s s e ne correspond b i e n sur ä aueune r e a l i t e , e i l e conserve t o u t e -
18 C h a p i t r e 2
f o i s un sens ä 1'histogramme e t aux conclusions qu'on peut en t i r e r .
s a l a i r e mensuel Figure 2.6
. Autre exemple
S a l a i r e s mensuels pergus a l ' e c h e l l e n a t i o n a l e dans 1 'I n d u s t r i e e t l e commerce
(Le Monde 8/3/77)
Les c l a s s e s adoptees sont i n e g a l e s . Les ordonnees (axe h o r i z o n t a l ) ne sont pas p r o - p o r t i o n n e l l e s ä lfe f f e c t i f . E l l e s sont obtenues en d i v i - sant l ' e f f e c t i f ( r e p r e s e n t e par l e s nombres encadres) par l a c l a s s e correspondante.
E X E R C I C E S CHAPITRE 2 Β. REPRESENTATIONS GRAPHIQUES
I . On recense dans 1 000 h o p i t a u x d'un pays europeen l e cas d!u n e maladie inconnue. On trouve l e s r e s u l t a t s s u i v a n t s
Nombre de malades 0 1 2 3 4 5
Nombre d'hopitaux 50 150 350 300 100 50
Representer graphiquement l e s donnees. C a l c u l e r l e s frequences r e l a t i v e s .
SOLUTION
frequences absolues
400 300
200-
100
frequences r e l a t i v e s 0,40
0,30
-0,20
0,10
nombre de 4 5 malades
20 C h a p i t r e 2
Norabres de malades 0 1 2 3 4 5
Nombre d!h o p i t a u x 50 150 350 300 100 50
Frequences r e l a t i v e s 0,05
11(11 lllil
0,30 0,10 0,05 On remarque que l a somme des frequences absolues e s t 1 000 e t que l a somme des frequences r e l a t i v e s e s t 1.I I . Reprendre l a s e r i e de l ' e x e r c i c e I precedent.
1°) C o n s t r u i r e un t a b l e a u donnant l e pourcentage d'hopitaux oü l e nombre de malades e s t i n f e r i e u r ä 0, 1, 2, 3, 4, 5 ou 6. Representer graphiquement l e s donnees de ce t a b l e a u . 2°) C o n s t r u i r e un t a b l e a u donnant l e pourcentage d'hopitaux oü l e nombre de malades e s t egal ou s u p e r i e u r ä 0, 1, 2, 3, 4, 5 ou 6, en f a i r e l a r e p r e s e n t a t i o n graphique..
SOLUTION 1°)
Nombre de malades i n f e r i e u r ä
Nombre
d'hopitaux Pourcentage
0 0
1 50
2 200
3 550
4 850
5 950
6 1 000
E x e r c i c e s Β. R e p r e s e n t a t i o n s graphiques 21
2°)
Nombre de malades egal ou s u p e r i e u r ä
Nombre
d'hopitaux Pourcentage
0 1 000 100
1 950 95
2 800 80
3 450 45
4 150 15
5 50 5
6 0 0
0 1 2 3 4 5 6
22 C h a p i t r e 2
I I I . Dans une u s i n e , on a r e l e v e l e s h o r a i r e s d ' a r r i v e e de 800 personnes
t . = c l a s s e des
1
temps en heures
[ 8 h 45 8 h 50]
[ 8 h 50 8 h 55]
[ 8 h 55 9 h 00]
[ 9 h 00 9 h 05]
[ 9 h 05 9 h 10]
n. = nombre
1
de personnes 4 10 26 110 150
t . = c l a s s e des
1
temps en heures
[ 9 h 10 9 h 15]
[ 9 h 15 9 h 20]
[ 9 h 20 9 h 25]
[ 9 h 25 9 h 30]
[ 9 h 30 9 h 35]
n. = nombre
1
de personnes
200 150 100 40 10
1°) Representer 1'histogramme de c e t t e d i s t r i b u t i o n . 2°) T r a c e r l e polygone de frequences
SOLUTION
1°) Histogramme : courbe 1 2°) Folygone de f r e q u e n c e s
courbe 2
E x e r c i c e s Β. Representations graphiques 23
IV. On e f f e c t u e lfa n a l y s e de sang de 60 personnes q u i o n t manipule un gaz t o x i q u e . La mesure du taux de l e u c o c y t e s ,
3
par mm , donne l e s r e s u l t a t s s u i v a n t s : 3000 $ Xi < 4000 n. = 10
1
4000 < X. < 10000
ν 1
= 48
10000 £ X. < 12000
1
n. = 12
1
n. r e p r e s e n t e l e nombre de gens dont l e taux de l e u c o c y t e s
1 3
par mm e s t X^. Representer 1'histogramme de c e t t e s e r i e q u a n t i t a t i v e ä classes i n e g a l e s .
SOLUTION
En adoptant un I n t e r v a l l e de c l a s s e de 1000, l a 2 erne classe v a u t 6 i n t e r v a l l e s de classe e t l a 3eme en v a u t 2. En e f f e c t u a n t une e q u i p a r t i t i o n de l ' e f f e c t i f e n t r e l e s d i f f e - r e n t s i n t e r v a l l e s de c l a s s e , on o b t i e n t l e t a b l e a u s u i v a n t :
xi n.
1
3000 <
Xi < 4000 10
4000
X i < 5000 8
5000
X i < 6000 8
6000
X i < 7000 8
7000
Xi < 8000 8
8000
Xi < 9000 8
9000
Xi < 10000 8
10000
Xi < 11000 6
11000 X.
1
< 12000 6
3000 4000 5000 6000 7000 8000 9000 10000 11000 12000
ro -t> σ> oo _Ι I I I Ο Ο σο
ο &>
Ό et3. Analyse d'une distribution de frequences
Les p o i n t s de d e p a r t de c e t t e analyse o n t e t e exposes dans l e c h a p i t r e precedent. I i s c o n s i s t e n t ä regrouper l e s donnees, en procedant eventuellernent ä un decoupage en classes ( c a r a c t e r e c o n t i n u ) , e t ä p r e s e n t e r sous forme de tableaux ou de graphes, l e s f o n c t i o n s de d i s t r i b u t i o n e t de r e p a r t i t i o n correspondantes.
Fonction de distribution : on designe a i n s i lfe n s e m b l e des couples c o n s t i t u e s par l e s v a l e u r s du c a r a c t e r e e t l e s frequences absolues ou r e l a t i v e s correspondantes. La r e p r e - s e n t a t i o n graphique de c e t t e f o n c t i o n - appelee p a r f o i s d i a - gramme d i f f e r e n t i e l - n'est a u t r e que 1'histogramme ( v o i r f i g . 2.4) dont une p r o p r i e t e e s s e n t i e l l e e s t que l e s a i r e s des d i f f e r e n t s r e c t a n g l e s sont p r o p o r t i o n n e l l e s aux e f f e c t i f s correspondants.
Fonction de repartition : c ' e s t 1'ensemble d e s c o u p l e s c o n s t i t u e s par une v a l e u r du c a r a c t e r e e t
a) s o i t l a somme des e f f e c t i f s ayant moins que c e t t e v a l e u r du c a r a c t e r e (diagramme i n t e g r a l c r o i s s a n t )
b) s o i t l a somme des e f f e c t i f s ayant c e t t e v a l e u r du c a r a c t e r e ou p l u s (diagramme i n t e g r a l d e c r o i s s a n t ) .
Les graphes sont l e s courbes cumulatives r e s p e c t i v e m e n t par v a l e u r s i n f e r i e u r e s e t par v a l e u r s s u p e r i e u r e s d e c r i t e s precedemment ( v o i r t a b l e a u 2.10 e t f i g . 2.5).
26 C h a p i t r e 3
La phase s u i v a n t e e s t c e l l e de l a r e d u c t i o n des donnees, q u i c o n s i s t e ä s u b s t i t u e r ä l a d i s t r i b u t i o n e t u d i e e , quelques parametres en nombre r e d u i t , d o n t l e s v a l e u r s numeriques don- neront un resume r e l a t i v e m e n t süffisant de 11 i n f o r m a t i o n contenue dans l a d i s t r i b u t i o n de frequences. Parmi ces p a r a - m e t r e s , on d i s t i n g u e :
a) l e s parametres de p o s i t i o n (moyenne, mediane, e t c . ) q u i permettent de se rendre compte de 1!o r d r e de grandeur de l1e n s e m b l e des o b s e r v a t i o n s e t de l o c a l i s e r l a zone des f r e - quences maximum ;
b) l e s parametres de d i s p e r s i o n ( e c a r t moyen, e c a r t t y p e , q u i p r e c i s e n t l e degre de d i s p e r s i o n des d i f f e r e n t e s observa- t i o n s autour d'une v a l e u r c e n t r a l e .
Α. PARAMETRES DE POSITION
l, LES MOVENNES
La n o t i o n de moyenne e s t assez commune : i l e s t f r e q u e n t ie r e d u i r e un ensemble f i n i de nombres ä une " v a l e u r moyenne"
a f i n de donner une idee de lfo r d r e de grandeur des elements i e cet ensemble. Cependant, i l e x i s t e p l u s i e u r s manieres de c a l c u l e r une " v a l e u r moyenne" s u i v a n t sa s i g n i f i c a t i o n .
1. La moyenne a r i t h m e t i q u e Symbole de sommation :
S o i t X j , *2> x3 ···xn u^ e s u i t e f i n i e de nombres. Par d e f i n i t i o n
Σ
η χ. = χΗ + χ^ 4- χ0 + . + χι 1 2 3 η i=l
Les p r o p r i e t e s de ce symbole de sommation sont l e s s u i - vantes :
- s i a e s t une c o n s t a n t s , d'apres l a d e f i n i t i o n prece- dente, on a immediatement :
η η
Σ
a x i = aΣ
X ii = l i = l
- en c o n s i d e r a n t l e cas oü x, = x~ = x0 = ... = χ , on en
1 2 3 n'
d e d u i t :
Σ
η a = n a i = l28 C h a p i t r e 3
- s o i t Υ|, ··· Yn une a u t r e s u i t e f i n i e de nombres.
D'apres l a meme d e f i n i t i o n , on a
η η η Σ < xi+ yO = Σ xi+ Σ Vi
1=1 1=1 ι=1
χ une s u i t e f i n i e de nombres. La η
D e f i n i t i o n de l a moyenne a r i t h m e t i q u e S o i t X j , *2 9 x3 ···xn une s u i t e moyenne a r i t h m e t i q u e e s t l e r a p p o r t :
η . ^ - j ι χ, + χη + χ- + ... + χ Λ η
1 2 3 η 1 (3. 1)
i = l
Si chaque v a l e u r χ^ a p p a r a i t η^ f o i s dans l a s e r i e , on peut encore e c r i r e
X = - Τ n. x.
• η 4τ· I i ι
En remarquant que η./η η1est a u t r e que l a frequence r e l a t i v e (3.2}
f ^ correspondant ä l a v a l e u r x^, on a aus s i
X = Υ f .· x. (3.3}
. Exemple
Cas du t a b l e a u 2.1 r e p r i s en 3.1 Nombre
d'enfants 0 1 2 3 4 5 T o t a l
Nombre de f a m i l i e s
16 18 14 1 1 3 2
Frequence
r e l a t i v e 0,250 0,281 0,218 0,172 0,047 0,031 Tableau 3.1
Le nombre moyen d ' e n f a n t s par f a m i l l e e s t , d'apres lfe q u a t i o n (3.2)
Α. Parametres de p o s i t i o n 29
Χ = ( 1 6x0) + (18x1) + ( 1 4 x 2 ) + ( l 1 x 3 ) +(3x4)+ (2x5)
64 ,58 e n f a n t
ou encore, ä l ' a i d e de l ' e x p r e s s i o n (3.3)
X = ( 0 , 2 5 x 0 ) + ( 0 , 2 8 l x l ) + ( 0 , 2 1 8 x 2 ) + ( 0 , 1 7 2 x 3 ) + ( 0 , 0 4 7 x 4 ) + ( 0 , 0 3 1 x 5 ) - 1,58 e n f a n t .
2. Cas de donnees groupees en c l a s s e s
On prend pour v a l e u r de l e s c e n t r e s de c l a s s e s . . Exemple
E x t r a i t du t a b l e a u 2.6.
Centres - de
classes
1,57 1,62 1 ,67 1,72 1,77 1 ,82 1 ,87
E f f e c t i f 3 12 18 25 15 5 2
Tableau 3.2
La t a i l l e moyenne d'un i n d i v i d u dans c e t t e c o l l e c t i v i t e est
j 7 _ ( 3 x l ,57)+ (12xl ,62) +(18x1 ,67) +(25x1 ,72)+(15x1 ,77) +(5x1 ,82) +(2x1 ,87) 80
= 1,707 m
3. S i m p l i f i c a t i o n du c a l c u l de l a moyenne a) Changement d ' o r i g i n e
On prend une moyenne p r o v i s o i r e arbiträire Xq , qu!on es- time e t r e a u s s i proche que p o s s i b l e de X, on s u b s t i t u e a l o r s I l a v a r i a b l e x^, l a v a r i a b l e
u. = χ. - χ
1 1 0
(3.4)
30 C h a p i t r e 3
L E x p r e s s i o n (3.2) d e v i e n t
X = - Τ η. χ. = - Υ η. (u. + χ )
X = ü + xQ (3.5)
Le c a l c u l de X r e v i e n t done au c a l c u l de u q u i peut e t i e p l u s s i m p l e ( c f . e x e r c i c e s 3 A)
b) Changement dTo r i g i n e e t d ' e c h e l l e
Si 1TI n t e r v a l l e de classe k e s t c o n s t a n t , on peut le p r e n d r e comme n o u v e l l e u n i t e e t i n t r o d u i r e l e changement de v a r i a b l e
x. - χ
Z i = ^ ( 3 . 6 )
On a a l o r s
X = - Υ n. (x + k z.) 1
11 1 V Ο l '
X = x + k z (3.7) ο
Le c a l c u l de X r e v i e n t ä c e l u i de ζ q u i peut encore e t r e p l u s simple ( c f . e x e r c i c e s 3 A ) .
4. P r o p r i e t e s de l a moyenne a r i t h m e t i q u e
a) La somme des d e v i a t i o n s dfu n ensemble de donnees x^, par r a p p o r t ä l e u r v a l e u r moyenne X, e s t n u l l e . En e f f e t :
] T n , (Xi - X) = £ η. χ. - η X = 0 ( 3 . 8 )
puisque * = ^ Σnixi '
b) La moyenne a r i t h m e t i q u e des d e v i a t i o n s x^ - Xq e s t egale ä l a d e v i a t i o n de l a moyenne a r i t h m e t i q u e des x^ par r a p p o r t ä XQ.
χ
- Υ η. (χ. - χ ) = ~ y n. χ. - _° y n. = χ - χ
A. Parametres de p o s i t i o n 31
5. La moyenne geometrique
Considerons une p o p u l a t i o n (au sens c l a s s i q u e ) q u i s'ac- c r o i t s u i v a n t une p r o g r e s s i o n geometrique. Ce sera l e c a s , par exemple, d'une p o p u l a t i o n dont l e s taux de n a t a l i t e e t de m o r t a l i t e sont c o n s t a n t s pendant l a p e r i o d e envisagee.
Soient r l e taux de croissance sur une p e r i o d e
Xq l ' e f f e c t i f de l a p o p u l a t i o n ä l a date i n i t i a l e t Q χ l ' e f f e c t i f de l a p o p u l a t i o n ä l a date t , c'est ä
η η' d i r e au bout de η p e r i o d e s .
On a a l o r s
Xl = Xo r 2
x0 = x. r = x r , e t c . e t par r e c u r r e n c e
2 1 ο r
χ = χ r η η ο
Si η e s t p a i r , l e m i l i e u des η periodes sera l a date t ^ oü Ρ - η/2.
On a p p e l l e moyenne geometrique des (χ^ ) ^e terme c o r r e s - pondant ä t ^ , s o i t
n/2 g = xo r
On montre que c e t t e moyenne geometrique e s t donnee par
g - ( xo x Xj χ x2 χ ... x xn)1/n+1 ( 3 . 9 ) En e f f e t c e t t e d e r n i e r e e x p r e s s i o n s ' e c r i t
g = ( x x x r x x r ^ x . . . x x r1 1)1/1 1*1
& v ο ο ο ο
t n+1 1+2+...+nN1/n+l
= (χ x r )
ο '
et en u t i l i s a n t l a r e l a t i o n l+2+...+n = n ^+^ on o b tie n t g = ( xon+1 χ r n C n + l ) / 2)l / n+l _ ^ n/2
On peut remarquer, ä p a r t i r de l ' e x p r e s s i o n ( 3 . 9 ) , que l e l o - garithme de g η'est a u t r e que l a moyenne a r i t h m e t i q u e des l o - garithmes des (χ^)·
32 C h a p i t r e 3
6. Moyenne harmonique
S o i t une s u i t e f i n i e de nombres { x j , ^29 Xß ··· Xf t ^
et l1e n s e m b l e des i n v e r s e s de ces nombres
{
_L, J_, _L,..., ±
}xl X2 x3 Xn
I I a r r i v e que ce s o i t l a moyenne a r i t h m e t i q u e de ces i n v e r s e s q u i a i t une s i g n i f i c a t i o n , p l u t o t que c e l l e de 1'ensemble i n i - t i a l , par exemple dans l e cas de grandeurs inversement p r o - p o r t i o n n e l l e s .
On a p p e l l e moyenne harmonique des x^ (supposes non n u l s ) 1!i n v e r s e de l a moyenne a r i t h m e t i q u e des inverses ( — ) , s o i t
i
h = (3.10) .^-ί χ.
1=1 ι . Exemple
Une v o i t u r e p a r c o u r t un c i r c u i t ferme ä une v i t e s s e de 10 km/h durant l e 1er t o u r , de 20 km/h durant l e second, de 30 km/h d u r a n t l e 3eme t o u r . Determiner l a v i t e s s e moyenne de l a v o i t u r e durant l e s t r o i s t o u r s .
S o i t I l a longueur du c i r c u i t (en km). La dutee t o t a l e des 3 parcours e s t
t = — + — + — 10 20 30
La v i t e s s e moyenne ν recherchee e s t done
3 i · 3 i 3 10 20 30 10 20 30
= 16,6 km/h
On v e r i f i e aisement que t o u t a u t r e c a l c u l de moyenne condui- r a i t ä un r e s u l t a t errone.
Α. Parametres de p o s i t i o n 33
7. Moyenne quadratique
I I a r r i v e que l e s ( x ^ ) i n t e r v i e n n e n t par lfe n s e m b l e de l e u r s c a r r e s
; 2 2 2 2,
1 ' x2 ' X3 "* *Xn
comme par exemple, en thermodynamique oü l!o n montre que l a temperature absolue d!u n gaz e s t l i e e aux c a r r e s des v i t e s s e s des molecules de ce gaz.
On d e f i n i t l a moyenne quadratique des (χ·) comme e t a n t l a
1 2
r a c i n e c a r r e e de l a moyenne a r i t h m e t i q u e des ( x ^ ) , s o i t (3.11) On montre que l e s d i f f e r e n t e s moyennes v e r i f i e n t l e s i n e - g a l i t e s
h £ g £ x £ q
( l e s e g a l i t e s ayant l i e u lorsque tous l e s nombres ( x ^ ) sont i d e n t i q u e s ) .
I I . LA MEDIANE 1. D e f i n i t i o n
La mediane e s t l a v a l e u r du c a r a c t e r e Mg t e l l e q u ' i l y a i t a u t a n t d ' i n d i v i d u s pour l e s q u e l s l e c a r a c t e r e e s t i n f e r i e u r ä Me que d ' i n d i v i d u s pour l e s q u e l s l e c a r a c t e r e e s t s u p e r i e u r ä Μ .
e
Pour determiner l a mediane, i l e s t done necessaire de c o n s i d e r e r l e s e f f e c t i f s cumules c r o i s s a n t s ou d e c r o i s s a n t s e t de chercher, l e cas echeant par i n t e r p o l a t i o n , l a v a l e u r du c a r a c t e r e correspondant ä 50 % de l ' e f f e c t i f t o t a l .
34 C h a p i t r e 3
2. Exemple
Dans l e cas de l a s e r i e groupee en classes du t a b l e a u 2 6 ( r e p r i s en 3 . 3 ) , on determine d'abord, ä p a r t i r des e f f e c t i f * cumules, l a classe contenant l a mediane, p u i s l a v a l e u r de 1<
mediane par i n t e r p o l a t i o n l i n e a i r e dans c e t t e c l a s s e . *
Centres E f f e c t i f s E f f e c t i f s Classes L i m i t e s de
c l a s s e
Effectifβ cumules cumules d*~
c r o i s s a n t
1,545 80
1,55-1,59
1,595
1,57 3
3 77
1,60-1,64
1 ,645
1,62 12
15 65
1,65-1,69
1,695
1 ,67 18
33 47
1 ,70-1,74
1 ,745
1,72 25
58 22
1,75-1 ,79
1 ,795
1,77 15
73 7
1,80-1 ,84
1 ,845
1 ,82 5
78 2
1,85-1 ,89
1 ,895
1 ,87 2
80
80
Tableau 3.3
La m o i t i e de l ' e f f e c t i f t o t a l e s t 40. Sur l e s e f f e c t i f s cumules c r o i s s a n t s , on v o i t que 33 personnes ont une t a i l l e i n f e r i e u r e ou egale ä 1,695 m. L ' i n t e r p o l a t i o n l i n e a i r e dans l a c l a s s e 1,695-1,745 dont l ' e f f e c t i f e s t de 25 personnes, donne pour l a mediane
Me = ,> 6 9 5 + 0,05 *2( 4 0 - 33) = ,> 6 9 5 + 0)014 . ,> 7 0 9 b
A. Parametres de p o s i t i o n 35
3. D e t e r m i n a t i o n graphigue de l a mediane a) ä p a r t i r de 11histogramme
E t a n t donnee l a s i g n i f i c a t i o n de l ' a i r e de 1'histogramme, l a mediane η'est a u t r e que l a v a l e u r du c a r a c t e r e q u i coupe 1'histogramme en deux p a r t i e s de s u r f a c e s egales.
. Exemple de l1histogramme de la figure 2.4 ( r e p r i s e dans l a f i g . 3.1).
frequence absolue
3 0 -
20.
10 _
A
in m \<d to<j- ON V <f
hi
frequence r e l a t i v e
-0,25
S t a i l l e
00
F i g u r e 3.1
b) ä p a r t i r des polygones des e f f e c t i f s cumules
La mediane e s t representee par l a v a l e u r du c a r a c t e r e c o r - respondant ä 1 ' i n t e r s e c t i o n
- s o i t de l a courbe des e f f e c t i f s cumules c r o i s s a n t s e t de l a courbe des e f f e c t i f s cumules d e c r o i s s a n t s
- s o i t de l'une des deux courbes precedentes avec 1 ' h o r i - z o n t a l e r e p r e s e n t a n t l ' e f f e c t i f m o i t i e .
. Exemple de la figure 2.5 ( r e p r i s e dans l a f i g . 3.2)
36 Chapitre 3
F i g u r e 3.2
I I I . LES PERCENTILES
Le kieme p e r c e n t i l e e s t l a v a l e u r du c a r a c t e r e C^
- t e l l e que l'ensemble des i n d i v i d u s dont l e c a r a c t e r e e s t au p l u s egal ä C^ represente l e s k % de l ' e f f e c t i f t o t a l
- t e l l e que l'ensemble des i n d i v i d u s dont l e c a r a c t e r e e s t au moins egal ä C^. r e p r e s e n t e l e s (100 - k ) % de l ' e f f e c t i f t o t a l
Parmi les p e r c e n t i l e s , on d i s t i n g u e l e s d e c i l e s , pour l e s q u e l s k = 10, 20, 30, ...
C1 0 = D l C2 0 = D2 ·'·
^e s q u a r t i l e s , pour l e s q u e l s k = 25, 50, 75 C2 5 = Q, C5 0 = Q2 C? 5 = Q3 l a mediane, pour l a q u e l l e k = 50, C ^ = Me = =
Le c a l c u l des d i f f e r e n t s p e r c e n t i l e s e s t t o u t ä f a i t ana- logue ä c e l u i de l a mediane.
Α. Parametres de p o s i t i o n 37
• Exemple
C a l c u l du 3eme q u a r t i l e pour l a d i s t r i b u t i o n du t a bleau 3.3.
Les 75 % de l ' e f f e c t i f t o t a l correspondent ä 60 personnes.
Sur l e s e f f e c t i f s cumules c r o i s s a n t s , on v o i t que 58 personnes ont une t a i l l e i n f e r i e u r e ou egale ä 1,745 m. Pour l e s 2 p e r - sonnes q u i manquent, on f a i t une i n t e r p o l a t i o n l i n e a i r e dans l a classe 1,745-1,795 dont l ' e f f e c t i f e s t de 15 personnes. On o b t i e n t done :
Q3 = 1 ,745 + — - * 1 ,745 + 0,006 = 1,75 1 m IV. MODE OU DOMINANTE
C'est l a v a l e u r du c a r a c t e r e correspondant ä l a frequence maximum.
Une d i s t r i b u t i o n peut präsenter p l u s i e u r s modes : on d i t q u ' e l l e e s t p l u r i m o d a l e .
. ExempleA
1. Diagramme en batons de l a f i g u r e 2.1 : Le mode e s t v i s i b l e m e n t D = 1 e n f a n t . 2. Histogramme de l a f i g u r e 2.4 :
On adopte pour mode l e c e n t r e de c l a s s e de l a c l a s s e mo- d a l e D = 1,72 m.
V. COMPARAISON DES DIFFERENTS PARAMETRES DE POSITION
La moyenne a r i t h m e t i q u e e s t peu s e n s i b l e aux f l u c t u a t i o n s d ' e c h a n t i l l o n n a g e . E l l e se p r e t e b i e n aux comparaisons. Des*
v a l e u r s aberrantes peuvent t o u t e f o i s l a m o d i f i e r sensiblement.
La mediane e s t plus s e n s i b l e aux f l u c t u a t i o n s d ' e c h a n t i l - lonage, e i l e l ' e s t moins ä des v a l e u r s aberrantes. T o u t e f o i s , e i l e se p r e t e moins b i e n ä des c a l c u l s a l g e b r i q u e s .
38 Chapitre 3
Le mode e s t r e p r e s e n t a t i f de l a v a l e u r du caractere I i p l u s c o u r a n t , l e p l u s t y p i q u e , mais i l peut presenter une :er-
t a i n e a m b i g u i t e .
En p r a t i q u e , i l e s t f r e q u e n t que parmi ces t r o i s para- m e t r e s , l e c h o i x de l!u n ne sfimpose pas p l u s que l e choix de
lf a u t r e . La comparaison des t r o i s permet de se f a i r e une i i e e p l u s complete de l a d i s t r i b u t i o n . L1 i n t e r p r e t a t i o n des p o s i t i o n s r e l a t i v e s de ces parametres e s t p a r f o i s p l u s immediate que c e l l e des parametres de d i s p e r s i o n q u i s e r o n t l ' o b j e t de l a f i n i e ce c h a p i t r e .
Β. PARAMETRES D E D I S P E R S I O N
Les parametres de p o s i t i o n sont i n s u f f i s a n t s pour carac- t e r i s e r completement une s e r i e . Par exemple, deux s e r i e s d i f f e r e n t e s ayant l a meme moyenne, ne se r e p a r t i s s e n t pas necessairement de l a meme maniere autour de c e t t e moyenne.
E l l e s sont p l u s ou moins e t a l e e s , ce q u i sera d e c r i t par l e s
" c a r a c t e r i s t i q u e s de d i s p e r s i o n .
Un parametre de d i s p e r s i o n se r a p p o r t e ä l a d i f f e r e n c e de deux v a l e u r s du c a r a c t e r e a l o r s qu'un parametre de p o s i - t i o n r e p r e s e n t e une v a l e u r du c a r a c t e r e . On d i s t i n g u e l e s n o t i o n s s u i v a n t e s :
d e v i a t i o n : d i f f e r e n c e a l g e b r i q u e de deux v a l e u r s du c a r a c - t e r e , par exemple x^ - X ;
e c a r t : v a l e u r absolue de l a d i f f e r e n c e de deux v a l e u r s du c a r a c t e r e , par exemple |x^ - x| ;
I n t e r v a l l e de v a r i a t i o n , etendue (ou range) : d i f f e r e n c e e n t r e l e s v a l e u r s extremes du c a r a c t e r e ;
e c a r t i n t e r q u a r t i l e : d i f f e r e n c e e n t r e l e 3eme e t l e 1er q u a r t i l e s , cfe s t ä d i r e - Qj ( v o i r paragraphe p r e c e - dent pour l a s i g n i f i c a t i o n des q u a r t i l e s ) .
Rappel : l a somme des d e v i a t i o n s dfu n ensemble de donnees x^
par r a p p o r t ä l e u r v a l e u r moyenne X, e s t n u l l e . En e f f e t , d'apres 1!e q u a t i o n (3.8)
Σ
η . ( xi - X) -Σ
ni xi - n X - 0i i
40 Chapitre 3
I . ECART MOYEN ARITHMETIQUE . D e f i n i t i o n
LTe c a r t moyen a r i t h m e t i q u e e s t l a moyenne a r i t h m e t i q u e des e c a r t s p a r r a p p o r t ä l a moyenne a r i t h m e t i q u e des v a l e u r s du c a r a c t e r e
Ε = - Υ n. |x. - Xl (3. 12) η Ar* ι 1 ι 1
1
A p a r t i r du t a b l e a u 3.3, en prenant X = 1,707 m, on o b t i e n t l e t a b l e a u s u i v a n t :
Centres de classes
1
n.
1 l * i - Xl n i Κ - x|
1,57 3 0,137 0,41 1
1,62 12 0,087 1,044
1,67 18 0,037 0,666
1,72 25 0,013 0,325
1,77 15 0,063 0,945
1,82 5 0,113 0,565
1,87 2 0,163 0,326
80 T o t a l 4,282
Tableau 3.4
1 = i Σ n i lxi - ^ « jo *4>282 - ° >0 53 m I I . VARIANCE. ECART-TYPE
1. Variance
La v a r i a n c e d'une s e r i e de v a l e u r s du c a r a c t e r e e s t l a
Β. Parametres de d i s p e r s i o n 41
moyenne a r i t h m e t i q u e des c a r r e s des e c a r t s de ces v a l e u r s par r a p p o r t ä l e u r moyenne a r i t h m e t i q u e .
Σ
ni
X )2 ( 3 . 13)Les c a r r e s des d i f f e r e n c e s e v i t e n t 1 ' u t i l i s a t i o n de v a l e u r s absolues. Les dimensions de V sont C e l l e s du c a r a c t e r e au c a r r e . I I f a u t done en e x t r a i r e l a r a c i n e carree pour o b t e n i r un parametre c a r a c t e r i s t i q u e des e c a r t s .
2. E c a r t - t y p e
Lfe c a r t - t y p e (ou e c a r t quadratique moyen) e s t l a r a c i n e carree de l a v a r i a n c e '
σ = Λ Γ (3. 14) ,Cfest l e p l u s s i g n i f i c a t i f de tous l e s parametres de d i s p e r
s i o n . . Exemple
A p a r t i r du t a b l e a u 3.4, avec X = 1,707 m on o b t i e n t l e t a b l e a u s u i v a n t :
Centres de c l a s s e s χ.
1
η.
1
( X i - x )2 n± (xv - X )2
1,57 3 0,01877 0,05631
1 ,62 12 0,00757 0,09084
1,67 ίδ 0,00137 0,02466
1,72 25 0,00017 0,00425
1,77 15 0,00397 0,05955
1 ,82 5 0,01277 0,06385
1 ,87 2 0,02657 0,05314
80 T o t a l 0,35260
Tableau 3.5