• Aucun résultat trouvé

INTRODUCTION A LA STATISTIQUE

N/A
N/A
Protected

Academic year: 2022

Partager "INTRODUCTION A LA STATISTIQUE"

Copied!
350
0
0

Texte intégral

(1)

INTRODUCTION A LA STATISTIQUE

(2)

I INTRODUCTION

II

TABLEAUX ET GRAPHES III

ANALYSE D'UNE DISTRIBUTION DE FREQUENCES IV

ANALYSE CO Μ BIN ΑΤΟΙ RE V

PRINCIPES G^NERAUX DU CALCUL DES PROBABILITES VI

LES LOIS DE PROBABILITG VII

LES TESTS STATISTIQUES

(3)

Emile Amzallag Norbert Piccioli

P R E M I E R S C Y C L E S U Ν I V Ε R S IΤ AI R Ε S

INTRODUCTION Α LA

STATISTIQUE

Exercices corriges

avec rappels detaillos de cours et exemples

A l ' u s a g e d e s e t u d i a n t s e n s c i e n c e s e c o n o m i q u e s , m e d e c i n e , p h a r m a c i e , e t c . a i n s i q u e d e s e l e v e s d e s s e c o n d s c y c l e s d e s l y c e e s e t d e s c l a s s e s p r e p a r a t o i r e s

a u x g r a n d e s e c o l e s s c i e n t i f i q u e s

Avec la collaboration de Francois Bry

Hermann - I L - Collection

Paris Meihodes

(4)

EMILE AMZALLAG, ne en 1932 au Maroc, I n g e n i e u r de l ' E c o l e s u p e r i e u r e d ' e l e c t r i c i t e , d o c t e u r es s c i e n c e s , e s t m a i t r e - a s s i s t a n t ä i ' U n i v e r - s i t e de P a r i s V I e t c h a r g e de c o u r s a L ' U n i v e r s i t e de P a r i s V.

NORBERT P I C C I O L I , ne en 1941 en A l g e r i e , d o c t e u r de 3e c y c l e , e s t m a t t r e - a s s i s t a n t a 1 ' U n i v e r s i t e de P a r i s V I .

Tous deux e f f e c t u e n t des r e c h e r c h e s s u r l e s p r o p r i e t e s o p t i q u e s des s e m i - c o n d u c t e u r s au L a b o r a t o i r e de p h y s i q u e des s o l i d e s de 1 ' U n i v e r - s i t e P i e r r e e t M a r i e C u r i e .

FRANCOIS ERY, ne e n 1956 a P a r i s , a passe l a m a i t r i s e de m a t h e m a t i q u e s en 1978 ; i l a f a i t ses e t u d e s a l'UER des m a t h e m a t i q u e s de l a d e c i - s i o n ä 1 ' U n i v e r s i t e P a r i s X I D a u p h i n e , ou i l s ' e s t i n i t i e a u x mathe- m a t i q u e s a p p l i q u e e s ä l ' e c o n o m i e avec I . E k e l a n d ; i l se c o n s a c r e ä p r e s e n t aux m a t h e m a t i q u e s p u r e s .

ISBN 2 7056 5889 0

1978, Hermann 293 r u e L e c o u r b e , 75015 P a r i s

Tous d r o i t s de r e p r o d u c t i o n , meme f r a g m e n t a i r e , sous q u e l q u e forme que ce s o i t , y c o m p r i s P h o t o g r a p h i e , m i c r o f i l m , bände m a g n e t i q u e , d i s q u e ou a u t r e , r e s e r v e s p o u r t o u s p a y s .

(5)

Table

CHAPITRE 1; INTRODUCTION 1 I . La s t a t i s t i q u e 1 II· Notions de base 1 I I I . La methode s t a t i s t i q u e 3

CHAPITRE 2; TABLEAUX ET GRAPHES 6

A. TABLEAUX 6 I . Tableau de frequences a un c a r a c t e r e 6

I I . Tableau de frequences cumulees 7 I I I . Tableau de frequences ä deux c a r a c t e r e s 8

IV. Cas d!une s e r i e q u a n t i t a t i v e c o n t i n u e 9

Β. REPRESENTATIONS GRAPHIQUES 11 I . Caractere d i s c o n t i n u . Diagramme en batons 11

I I . Caractere c o n t i n u . Histogramme 13 E x e r c i c e s : B. R e p r e s e n t a t i o n s graphiques 19 CHAPITRE 3: ANALYSE D1UNE DISTRIBUTION DE FREQUENCES 25

A. PARAMETRES DE POSITION 27

I . Les moyennes 27 I I . La mediane 33 I I I . Les p e r c e n t i l e s 36 IV. Mode ou dominante 37 V. Comparaison des d i f f e r e n t s parametres de

p o s i t i o n 37 Β. PARAMETRES DE DISPERSION 39

I . E c a r t moyen a r i t h m e t i q u e 40 I I . V a r i a n c e . E c a r t - t y p e 40 I I I . Moments d!une s e r i e s t a t i s t i q u e 43

E x e r c i c e s : A. Parametres de p o s i t i o n 44 Β. Parametres de d i s p e r s i o n 47 CHAPITRE 4: ANALYSE COMBINATOIRE 55

A. ARRANGEMENTS 57

I . D e f i n i t i o n . C a l c u l de AP 57

η

I I . Arrangements avec r e p e t i t i o n 58

(6)

Β. PERMUTATIONS 60 I . D e f i n i t i o n . C a l c u l de Ρ 60

η

I I . Permutations avec r e p e t i t i o n 61 I I I . Permutation c i r c u l a i r e 61

C. COMBINAISONS 63

I . D e f i n i t i o n . C a l c u l de CP 63

η

I I . Permutations avec r e p e t i t i o n s e t

combinaisons 64 I I I . Binome de Newton 65

IV. Combinaisons avec r e p e t i t i o n 66

E x e r c i c e s : A. Arrangements 67 B. Permutations 69 C. Combinaisons 71 CHAPITRE 5: CALCUL DES PROBABILITES 81

A. LOGIQUE DES ΕVEΝΕΜΕNTS 81

I . I n t r o d u c t i o n 81 I I . Notions de base 82 I I I . Logique des evenements 84

Β. PROBABILITE 87 I . P r o b a b i l i t e uniforme 87

I I . P r o b a b i l i t e e t frequence 88 I I I . D e f i n i t i o n dfune p r o b a b i l i t e 89

C. PROBABILITES TOTALES 93 I . Theoreme des p r o b a b i l i t e s t o t a l e s 94

I I . G e n e r a l i s a t i o n 94 D. PROBABILITES COMPOSEES ET THEOREME DE BAYES 96

I . D e f i n i t i o n d'une p r o b a b i l i t e composee 96

I I . Evenements independants 97 I I I . Theoreme de Bayes 97 Ε. EXEMPLES COMPLEMENTAIRES 101

I . L o i binömiale 101 I I . L o i hypergeometrique 102

E x e r c i c e s : A. Logique des evenements 104

B. P r o b a b i l i t e 109

Ce P r o b a b i l i t e s t o t a l e s 117

(7)

D. P r o b a b i l i t e s composees e t theoreme de Bayes 125

E. Exercices complementaires 135

CHAPITRE 6: LES LOIS DE PROBABILITE 141 A. VARIABLES ALEATOIRES 141

I . I n t r o d u c t i o n 141 I I . L o i de p r o b a b i l i t e , f o n c t i o n de r e p a r t i -

t i o n , d e n s i t e de p r o b a b i l i t e 143 I I I . Esperance mathematique e t moments 146

IV. I n e g a l i t e de Bienayme-Tchebycheff. L o i des

grands nombres 148 B. LOI BINOMIALE 151

I . D e f i n i t i o n 151 I I . Diagramme e t parametres c a r a c t e r i s t i q u e s 152

I I I . Approximations de l a l o i binömiale 153

C. LOI DE POISSON 154 I . D e f i n i t i o n 154 I I . Diagramme e t parametres c a r a c t e r i s t i q u e s 154

D. LOI NORMALE 158 I . D e f i n i t i o n 158 I I . Densite de p r o b a b i l i t e 159

I I I . F o n c t i o n de r e p a r t i t i o n 160 IV. Exemples d ' a p p l i c a t i o n 162 E x e r c i c e s : A. V a r i a b l e s a l e a t o i r e s 166

B. L o i binömiale 173 C. L o i de Poisson 184 D. L o i normale 192 CHAPITRE 7: LES TESTS STATISTIQUES 207

A. ECHANTILLONNAGE 209 I . D i s t r i b u t i o n des moyennes 209

I I . D i s t r i b u t i o n des frequences 211 I I I . Autres d i s t r i b u t i o n s d1e c h a n t i l l o n n a g e 212

B. ESTIMATION 214 I . E s t i m a t i o n p o n c t u e l l e 214

I I . E s t i m a t i o n par I n t e r v a l l e de c o n f i a n c e 216

(8)

I I I , N o r m a l i t e des f l u c t u a t i o n s d ' e c h a n t i -

llonnage 217 IV. I n t e r v a l l e de confiance d!une moyenne 221

V. I n t e r v a l l e de confiance d'une frequence 224

C. TESTS DE SIGNIFICATION 227 I . P r i n c i p e s des t e s t s d'hypothese 227

I I . Premiere a p p l i c a t i o n : l e s t e s t s de

c o n f o r m i t e 229 I I I . Deuxieme a p p l i c a t i o n : l e s t e s t s

d1homogeneite 235

D. TEST DU χ2 240

2

I . D i s t r i b u t i o n du χ 240 I I . C r i t e r e de Pearson 241 I I I . Test de c o n f o r m i t e 243

I V . Test d1homogeneite 246

E. AJUSTEMENT LINEAIRE - CORRELATION 249

I . I n t r o d u c t i o n 249 I I . D r o i t e de r e g r e s s i o n 251

I I I . C o e f f i c i e n t de c o r r e l a t i o n 251

I V . Tests d!hypothese 256

E x e r c i c e s : A. E c h a n t i l l o n n a g e 262 B. E s t i m a t i o n 269 C. Tests de s i g n i f i c a t i o n 277

D. Tests de χ2 289

Ε. Ajustement l i n e a i r e - c o r r e l a t i o n 301

NAISSANCE DU CALCUL DES PROBABILITES 311

TABLE 1 326 TABLE 2 328 TABLE 3 329 TABLE 4 330 TABLE 5 331 TABLE 6 332 TABLE 7 333 Index des symboles 335

Index 337

(9)

Avant-propos

Cet ouvrage e s t d e s t i n e aux e t u d i a n t s des premiers c y c l e s u n i - versitäres, aux eleves des classes p r e p a r a t o i r e s aux grandes ecoles s c i e n t i f i q u e s , a i n s i qu!ä tous ceux q u i d e s i r e n t s ' i n i t i e r au c a l c u l des p r o b a b i l i t e s e t a l a s t a t i s t i q u e . I I i n t e r e s s e r a specialement l e s e t u d i a n t s en sciences economiques e t ceux du premier c y c l e des etudes medicales e t d e n t a i r e s (P.C.E.M) ou de pharmacie.

C'est avant t o u t un l i v r e dfi n i t i a t i o n q u i v i s e a 1 ' a c q u i s i t i o n de techniques de base, plutöt qu'ä l1e t u d e de t h e o r i e s mathemati- ques f i n e s ou de problemes p h i l o s o p h i q u e s poses par l e s n o t i o n s de p r o b a b i l i t e ou d1i n d u c t i o n s t a t i s t i q u e . A f i n de repondre aux d i f f i c u l t e s que r e n c o n t r e n t l e s e t u d i a n t s pour passer du cours aux a p p l i c a t i o n s , 1Ouvrage r e u n i t des r a p p e l s d e t a i l l e s de cours v i s a n t ä f a m i l i a r i s e r l e l e c t e u r avec l e s n o t i o n s e s s e n t i e l l e s , de nombreux exemples d ' a p p l i c a t i o n , a i n s i qu'une c e n t a i n e d'exer- c i c e s c l a s s e s par o r d r e de d i f f i c u l t e c r o i s s a n t e e t s u i v i s de c o r r i g e s s u c c i n t s , p e r m e t t a n t de m e t t r e en p r a t i q u e e t de contrö- l e r l e s connaissances.

On expose d'abord l e s grandes l i g n e s de l a s t a t i s t i q u e d e s c r i p t i v e , oü i l s ' a g i t e s s e n t i e l l e m e n t de p r e s e n t e r l e s donnees sous une forme immediatement e x p l o i t a b l e , en l e s r e d u i s a n t ä quelques parametres c a r a c t e r i s t i q u e s . Apres des r a p p e l s d'analyse combi- n a t o i r e , on i n t r o d u i t l e s p r i n c i p e s generaux du c a l c u l des p r o - b a b i l i t e s , en m o n t r a n t l e s p o s s i b i l i t e s d ' u t i l i s a t i o n de l ' a l g e b r e des ensembles q u i e s t de p l u s en p l u s f a m i l i e r e aux e t u d i a n t s . Les d i f f e r e n t e s l o i s de p r o b a b i l i t e u s u e l l e s sont e n s u i t e e t u d i e e s e t l e u r s c o n d i t i o n s d ' a p p l i c a t i o n examinees. La d e r n i e r e p a r t i e de l'ouvrage i n t r o d u i t a l a s t a t i s t i q u e i n d u c t i v e q u i , grace ä

1 ' a s s i m i l a t i o n des o b s e r v a t i o n s experimentales aux l o i s t h e o r i q u e s e t a 1 ' a p p l i c a t i o n de t e s t s , f o u r n i t des elements de d e c i s i o n . Les e x e r c i c e s proposes se r a p p o r t e n t ä des domaines v a r i e s : economie, medecine, j e u x , e t c . . . De nombreux problemes proposes ces d e r n i e r e s annees aux concours de P.C.E.M sont donnes avec l e u r s c o r r i g e s .

(10)
(11)

1. Introduction

I . LA STATISTIQUE

De nombreux domaines de l a connaissance p r a t i q u e s'ap- p u i e n t sur 1'etude de c o l l e c t i o n s homogenes d * o b j e t s ou de personnes. La s t a t i s t i q u e e s t un ensemble de methodes permet- t a n t de degager l e s c a r a c t e r i s t i q u e s ou l a r e p a r t i t i o n de ces o b j e t s en f o n c t i o n de c r i t e r e s d!e t u d e determines.

Ces methodes t i r e n t l e u r j u s t i f i c a t i o n t h e o r i q u e de c e r - t a i n e s c o n s t r u c t i o n s mathematiques ( t h e o r i e des p r o b a b i l i t e s , algebre l i n e a i r e , e t c . ) , mais c!e s t l e domaine d* a p p l i c a t i o n q u i j u s t i f i e l e choix de l a methode e t 11 i n t e r p r e t a t i o n des r e s u l t a t s obtenus. I I e s t r e l a t i v e m e n t f r e q u e n t que des con- c l u s i o n s erronees s o i e n t t i r e e s dTune etude s t a t i s t i q u e p a r - f a i t e m e n t coherente en t h e o r i e ( c ' e s t souvent l e cas des sondages d1o p i n i o n en p e r i o d e e l e c t o r a l e ) . I I e s t done e s - s e n t i e l de ne pas r e d u i r e l a s t a t i s t i q u e ä 11 a p p l i c a t i o n meca- nique de formules.

I I . NOTIONS DE BASE

La c o l l e c t i o n d ' o b j e t s ou de personnes e t u d i e e e s t appe- lee p o p u l a t i o n ou u n i v e r s .

Un o b j e t ou une personne sur l e s q u e l s p o r t e lfe t u d e e s t appele i n d i v i d u ( i n d i v i d u s t a t i s t i q u e ) .

Les c r i t e r e s e t u d i e s c o n s t i t u e n t des c a r a c t e r e s . On peut p r e c i s e r ces n o t i o n s sur I'exemple s u i v a n t , ex- t r a i t d'une f e u i l l e de recensement r e l a t i v e aux logements occupes par l e s menages dans une commune i n d u s t r i e l l e du Nord de l a France.

(12)

2 I n t r o d u c t i o n

Type 4e logemettf; appartemettt ' - ; , maison, i n d i v i d u e l l e

a u t r e s n

Surface h a b i t a b l e «**•, *« , * *» *4·**ΨΦ***4ψΛ l ,

Nombre de,pieces d*Kabitatioti

Y a- t- i l une cuisi&£ t ouif p r i v i e Ο "

o u i , commune Π

S a l l e de bains ott douche ? o u i , p r i v g e

o u i , comime

ncm

Questionnaire (partiel) relatif aux logements occupes par les manages.

La p o p u l a t i o n s t a t i s t i q u e e s t c o n s t i t u t e i c i par 1'en­

semble des menages de l a commune. Les c a r a c t e r e s , q u i c o r r e s ­ pondent aux questions posees sont de deux types :

- on ne peut a s s o c i e r ä c e r t a i n s d'entre eux n i une v a l e u r numerique, n i un o r d r e n a t u r e l (par exemple : l e t y p e de logement). De t e l s c a r a c t e r e s sont appeles caracteres q u a l i t a t i f s ;

- c e r t a i n s c a r a c t e r e s prennent des v a l e u r s numeriques (par exemple : l e nombre de pieces d ' h a b i t a t i o n ) . Ce sont des c a r a c t e r e s q u a n t i t a t i f s .

Un caractere c o n t i n u e s t un c a r a c t e r e q u a n t i t a t i f q u i peut prendre toutes l e s v a l e u r s numeriques dfu n I n t e r v a l l e determine (par exemple : l a surface h a b i t a b l e ) .

Un caractere d i s c r e t (ou d i s c o n t i n u ) e s t un c a r a c t e r e q u i ne peut prendre que des v a l e u r s numeriques i s o l e e s dans un I n t e r v a l l e (par exemple : l e nombre de pieces d ' h a b i t a t i o n ) .

(13)

I n t r o d u c t i o n 3

Un t e l recensement peut e t r e g e n e r a l ( e t p o r t e r par exemple sur 1*ensemble des menages dfune grande v i l i e ) ou p a r t i e l (ne p o r t e r que sur une p a r t i e seulement de ces mena- ges). Dfune maniere g e n e r a l e , on a p p e l l e e c h a n t i l l o n l a p a r t i e de l a p o p u l a t i o n s t a t i s t i q u e sur l a q u e l l e p o r t e lfe n - quete.

L1e f f e c t i f ou frequence absolue associee ä une v a l e u r d*un c a r a c t e r e e s t l e nombre de f o i s oü c e t t e v a l e u r du c a r a c -

t e r e a ete observee.

La frequence r e l a t i v e associee ä une v a l e u r d'un c a r a c - t e r e e s t l e r a p p o r t , de l a frequence absolue correspondant ä c e t t e v a l e u r du c a r a c t e r e au nombre d ' i n d i v i d u s de 1'echan- t i l l o n .

Une s e r i e s t a t i s t i q u e , ou d i s t r i b u t i o n s t a t i s t i q u e , asso- ciee ä un c a r a c t e r e , e s t 1!ensemble des v a l e u r s du c a r a c t e r e , avec en r e g a r d , l e s frequences absolues ou r e l a t i v e s c o r r e s - pondantes.

Les s t a t i s t i q u e s d e s i g n e n t communement l e s donnees r e l a - t i v e s ä une meme c a r a c t e r i s t i q u e ou encore l e s r e s u l t a t s obtenu's ä p a r t i r de ces donnees. Par exemple : l e s s t a t i s t i - ques de l ^ m p l o i ou du chomage, l e s s t a t i s t i q u e s d'une c e r t a i n e maladie.

I I I . LA METHODE STATISTIQUE

D'une maniere g e n e r a l e , l a s t a t i s t i q u e considere des phe- nomenes q u i ne sont pas t o u j o u r s a c c e s s i b l e s ä 11 e x p e r i e n c e . Par s u i t e de l a m u l t i p l i c i t e des causes, on ne peut comme en physique par exemple, f i x e r un c e r t a i n nombre de parametres e t e t u d i e r d e v o l u t i o n du phenomene. La methode s t a t i s t i q u e comporte e s s e n t i e l l e m e n t t r o i s phases :

- une phase m a t e r i e l l e oü i l s ' a g i t de rassembler des

(14)

4 I n t r o d u c t i o n

donnees, de l e s regrouper e t de l e s p r e s e n t e r sous forme de t a b l e a u x ou graphes ;

- une phase änalytique q u i c o n s i s t e ä r e d u i r e l e s don- nees ä un nombre l i m i t e de parametres c a r a c t e r i s t i q u e s (mo- ments d!o r d r e 1, 2, 3, ...) s u s c e p t i b l e s de d e c r i r e l a s e r i e s t a t i s t i q u e . l/ensemble de ces deux phases c o n s t i t u e l ' o b j e t e s s e n t i e l de l a s t a t i s t i q u e d e s c r i p t i v e (ou d e d u c t i v e ) dont l e s r e s u l t a t s r e s t e n t l i m i t e s aux e c h a n t i l l o n s etucjies ;

- une phase i n t e r p r e t a t i v e , q u i e s t ä l a base de l a s t a t i s t i q u e i n d u c t i v e , e t q u i permet de d e d u i r e des r e s u l t a t s obtenus sur un e c h a n t i l l o n des c o n c l u s i o n s r e l a t i v e s ä lfe n - semble de l a p o p u l a t i o n d'oü e s t e x t r a i t c e t e c h a n t i l l o n . Ces c o n c l u s i o n s d o i v e n t t e n i r compte de l a marge d ' e r r e u r due au f a i t que l e s donnees sont seulement p a r t i e l l e s . Les metho- des u t i l i s e e s n'ont de sens que s i e l l e s sont j u s t i f i e e s par des r e s u l t a t s u l t e r i e u r s .

(15)

2. Tableaux et graphes

Une enqueue s t a t i s t i q u e comporte t o u j o u r s une phase i n i - t i a l e oü i l s ' a g i t de c o l l e c t e r des renseignements, s u i v i e d'un§ phase de d e p o u i l l e m e n t q u i c o n s i s t e ä passer des donnees b r u t e s ä des tableaux ou ä des graphes q u i se p r e t e n t mieux a.

lfa n a l y s e e t 1fi n t e r p r e t a t i o n .

La maniere dont l'enquete e s t e f f e c t u e e e s t evidemment t r e s i m p o r t a n t e . En p a r t i c u l i e r , s i l ' o n espere d e d u i r e des r e s u l t a t s obtenus sur un e c h a n t i l l o n des c o n c l u s i o n s r e l a t i - ves ä t o u t e l a p o p u l a t i o n , i l c o n v i e n t de s?a s s u r e r que lre - c h a n t i l l o n e s t b i e n r e p r e s e n t a t i f de c e t t e p o p u l a t i o n , ce q u i sera p r e c i s e dans l a t h e o r i e de 11e c h a n t i l l o n n a g e ( c f . chap. 7 ) . Cependant 1*objet du p r e s e n t c h a p i t r e sera l i m i t e ä lfe t u d e des d i f f e r e n t e s manieres de p r e s e n t e r une s e r i e s t a t i s t i q u e .

(16)

A. TABLEAUX

I . TABLEAU DE FREQUENCES A UN CARACTERE

Ce t a b l e a u e t a b l i t l a correspondance e n t r e deux s e r i e s de nombres, l'une c o n s t i t u t e par l e s v a l e u r s du c a r a c t e r e e t u d i e , 1'autre par l e s e f f e c t i f s correspondants (ou l e s f r e - quences r e l a t i v e s correspondantes).

, Exemple d'une serie quantitative discrete

L ' e c h a n t i l l o n e s t un irameuble de 64 f a m i l i e s , l e carac- t e r e e t u d i e e t a n t l e nombre dfe n f a n t s par f a m i l l e .

Nombre

d'enfants 0 1 2 ' 3 4 5 T o t a l

Nombre de

f a m i l i e s 16 18 14 1 1 3 2 64

Frequence

r e l a t i v e 0,250 0,281 0,218 0,172 0,047 0,031 1

Tableau 2.1

. Exemple dfune serie qualitative

L * e c h a n t i l l o n e s t l'immeuble de 64 f a m i l i e s de 1'exemple precedent, l e c a r a c t e r e e s t l a p r o f e s s i o n du chef de f a m i l l e , ä l a q u e l l e on a t t r i b u e un code dfune maniere a r b i t r a i r e .

La correspondance v a l e u r du c a r a c t e r e - e f f e c t i f c o r r e s - pondant, d e f i n i t une f o n c t i o n d i t e f o n c t i o n de d i s t r i b u t i o n , q u i sera developpee au c h a p i t r e 3.

(17)

A. Tableaux 7

P r o f e s s i o n Code E f f e c t i f Frequence r e l a t i v e

O u v r i e r s e t employes 1 24 0,375 Cadres moyens e t s u p e r i e u r s 2 9 0,140 ...

Commergants 3 10 0,156 ...

F o n c t i o n n a i r e s 4 15 0,234 ...

P r o f e s s i o n s l i b e r a l e s 5 6 0,093 ...

64 1

Tableau 2.2

I I . TABLEAU DE FREQUENCES CUMULEES

La s e r i e s t a t i s t i q u e du t a b l e a u 2.1 peut e t r e presentee sous une forme d i t e cumulee, des deux manieres s u i v a n t e s :

. Cumul par valeurs inferieures ou effectifs cumules croissants

Nombre d'enfants cumules

Moins de 1 e n f a n t 16 f a m i l i e s 2 e n f a n t s 16 + 18 = 34 It

3 II 34 + 14 = 48 II

4 II 48 + 11 -59 II

5 II 59 + 3 = 62 II

6 II 62 + 2 = 64 II

Tableau 2.3

(18)

8 C h a p i t r e 2

Cumul par valeurs superieures ou effectifs cumules decrois- sants

Nombre d'enfants E f f e c t i f s cumules 0 e n f a n t ou p l u s 64 f a m i l i e s . 1 e n f a n t " " 64 - 16 = 48

2 e n f a n t s " 48 - 18 = 30

3 If II It 30 - 14 = 16

4 II II II 1 6 - 1 1 = 5

5 It If It 5 - 3 = 2

Tableau 2.4

La correspondance v a l e u r du c a r a c t e r e - e f f e c t i f cumule c o r r e s p o n d a n t , d e f i n i t une f o n c t i o n d i t e de r e p a r t i t i o n , q u i s e r a egalement developpee au c h a p i t r e 3.

I I I . TABLEAU DE FREQUENCES A DEUX CARACTERES

Si lfo n sfi n t e r e s s e ä deux caracteres d i f f e r e n t s dans un meme e c h a n t i l l o n , i l e s t p o s s i b l e de r e p r e s e n t e r 1'ensemble des renseignements dans un meme t a b l e a u ( t a b l e a u ä double e n t r e e ) .

* ExemP^e de tableau de frequences a deux caracteres

L1e c h a n t i l l o n e s t l e meme que precedemment. Le c a r a c t e r e X e s t l e nombre de personnes v i v a n t dans un appartement, l e c a r a c t e r e Y e s t l e nombre de pieces par appartement. L * i n t e r - s e c t i o n dfune l i g n e e t d!une colonne du t a b l e a u e s t l e nombre de f o i s oü lfo n a observe X personnes v i v a n t dans un apparte- ment de Y p i e c e s . Par exemple, on a observe 7 f o i s 3 personnes v i v a n t dans un appartement de 3 pieces.

(19)

A. Tableaux 9

>ν Χ

Υ \ ν 2 3 4 6 T o t a l nombre

d1appartements

2 8 5 2 0 0 15

3 5 7 4 2 0 18

4 3 6 8 9 5 31

T o t a l nombre de f a m i l i e s

16 18 14 1 1 5 64

Tableau 2.5

IV. CAS D'UNE SERIE QUANTITATIVE CONTINUE

A f i n de rendre l a s e r i e s t a t i s t i q u e p l u s commode ä e t u d i e r , i l e s t necessaire de regrouper l e s v a l e u r s du c a r a c t e r e en i n t e r v a l l e s s u c c e s s i f s e t c o n t i g u s , t e l s que dans chaque I n t e r - v a l l e ou c l a s s e , on ne d i s t i n g u e pas l e s v a l e u r s du c a r a c t e r e q u i y sont comprises. Les nombres e n t r e l e s q u e l s sont comprises ces v a l e u r s c o n s t i t u e n t l e s l i m i t e s de c l a s s e . Dans chaque c l a s s e , on remplace l e s v a l e u r s du c a r a c t e r e observees par une v a l e u r unique, c e l l e du m i l i e u de 1TI n t e r v a l l e ou c e n t r e de classe.

. Exemple

Une enquete p o r t a n t sur l a t a i l l e des i n d i v i d u s dfu n e c e r - t a i n e c o l l e c t i v i t e de 80 personnes a permis de dresser l e t a b l e a u s u i v a n t oü lfo n a adopte un I n t e r v a l l e de classe de 0,05 m.

(20)

10 Chapitre 2

Centres E f f e c t i f s E f f e c t i f s Classes L i m i t e s de

c l a s s e

E f f e c t i f s cumules c r o i s s a n t s

cumules de- er o i s s a n t s

1 ,545 80

1 ,55-1,59

1,595

1,57 3

3 77

1,60-1,64

1 ,645

1 ,62 12

15 65

1,65-1,69

1 ,695

1 ,67 18

33 47

1,70-1,74

1,745

1,72 25

58 22

1,75-1,79

1 ,795

1,77 15

73 7

1 ,80-1,84

1,845

1 ,82 5

78 2

1,85-1,89

1 ,895

1 ,87 2

80

80

Tableau 2.6

On peut remarquer que l e s e f f e c t i f s cumules c r o i s s a n t s correspondent aux f r o n t i e r e s superieures des c l a s s e s , e t l e s e f f e c t i f s cumules d e c r o i s s a n t s aux f r o n t i e r e s i n f e r i e u r e s des c l a s s e s .

(21)

Β. REPRESENTATIONS GRAPHIQUES

Les r e p r e s e n t a t i o n s graphiques ont lTa v a n t a g e dfo f f r i r une m e i l l e u r e vue d1ensemble de l a s e r i e s t a t i s t i q u e que l e s t a ­ bleaux. E l l e s p e r m e t t e n t par simple l e c t u r e , de v o i r l e s carac­

t e r i s t i q u e s e s s e n t i e l l e s de l a s e r i e , e t a u s s i de comparer des s e r i e s d i f f e r e n t e s .

I . CARACTERE DISCONTINU. DIAGRAMME EN BATONS

Lorsque l e c a r a c t e r e e s t d i s c o n t i n u , on u t i l i s e l e d i a - gramme en batons : l e s v a l e u r s du c a r a c t e r e sont portees en a b s c i s s e s , l e s frequences correspondantes sont representees par des t r a i t s p l e i n s , en ordonnees.

Si l ' o n j o i n t l e s sommets des batons, on o b t i e n t l e p o l y - gone des frequences,.

Exemple 1

Diagramme en batons du t a b l e a u 2.1 r e p r i s en 2.7

Nombre d'enfants Frequences Frequences r e l a t i v e s

0 16 0,250

1 18 0,281

2 14 0,218

3 1 1 0,172

4 3 0,047

5 2 0,031

64 1

Tableau 2.7

(22)

12 C h a p i t r e 2

frequences

20

10

F i g u r e 2.1 _ 0 1 2 3 4 5

nombre d'enfants Exemple 2

Diagramme des frequences cumulees des t a b l e a u x 2.3 e t 2.4, r e p r i s en 2.8 e t 2.9.

Nombre d ' e n f a n t s

Frequences cumulees c r o i s s a n t e s

Nombre d'enfants

Frequences cumulees 4 e c r o i s ^ a n t e s

Möins de 1 16 0 ou p l u s 64

2 34 1 48

3 48 2 30

4 59 3 16

5 62 4 5

6 64 5 2

Tableau 2.8 Tableau 2.9

frequences r e l a t i v e s A

Le graphe des frequences cumulees (appele a u s s i diagramme i n t e g r a l ) ne met pas en evidence l e s d i f f e r e n c e s e t ne f a i t pas r e s s o r t i r l a frequence maximum ( f i g . 2.2).

(23)

Β. Representations graphiques 13

Pour chaque v a l e u r du c a r a c t e r e l a somme des frequences cumulees c r o i s s a n t e e t d e c r o i s s a n t e e s t evidemment egale ä l ' e f f e c t i f t o t a l .

Ces graphes e t a n t c o n s t i t u e s par un ensemble d i s c o n t i n u de p o i n t s ( l e s sommets des b a t o n s ) , 1 ' i n t e r p o l a t i o n e n t r e p o i n t s s u c c e s s i f s n'a pas de sens. On peut a u s s i b i e n adopter une frequence constante e n t r e l e s v a l e u r s d i s c r e t e s du c a r a c - t e r e ( f i g . 2.3).

k frequences cumulees 60

40-

20

c r o i s s a n t e s

vd e c r o i s s a n t e s

^frequences cumulees

c r o i s s a n t e s

, d e c r o i s s a n t e s

1/

0 1 1 3 4 5 6 0 1 2 > 5 6

nombre d'enfants F i g u r e 2.2

nombre d'enfants F i g u r e 2.3

I I . CARACTERE CONTINU. HISTOGRAMME

Dans l e cas d'un c a t a c t e r e c o n t i n u , on u t i l i s e 11h i s t o - gramme, q u i c o n s t i t u e une g e n e r a l i s a t i o n du diagramme en batons ä l a n o t i o n de c l a s s e .

a) Series ä classes egales

Chaque classe e s t representee par un r e c t a n g l e dont l a base e s t egale ä lf I n t e r v a l l e de l a c l a s s e e t d o n t l a hauteur

(24)

14 Chapitre 2

e s t egale ä l ' e f f e c t i f correspondant. LTh i s togramme e s t cons- t i t u e en f a i t par l e contour p o l y g o n a l enveloppant lfensemble de ces r e c t a n g l e s .

Le polygone des frequences absolues (ou des frequences r e l a t i v e s ) s ' o b t i e n t en j o i g n a n t l e s p o i n t s dont l e s abscisses sont l e s m i l i e u x des d i f f e r e n t e s classes e t dont l e s ordonnees sont l e s e f f e c t i f s (ou l e s frequences r e l a t i v e s ) correspon- d a n t s .

. Exemple

Histogramme r e l a t i f au t a b l e a u 2.6 ( r e p r i s en 2.10).

Clas L i m i t e s Centres

E f f e c t i f s E f f e c t i f s E f f e c t i f s Clas ses L i m i t e s

de classe

E f f e c t i f s

cumules c r o i s s a n t s

cumules de- c r o i s s a n t s

1 ,545 80

1,55- 1,59

1 ,595

1,57 3

3 77

1 ,60- 1 ,64

1 ,645

1 ,62 12

15 65

1,65- 1 ,69

1 ,695

1 ,67 18

33 47

1,70- 1,74 1,72 25

1,70-

1 ,745 58 22

1,75- 1,79

1 ,795

1,77 15

73 7

1,80- 1 ,84

1 ,845

1,82 5

78 2

1,85- 1,89

1 ,895

1,87 2

~8Ö

80

Tableau 2.10

(25)

Β. Representations graphiques 15

frequence absolue

frequence r e l a t i v e

0,50

- 0,25

3 £ 3 ί £ 3 £ 3 £ t a i l l e

L O t O v D v O Γ"- 00 00

histogramme

>polygone des frequences

Figure 2.4

. Aire de I rhistogramme

C'est l ' a i r e comprise e n t r e 1'histogramme e t 11 axe des

abscisses. Dans l e cas d'un histogramme des frequences a b s o l u e s , c e t t e a i r e e s t evidemment p r o p o r t i o n n e l l e au p r o d u i t de 1' I n ­ t e r v a l l e de classe par l ' e f f e c t i f t o t a l . Dans l e cas d'un h i s ­ togramme des frequences r e l a t i v e s , s i 1 ' I n t e r v a l l e de c l a s s e est p r i s comme u n i t e , lTa i r e e s t egale ä 1 ' u n i t e , puisque l a somme des frequences r e l a t i v e s e s t elle-meme egale ä 1 ' u n i t e . L ' a i r e comprise e n t r e l e polygone des frequences e t l'axe des abscisses e s t egale ä c e l l e de 1'histogramme, puisque, comme on peut l e v o i r sur l a f i g u r e 2.4, l e s s u r f a c e s non communes ä ces deux a i r e s se compensent deux par deux.

. Polygone des effectifs cumules

En observant que l e s e f f e c t i f s cumules c r o i s s a n t s c o r - respondent aux f r o n t i e r e s superieures des d i f f e r e n t e s c l a s s e s , e t l e s e f f e c t i f s cumules d e c r o i s s a n t s aux f r o n t i e r e s i n f e -

(26)

16 C h a p i t r e 2

r i e u r e s des c l a s s e s , on peut, ä l ' a i d e du t a b l e a u 2.10, c o n s t r u i r e l e s polygones des e f f e c t i f s cumules s u i v a n t s

^ frequences r e l a t i v e s

1

m m in 1 in m I in in m

<t ON ON ON ON m in r-- Γ - oo 00

Figure 2.5 On peut remarquer que pour chaque v a l e u r du c a r a c t e r e , l a somme des e f f e c t i f s c r o i s s a n t s e t des e f f e c t i f s d e c r o i s - sants e s t egale ä l ' e f f e c t i f t o t a l .

Remarque

L ' i n t e r e t de ces r e p r e s e n t a t i o n s cumulees a p p a r a i t r a un peu p l u s t a r d , ä lfo c c a s i o n de lTa n a l y s e des s e r i e s s t a t i s t i q u e s .

b) S e r i e s a classes i n e g a l e s

S i l ' o n veut que l ' a i r e de 1'histogramme s o i t t o u j o u r s p r o p o r t i o n n e l l e ä l ' e f f e c t i f , i l e s t necessaire de t e n i r compte de l ' i n e g a l i t e des c l a s s e s . On opere a l o r s de l a maniere s u i - v a n t e : une classe dont l'etendue e s t egale ä η f o i s 1 ' I n t e r ­ v a l l e de c l a s s e fundamental, e s t representee avec une ordonnee egale ä l ' e f f e c t i f de c e t t e classe d i v i s e par n, de t e l l e s o r t e que l ' a i r e r e l a t i v e ä c e t t e classe söit b i e n p r o p o r t i o n - n e l l e ä son e f f e c t i f .

(27)

Β.. Representations graphiques 17

. Exemple

Une enquete p o r t a n t sur l e s s a l a i r e s mensuels pergus dans une c e r t a i n e e n t r e p r i s e a f o u r n i l e s renseignements s u i v a n t s :

S a l a i r e mensuel en F. E f f e c t i f s

Entre 2 000 e t 3 000 34

3 000 e t 4 000 52

4 000 e t 5 000 60

5 000 e t 6 000 20

6 000 e t 7 000 8

11 7 000 e t 11 000 6

180

Tableau 2.11

La d e r n i e r e c l a s s e , de 7 000 ä 11 000 F v a u t 4 i n t e r v a l l e s de c l a s s e , i l f a u t done reamenager sa p r e s e n t a t i o n a i n s i :

S a l a i r e mensuel en F. E f f e c t i f s

Entre 7 000 et 8 000 1,5

8 000 e t 9 000 1,5

9 000 e t 10 000 1,5

" 10 000 e t 1 1 000 1,5

Tableau 2.12

Cette r e p a r t i t i o n de l ' e f f e c t i f dans l a d e r n i e r e c l a s s e ne correspond b i e n sur ä aueune r e a l i t e , e i l e conserve t o u t e -

(28)

18 C h a p i t r e 2

f o i s un sens ä 1'histogramme e t aux conclusions qu'on peut en t i r e r .

s a l a i r e mensuel Figure 2.6

. Autre exemple

S a l a i r e s mensuels pergus a l ' e c h e l l e n a t i o n a l e dans 1 'I n d u s t r i e e t l e commerce

(Le Monde 8/3/77)

Les c l a s s e s adoptees sont i n e g a l e s . Les ordonnees (axe h o r i z o n t a l ) ne sont pas p r o - p o r t i o n n e l l e s ä lfe f f e c t i f . E l l e s sont obtenues en d i v i - sant l ' e f f e c t i f ( r e p r e s e n t e par l e s nombres encadres) par l a c l a s s e correspondante.

(29)

E X E R C I C E S CHAPITRE 2 Β. REPRESENTATIONS GRAPHIQUES

I . On recense dans 1 000 h o p i t a u x d'un pays europeen l e cas d!u n e maladie inconnue. On trouve l e s r e s u l t a t s s u i v a n t s

Nombre de malades 0 1 2 3 4 5

Nombre d'hopitaux 50 150 350 300 100 50

Representer graphiquement l e s donnees. C a l c u l e r l e s frequences r e l a t i v e s .

SOLUTION

frequences absolues

400 300

200-

100

frequences r e l a t i v e s 0,40

0,30

-0,20

0,10

nombre de 4 5 malades

(30)

20 C h a p i t r e 2

Norabres de malades 0 1 2 3 4 5

Nombre d!h o p i t a u x 50 150 350 300 100 50

Frequences r e l a t i v e s 0,05

11(11 lllil

0,30 0,10 0,05 On remarque que l a somme des frequences absolues e s t 1 000 e t que l a somme des frequences r e l a t i v e s e s t 1.

I I . Reprendre l a s e r i e de l ' e x e r c i c e I precedent.

1°) C o n s t r u i r e un t a b l e a u donnant l e pourcentage d'hopitaux oü l e nombre de malades e s t i n f e r i e u r ä 0, 1, 2, 3, 4, 5 ou 6. Representer graphiquement l e s donnees de ce t a b l e a u . 2°) C o n s t r u i r e un t a b l e a u donnant l e pourcentage d'hopitaux oü l e nombre de malades e s t egal ou s u p e r i e u r ä 0, 1, 2, 3, 4, 5 ou 6, en f a i r e l a r e p r e s e n t a t i o n graphique..

SOLUTION 1°)

Nombre de malades i n f e r i e u r ä

Nombre

d'hopitaux Pourcentage

0 0

1 50

2 200

3 550

4 850

5 950

6 1 000

(31)

E x e r c i c e s Β. R e p r e s e n t a t i o n s graphiques 21

2°)

Nombre de malades egal ou s u p e r i e u r ä

Nombre

d'hopitaux Pourcentage

0 1 000 100

1 950 95

2 800 80

3 450 45

4 150 15

5 50 5

6 0 0

0 1 2 3 4 5 6

(32)

22 C h a p i t r e 2

I I I . Dans une u s i n e , on a r e l e v e l e s h o r a i r e s d ' a r r i v e e de 800 personnes

t . = c l a s s e des

1

temps en heures

[ 8 h 45 8 h 50]

[ 8 h 50 8 h 55]

[ 8 h 55 9 h 00]

[ 9 h 00 9 h 05]

[ 9 h 05 9 h 10]

n. = nombre

1

de personnes 4 10 26 110 150

t . = c l a s s e des

1

temps en heures

[ 9 h 10 9 h 15]

[ 9 h 15 9 h 20]

[ 9 h 20 9 h 25]

[ 9 h 25 9 h 30]

[ 9 h 30 9 h 35]

n. = nombre

1

de personnes

200 150 100 40 10

1°) Representer 1'histogramme de c e t t e d i s t r i b u t i o n . 2°) T r a c e r l e polygone de frequences

SOLUTION

1°) Histogramme : courbe 1 2°) Folygone de f r e q u e n c e s

courbe 2

(33)

E x e r c i c e s Β. Representations graphiques 23

IV. On e f f e c t u e lfa n a l y s e de sang de 60 personnes q u i o n t manipule un gaz t o x i q u e . La mesure du taux de l e u c o c y t e s ,

3

par mm , donne l e s r e s u l t a t s s u i v a n t s : 3000 $ Xi < 4000 n. = 10

1

4000 < X. < 10000

ν 1

= 48

10000 £ X. < 12000

1

n. = 12

1

n. r e p r e s e n t e l e nombre de gens dont l e taux de l e u c o c y t e s

1 3

par mm e s t X^. Representer 1'histogramme de c e t t e s e r i e q u a n t i t a t i v e ä classes i n e g a l e s .

SOLUTION

En adoptant un I n t e r v a l l e de c l a s s e de 1000, l a 2 erne classe v a u t 6 i n t e r v a l l e s de classe e t l a 3eme en v a u t 2. En e f f e c t u a n t une e q u i p a r t i t i o n de l ' e f f e c t i f e n t r e l e s d i f f e - r e n t s i n t e r v a l l e s de c l a s s e , on o b t i e n t l e t a b l e a u s u i v a n t :

xi n.

1

3000 <

Xi < 4000 10

4000

X i < 5000 8

5000

X i < 6000 8

6000

X i < 7000 8

7000

Xi < 8000 8

8000

Xi < 9000 8

9000

Xi < 10000 8

10000

Xi < 11000 6

11000 X.

1

< 12000 6

(34)

3000 4000 5000 6000 7000 8000 9000 10000 11000 12000

ro -t> σ> oo I I I Ο Ο σο

ο &>

Ό et

(35)

3. Analyse d'une distribution de frequences

Les p o i n t s de d e p a r t de c e t t e analyse o n t e t e exposes dans l e c h a p i t r e precedent. I i s c o n s i s t e n t ä regrouper l e s donnees, en procedant eventuellernent ä un decoupage en classes ( c a r a c t e r e c o n t i n u ) , e t ä p r e s e n t e r sous forme de tableaux ou de graphes, l e s f o n c t i o n s de d i s t r i b u t i o n e t de r e p a r t i t i o n correspondantes.

Fonction de distribution : on designe a i n s i lfe n s e m b l e des couples c o n s t i t u e s par l e s v a l e u r s du c a r a c t e r e e t l e s frequences absolues ou r e l a t i v e s correspondantes. La r e p r e - s e n t a t i o n graphique de c e t t e f o n c t i o n - appelee p a r f o i s d i a - gramme d i f f e r e n t i e l - n'est a u t r e que 1'histogramme ( v o i r f i g . 2.4) dont une p r o p r i e t e e s s e n t i e l l e e s t que l e s a i r e s des d i f f e r e n t s r e c t a n g l e s sont p r o p o r t i o n n e l l e s aux e f f e c t i f s correspondants.

Fonction de repartition : c ' e s t 1'ensemble d e s c o u p l e s c o n s t i t u e s par une v a l e u r du c a r a c t e r e e t

a) s o i t l a somme des e f f e c t i f s ayant moins que c e t t e v a l e u r du c a r a c t e r e (diagramme i n t e g r a l c r o i s s a n t )

b) s o i t l a somme des e f f e c t i f s ayant c e t t e v a l e u r du c a r a c t e r e ou p l u s (diagramme i n t e g r a l d e c r o i s s a n t ) .

Les graphes sont l e s courbes cumulatives r e s p e c t i v e m e n t par v a l e u r s i n f e r i e u r e s e t par v a l e u r s s u p e r i e u r e s d e c r i t e s precedemment ( v o i r t a b l e a u 2.10 e t f i g . 2.5).

(36)

26 C h a p i t r e 3

La phase s u i v a n t e e s t c e l l e de l a r e d u c t i o n des donnees, q u i c o n s i s t e ä s u b s t i t u e r ä l a d i s t r i b u t i o n e t u d i e e , quelques parametres en nombre r e d u i t , d o n t l e s v a l e u r s numeriques don- neront un resume r e l a t i v e m e n t süffisant de 11 i n f o r m a t i o n contenue dans l a d i s t r i b u t i o n de frequences. Parmi ces p a r a - m e t r e s , on d i s t i n g u e :

a) l e s parametres de p o s i t i o n (moyenne, mediane, e t c . ) q u i permettent de se rendre compte de 1!o r d r e de grandeur de l1e n s e m b l e des o b s e r v a t i o n s e t de l o c a l i s e r l a zone des f r e - quences maximum ;

b) l e s parametres de d i s p e r s i o n ( e c a r t moyen, e c a r t t y p e , q u i p r e c i s e n t l e degre de d i s p e r s i o n des d i f f e r e n t e s observa- t i o n s autour d'une v a l e u r c e n t r a l e .

(37)

Α. PARAMETRES DE POSITION

l, LES MOVENNES

La n o t i o n de moyenne e s t assez commune : i l e s t f r e q u e n t ie r e d u i r e un ensemble f i n i de nombres ä une " v a l e u r moyenne"

a f i n de donner une idee de lfo r d r e de grandeur des elements i e cet ensemble. Cependant, i l e x i s t e p l u s i e u r s manieres de c a l c u l e r une " v a l e u r moyenne" s u i v a n t sa s i g n i f i c a t i o n .

1. La moyenne a r i t h m e t i q u e Symbole de sommation :

S o i t X j , *2> x3 ···xn u^ e s u i t e f i n i e de nombres. Par d e f i n i t i o n

Σ

η χ. = χΗ + χ^ 4- χ0 + . + χ

ι 1 2 3 η i=l

Les p r o p r i e t e s de ce symbole de sommation sont l e s s u i - vantes :

- s i a e s t une c o n s t a n t s , d'apres l a d e f i n i t i o n prece- dente, on a immediatement :

η η

Σ

a x i = a

Σ

X i

i = l i = l

- en c o n s i d e r a n t l e cas oü x, = x~ = x0 = ... = χ , on en

1 2 3 n'

d e d u i t :

Σ

η a = n a i = l

(38)

28 C h a p i t r e 3

- s o i t Υ|, ··· Yn une a u t r e s u i t e f i n i e de nombres.

D'apres l a meme d e f i n i t i o n , on a

η η η Σ < xi+ yO = Σ xi+ Σ Vi

1=1 1=1 ι=1

χ une s u i t e f i n i e de nombres. La η

D e f i n i t i o n de l a moyenne a r i t h m e t i q u e S o i t X j , *2 9 x3 ···xn une s u i t e moyenne a r i t h m e t i q u e e s t l e r a p p o r t :

η . ^ - j ι χ, + χη + χ- + ... + χ Λ η

1 2 3 η 1 (3. 1)

i = l

Si chaque v a l e u r χ^ a p p a r a i t η^ f o i s dans l a s e r i e , on peut encore e c r i r e

X = - Τ n. x.

• η 4τ· I i ι

En remarquant que η./η η1est a u t r e que l a frequence r e l a t i v e (3.2}

f ^ correspondant ä l a v a l e u r x^, on a aus s i

X = Υ f .· x. (3.3}

. Exemple

Cas du t a b l e a u 2.1 r e p r i s en 3.1 Nombre

d'enfants 0 1 2 3 4 5 T o t a l

Nombre de f a m i l i e s

16 18 14 1 1 3 2

Frequence

r e l a t i v e 0,250 0,281 0,218 0,172 0,047 0,031 Tableau 3.1

Le nombre moyen d ' e n f a n t s par f a m i l l e e s t , d'apres lfe q u a ­ t i o n (3.2)

(39)

Α. Parametres de p o s i t i o n 29

Χ = ( 1 6x0) + (18x1) + ( 1 4 x 2 ) + ( l 1 x 3 ) +(3x4)+ (2x5)

64 ,58 e n f a n t

ou encore, ä l ' a i d e de l ' e x p r e s s i o n (3.3)

X = ( 0 , 2 5 x 0 ) + ( 0 , 2 8 l x l ) + ( 0 , 2 1 8 x 2 ) + ( 0 , 1 7 2 x 3 ) + ( 0 , 0 4 7 x 4 ) + ( 0 , 0 3 1 x 5 ) - 1,58 e n f a n t .

2. Cas de donnees groupees en c l a s s e s

On prend pour v a l e u r de l e s c e n t r e s de c l a s s e s . . Exemple

E x t r a i t du t a b l e a u 2.6.

Centres - de

classes

1,57 1,62 1 ,67 1,72 1,77 1 ,82 1 ,87

E f f e c t i f 3 12 18 25 15 5 2

Tableau 3.2

La t a i l l e moyenne d'un i n d i v i d u dans c e t t e c o l l e c t i v i t e est

j 7 _ ( 3 x l ,57)+ (12xl ,62) +(18x1 ,67) +(25x1 ,72)+(15x1 ,77) +(5x1 ,82) +(2x1 ,87) 80

= 1,707 m

3. S i m p l i f i c a t i o n du c a l c u l de l a moyenne a) Changement d ' o r i g i n e

On prend une moyenne p r o v i s o i r e arbiträire Xq , qu!on es- time e t r e a u s s i proche que p o s s i b l e de X, on s u b s t i t u e a l o r s I l a v a r i a b l e x^, l a v a r i a b l e

u. = χ. - χ

1 1 0

(3.4)

(40)

30 C h a p i t r e 3

L E x p r e s s i o n (3.2) d e v i e n t

X = - Τ η. χ. = - Υ η. (u. + χ )

X = ü + xQ (3.5)

Le c a l c u l de X r e v i e n t done au c a l c u l de u q u i peut e t i e p l u s s i m p l e ( c f . e x e r c i c e s 3 A)

b) Changement dTo r i g i n e e t d ' e c h e l l e

Si 1TI n t e r v a l l e de classe k e s t c o n s t a n t , on peut le p r e n d r e comme n o u v e l l e u n i t e e t i n t r o d u i r e l e changement de v a r i a b l e

x. - χ

Z i = ^ ( 3 . 6 )

On a a l o r s

X = - Υ n. (x + k z.) 1

11 1 V Ο l '

X = x + k z (3.7) ο

Le c a l c u l de X r e v i e n t ä c e l u i de ζ q u i peut encore e t r e p l u s simple ( c f . e x e r c i c e s 3 A ) .

4. P r o p r i e t e s de l a moyenne a r i t h m e t i q u e

a) La somme des d e v i a t i o n s dfu n ensemble de donnees x^, par r a p p o r t ä l e u r v a l e u r moyenne X, e s t n u l l e . En e f f e t :

] T n , (Xi - X) = £ η. χ. - η X = 0 ( 3 . 8 )

puisque * = ^ Σnixi '

b) La moyenne a r i t h m e t i q u e des d e v i a t i o n s x^ - Xq e s t egale ä l a d e v i a t i o n de l a moyenne a r i t h m e t i q u e des x^ par r a p p o r t ä XQ.

χ

- Υ η. (χ. - χ ) = ~ y n. χ. - _° y n. = χ - χ

(41)

A. Parametres de p o s i t i o n 31

5. La moyenne geometrique

Considerons une p o p u l a t i o n (au sens c l a s s i q u e ) q u i s'ac- c r o i t s u i v a n t une p r o g r e s s i o n geometrique. Ce sera l e c a s , par exemple, d'une p o p u l a t i o n dont l e s taux de n a t a l i t e e t de m o r t a l i t e sont c o n s t a n t s pendant l a p e r i o d e envisagee.

Soient r l e taux de croissance sur une p e r i o d e

Xq l ' e f f e c t i f de l a p o p u l a t i o n ä l a date i n i t i a l e t Q χ l ' e f f e c t i f de l a p o p u l a t i o n ä l a date t , c'est ä

η η' d i r e au bout de η p e r i o d e s .

On a a l o r s

Xl = Xo r 2

x0 = x. r = x r , e t c . e t par r e c u r r e n c e

2 1 ο r

χ = χ r η η ο

Si η e s t p a i r , l e m i l i e u des η periodes sera l a date t ^ oü Ρ - η/2.

On a p p e l l e moyenne geometrique des (χ^ ) ^e terme c o r r e s - pondant ä t ^ , s o i t

n/2 g = xo r

On montre que c e t t e moyenne geometrique e s t donnee par

g - ( xo x Xj χ x2 χ ... x xn)1/n+1 ( 3 . 9 ) En e f f e t c e t t e d e r n i e r e e x p r e s s i o n s ' e c r i t

g = ( x x x r x x r ^ x . . . x x r1 1)1/1 1*1

& v ο ο ο ο

t n+1 1+2+...+nN1/n+l

= (χ x r )

ο '

et en u t i l i s a n t l a r e l a t i o n l+2+...+n = n ^+^ on o b tie n t g = ( xon+1 χ r n C n + l ) / 2)l / n+l _ ^ n/2

On peut remarquer, ä p a r t i r de l ' e x p r e s s i o n ( 3 . 9 ) , que l e l o - garithme de g η'est a u t r e que l a moyenne a r i t h m e t i q u e des l o - garithmes des (χ^)·

(42)

32 C h a p i t r e 3

6. Moyenne harmonique

S o i t une s u i t e f i n i e de nombres { x j , ^29 Xß ··· Xf t ^

et l1e n s e m b l e des i n v e r s e s de ces nombres

{

_L, J_, _L,..., ±

}

xl X2 x3 Xn

I I a r r i v e que ce s o i t l a moyenne a r i t h m e t i q u e de ces i n v e r s e s q u i a i t une s i g n i f i c a t i o n , p l u t o t que c e l l e de 1'ensemble i n i - t i a l , par exemple dans l e cas de grandeurs inversement p r o - p o r t i o n n e l l e s .

On a p p e l l e moyenne harmonique des x^ (supposes non n u l s ) 1!i n v e r s e de l a moyenne a r i t h m e t i q u e des inverses ( — ) , s o i t

i

h = (3.10) .^-ί χ.

1=1 ι . Exemple

Une v o i t u r e p a r c o u r t un c i r c u i t ferme ä une v i t e s s e de 10 km/h durant l e 1er t o u r , de 20 km/h durant l e second, de 30 km/h d u r a n t l e 3eme t o u r . Determiner l a v i t e s s e moyenne de l a v o i t u r e durant l e s t r o i s t o u r s .

S o i t I l a longueur du c i r c u i t (en km). La dutee t o t a l e des 3 parcours e s t

t = — + — + — 10 20 30

La v i t e s s e moyenne ν recherchee e s t done

3 i · 3 i 3 10 20 30 10 20 30

= 16,6 km/h

On v e r i f i e aisement que t o u t a u t r e c a l c u l de moyenne condui- r a i t ä un r e s u l t a t errone.

(43)

Α. Parametres de p o s i t i o n 33

7. Moyenne quadratique

I I a r r i v e que l e s ( x ^ ) i n t e r v i e n n e n t par lfe n s e m b l e de l e u r s c a r r e s

; 2 2 2 2,

1 ' x2 ' X3 "* *Xn

comme par exemple, en thermodynamique oü l!o n montre que l a temperature absolue d!u n gaz e s t l i e e aux c a r r e s des v i t e s s e s des molecules de ce gaz.

On d e f i n i t l a moyenne quadratique des (χ·) comme e t a n t l a

1 2

r a c i n e c a r r e e de l a moyenne a r i t h m e t i q u e des ( x ^ ) , s o i t (3.11) On montre que l e s d i f f e r e n t e s moyennes v e r i f i e n t l e s i n e - g a l i t e s

h £ g £ x £ q

( l e s e g a l i t e s ayant l i e u lorsque tous l e s nombres ( x ^ ) sont i d e n t i q u e s ) .

I I . LA MEDIANE 1. D e f i n i t i o n

La mediane e s t l a v a l e u r du c a r a c t e r e Mg t e l l e q u ' i l y a i t a u t a n t d ' i n d i v i d u s pour l e s q u e l s l e c a r a c t e r e e s t i n f e r i e u r ä Me que d ' i n d i v i d u s pour l e s q u e l s l e c a r a c t e r e e s t s u p e r i e u r ä Μ .

e

Pour determiner l a mediane, i l e s t done necessaire de c o n s i d e r e r l e s e f f e c t i f s cumules c r o i s s a n t s ou d e c r o i s s a n t s e t de chercher, l e cas echeant par i n t e r p o l a t i o n , l a v a l e u r du c a r a c t e r e correspondant ä 50 % de l ' e f f e c t i f t o t a l .

(44)

34 C h a p i t r e 3

2. Exemple

Dans l e cas de l a s e r i e groupee en classes du t a b l e a u 2 6 ( r e p r i s en 3 . 3 ) , on determine d'abord, ä p a r t i r des e f f e c t i f * cumules, l a classe contenant l a mediane, p u i s l a v a l e u r de 1<

mediane par i n t e r p o l a t i o n l i n e a i r e dans c e t t e c l a s s e . *

Centres E f f e c t i f s E f f e c t i f s Classes L i m i t e s de

c l a s s e

Effectifβ cumules cumules d*~

c r o i s s a n t

1,545 80

1,55-1,59

1,595

1,57 3

3 77

1,60-1,64

1 ,645

1,62 12

15 65

1,65-1,69

1,695

1 ,67 18

33 47

1 ,70-1,74

1 ,745

1,72 25

58 22

1,75-1 ,79

1 ,795

1,77 15

73 7

1,80-1 ,84

1 ,845

1 ,82 5

78 2

1,85-1 ,89

1 ,895

1 ,87 2

80

80

Tableau 3.3

La m o i t i e de l ' e f f e c t i f t o t a l e s t 40. Sur l e s e f f e c t i f s cumules c r o i s s a n t s , on v o i t que 33 personnes ont une t a i l l e i n f e r i e u r e ou egale ä 1,695 m. L ' i n t e r p o l a t i o n l i n e a i r e dans l a c l a s s e 1,695-1,745 dont l ' e f f e c t i f e s t de 25 personnes, donne pour l a mediane

Me = ,> 6 9 5 + 0,05 *2( 4 0 - 33) = ,> 6 9 5 + 0)014 . ,> 7 0 9 b

(45)

A. Parametres de p o s i t i o n 35

3. D e t e r m i n a t i o n graphigue de l a mediane a) ä p a r t i r de 11histogramme

E t a n t donnee l a s i g n i f i c a t i o n de l ' a i r e de 1'histogramme, l a mediane η'est a u t r e que l a v a l e u r du c a r a c t e r e q u i coupe 1'histogramme en deux p a r t i e s de s u r f a c e s egales.

. Exemple de l1histogramme de la figure 2.4 ( r e p r i s e dans l a f i g . 3.1).

frequence absolue

3 0 -

20.

10 _

A

in m \<d to

<j- ON V <f

hi

frequence r e l a t i v e

-0,25

S t a i l l e

00

F i g u r e 3.1

b) ä p a r t i r des polygones des e f f e c t i f s cumules

La mediane e s t representee par l a v a l e u r du c a r a c t e r e c o r - respondant ä 1 ' i n t e r s e c t i o n

- s o i t de l a courbe des e f f e c t i f s cumules c r o i s s a n t s e t de l a courbe des e f f e c t i f s cumules d e c r o i s s a n t s

- s o i t de l'une des deux courbes precedentes avec 1 ' h o r i - z o n t a l e r e p r e s e n t a n t l ' e f f e c t i f m o i t i e .

. Exemple de la figure 2.5 ( r e p r i s e dans l a f i g . 3.2)

(46)

36 Chapitre 3

F i g u r e 3.2

I I I . LES PERCENTILES

Le kieme p e r c e n t i l e e s t l a v a l e u r du c a r a c t e r e C^

- t e l l e que l'ensemble des i n d i v i d u s dont l e c a r a c t e r e e s t au p l u s egal ä C^ represente l e s k % de l ' e f f e c t i f t o t a l

- t e l l e que l'ensemble des i n d i v i d u s dont l e c a r a c t e r e e s t au moins egal ä C^. r e p r e s e n t e l e s (100 - k ) % de l ' e f f e c t i f t o t a l

Parmi les p e r c e n t i l e s , on d i s t i n g u e l e s d e c i l e s , pour l e s q u e l s k = 10, 20, 30, ...

C1 0 = D l C2 0 = D2 ·'·

^e s q u a r t i l e s , pour l e s q u e l s k = 25, 50, 75 C2 5 = Q, C5 0 = Q2 C? 5 = Q3 l a mediane, pour l a q u e l l e k = 50, C ^ = Me = =

Le c a l c u l des d i f f e r e n t s p e r c e n t i l e s e s t t o u t ä f a i t ana- logue ä c e l u i de l a mediane.

(47)

Α. Parametres de p o s i t i o n 37

• Exemple

C a l c u l du 3eme q u a r t i l e pour l a d i s t r i b u t i o n du t a ­ bleau 3.3.

Les 75 % de l ' e f f e c t i f t o t a l correspondent ä 60 personnes.

Sur l e s e f f e c t i f s cumules c r o i s s a n t s , on v o i t que 58 personnes ont une t a i l l e i n f e r i e u r e ou egale ä 1,745 m. Pour l e s 2 p e r - sonnes q u i manquent, on f a i t une i n t e r p o l a t i o n l i n e a i r e dans l a classe 1,745-1,795 dont l ' e f f e c t i f e s t de 15 personnes. On o b t i e n t done :

Q3 = 1 ,745 + — - * 1 ,745 + 0,006 = 1,75 1 m IV. MODE OU DOMINANTE

C'est l a v a l e u r du c a r a c t e r e correspondant ä l a frequence maximum.

Une d i s t r i b u t i o n peut präsenter p l u s i e u r s modes : on d i t q u ' e l l e e s t p l u r i m o d a l e .

. ExempleA

1. Diagramme en batons de l a f i g u r e 2.1 : Le mode e s t v i s i b l e m e n t D = 1 e n f a n t . 2. Histogramme de l a f i g u r e 2.4 :

On adopte pour mode l e c e n t r e de c l a s s e de l a c l a s s e mo- d a l e D = 1,72 m.

V. COMPARAISON DES DIFFERENTS PARAMETRES DE POSITION

La moyenne a r i t h m e t i q u e e s t peu s e n s i b l e aux f l u c t u a t i o n s d ' e c h a n t i l l o n n a g e . E l l e se p r e t e b i e n aux comparaisons. Des*

v a l e u r s aberrantes peuvent t o u t e f o i s l a m o d i f i e r sensiblement.

La mediane e s t plus s e n s i b l e aux f l u c t u a t i o n s d ' e c h a n t i l - lonage, e i l e l ' e s t moins ä des v a l e u r s aberrantes. T o u t e f o i s , e i l e se p r e t e moins b i e n ä des c a l c u l s a l g e b r i q u e s .

(48)

38 Chapitre 3

Le mode e s t r e p r e s e n t a t i f de l a v a l e u r du caractere I i p l u s c o u r a n t , l e p l u s t y p i q u e , mais i l peut presenter une :er-

t a i n e a m b i g u i t e .

En p r a t i q u e , i l e s t f r e q u e n t que parmi ces t r o i s para- m e t r e s , l e c h o i x de l!u n ne sfimpose pas p l u s que l e choix de

lf a u t r e . La comparaison des t r o i s permet de se f a i r e une i i e e p l u s complete de l a d i s t r i b u t i o n . L1 i n t e r p r e t a t i o n des p o s i t i o n s r e l a t i v e s de ces parametres e s t p a r f o i s p l u s immediate que c e l l e des parametres de d i s p e r s i o n q u i s e r o n t l ' o b j e t de l a f i n i e ce c h a p i t r e .

(49)

Β. PARAMETRES D E D I S P E R S I O N

Les parametres de p o s i t i o n sont i n s u f f i s a n t s pour carac- t e r i s e r completement une s e r i e . Par exemple, deux s e r i e s d i f f e r e n t e s ayant l a meme moyenne, ne se r e p a r t i s s e n t pas necessairement de l a meme maniere autour de c e t t e moyenne.

E l l e s sont p l u s ou moins e t a l e e s , ce q u i sera d e c r i t par l e s

" c a r a c t e r i s t i q u e s de d i s p e r s i o n .

Un parametre de d i s p e r s i o n se r a p p o r t e ä l a d i f f e r e n c e de deux v a l e u r s du c a r a c t e r e a l o r s qu'un parametre de p o s i - t i o n r e p r e s e n t e une v a l e u r du c a r a c t e r e . On d i s t i n g u e l e s n o t i o n s s u i v a n t e s :

d e v i a t i o n : d i f f e r e n c e a l g e b r i q u e de deux v a l e u r s du c a r a c - t e r e , par exemple x^ - X ;

e c a r t : v a l e u r absolue de l a d i f f e r e n c e de deux v a l e u r s du c a r a c t e r e , par exemple |x^ - x| ;

I n t e r v a l l e de v a r i a t i o n , etendue (ou range) : d i f f e r e n c e e n t r e l e s v a l e u r s extremes du c a r a c t e r e ;

e c a r t i n t e r q u a r t i l e : d i f f e r e n c e e n t r e l e 3eme e t l e 1er q u a r t i l e s , cfe s t ä d i r e - Qj ( v o i r paragraphe p r e c e - dent pour l a s i g n i f i c a t i o n des q u a r t i l e s ) .

Rappel : l a somme des d e v i a t i o n s dfu n ensemble de donnees x^

par r a p p o r t ä l e u r v a l e u r moyenne X, e s t n u l l e . En e f f e t , d'apres 1!e q u a t i o n (3.8)

Σ

η . ( xi - X) -

Σ

ni xi - n X - 0

i i

(50)

40 Chapitre 3

I . ECART MOYEN ARITHMETIQUE . D e f i n i t i o n

LTe c a r t moyen a r i t h m e t i q u e e s t l a moyenne a r i t h m e t i q u e des e c a r t s p a r r a p p o r t ä l a moyenne a r i t h m e t i q u e des v a l e u r s du c a r a c t e r e

Ε = - Υ n. |x. - Xl (3. 12) η Ar* ι 1 ι 1

1

A p a r t i r du t a b l e a u 3.3, en prenant X = 1,707 m, on o b t i e n t l e t a b l e a u s u i v a n t :

Centres de classes

1

n.

1 l * i - Xl n i Κ - x|

1,57 3 0,137 0,41 1

1,62 12 0,087 1,044

1,67 18 0,037 0,666

1,72 25 0,013 0,325

1,77 15 0,063 0,945

1,82 5 0,113 0,565

1,87 2 0,163 0,326

80 T o t a l 4,282

Tableau 3.4

1 = i Σ n i lxi - ^ « jo *4>282 - ° >0 53 m I I . VARIANCE. ECART-TYPE

1. Variance

La v a r i a n c e d'une s e r i e de v a l e u r s du c a r a c t e r e e s t l a

(51)

Β. Parametres de d i s p e r s i o n 41

moyenne a r i t h m e t i q u e des c a r r e s des e c a r t s de ces v a l e u r s par r a p p o r t ä l e u r moyenne a r i t h m e t i q u e .

Σ

n

i

X )2 ( 3 . 13)

Les c a r r e s des d i f f e r e n c e s e v i t e n t 1 ' u t i l i s a t i o n de v a l e u r s absolues. Les dimensions de V sont C e l l e s du c a r a c t e r e au c a r r e . I I f a u t done en e x t r a i r e l a r a c i n e carree pour o b t e n i r un parametre c a r a c t e r i s t i q u e des e c a r t s .

2. E c a r t - t y p e

Lfe c a r t - t y p e (ou e c a r t quadratique moyen) e s t l a r a c i n e carree de l a v a r i a n c e '

σ = Λ Γ (3. 14) ,Cfest l e p l u s s i g n i f i c a t i f de tous l e s parametres de d i s p e r ­

s i o n . . Exemple

A p a r t i r du t a b l e a u 3.4, avec X = 1,707 m on o b t i e n t l e t a b l e a u s u i v a n t :

Centres de c l a s s e s χ.

1

η.

1

( X i - x )2 n± (xv - X )2

1,57 3 0,01877 0,05631

1 ,62 12 0,00757 0,09084

1,67 ίδ 0,00137 0,02466

1,72 25 0,00017 0,00425

1,77 15 0,00397 0,05955

1 ,82 5 0,01277 0,06385

1 ,87 2 0,02657 0,05314

80 T o t a l 0,35260

Tableau 3.5

Références

Documents relatifs

par une variable

La phase exploratoire d´ ecrite dans le chapitre pr´ ec´ edent permet, ` a partir d’observations, de formuler des hypoth` eses concernant une variable al´ eatoire.. La statistique

Espace Exemple : L’ensemble de tousrésultats possibles d’une expériencealéatoire: fréquence une expérience qui peut être reproduit dans les mêmes conditions

Delacour - Physique - PTSI Paul Constans - Optique Chapitre 2 : Principes et lois de l’optique géométrique.. Dioptre : surface de séparation entre deux milieux transparents

(5) Mémoire intitulé : « Pourquoi nous décelons parfois des corrélations entre les séries, fonctions du temps. Étude sur l'échantillonnage et sur la valeur de ces séries..

on remarque de plus que pour deux distributions moyennes identiques, celle pour laquelle la valeur de Y relative à X = X t est la mieux définie est celle pour laquelle les écarts

À l’origine, leur étude commençait au cours des deux dernières années du primaire (Gouvernement du Québec, 1976a), l’étude de la statistique devait se faire à partir

Pour remédier à cet échec et pour rapprocher l’enseignement des probabilités et de la statistique, la réforme de 1991 du programme des classes de première part de l’observation de