• Aucun résultat trouvé

Cours 10 : Statistiques

N/A
N/A
Protected

Academic year: 2022

Partager "Cours 10 : Statistiques"

Copied!
4
0
0

Texte intégral

(1)

__________________________________________________________________________________________________

Cours 10 – Statistiques Page 1 sur 4

Seconde – Lycée Desfontaines - Melle Statistiques

Cours 10 : Statistiques

I. Introduction

Le mot "statistique" vient du latin "status" qui signifie "Etat". A l'origine, la statistique rassemblait exclusivement des renseignements concernant l'Etat : recensement d'une population, évaluation des ressources, état des stocks en denrées alimentaires etc ... ce qui explique le vocabulaire employé actuellement.

De nos jours, les méthodes statistiques sont employées en médecine (évaluation de l'efficacité d'un traitement , lien entre maladie et mode de vie ... ) aussi bien qu'en agronomie (sélection des variétés, études de descendance ... ) ou dans l'industrie ( contrôle de qualité, organisation du travail ... ) sans oublier la sociologie dont les enquêtes et sondages de toutes sortes fleurissent dans les médias.

Les annexes 1, 2 ainsi quun TP info (étude dune série statistique) donnent 3 exemples d’étude statistique.

II. Vocabulaire et exemples

1) Population, individu, caractère, classe statistique

Les premiers problèmes auxquels s'est intéressée la statistique étant de nature démographique (recensement de population), elle en a hérité une partie d'un vocabulaire spécifique:

• On appelle ainsi population tout ensemble que l'on soumet à une étude statistique

• Pour ces mêmes raisons et de façon tout à fait cohérente, on nomme individu tout élément de l'ensemble en question.

• L'étude statistique d'une population concerne une particularité, une propriété qui est commune à tous ces individus : on lui donne le nom de caractère. Parmi les caractères, on peut distinguer les caractères quantitatifs et les caractères qualitatifs :

• Les caractères quantitatifs sont ceux que l'on peut mesurer (note obtenue à un devoir, revenu annuel, taille, poids, température ... ) . Parmi eux, on distingue les caractères quantitatifs discrets qui ne peuvent prendre que des valeurs isolées (notes obtenues à un devoir, nombre d'enfants par famille, nombre de pièces d'un logement ... ) et les caractères quantitatifs continus qui, à priori, peuvent prendre n'importe quelle valeur d'un intervalle

[

a b;

[

appelé classe statistique ( taille d'une personne, superficie en m2 d'un logement ... ).

On appelle alors centre de la classe la moyenne 2 a+b

et amplitude de la classe la différence ba.

• Les caractères qualitatifs sont ceux qui ne sont pas mesurables (couleur des yeux, profession d'une personne ... ). Pour un tel caractère, on ne parle pas de valeurs possibles mais de modalités.

2) Effectifs, fréquences.

• Le nombre d'individus dont le caractère prend une valeur donnée xi s'appelle l'effectif de la valeur xi et est notée ni. On définit de même l'effectif d'une classe et l'effectif d'une modalité. La somme des effectifs est l'effectif total (noté N) de la population.

• On appelle fréquence d'une valeur xi (ou d'une modalité ou d'une classe) et on note fi le quotient de l'effectif de la valeur par l'effectif total de la population, c'est à dire: i ni

f = N . Les fréquences sont donc des nombres compris entre 0 et 1 et leur somme est égale à 1. On note 1 2 3

1

... 1

i p

i p

i

f f f f f

=

=

= + + + + =

.

Les fréquences peuvent aussi s’exprimer en pourcentages (ex : 0.25= 25

100=25%)

(2)

__________________________________________________________________________________________________

Cours 10 – Statistiques Page 2 sur 4

3) Série statistique

Une série statistique est la donnée : - d'une population,

- d'un caractère,

- de l'effectif (ou fréquence) de chaque valeur (ou classe ou modalité) du caractère.

Les résultats d'une série statistique sont le plus souvent présentés sous forme d'un tableau.

III. Effectifs cumulés croissants

Leurs intérêts sont multiples : ils peuvent permettre de répondre à certaines questions rapidement et sont parfois utiles pour déterminer la médiane… (on le verra plus tard)

Remarque :

1) On pourrait également envisager de faire les effectifs cumulés décroissants…

2) Lorsqu’il s’agit de l’étude d’un caractère qualitatif on ne peut pas établir d’ordre donc les effectifs cumulés n’ont alors aucun sens…

IV. Représentations graphiques usuelles d’une série

1) Représentation des effectifs (ou des fréquences) d’une série a) Diagramme en bâtons

C’est la représentation graphique la plus fréquemment utilisée pour un caractère quantitatif discret.

Méthode : Pour réaliser un diagramme en bâtons, il faut se placer dans un repère et : - porter, en abscisse les valeurs xi.

- et tracer pour chaque valeur xi, un bâton de hauteur correspondant à l’effectif ni (ou la fréquence fi)

b) Histogramme

C’est la représentation graphique la plus fréquemment utilisée pour un caractère quantitatif continu.

Méthode : Pour réaliser un histogramme, il faut : - représenter les classes sur l’axe des abscisses.

- représenter des rectangles dont les aires (et non pas nécessairement les hauteurs) sont proportionnelles

aux effectifs ni (ou aux fréquences fi)

c) Diagramme en secteur (circulaire, semi-circulaire,…) C’est la représentation graphique souvent utilisée pour un caractère qualitatif.

Méthode : Pour réaliser un diagramme en secteur (d’angle α) , il faut : - tracer un arc de cercle d’angle α.

- partitionner en secteurs de telle sorte que les angles soient proportionnels aux effectifs ni (ou aux - fréquences fi) sachant que 360° représente l’effectif total N.

2) Représentation des effectifs cumulés (ou des fréquences cumulées) d’une série continue:

Méthode : Pour réaliser ce type de représentation appelée le polygone des effectifs cumulés (ou des fréquences cumulées), il faut dans un repère :

- Placer tous les points de coordonnées (bornes d’une classe, effectif cumulé croissant correspondant).

- Et relier ces points par des segments (ce qui forme ainsi un polygone (d’où le nom…)

(3)

__________________________________________________________________________________________________

Cours 10 – Statistiques Page 3 sur 4

V. Paramètres de position et de dispersion

Dans toute cette partie :

o x1, x2, x3,…,xk désigneront : les valeurs possibles du caractère dans le cas d’une série discrète ou Les centres des classes dans le cas d’une série continue.

o n1, n2, n3, …, nk désigneront les effectifs des valeurs x1, x2, x3,…,xk. o N désignera l’effectif total : N = n1 + n2 + n3 + … + nk

o f1, f2, f3, … , fk désigneront les fréquences respectives des valeurs x1, x2, x3,…,xk : 

fi = ni

N Valeurs du caractère ou

centre des classes xi

x1 x2 x3xk TOTAL

Effectif partiel ni n1 n2 n3 nk N

Fréquence fi f1 = n1

N f2 = n2

N f3 = n3

N fk = nk

N 1

A - Un paramètre de position : la moyenne arithmétique

1. Définition :

La moyenne de la série est le réel noté x défini par x = n1x1+n2x2+n3x3+…+nkxk

N =

i=1 k

nixi

N Ainsi x = n1x1+n2x2+n3x3+…+nkxk

N = n1x1

N + n2x2

N + n3x3

N + …. + nkxk

N = n1

N x1 + n2

N x2 + n3

N x3 + … + nk

N xk

On déduit donc que la moyenne peut se calculer par : x = f1 x1 + f2 x2 + f3 x3 + … + fk xk =

i=1 k

fixi

Remarque : On ne peut pas calculer la moyenne d’une série à caractère qualitatif.

1. Linéarité de la moyenne

° Lorsqu’on multiplie chaque valeur d’une série statistique par une constante a, la moyenne est aussi multipliée par cette constante a.

° Lorsqu’on ajoute à chaque valeur d’une série statistique une même constante b, cette constante s’ajoute aussi à la moyenne.

° Pour résumer et généraliser :

Si x désigne la moyenne des nombres x1, x2, x3,…,xk affectés respectivement des coefficients n1, n2, n3, …, nk

alors la moyenne des nombres ax1 + b, ax2 + b, ax3 + b, …,axk + b, affectés respectivement des mêmes coefficients n1, n2 et nk est le réel : a x + b

2. Calcul de moyennes à partir de moyennes de sous-groupes On considère deux populations :

° La première constituée de p individus.

° La seconde constituée de q individus.

On étudie sur ces deux populations un même caractère quantitatif et on s’intéresse à la moyenne obtenue par chacune d’elles.

Soit alors x1 la moyenne de la première et x2 la moyenne de la deuxième population. On réunit ces deux populations.

On obtient donc une population de p + q individus c'est-à-dire dont l’effectif total est N = p + q.

La moyenne de cette nouvelle série statistique est donc x =

p x1 +q x2

p+q = p

N x1 + q N x2 Exemple : exercice 1

(4)

__________________________________________________________________________________________________

Cours 10 – Statistiques Page 4 sur 4

3. Moyenne élaguée

L’exercice 1 nous a montré que la moyenne arithmétique est sensible aux valeurs « aberrantes ».

On appelle moyenne élaguée le calcul de la moyenne arithmétique lorsqu’on supprime les valeurs aberrantes.

Exemple : exercice 3

B - Un paramètre de position : la médiane

Définition :

La médiane d’une série statistique est un réel, noté M, tel que :

° Au moins 50 % des valeurs de la série sont inférieures ou égales à M.

° Au moins 50 % des valeurs de la série sont supérieures ou égales à M.

Cas d’un caractère quantitatif discret : On suppose que les valeurs de la série sont rangées dans l’ordre croissant.

La médiane est alors :

° La valeur centrale de la série, si l’effectif total N est impair. (la valeur centrale est celle située au rang N + 1 2 ).

° N’importe quelle valeur comprise entre les deux valeurs centrales, si l’effectif total N est pair. (les valeurs centrales sont celles situées au rangs N

2 et N

2 + 1). Dans la pratique, on prend toujours comme médiane la demi- somme des deux valeurs centrales.

Cas d’un caractère quantitatif continu :

Une valeur approchée de la médiane est l’abscisse du point d’ordonnée N

2 du diagramme des effectifs cumulés croissants.

Remarque : On ne peut pas calculer la médiane d’une série à caractère qualitatif.

L’exercice 1 nous a montré que, contrairement à la moyenne, la médiane a pour avantage d’être peu sensible aux valeurs extrêmes qui peuvent ne pas être fiables. Elle est donc parfois beaucoup plus pertinente que la moyenne arithmétique. Cependant, elle a l’inconvénient de mal se prêter aux calculs algébriques (pas de linéarité, pas de calcul à partir à l’aide de sous groupes).

C - Un paramètre de position : le mode

Dans de nombreuses situations, il est important de connaître la valeur la plus fréquente de la variable. C’est le cas, par exemple, du Top 50.

1. Cas d’un caractère quantitatif discret Définition :

Dans le cas d’un caractère quantitatif discret, un mode est une valeur du caractère ayant le plus grand effectif.

Remarques :

Il peut y avoir plusieurs modes.

Lorsqu’il y a beaucoup de modes, ce paramètre ne présente plus alors beaucoup d’intérêt.

2. Cas d’un caractère quantitatif continu : classe modale Définition :

Dans le cas d’un caractère quantitatif continu, une classe modale est une classe ayant le plus grand effectif par unité d’amplitude, c’est-à-dire une classe donnant dans l’histogramme, un rectangle ayant la plus grande hauteur.

Remarque : Il peut y avoir plusieurs classes modales.

3. Cas d’un caractère qualitatif : mode Définition :

Dans le cas d’un caractère qualitatif, un mode est une modalité ayant le plus grand effectif.

D - Un paramètre de dispersion : l’étendue

Définition :

L’étendue d’une série statistique est la différence entre la plus grande et la plus petite des valeurs prises par un caractère. Pour un caractère continu, on ne peut déterminer qu’un encadrement de l’étendue.

Remarque : On ne peut pas parler d’étendue d’une série à caractère qualitatif.

Références

Documents relatifs

[r]

f est une fonction linéaire donc sa représentation graphique est une droite qui passe par l'origine du repère.. Pour tracer cette droite, il suffit de connaître les

f est une fonction linéaire donc sa représentation graphique est une droite qui passe par l'origine du repère.. Pour tracer cette droite, il suffit de connaître les

8 Le diagramme en barres suivant représente la répartition des élèves du collège selon leur mode de transport principal pour se rendre en cours :.. À pied En voiture En bus En

[r]

Les « moustaches » en revanche peuvent s’achever aux valeurs extrêmes, le minimum et le maximum de la série, ou aux premier et neuvième déciles, 10 % et 90 %, mais la notion

Une celle plus raisonnable fait simplement le tour d'une roue de vélo, ce tour mesurant 4 m.. On ajoute à chaque celle un mètre de celle, et l'on reforme des cercles avec ces

C'est un système d'identification des conducteurs qui utilise les marques des bornes auxquelles sont raccordés ces conducteurs. Le repérage des conducteurs peut dépendre