• Aucun résultat trouvé

Param` etres de position, dispersion, relation

Dans le document Probabilit´es et statistique pour le CAPES (Page 100-103)

On consid`ere un ´echantillon de n individus et on souhaite ´etudier une variable (caract`ere) quantitative de cette population. Pour tout i ∈ {1,· · · , n}, xi repr´esente la donn´ee de la variable (caract`ere) pour le i-i`eme individu. Les donn´ees sont repr´esent´ees dans un vecteur (x1, . . . , xn), qui s’appelle unes´erie statistique quantitative. Sans perte de g´en´eralit´e, supposons quex1≤x2 ≤ · · · ≤xn (puisque les xi sont des nombres r´eels).

Exemple. On ´etudie les r´esultats de 10 ´etudiants `a un test de statistique : x= (2,5,5,8,10,12,12,12,15,20).

L’effectif total estn. Dans l’exemple, n= 10.

Notons (z1,· · · , zm) les valeurs diff´erentes des donn´ees de la s´erie. On a donc m≤n. L’effectif nj d’une valeur zj est le nombre de r´ep´etitions de zj dans la s´erie. Remarquer que

Pm j=1

nj =n.

La fr´equence fj d’une donn´eezj est :fj = effectif (zj) effectif total = nnj. Exemple. Reprenons l’exemple pr´ec´edent.

m= 7,

(z1,· · · , z7) = (2,5,8,10,12,15,20) n1= 1, n2= 2,· · ·

f1= 1

10, f2 = 1 5,· · ·

Nous souhaitons ensuite ´etudier une deuxi`eme variable quantitative de cette population. Pour touti∈ {1,· · ·, n},yi repr´esente la donn´ee de la deuxi`eme variable pour lei-i`eme individu.

On appelle statistique double la donn´ee {(xi, yi) : i ∈ {1,· · ·, n}} des deux variables pour chacun des individus.

Exemple. Consid´erons les deux s´eries repr´esentant les r´esultats de 10 ´etudiants `a l’examen de statistique et d’alg`ebre, respectivement :

x= (2,5,5,8,10,12,12,12,15,20), y= (3,4,6,7,8,10,12,14,16,19).

D´efinition (Param`etres de position). Chacune des quantit´es d´efinies ci-dessous se calcule pour la donn´ee d’une des variables.

— Lamoyenne arithm´etique ou simplement la moyenne, not´ee ¯xest :

¯ x= 1

n

n

X

k=1

xk

= 1 n

m

X

j=1

njzj =

m

X

j=1

fjzj.

— La moyenne ´elagu´ee est la moyenne de la s´erie priv´ee de ses valeurs extrˆemes lorsque celles-ci semblent aberrantes (`a interpr´eter selon les cas).

— On appellem´edianeouvaleur m´edianetout nombreatel qu’au moins la moiti´e de l’effec-tif de la s´erie soit inf´erieur ou ´egal `aa, et au moins la moiti´e de l’effectif soit sup´erieur ou

´

egal `aa. Lorsquen= 2p+ 1 est impair,xp+1 est la m´ediane de la s´erie. Lorsquen= 2p est pair, tout nombre de l’intervalle [xp;xp+1] (appel´e dans ce cas intervalle m´edian car c’est l’ensemble des valeurs m´edianes) convient.

Attention ! Dans le secondaire on utilise la d´efinition suivante, l´eg`erement diff´erente, pour la m´ediane. L’avantage est que la m´ediane est unique, on la noteµ : sin= 2p+ 1 est impair,µ=xp+1, et sin= 2p est pair,µ= xp+x2p+1. On peut alors d´emontrer que la m´ediane µ poss`ede la propri´et´e suivante : au moins la moiti´e de l’effectif de la s´erie est inf´erieur ou ´egal `aµ, et au moins la moiti´e de l’effectif est sup´erieur ou ´egal `a µ.

— Unmode est une valeur de plus grand effectif. Un mode n’est pas forc´ement unique. Les modes n’ont d’int´erˆet que si leurs effectifs (´egaux) sont nettement sup´erieurs `a ceux des autres caract`eres.

— Soitα ∈]0,1[. Le fractile d’ordre α est le plus petit nombre r´eel a de la s´erie, tel qu’au moins 100α% de l’effectif est inf´erieur ou ´egal `a a. C’est donc une valeur de la s´erie.

Lorsque α vaut 14, 12 ou 34, on parle de quartiles : premier quartile not´e Q1, deuxi`eme quartileQ2, troisi`eme quartileQ3. L’intervalle [Q1, Q3] s’appelle l’intervalle interquartile.

Lorsque α vaut 0,1 ou 0,2, ..., ou 0,9, on parle de d´eciles : premier, deuxi`eme, ..., neuvi`eme.

Attention. La m´ediane et le deuxi`eme quartile ne sont pas forc´ement ´egaux. En effet, le deuxi`eme quartile est par d´efinition une valeur de la s´erie, ce qui n’est pas le cas pour la m´ediane.

Exemple. Nous traitons la premi`ere s´erie de l’exemple.

— La moyenne est : ¯x= 2+2.5+8+10+3.12+15+20

10 = 10,1.

— Tout nombre de l’intervalle [10,12] est valeur m´ediane. Avec la d´efinition utilis´ee dans le secondaire, la m´ediane vautµ= 11.

— Le premier quartile estQ1= 5, le deuxi`emeQ2 = 10, le troisi`emeQ3 = 12. Ainsi m´ediane (µ= 11) et deuxi`eme quartile (Q2 = 10) ne co¨ıncident pas n´ecessairement.

Remarque. Attention, les calculatrices et les tableurs ne calculent g´en´eralement pas correcte-ment les fractiles des s´eries statistiques, et confondent deuxi`eme quartile et m´ediane. Ainsi, pour calculer le premier quartile de la s´erie 1, 2, 3 (qui vaut Q1=x1 = 1 car la s´erie comporte trois termes), le tableur fait une approximation affine entre les diff´erentes valeurs de la s´erie, comme s’il s’agissait d’une s´erie “continue uniforme”, et retourne des valeurs qui ne sont pas n´ecessairement des valeurs de la s´erie, ici 1,5 (ne pas oublier que, par d´efinition, un quartile, et plus g´en´eralement un fractile, est une valeur de la s´erie).

D´efinition(Param`etres de dispersion). Chacune des quantit´es d´efinies ci-dessous se calcule pour la donn´ee d’une des variables.

— Lesvaleurs extrˆemes sont le minimum et le maximum de la s´erie, ici x1 etxn.

— L’´etendue est la diff´erence entre les valeurs extrˆemes de la s´erie, icixn−x1. On parle de faible dispersion si l’´etendue est consid´er´ee comme petite, de forte dispersion si elle est consid´er´ee comme grande, ce qui est une appr´eciation subjective.

— Lavariance, not´eeσ2x, permet de mesurer la dispersion des donn´ees en tenant compte de toutes les valeurs. Elle est d´efinie par :

σx2 = 1

D´efinition (Param`etres de relation). . Les quantit´es d´efinies ci-dessous permettent de d´eterminer des relations entre la donn´ee des diff´erentes variables.

— Lacovariance entre les donn´eesx ety, not´eeσx,y est d´efinie par :

— Siσx6= 0 etσy 6= 0, le coefficient de corr´elation, not´e ρx,y, est d´efini par : ρx,y = σx,y

σxσy

.

Remarque. Six ety ont des unit´es (kg, m, ...),σx a pour unit´e celle dex,σy celle dey, etσx,y a pour unit´e le produit des unit´es de x et de y. Mais le coefficient de corr´elation ρx,y est un nombre, sans unit´e donc. Nous verrons plus tard qu’il v´erifie :−1≤ρx,y ≤1.

Dans le document Probabilit´es et statistique pour le CAPES (Page 100-103)