BTS1-Chapitre 4 : Série statistique à une variable, à deux variables I. Série statistique à une variable
Propriété : les différentes grandeurs statistiques
Etant donné une série statistique, notée ( ), constituée de données distinctes ou confondues, on peut calculer : La moyenne :
̅ =1
=1
( + + ⋯ + )
Lorsque les valeurs identiques ont été regroupées en valeurs distinctes :
̅ =1
× =1
( . + . + ⋯ + . )
L’étendue : = −
L’écart-type mesure la dispersion par rapport à la moyenne. On a = √ !"#! $ ; les nombres % sont obtenues à la calculatrice ou au tableur.
La série étant ordonnée :
La médiane : & partage la série ordonnée en deux groupes de même effectif On désigne par l’effectif total de la série.
Si est impair, la médiane est la valeur située au milieu de la série
Si est pair, la médiane est la demi-somme des deux valeurs « du milieu » Au moins 50% des valeurs de la série sont inférieures ou égales à la médiane
Les quartiles ' et '( et la médiane partage la série en quatre groupes de même effectif.
' est la valeur de la série ordonnée, telle que au moins 25 % des données soient inférieures ou égales à ' Calculez
) , puis prendre la valeur approchée par excès.
'(est la valeur de la série ordonnée, telle que au moins 75 % des données soient inférieures ou égales à '( Calculez (
) , puis prendre la valeur approchée par excès.
l’intervalle interquartile est [' ; '(] et l’écart interquartile est '(− ' . Caractéristiques de position : la moyenne, la médiane, les quartiles.
Caractéristiques de dispersion : l’étendue, l’écart-type, l’intervalle interquartile, l’écart interquartile.
Les commandes EXCEL : la plage de données étant (-5: -34)
= MOYENNE(H5:H34) // = ARRONDI(MOYENNE(H5 :H34) ;1) donne la moyenne arrondie au dixième //
=ECARTYPEP(H5:H34) // =MIN(H5:H34) // =MAX(H5:H34) // =QUARTILE(H5:H34;1) // =MEDIANE(H5:H34) //
=QUARTILE(H5:H34;3)
La commande =NB.SI(H5:H34;">=10") compte le nombre de valeurs supérieures ou égales à 10 dans la plage de données.
Quelques représentations d’une série statistique
Axe gradué : On résume la série en plaçant sur un axe gradué les valeurs extrêmes, la moyenne ̅ ; l’intervalle [ ̅ − ; ̅ + ] ou [ ̅ − 2 ; ̅ + 2 ].
Diagramme en boîte
On peut résumer la série en plaçant sur un axe gradué les valeurs extrêmes, la médiane et les quartiles en dessinant un rectangle ( « une boîte ») sur l’intervalle [' ; '(]
Histogramme
On peut effectuer des regroupements par classe de même amplitude ou d’amplitude différente. On représente alors la série par un histogramme : l’aire des rectangles est proportionnelle aux effectifs des classes.
II. Série statistique à deux variables II-A : Nuage de points et point moyen
Une série statistique à deux variables ( ; 3 se représente dans un repère orthogonal par un nuage de points & ; 3 .
Le point moyen du nuage est le point 4 ̅ ; 35
Son abscisse est la moyenne de la série : ̅ 678698⋯86: Son ordonnée est la moyenne de la série 3 : 35 ;78;98⋯8;: II-B : Ajustement de < en =
Effectuer un ajustement de 3 en , c’est trouver une fonction mathématique > dont la courbe représentative d’équation 3 > s’ajuste le mieux possible au nuage de points.
(Remarque : cela ne veut pas dire qu’il y a une relation de cause à effet)
On peut ajuster par une fonction affine, une fonction polynôme de degré 2 , une fonction exponentielle, … Un ajustement permet de faire des estimations :
interpolation (dans l’intervalle d’étude) extrapolation (en dehors de l’intervalle d’étude) Ajustement affine par la droite des points extrêmes
On détermine l’équation de la droite passant par le 1er et le dernier point du nuage. (cf ex12 p71) Ajustement affine de < en = par la méthode des moindres carrés ou droite de régression de < en = Lorsque les points du nuage sont presque alignés, on recherche une droite d’ajustement.
On admet qu’il existe une droite qui ajuste « au mieux » le nuage, appelé droite d’ajustement affine par la méthode des moindres carrés, ou droite de régression de < en =.
Cette droite passe par le point moyen ? =@ ; <@ .
Son équation < A= B est obtenue à la calculatrice : CDEFGH A= B FI, FK ( ou au tableur)
On admet que cette droite minimise la somme des carrés des écarts « verticaux », aussi appelés
« résidus » L & M ²
Plus la somme des résidus est faible, meilleur est l’ajustement affine.
Remarque : On peut éventuellement aussi utiliser la droite d’ajustement de en 3 ; son équation est :
!3 O ; CDEFGH A= B FK, FI ; elle minimise la somme des carrés des écarts « horizontaux » . II-C : Coefficient de corrélation linéaire
Pour évaluer la qualité d’un ajustement, on calcule (à la calculatrice ou au tableur) le coefficient de corrélation linéaire .
On admet :
• 1 P Q P 1
• Q R 0 si le nuage a une « allure montante » et Q P 0 si le nuage a une « allure descendante »
• Plus Q est proche de 1 ou 1, meilleure est la qualité de l’ajustement La commande EXCEL : = COEFFICIENT.CORRELATION(matrice1 ;matrice2)
Dans notre exemple matrice1 A2:A13 matrice2 B2 :B13 d’où = COEFFICIENT.CORRELATION(A2:A13;B2:B13)