• Aucun résultat trouvé

constituée de données distinctes ou confondues, on peut calculer : La moyenne

N/A
N/A
Protected

Academic year: 2022

Partager "constituée de données distinctes ou confondues, on peut calculer : La moyenne"

Copied!
2
0
0

Texte intégral

(1)

BTS1-Chapitre 4 : Série statistique à une variable, à deux variables I. Série statistique à une variable

Propriété : les différentes grandeurs statistiques

Etant donné une série statistique, notée ( ), constituée de données distinctes ou confondues, on peut calculer : La moyenne :

̅ =1

=1

( + + ⋯ + )

Lorsque les valeurs identiques ont été regroupées en valeurs distinctes :

̅ =1

× =1

( . + . + ⋯ + . )

L’étendue : = −

L’écart-type mesure la dispersion par rapport à la moyenne. On a = √ !"#! $ ; les nombres % sont obtenues à la calculatrice ou au tableur.

La série étant ordonnée :

La médiane : & partage la série ordonnée en deux groupes de même effectif On désigne par l’effectif total de la série.

Si est impair, la médiane est la valeur située au milieu de la série

Si est pair, la médiane est la demi-somme des deux valeurs « du milieu » Au moins 50% des valeurs de la série sont inférieures ou égales à la médiane

Les quartiles ' et '( et la médiane partage la série en quatre groupes de même effectif.

' est la valeur de la série ordonnée, telle que au moins 25 % des données soient inférieures ou égales à ' Calculez

) , puis prendre la valeur approchée par excès.

'(est la valeur de la série ordonnée, telle que au moins 75 % des données soient inférieures ou égales à '( Calculez (

) , puis prendre la valeur approchée par excès.

l’intervalle interquartile est [' ; '(] et l’écart interquartile est '(− ' . Caractéristiques de position : la moyenne, la médiane, les quartiles.

Caractéristiques de dispersion : l’étendue, l’écart-type, l’intervalle interquartile, l’écart interquartile.

Les commandes EXCEL : la plage de données étant (-5: -34)

= MOYENNE(H5:H34) // = ARRONDI(MOYENNE(H5 :H34) ;1) donne la moyenne arrondie au dixième //

=ECARTYPEP(H5:H34) // =MIN(H5:H34) // =MAX(H5:H34) // =QUARTILE(H5:H34;1) // =MEDIANE(H5:H34) //

=QUARTILE(H5:H34;3)

La commande =NB.SI(H5:H34;">=10") compte le nombre de valeurs supérieures ou égales à 10 dans la plage de données.

Quelques représentations d’une série statistique

Axe gradué : On résume la série en plaçant sur un axe gradué les valeurs extrêmes, la moyenne ̅ ; l’intervalle [ ̅ − ; ̅ + ] ou [ ̅ − 2 ; ̅ + 2 ].

Diagramme en boîte

On peut résumer la série en plaçant sur un axe gradué les valeurs extrêmes, la médiane et les quartiles en dessinant un rectangle ( « une boîte ») sur l’intervalle [' ; '(]

Histogramme

On peut effectuer des regroupements par classe de même amplitude ou d’amplitude différente. On représente alors la série par un histogramme : l’aire des rectangles est proportionnelle aux effectifs des classes.

(2)

II. Série statistique à deux variables II-A : Nuage de points et point moyen

Une série statistique à deux variables ( ; 3 se représente dans un repère orthogonal par un nuage de points & ; 3 .

Le point moyen du nuage est le point 4 ̅ ; 35

Son abscisse est la moyenne de la série : ̅ 678698⋯86: Son ordonnée est la moyenne de la série 3 : 35 ;78;98⋯8;: II-B : Ajustement de < en =

Effectuer un ajustement de 3 en , c’est trouver une fonction mathématique > dont la courbe représentative d’équation 3 > s’ajuste le mieux possible au nuage de points.

(Remarque : cela ne veut pas dire qu’il y a une relation de cause à effet)

On peut ajuster par une fonction affine, une fonction polynôme de degré 2 , une fonction exponentielle, … Un ajustement permet de faire des estimations :

interpolation (dans l’intervalle d’étude) extrapolation (en dehors de l’intervalle d’étude) Ajustement affine par la droite des points extrêmes

On détermine l’équation de la droite passant par le 1er et le dernier point du nuage. (cf ex12 p71) Ajustement affine de < en = par la méthode des moindres carrés ou droite de régression de < en = Lorsque les points du nuage sont presque alignés, on recherche une droite d’ajustement.

On admet qu’il existe une droite qui ajuste « au mieux » le nuage, appelé droite d’ajustement affine par la méthode des moindres carrés, ou droite de régression de < en =.

Cette droite passe par le point moyen ? =@ ; <@ .

Son équation < A= B est obtenue à la calculatrice : CDEFGH A= B FI, FK ( ou au tableur)

On admet que cette droite minimise la somme des carrés des écarts « verticaux », aussi appelés

« résidus » L & M ²

Plus la somme des résidus est faible, meilleur est l’ajustement affine.

Remarque : On peut éventuellement aussi utiliser la droite d’ajustement de en 3 ; son équation est :

!3 O ; CDEFGH A= B FK, FI ; elle minimise la somme des carrés des écarts « horizontaux » . II-C : Coefficient de corrélation linéaire

Pour évaluer la qualité d’un ajustement, on calcule (à la calculatrice ou au tableur) le coefficient de corrélation linéaire .

On admet :

• 1 P Q P 1

• Q R 0 si le nuage a une « allure montante » et Q P 0 si le nuage a une « allure descendante »

• Plus Q est proche de 1 ou 1, meilleure est la qualité de l’ajustement La commande EXCEL : = COEFFICIENT.CORRELATION(matrice1 ;matrice2)

Dans notre exemple matrice1 A2:A13 matrice2 B2 :B13 d’où = COEFFICIENT.CORRELATION(A2:A13;B2:B13)

Références

Documents relatifs

Une première stratégie consiste à utiliser un plan de sondage aléatoire simple sans remise, puis de prendre en compte l’information auxiliaire dans l’estimateur en introduisant

[r]

[r]

[r]

[r]

Une maîtresse a regroupé dans un tableau statistique les résultats d’une enquête portant sur le nombre de gâteau consommés pendant la récréation par 200 élèves

Utiliser les trois nombres obtenus à la question précédente pour écrire des phrases qui donnent une analyse statistique du tableau sans utiliser les mots médiane ou quartile..

Exemple : notes d’un devoir dans une classe de 28 élèves La note minimale est 3 ; la note maximale est 15.. La médiane