Les autres moyennes
• Moyenne géométrique d'une série de valeurs positives est la racine n
ièmedu produit des n valeurs. Elle est toujours
inférieure ou égale à la moyenne arithmétique.
• Moyenne harmonique d'une série de valeurs positives est égale à l'inverse de la moyenne des inverses.
• Moyenne quadratique est la racine carré de la moyenne
arithmétique des carrés.
Paramètres de position
D'autres moyennes
Paramètres de position
D'autres moyennes Exemples :
On donne x = 3 et y = 5. Calculer les moyennes arithmétique, géométrique, quadratique et harmonique de x et y.
C'est rassurant, toutes ces moyennes sont assez voisines.
Applications :
Moyenne géométrique et taux d'accroissement moyen.
Une quantité (positive) Q0 évolue de t1% une année puis de t2% l'année suivante.
Quel est le taux moyen annuel d'évolution ?
Notons c1 = 1 + t1/100 et c2 = 1 + t2/100 et Q2 = c1c2Q0 la quantité après deux années.
Soit c le coefficient multiplicateur correspondant au taux moyen annuel.
Ainsi : Q2 = c2Q0.
D'où : c = racine (c1 c2)
Généralisation à n années : c = racinen (c1 c2… cn)
Le taux moyen d'évolution pour une période est la moyenne géométrique des taux d'évolutions des sous-périodes.
Paramètres de position
Moyenne harmonique et vitesse moyenne.
Un avion parcourt une distance d à l'aller à une vitesse constante v1 et au retour à une vitesse constante v2.
Quelle est sa vitesse moyenne vmoy sur le trajet aller-retour (2d) ? vmoy = 2d/(taller + tretour) Où taller = d/v1 et tretour = d/v2.
Ainsi : vmoy = 2/ (1/v1 +1/v2)
Généralisation à n sous-trajets de même longueur parcourus à des vitesses constantes v1, ..., vn : vmoy = n/ (1/v1 +1/v2+…+1/ vn)
La vitesse moyenne sur une distance est la moyenne harmonique des vitesses sur les sous- distances.
Paramètres de position
Moyenne géométrique et suite ... géométrique.
Soient a, b et c trois réels non nuls tels que l'on passe de l'un au suivant en multipliant par une même quantité q :
a b = qa c = qb = q2a
(On dit que a, b et c sont trois termes consécutifs d'une suite géométrique) Alors le terme central (à savoir b) est la moyenne géométrique des termes extrêmes (a et c).
En effet : b2 = q2a2 = ac Donc : b = racine (ac)
Paramètres de position
Une série statistique à p dimensions possède p moyennes, une par caractère. On les représente en utilisant l’indice j variant de 1 à p.
Les p moyennes xj sont les coordonnées du centre de gravité G du nuage de points dans l’espace des individus.
Matrice des données centrées
Le terme général xij d’une série statistique auquel on soustrait la moyenne xj engendre la matrice des données centrées DC.
L’individu n°i représentée par le point Mi peut être repéré dans un nouveau système d’axes : l’ancien, translaté au centre de gravité G dont les
coordonnées dans l’ancien système sont les moyennes xj (j variant de 1 à p) OMi = OGi + GMi d’où GMi = OMi - OGi
Matrice des données centrées
Montrer que
- les moyennes des données centrées sont égales à zéro - et que les variances des données centrées sont égales à
celles des données initiales
Nécessité des indicateurs de dispersion
V = (3,2 ; 3,4 ; 3,6 ; 4,1 ; 4,2)
W = (2 ; 2,3 ; 2,5 ; 5,7 ; 6)
Les deux séries de 5 valeurs ont la même moyenne (3,7) mais pourtant elles ne se ressemblent pas
Ø Besoin d’un indicateur de dispersion pour décrire de façon
Paramètres de dispersion
Les paramètres de dispersion d’une série statistique à une dimension permettent de définir la plus ou moins grande concentration des données.
L ’étendue
On appelle étendue d’une série statistique, l’intervalle compris entre la plus grande et la plus petite valeur de la série. Plus cet intervalle est grand plus la série est dispersée.
Cet indicateur est très sensible au valeur extrême
Exemple : X= (3 ; 1 ; 5 ; 2 ; 8) étendue : 8 - 1 = 7
Variance
Variance : est un indicateur de la dispersion d’une série par rapport
à sa moyenne. La variance des valeurs prises par le caractère d’une série statistique est égale à la somme des carrés des écarts de ces valeurs à la moyenne divisée par la taille de l’échantillon
La variance est la mesure de la moyenne des carrés des distances des points Mi au centre de gravité G de la série statistique; en d’autres termes, la variance est la moyenne des normes des vecteurs GMi élevées au carré.
Après développement, on obtient:
Ecart type
Ecart type
L’écart type des valeurs prises par le caractère d’une série statistique à une dimension est égal à la racine carrée de leur variance: s = racine Var (C)
Contribution d’un individu à la variance totale
Paramètres de dispersion
Remarques :
§ + la variance est élevée et + plus la dispersion est grande
§ La variance et l’écart-type sont toujours positifs ou nuls
§ La variance (Var(C)), parfois notée s
2, possède la dimension du caractère élevé au carré
Exemple : si la moyenne est exprimé en mètre, la variance est exprimée en m
2.
§ L’écart-type possède la dimension du caractère
Coefficient de variation
• CV est le rapport de l’écart type divisé par la moyenne.
• CV est un nombre pur, sans unités.
• CV est totalement indépendant des unités.
• Le CV permet de comparer la dispersion des séries entre elles
ou la variabilité de distributions de variables qui ne sont pas
dans les mêmes unités.
Paramètres de dispersion
Remarque
Une série statistique à p dimensions possède p variances (p écarts-type).
On les représente on utilisant l’indice j variant de 1 à p.
La variance du caractère n°j est la somme des carrés des termes de la colonnes n°j de la matrice des données centrées divisée par la taille de l’échantillon.
Matrice des données centrées réduites
Le terme général xij d’une série statistique auquel on soustrait la moyenne xj et que l’on normalise par son écart type sj engendre la matrice des
données centrées réduites DCR.
Cette matrice, tout comme la matrice des données centrées est une matrice à N lignes et à p colonnes dont le terme général est
Remarque : La normalisation des caractères par leur écart type a
l’avantage de rendre la représentation indépendante des unités de mesure et donc de rendre leur dispersion comparable puisque leur variance est égale à 1.
les variables centrées réduites sont sans dimension;
xij – xj sj
Matrice des données centrées réduites
Montrer que :
- leurs moyennes sont égales à zéro;
- et leurs variances sont égales à un.
Paramètres de forme: coefficients de fisher
Le résumé statistique d’une série doit comprendre une information sur la forme de l’histogramme, c’est-à-dire sur la répartition des valeurs de la série.
Les trois courbes se situent dans les mêmes gammes de valeurs,
mais ont des étalements très différents. Les paramètres de dispersion, de symétrie et d'aplatissement le mettent clairement en évidence.
Paramètres de forme: coefficients de fisher
Coefficient d’asymétrie (skewness)
Le coefficient d’asymétrie qualifie la répartition plus ou moins étalée des valeurs de la série à droite ou à gauche de l’histogramme.
g1<0 g1=0 g1>0
Paramètres de forme: coefficients de fisher
Coefficient d’aplatissement (kurtosis)
Le coefficient d’aplatissement qualifie la répartition plus ou moins étalée des valeurs de la série: plus les valeurs sont étalées, plus l’histogramme des fréquences simples est plat et moins les valeurs sont étalées, plus l’histogramme des fréquences présente un pic.
g2<0
g2=0 g2>0
Paramètre de forme Paramètre de dispersion Paramètre de position Quartile 2
Etendue Médiane Variance
Coefficient d’asymétrie Intervalle interquartile Moyenne arithmétique Décile
Coefficient d’aplatissement Quartile 3
Une série statistique peut être résumée par un ensemble de paramètres ; ces paramètres peuvent être de forme, de dispersion ou de position. On vous demande, pour chacun des dix paramètres inscrits dans la première colonne du tableau 1, de préciser sa nature. Pour cela vous mettrez une croix dans la bonne colonne
Tableau 1
Exercices
Exercices
On a mesuré la profondeur de carbonatation du béton en plusieurs sites en arrondissant les résultats à 5 mm:
a) Représentez graphiquement le diagramme des fréquences cumulées.
b) Calculez la moyenne.
c) Calculez la médiane.
d) Calculez l'écart-type.
e) En comparant la moyenne et la médiane, que pouvez-vous dire de cette distribution ? f) On compare la distribution précédente avec celle d'un autre groupe dont la moyenne et l'écart-type sont respectivement:
m2 = 165 s2 = 5.6
Lequel est le plus homogène ?
profondeur de carbonatation (mm) Nombre de sites
155 6
160 9
165 5
170 3
175 1