• Aucun résultat trouvé

Vocabulaire de base du domaine de la statistique

N/A
N/A
Protected

Academic year: 2022

Partager "Vocabulaire de base du domaine de la statistique"

Copied!
8
0
0

Texte intégral

(1)

Orientation Glossaire

Atlas / Nombres

Classe

Débutant DicoMot

DicoNombre

STATISTIQUES

Définition Le but principal de la statistique est de déterminer les caractéristiques d'une population donnée à partir de l'étude d'une partie de cette population, appelée

"échantillon".

Statistiquenom féminin (allemand Statistik ; du latin status, état)

1. Ensemble de méthodes mathématiques qui, à partir du recueil et de l'analyse de données

réelles, permettent l'élaboration de modèles probabilistes autorisant les prévisions.

2. Tableau numérique d'un phénomène se prêtant à l'analyse statistique. Statistique de la natalité

Définition Larousse

Étapes de l'analyse statistique

Cinq étapes typiques de la pratique de la statistique:

1 Définition des unités statistiques, des variables, sur lesquelles on va opérer: caractères comme la température, la taille, la rémunération, les notes

2 Recueil des données: mesures, enquêtes, sondages, échantillonnage …

3 Présentation des données sous forme de tableaux, de courbes, de graphiques … 4 Caractérisation de ces données par des

paramètres. statistiques caractéristiques:

moyenne, médiane, mode, écart-type … 5 Extraction des conclusions: bilan narratif,

modélisation, expression de tendances, test des hypothèses, recherche de lien entre caractères, de corrélations …

(2)

Le traitement des données s'appelle la statistique descriptive (étapes 1 à 4); l'interprétation des données s'appelle l'inférence statistique ou statistique inférentielle (étape 5).

Jargon! On cherche à mieux connaître les enfants présents dans la salle en précisant leur âge.

On interroge la population sur les âges

On classe par valeurs

croissantes, et on obtient la série

statistique (classée)

Le caractère étudié, l'âge, prend cinq valeurs

L'étendue de la série

Les effectifs

L'effectif total L'effectif cumulé à 12 ans

La fréquence égale à

10, 12, 14, 10, 12, 11, 12, 10, 12, 13

10, 10, 10, 11, 12, 12, 12, 12, 13, 14

10, 11, 12, 13, 14

14 – 10 = 4 ans

Âge 10 11 12 13 14

Effectif 3 1 4 1 1

3+1+4+1+1 = 10

3+1+4 = 8

Âge 10 11 12 13 14

Effectif 3 1 4 1 1

Fréquence 0,3 0,1 0,4 0,1 0,1

(3)

l'effectif par caractère divisé par l'effectif total;

nombre inférieur à 1;

parfois

exprimé en %

Voir Suite

Anglais Statistics: figures giving information about something; the study of such figures.

Statistic: a function of a sample; in other words, a quantity calculated from a set of observations. Often a statistic is an estimator for a population parameter.

For example, the sample mean, the sample median and the sample variance are each a statistic.

The sum of observations in a sample is also a statistic, but this is not an estimator.

En savoir plus

Statistiques – Débutant

Probabilités et statistiques – Index Probabilités

Dénombrement

Cette page http://villemin.gerard.free.fr/Referenc/Vocabula/GlosS/Statisti.htm

La statistique est moins une science qu'un art. Elle est la poésie des nombres. Chacun y trouve ce qu'il y met.

Albert Brie

Voir Pensées & humour

(4)

Vocabulaire de base du domaine de la statistique

Caractère

Variable Le caractère est la grandeur sur laquelle porte la statistique:

Âges dans une population, profondeurs dans une mer donnée, notes dans une classe, rémunération des grands patrons, prix d'achat d'un appartement dans une région …

Caractère quantitatif: le prix d'un objet, la hauteur des arbres ou tout autre critère d'étude en statistique auquel on peut donner une valeur; un caractère quantitatif peut être:

- soit discret (ex: pointure des chaussures);

- soit continu (ex: tension mesurée aux bornes d'une pile).

Caractère qualitatif: ce sont des noms et pas des nombres; ex: les produits d'un magasin, le sexe d'une population, la couleur d'objets, la nationalité

Caractère est le mot général; un caractère quantitatif est aussi baptisé variable statistique.

Population Échantillon Effectif

La population est l'ensemble des éléments soumis à une étude statistique.

L'échantillon est l'ensemble des éléments effectivement choisis pour contribuer à l'étude statistique.

(5)

L'effectif d'un caractère (ou d'une variable) est le nombre d'éléments pour lequel le

caractère a une valeur donnée.

L'effectif total est le nombre d'éléments soumis à la statistique; c'est la somme des effectifs de toutes les valeurs du caractère.

L'effectif cumulé d'un caractère est le nombre d'éléments pour lequel le caractère a une valeur inférieure ou égale à une valeur donnée; c'est la somme des effectifs de

toutes les valeurs du caractère inférieures ou égales à une valeur donnée.

Exemple: les chaussures de la famille Pointure 37 1

Pointure 39 3 Effectif "pointure 39" = 3

Pointure 40 1 Effectif cumulé "pointure 40" = 5 Pointure 43 2

Effectif total = 7

L'effectif d'une classe, dans le cas d'un caractère continu, est l'effectif d'un

caractère choisi dans un intervalle donné (une classe).

Série

Étendue Une série statistique est la liste de toutes valeurs étudiées.

L'étendue de la série est la différence entre la plus grande valeur et la plus petite.

(6)

Fréquence La fréquence donne le taux de présence d'un effectif par rapport à l'effectif total; c'est le quotient de l'effectif d'un caractère donné sur l'effectif total.

C'est une valeur comprise entre 0 et 1 qui peut aussi être exprimée sous la forme d'un pourcentage.

Exemple:

La fréquence de la pointure 40 est de 1 sur 7 soit 0,14 ou 14%.

Pour une modalité (valeur) d'un caractère, la fréquence est le rapport entre l'effectif de la modalité et l'effectif total.

Moyenne Médiane Mode

La Moyenne représente le caractère moyen;

c'est la moyenne arithmétique des caractères (longueur, salaire …).

Exemple:

Trois individus de 1,70m, 1,73m et 1,92 m, la moyenne est 1,78 m (somme des 3 valeurs divisée par 3).

La Médiane partage la population en deux parties de même effectif: 50% des individus ont une valeur du caractère (taille, âge …) inférieure ou égale à la médiane, et 50% une valeur supérieure ou égale à la médiane.

(7)

Mode: individu le plus fréquent; en statistique, le mode (ou la classe modale) est la valeur (ou la classe de valeurs) de X pour laquelle

l'effectif (ou la fréquence) est maximal(e).

C'est la donnée la mieux représentée.

Voir Moyennes (statistiques) / Moyennes en général

Variance

Écart-type Variance: différence entre la moyenne des carrés E[X²] et carré de la moyenne E[X]²

Écart-type: racine carrée de la variance.

Caractérise la dispersion autour de la moyenne.

Nombre positif noté (sigma).

Ces valeurs sont appelées paramètres de dispersion.

Ils permettent d'évaluer les écarts des valeurs des caractères par rapport à la moyenne

Plus l'écart-type est grand plus la dispersion est grande.

Note: l'étendue est aussi un paramètre de dispersion. Quant à la moyenne, la médiane, le mode et les quartiles, ce sont des paramètres de tendance.

Distribution Distribution: Ensemble des valeurs, modalités ou classes d'une variable statistique, et des effectifs ou fréquences associées. La

(8)

distribution de probabilité est la distribution des valeurs (xi) de la variable aléatoire X et de leurs probabilités (pi).

Loi de probabilité: une loi de probabilité décrit le comportement aléatoire d'un

phénomène dépendant du hasard. Ex: Loi de Poisson.

Processus: Une loi de probabilité est une distribution définie par trois paramètres:

un processus aléatoire d'épreuve (la manière de s'y prendre, d'opérer les tirages, de solliciter le hasard),

les résultats incompatibles deux à deux, et

les probabilités correspondantes: pi = Prob(xi).

Cette page http://villemin.gerard.free.fr/Referenc/Vocabula/GlosS/Statisti.htm

Références

Documents relatifs

Pour cela, il a à sa disposition deux planches de longueur 2m et de largeur 1m qui constitueront les côtés latéraux de la maie et une troisième planche de mêmes dimensions

L’accès aux archives de la revue « Nouvelles annales de mathématiques » implique l’accord avec les conditions générales d’utilisation ( http://www.numdam.org/conditions )..

Par exemple, si l'on trouve un p = 0,04, cela signifie qu'il n'y a que 4 % de chances que la diff erence retrouv ee dans la comparaison n'existe pas dans la r ealit e, et soit li ee

Une nouvelle consultation du Domaine serait nécessaire si l’opération n’était pas réalisée dans le délai ci-dessus, ou si les règles d’urbanisme, notamment celles

Une nouvelle consultation du Domaine serait nécessaire si l’opération n’était pas réalisée dans le délai ci-dessus, ou si les règles d’urbanisme, notamment celles de

- au 1 er étage, un appartement de type 4 en duplex (Mezzanine) d’une superficie de 120m² parfaitement rénové et bénéficiant également d’aménagements de bonnes

Toute utilisation commerciale ou impression sys- tématique est constitutive d’une infraction pénale.. Toute copie ou impression de ce fi- chier doit contenir la présente mention

[r]