L1 - M
ODULE2
OU3
S
TATISTIQUESD
ESCRIPTIVESJulie Scholler - Bureau B246
octobre 2020
I. Introduction générale
Définition
La statistique
• ensemble de méthodes permettant d’analyser/traiter les données issues d’un ensemble d’observations
• utilise les mathématiques et l’informatique
I. Introduction générale
Historique
Trois phases
• De l’antiquité à la fin du 19e siècle
• technique de comptage d’une population
• rudimentaire
• De la fin du 19e siècle aux années 1960
• émergence de la statistique mathématique
• école anglo-saxonne liée aux développements de probabilités et des mathématiques
• À partir des années 1960
• développement puis banalisation des outils informatiques
• facilitation de la production de graphiques
• statistique multidimensionnelle, machine learning, IA
I. Introduction générale
Deux grandes sous-parties en statistique
Statistique descriptive (L1-S1) Description des données étudiées
• présentation commode et synthétique
• représentations graphiques
• résumés numériques
Absence d’hypothèse probabiliste sur les données
Statistique inférentielle (L2 et L3)
Induction de propriétés à la population entière à partir d’observations sur une sous-partie
• estimations et tests d’hypothèse
• modèles prédictifs Fondée sur les probabilités
II. Vocabulaire
Population
• ensemble concerné par une étude statistique
Individu
• tout élément de la population étudiée
Échantillon
• sous-ensemble de la population toute entière
Taille de la population
• nombre d’individus dans la population
• souvent notée n
II. Vocabulaire
Variable
• caractéristique définie sur la population et observée sur la population ou un échantillon
• il existe différents types de variables
Modalités d’une variable
• valeurs que peut prendre la variable
II. Vocabulaire
Variable quantitative
• variable dont les modalités sont numériques
• quantitative discrète : les modalités éventuelles sont finies
• quantitative continue : les modalités éventuelles ne sont pas finies ou très nombreuses
Variable qualitative
• variable dont les modalités ne sont pas numériques
• qualitative ordinale : si les modalités sont ordonnées
• qualitative nominale : si les modalités ne peuvent pas être ordonnées
II. Vocabulaire
Données
• ensemble des individus observés
• ensemble des variables considérées
• les valeurs de ces variables pour ces individus
Tableau de données
• en ligne : les individus
• en colonne : les variables
• à l’intérieur : les valeurs des variables pour les individus
III. Les données
Réponses à un QCM de culture générale
Lors de l’année scolaire 2018-2019, quatre étudiants de L3 Économie à Tours (Jérémy Cardoso, Laura Candoni, Hugo Grémy et Jean Clark) ont testé la culture générale de leurs camarades de Licence.
QCM
• 60 questions de culture générale
• 6 thèmes : histoire, géographie, littérature,
mathématiques/physique, économie et sports/loisirs
• 10 questions du culture générale par thèmes
• pour chaque thème
• 3 questions faciles
• 4 questions moyennes
• 3 questions difficiles
• estimation du nombre de bonnes réponses
• lien vers le QCM
III. Les données
Réponses à un QCM de culture générale
Population étudiants de Licence d’économie à Tours en 2018/2019 ayant répondu au questionnaire Individus un étudiant de Licence d’économie à Tours en
2018/2019 ayant répondu au questionnaire
Variables réponses au questionnaire, année de licence, série du bac, sexe, nombre estimé de bonnes réponses, notes, etc.
Taille de la population 129 Nombre de variables 84
III. Les données
Données brutes - extrait
annee bac sexe note_totalesur_estimationeco_n_justeeco_note hist1 geo1 eco1 L1 Bac ES F 10.50 -10 9 17 Le griffon Cuba Taxe
L1 Bac S F 7.50 7 5 10 Le sphinx Cuba Taux
L1 Bac ES H 6.33 -2 5 10 Le griffon Cuba Taxe
L1 Bac ES F 8.17 -10 8 16 Le griffon Panama Taxe
L1 Bac ES F 8.00 -1 5 9 Le sphinx Cuba Taxe
L2 Bac ES H 13.50 -1 7 14 Le sphinx Cuba Taxe
L1 Bac S F 9.83 1 6 12 Le griffon Cuba Taxe
L2 Bac S H 11.67 -4 9 19 Le sphinx Cuba Taxe
L2 Bac S H 12.17 -4 8 15 Le griffon Cuba Taxe
L3 Bac S H 12.50 -2 9 18 Le sphinx Cuba Taxe
L1 Bac S F 9.00 8 8 16 Le griffon Cuba Taxe
L3 Bac ES H 10.33 -21 9 18 Le griffon Cuba Taxe L3 Bac ES H 10.83 -5 8 17 Le sphinx Panama Taxe
L3 Bac S H 13.00 -11 9 17 Le griffon Cuba Taxe
L1 Bac S H 14.83 -3 9 17 Le griffon Cuba Taxe
III. Les données
Description des variables
Variable Type Exemples
annee quali. ord. L1, L2, L3
bac quali. nom. Bac ES, Bac S, Bac STMG, Bac professionnel
sexe quali. nom. F, M
note_totale quantitative 10.5, 7.5, 6.33, 8.17, 8,. . . sur_estimation quantitative -10, 7, -2, -10, -1, 1, -4, -2,. . . eco_n_juste quantitative 9, 5, 5, 8, 5, 7, 6, 9, 8, 9,. . .
***_n_juste quantitative 5, 3, 4, 4, 4, 8, 5, 3, 6, 7,. . .
eco_note quantitative 17, 10, 10, 16, 9, 14, 12, 19, 15, 18,. . .
***_note quantitative 9, 6, 8, 8, 8, 18, 8, 7, 11, 13, . . . eco1 (2, . . . ,10) quali. nom. ex : Tarif, Taux, Taxe, Taxification
***1 (2, . . . ,10) Réponses à la question
econ quantitative 4, 6, 5, 4, 5, 6, 8, 7, 7, 8,. . .
***n quantitative 6, 5, 4, 4, 5, 10, 6, 5, 8, 7, . . . avec *** parmi eco, geo, hist, sport, mat, litt
IV. Déroulement du cours
Objectifs de l’enseignement
• Savoir réaliser et comprendre les tableaux d’effectifs, de fréquences, de contingence, les graphiques courants et les données synthétiques utilisés pour résumer des données
• Développer l’esprit critique vis-à-vis des données numériques
Contenu de l’enseignement
• Statistiques descriptives unidimensionnelles
tableaux synthétiques, graphiques, indicateurs de tendance centrale, de dispersion, courbe de concentration, indice de Gini
• Statistiques descriptives bidimensionnelles
tableaux de contingence, liens entre variables, variances expliquées et résiduelles, régression linéaire simple
IV. Déroulement du cours
Organisation
Pour tous : 6 séances de cours magistraux de 2h + Examen terminal
Pour les L1 Économie : 4 séances de travaux dirigés de 2h
Supports pédagogiques sur Celene
• polycopié de cours
• fascicule d’exercices et corrections
• annales (attention le programme a changé depuis 2018/2019)
• QCM d’entraînement en ligne
Le polycopié et le fascicule d’exercices sont aussi disponibles sur ma page personnelle juliescholler.gitlab.io