L’enseignement
des statistiques
Un Vendredi noir à la Bourse !
3760 3770 3780 3790 3800 3810 3820 3830 3840 3850 3860
L’indice des valeurs est en repli de 2%
3500 3550 3600 3650 3700 3750 3800 3850 3900
Un slogan publicitaire pour un jeu de hasard célèbre
Cent pour cent des
gagnants ont tenté leur
chance !
Pour manger, un salarié sur dix a recours aux associations !
Dans le journal Libération du 17-18 juin 2006 , un titre page 14 :
« Pour manger, un salarié sur dix a recours aux associations. »
Il y a environ 24 millions de salariés en France, donc 2,4 millions auraient recours aux
associations pour manger ?
Mais dans l’article, on lit que parmi les personnes faisant appel aux banques alimentaires, une sur dix est salariée. C’est bien différent !
« Aujourd’hui, il n’est pas exagéré de considérer la statistique en France
comme une discipline émergeant difficilement ».
(Rapport de l’Académie des Sciences,
juillet 2000).
Les problématiques conduisant à des questions de nature statistique sont variées. La prise en compte de l’aléatoire a gagné presque tous les domaines : le
contrôle de qualité en milieu industriel, la prévision des petits et des grands risques, l’élaboration de politiques de santé publique, les calculs financiers, etc…
Pour comprendre l’actualité, une formation à la
statistique est aujourd’hui indispensable ; c’est une formation qui développe les qualités d’analyse et de synthèse et exerce le regard critique.
« La statistique enseignée dans le secondaire voudrait être de la statistique descriptive, mais consiste le plus souvent en une fastidieuse
série d’exercices de calculs de moyenne,
d’écart – types et de tracés d’histogrammes – c’est à peu près aussi intéressant que de lire un annuaire du téléphone sans aucune raison de le faire ».
(Claudine Robert 1996)
?
Préféreriez vous travailler dans une entreprise où le salaire
moyen est de 1 500 € ou bien
dans une entreprise où le salaire
moyen est de 3 000 € ?
Est – il possible de faire de
la plongée dans un lac dont
la profondeur moyenne est
50 cm ?
Un domaine d’enseignement « jeune »
• Apparaît en 1965 en Première A, B et D et en 1970 en Première C.
• Apparaît en Seconde en 1981.
• Apparaît au Collège seulement en 1986.
• Une évolution en 1992: on demande de réaliser (au moins une fois) une étude statistique de A à Z.
• « Révolution » en 2000 : le programme de
Seconde demande de consacrer 1/8 du temps à l’enseignement des statistiques.
Des fonctions données à l’enseignement des statistiques dans les programmes
• Une fonction sociale
• Une fonction institutionnelle, qui présente deux composantes :
- une composante disciplinaire ;
- une composante interdisciplinaire.
• Une fonction de formation générale
Une distinction
• Les statistiques : ce sont des dénombrements de sujets, d’objets, d’évènements dans des
populations ou des sous – populations.
• La statistique : c’est un mode de pensée permettant de recueillir, de traiter et
d’interpréter les données qu’on rencontre dans divers domaines.
Enseigner les statistiques et les probabilités ?
Que ce soit dans le domaine des statistiques ou dans celui des probabilités, notre enseignement français accuse un certain retard sur d’autres pays, en
particulier sur les pays anglo-saxons. Différentes raisons peuvent expliquer ce retard :
• impression que ce ne sont pas de « vraies mathématiques »
• manque de formation des enseignants
• manque de temps
Le traitement statistique
• Les statistiques vont transformer les données brutes en les représentant de façon « classée » pour pouvoir en faire des
« résumés ».
• Ces « résumés » vont pouvoir donner des interprétations du phénomène empirique.
• Problème fondamental de la statistique: concilier le mieux possible deux pôles antagonistes : la « fidélité » et la « clarté »
Phénomène empirique : données brutes
Statistiques données traitées
Dans les programmes
Les programmes de l’école primaire
Cycle 2
Organisation et gestion des données
• Lire ou compléter un tableau dans des situations concrètes simples
• Utiliser un tableau, un graphique.
• Organiser les informations d’un énoncé
Cycle 3
Organisation et gestion des données
• Savoir organiser les données d’un problème en vue de sa résolution.
• Construire et utiliser un tableau ou un graphique en vue d’un traitement des données.
• Interpréter un tableau ou un graphique.
Sixième
Organisation et représentation des données
• Représentations usuelles : tableaux
• Représentations usuelles (lire, utiliser, interpréter):
- diagrammes en bâtons
- *diagrammes circulaires ou demi – circulaires - graphiques cartésiens
Tableau récapitulant l’évolution des tonnages et des chiffres d’affaire de la pêche dans le département des Côtes d’Armor de
1991 à 1998.
Etude des tonnages par catégorie
Des questions qui se posent …
• - Quel est le tonnage de poissons pêchés en 1998 ?
• - Quelle est la catégorie la plus pêchée en 1992, en 1998 ?
• - Quelles sont les différences les plus significatives entre les deux années ?
Quelles sont les différences les plus
significatives entre les deux années ?
Résumé de la pêche par catégorie en
1986
Evolution du tonnage de la pêche à
l’araignée entre 1991 et 1998
ou bien ….
Cinquième
Représentation et traitement des données
• Effectifs
*Fréquences
Classes (de même amplitude)
• Tableau de données, représentations
graphiques de données (diagrammes divers, histogrammes)
Attention aux histogrammes …
Quatrième
Traitement des données
• Moyennes pondérées
Créer, modifier une feuille de calcul, insérer une formule.
Créer un graphique à partir des données d’une feuille de calcul.
Troisième
Statistique
• Caractéristiques de position
• Approche de caractéristiques de dispersion : - médiane ;
- premier et troisième quartiles ; - étendue.
La
médiane et les
quartiles
… dans les
manuels
Définitions actuelles
• Médiane. La série des données est ordonnée par ordre croissant. Si la série est de taille impaire (2n+1), la
médiane est la valeur du terme de rang n+1. Si la série est de taille paire (2n), la médiane est la demi - somme des valeurs des termes de rang n et n+1.
• Quartiles. Le premier (respectivement le troisième) quartile est le plus petit élément Q1 (respectivement Q3) des valeurs des termes de la série ordonnée par ordre croissant, tel qu’au moins 25%(respectivement 75%) de ces valeurs soient inférieures ou égales à Q1 (respectivement Q3).
Seconde
Statistique descriptive, analyse de données
• Caractéristiques de position et de dispersion : - médiane, quartiles ;
- moyenne.
• Utiliser un logiciel (tableur) ou une calculatrice pour étudier une série statistique.
• Effectifs cumulés, fréquences cumulées.
• Représentations graphiques: nuage de points, courbe des fréquences cumulées.
Durée annuelle du travail en heures
0 500 1 000 1 500 2 000 2 500
Pays-Bas Allemagne France Italie Suède Royaume-Uni Espagne Japon États-Unis
1950 2007
Comparaison de deux séries à l’aide
d’un logiciel
Des écueils de cet enseignement
• Exercice du serveur Wims (Seconde)
• Soit la série statistique suivante:
Calculer pour cette série statistique:
- la moyenne;
- la valeur maximale;
- la valeur minimale;
- l’étendue statistique
Valeurs 6.5 7 8 2.5 10.5 2 1 0.5 9.5 4.5 3 4 6 0 10.5 9.5
Une série
d’exercices
issus d’un
manuel de
BTS d’il y a
quelques
années
Premières générales
L ES S
Diagrammes en boîtes Intervalle interquartile Variance, écart – type Données gaussiennes.
Plage de normalité pour un niveau de confiance
donné.
Tableaux croisés
Analyse d’un tableau de grand effectifs.
Construction et
interprétation des marges , du tableau des
pourcentages par ligne, par colonne …
Séries de données Séries chronologiques, indices …
Lissage par moyennes mobiles ;
Histogrammes à pas non constants ;
Diagrammes en boîte.
Effet de structure lors du calcul de moyennes.
Mesures de dispersion : intervalle interquartile ; écart – type.
Tableau à double entrée Etude fréquentielle ; lien entre arbre et tableau à double entrée ; notion de fréquence de A sachant B.
Variance et écart – type.
Diagramme en boîte , intervalle interquartile.
Influence sur l’écart – type et l’intervalle interquartile d’une transformation affine des données
Un diagramme en boîte
Premières technologiques
STG ST2S
Séries de données Histogrammes,
diagrammes en boîte, en secteurs ou en bâtons.
Tendance centrale : - moyenne
- médiane.
Dispersion :
- quartiles, déciles.
- Intervalle interquartile, intervalle interdécile.
- écart type.
Tableau croisé d’effectifs
Etude fréquentielle, notion de fréquence de A sachant B
Présentation des données
Histogrammes à pas non constants Tableau à double entrée
Indicateurs de centralité
- moyenne ; calcul à partir des moyennes des sous – populations.
- Médiane
Indicateurs de dispersion - quantiles, décile, intervalle
interquartile, intervalle interdécile - diagramme en boîte
- écart type
Terminales
ES STG ST2S STL
Nuage de points associé à une série statistique à deux
variables numériques.
Point moyen.
Ajustement affine par moindres carrés.
Etude de séries de données statistiques quantitatives à deux variables Nuage de
points, point moyen
Ajustement affine
Séries
chronologiques
Séries statistiques à deux variables
-qualitatives : tris croisés
étude fréquentielle, notion de fréquence de A sachant B.
-quantitatives :
tableaux d’effectifs, nuage de points associés, points moyens.
Exemples
d’ajustements.
Séries
statistiques à deux variables quantitatives : tableaux
d'effectifs, nuage de points
associés, point moyen.