Par Paul CHEGE
African Virtual university Université Virtuelle Africaine Universidade Virtual Africana
et statistiques
Note
Ce document est publié sous une licence Creative Commons.
http://en.wikipedia.org/wiki/Creative_Commons Attribution
http://creativecommons.org/licenses/by/2.5/
License (abréviation « cc-by »), Version 2.5.
I. Probabilités et statistiques ___________________________________ 3 II. Prérequis / connaissances préalables nécessaires _________________ 3 III. Volume horaire/temps _______________________________________ 3 IV. Matériels didactiques _______________________________________ 3 V. Justification/Importance du module ____________________________ 3 VI. Contenu__________________________________________________ 5 6.1 Résumé _______________________________________________ 5 6.2 Contour/grandes lignes ___________________________________ 6 6.3 Représentation graphique _________________________________ 7 VII. Objectif général ____________________________________________ 8 VIII. Objectifs spécifiques aux activités d’apprentissage _________________ 8 IX. Activités d’enseignement et d’apprentissage ______________________ 10 X. Concepts-clés (glossaire) ____________________________________ 13 XI. Lectures obligatoires ________________________________________ 20 XII. Ressources obligatoires _____________________________________ 22 XIII. Liens utiles _______________________________________________ 23 XIV. Activités d’apprentissage ____________________________________ 25 XV. Synthèse du module _______________________________________ 119 XVI. Évaluation sommative ______________________________________ 120 XVII. Références bibliographiques _________________________________ 128 XVIII.Fiche d’évaluation _________________________________________ 129 XIX. Auteur du module _________________________________________ 129 XX. Structure _______________________________________________ 130
Table des maTières
i. Probabilités et statistiques
Par Paul Chege
ii. Prérequis/ connaissances préalables nécessaires
Cours de statistiques et probabilités au secondaire.
iii. Volume horaire/temps
La durée de ce module est de 120 heures.
iV. matériels didactiques
Les étudiants devraient avoir accès aux lectures mentionnées plus loin. De plus, ils auront besoin d’un ordinateur pour avoir accès à ces lectures. Par ailleurs, les étu- diants devraient pouvoir installer le logiciel wxMaxima et l’utiliser pour pratiquer des concepts algébriques. Ils doivent également avoir accès au logiciel du microsoft office Excel qui traite les lois de probabilités usuelles, les tests statistiques, et analyses statistiques descriptives et inférentielles classiques.
V. Justification/importance du module
Les probabilités et les statistiques, en plus d’être un élément clé dans l’ensei-
gnement au secondaire, fournissent un bagage important pour les mathéma-
tiques avancées au niveau tertiaire. Les statistiques font partie de la base des
mathématiques appliquées dans la plupart des sujets académiques et sont très
utiles pour l’analyse dans des industries de production. Les spécialistes de
statistiques appelés statisticiens analyseront des données brutes cueillies dans
le domaine pour fournir un aperçu sur le comportement de la population. Les
statistiques fournissent aux gouvernements et aux organisations un résumé
concret d’une situation qui aidera les dirigeants à prendre une décision. Par
exemple, le taux de propagation des maladies, des rumeurs, des incendies de
forêt, la modélisation de la pluviométrie et les évolutions de population ou le
mouvement démographique.
D’autre part, l’étude des probabilités aidera à la prise de décision des agents gouvernementaux et des organisations basées sur la théorie de la chance. Par exemple : prédire les sexes nouveau-nés sur une certaine période et projeter le niveau de la quantité des pluies sur des régions, eu égard aux données histori- ques sur le sujet. Les probabilités sont aussi utilisées dans le choix du niveau de qualité de certains produits dans la production industrielle, (comme) par exemple, le nombre de pièces défectueuses prévues dans le processus manu- facturier d’une industrie.
Enfin, à un niveau plus avancé, en cette ère de la nouvelle technologie de l’information, grâce à la puissance accrue des ordinateurs et à la performance des algorithmes pour traiter de gros volumes des données, l’étude statistique des tickets de caisse permet de mieux optimiser la liquidation des articles dans une grande surface en tenant compte des associations des produits vendus.
Cela relève du domaine communément appelé la fouille des données ou le data mining qui traite différents types des données, données qualitatives et / ou quantitatives, et qui comprend plusieurs méthodes telles l’analyse des règles d’association, les analyses factorielles de composantes principales, de correspondances, etc.
Dans ce module de cours, on se limitera essentiellement à l’étude des données
quantitatives. Le logiciel Excel du microsoft office fait partie d’outils didac-
tiques à travers son module Outils/Utilitaires d’Analyses.
Vi. Contenu
6.1 Résumé
Ce module est divisé en trois unités :
Unité 1 : Les statistiques illustrées (qualificatives**) et la distribution de proba- bilités
Les statistiques illustrées dans l’unité 1 sont développées, soit par extension aux mathématiques au niveau secondaire, soit comme une introduction pour ceux qui apprennent les statistiques pour la première fois. Cette unité introduit la mesure de la dispersion dans les statistiques. Elle introduira aussi les concepts de probabilités et le traitement théorique des probabilités.
Unité 2 : Les variables aléatoires et la distribution
Cette unité requiert l’unité 1 en prérequis. Elle parle du moment et des fonctions produisant le moment, les inégalités de Markov et Chebychev, les distributions spéciales à une variable, les distributions des probabilités à deux variables et l’ana- lyse des probabilités conditionnelles. Cette unité donne un aperçu sur l’analyse des coefficients de corrélation linéaires et la distribution des fonctions de variables aléa- toires, comme, par exemple, le khi carré, T et F. Utilisation de Excel sous Outils/
Utilitaires d’analyse.
Unité 3 : La théorie des probabilités
Cette unité a été conçue à partir de l’unité 2. Elle analyse la probabilité en utilisant un indicateur de fonctions. Elle introduit les vecteurs aléatoires inégaux de Bonfe- roni, les fonctions de production, les fonctions caractéristiques et les échantillons aléatoires de statistiques indépendantes. Cette unité montre en détail les concepts de fonctions de plusieurs variables et l’indépendance de X et de S2 dans des échantillons gaussiens de statistiques d’ordre. Cette unité résume le traitement de divers modes de convergence et des théorèmes limites.
6.2 Contour/grandes lignes
Unité 1 (40 heures) : Les statistiques illustrées et la distribution de probabilités
Niveau 1. Priorité A. Sans prérequis.
La fréquence des distributions relatives et cumulatives, les courbes à fréquence variables, les moyennes, le mode et la médiane. Les quartiles et les percentiles, les écarts-types, les distributions symétriques et asymétriques. La probabilité; les échantillonnages et les événements; la définition des probabilités; les propriétés des probabilités; les variables aléatoires; la probabilité des distributions; Bernouli, lois binômiales, lois de Poisson, lois géométriques, lois hypergéométriques, lois uniformes, lois exponentielles et lois normales. Des distributions à deux variables. Les tables des lois de probabilité jointes et les lois de probabilité marginales.
Unité 2 (40 heures) : Les variables aléatoires et la distribution
Niveau 2. Priorité B. Prérequis : Statistiques 1.
Moments et fonction génératrice de moments. Les inégalités de Markov et Cheby- chev, des distributions univariées spéciales. La probabilité de distributions à deux variables; les distributions marginales et conditionnelles communes; l’indépendance;
l’anticipation de la régression et de la corrélation à deux variables; l’analyse de la régression et du coefficient de corrélation pour des données à deux variables. La distribution de variables aléatoires, la distribution normale à deux variables. Les distributions dérivées comme le khi carré, T. et F.
Unité 3. (40 heures) : La théorie des probabilités Niveau 3. Priorité C. Prérequis : Statistiques 2.
Probabilités : Utilisation des fonctions indicatrices. Les inégalités de Bonferoni et les vecteurs aléatoires. Les fonctions génératrices. Les fonctions caractéristi- ques. L’indépendance des statistiques et échantillons aléatoires. La distribution multinomiale. Les fonctions de plusieurs variables aléatoires.
L’indépendance de
€
X et de S
2dans des échantillons normaux. Statistique d’or- dre. Lois normales multidimensionnelles. Convergence et théorèmes limites.
Exercices pratiques.
6.3 Représentation graphique de l’organisation
Les inégalités de Markov et de
Chebychev
Les distributions dérivées, le khi
deux, t et F.
Les lois à une variable et à deux variables
DONNÉES
Les
tableaux de probabilités usuelles La
moyenne, le mode et la médiane
Les courbes à fréquence variable, les quartiles et les percentiles
Les fonctions génératrices et caractéristiques et les échantillons aléatoires
Les indicateur s de fonctions
La probabilité des
distributions
Le moment et fonction génératrice des moments
Les inégalités de Bonferoni, les vecteurs aléatoires
Loi multinomiale, les fonctions de variables aléatoires
Variance et écart type
Les probabilités
La régression et la
corrélation
Les lois marginales et conditionnelles usuelles
Les lois
multidimensionnelles , la convergence et théorèmes limites
Vii. Objectif général
À la fin de ce module, l’étudiant devrait être en mesure de calculer les diffé- rentes mesures de dispersions dans les statistiques et d’effectuer des probabi- lités basées sur les lois de la probabilité, de faire des tests sur des données en utilisant les théories de la probabilité.
Viii. Objectifs spécifiques aux activités d’apprentissage
Unité 1 : Les statistiques illustrées et la distribution de probabilités (40 heures) À la fin de l’unité 1, l’étudiant devrait être en mesure de :
• Dessiner diverses courbes de fréquences
• Trouver la moyenne, le mode, la médiane, les quartiles, les percentiles et les écarts-types de données regroupées
• Définir et énoncer les propriétés des probabilités
• Illustrer des variables aléatoires, des probabilités de distributions, et les valeurs attendues de variables aléatoires
• Illustrer les distributions de Bernoulli, les lois binomiales, lois de Poisson, lois géométriques, hypergéométriques, uniformes, exponentielles et normales
• Faire des enquêtes sur les fréquences de distribution à deux variables
• Construire des tableaux de probabilités communes et marginales Unité 2 : Les variables aléatoires et la distribution (40 heures)
À la fin de l’unité 2, l’étudiant devrait être en mesure de :
• Illustrer le moment et le moment générant des fonctions
• Analyser les inégalités de Markov et de Chebychev
• Examiner les distributions spéciales à une variable, les probabilités de dis- tributions à deux variables, les distributions marginales communes et condi- tionnelles
• Montrer l’indépendance, l’anticipation à deux variables, la régression et la corrélation
• Analyser la régression et la corrélation du coefficient pour des données à deux variables
• Montrer les fonctions de distribution de variables aléatoires
• Examiner les distributions normales à deux variables
• Illustrer les distributions dérivées comme le khi carré, T et F.
Unité 3 : La théorie des probabilités (40 heures)
À la fin de l’unité 3, l’étudiant devrait être en mesure de :
• Utiliser des indicateurs de fonctions dans les probabilités
• Montrer les inégalités de vecteurs aléatoires de Bonferoni
• Illustrer les fonctions génératrices et caractéristiques
• Examiner l’indépendance d’échantillons aléatoires de statistiques et les dis- tributions multinomiales
• Évaluer les fonctions de plusieurs variables aléatoires
• Illustrer l’indépendance de X et de S2 dans des échantillons normaux de statistiques
• Montrer les distributions normales multidimensionnelles
• Illustrer la convergence et les théorèmes limites
• Faire des exercices pratiques
iX. activités d’enseignement et d’apprentissage
9.1 Évaluation préliminaire/initiale
Les mathématiques de base constituent un prérequis pour les probabilités et les statistiques.
Questions
1. Lorsqu’un dé est lancé, la probabilité d’avoir un nombre supérieur à 4 est de : a. 1/6
b. 1/3 c. 1/2 d. 1
2. Une seule carte est tirée au hasard d’un paquet de cartes. Trouvez la probabilité de tirer une reine.
a. 1/13 b. 1/52 c. 4/13 d. 1/2
3. Sur 100 nombres, il y avait vingt 4, quarante 5, trente 6 et le restant étaient des 7. Trouvez la moyenne arithmétique des nombres.
a. 0.22 b. 0.53 c. 2.20 d. 5.30
4. Calculez la moyenne des données suivantes :
Grandeur (cm) Indice de classement (x)
60-62 61
63-65 64
66-68 67
69-71 70
72-74 73
a. 57.40 b. 62.00 c. 67.45 d. 72.25
5. Trouvez le mode des données suivantes : 5, 3, 6, 5, 4, 5, 2, 8, 6, 5, 4, 8, 3, 4, 5, 4, 8, 2, 5 et 4é
a. 4 b. 5 c. 6 d. 8
6. L’étendue des valeurs qu’une probabilité peut présumer est : a. De 0 à 1
b. De -1 à +1 c. De 1 à 100 d. De 0 à ½
7. Trouvez la médiane des données suivantes : 8, 7, 11, 5, 6, 4, 3, 12, 10, 8, 2, 5, 1, 6, 4.
a. 12 b. 5 c. 8 d. 6
8. Trouvez l’étendue de ces chiffres : 7, 4, 10, 9, 15, 12, 7, 9.
a. 9 b. 11 c. 7 d. 8.88
9. Lorsque deux pièces de monnaie sont lancées, l’espace d’échantillon est : a. P, F et PF
b. PP, PF, FP, FF c. PP, PF, FF d. P, F
10. Si une lettre est sélectionnée au hasard dans le mot « Mississippi », trouvez la probabilité que ce soit un « i ».
a. 1/8 b. 1/2 c. 3/11 d. 4/11
Corrigé 1. B 2. A 3. D 4. C 5. B 6. A 7. D 8. B 9. B 10. D
Commentaires pédagogiques pour les étudiants
Cette évaluation préliminaire a été conçue pour donner un aperçu aux étudiants sur ce qu’ils peuvent se rappeler en probabilités et en statistiques. Une note inférieure à 50 % dans cette évaluation préliminaire indique que l’élève doit réviser les proba- bilités et les statistiques vues en mathématiques du niveau secondaire. L’évaluation préliminaire couvre les concepts de base que les étudiants doivent connaître avant de continuer dans ce module. Si vous avez eu des problèmes avec cette évaluation, vous devriez réviser les probabilités et statistiques vues en mathématiques du secondaire, et vous devriez maîtriser les bases.
X. Concepts-clés (glossaire)
Absolument exclusifs / incompatibles : Deux événements sont mutuellement exclusifs s’ils ne peuvent pas intervenir en même temps.
La variance d’un ensemble de données est définie comme le carré de l’écart -type. Ex. : variance
= s2.Essai : Ce terme se rapporte à une activité qui applique une expérience, comme, par exemple, prendre une carte dans un paquet de 52 cartes ou lancer un ou plusieurs dés.
Espace d’échantillon ou univers des possibles: Ce terme désigne toutes les possibilités d’une expérience de probabilités. On l’appelle l’événement certain ou l’événement sûr attaché à l’expérience considérée. Ex. : En laçant une pièce de monnaie, le résultat sera soit pile (P) ou face (F).
Variable aléatoire : C’est une fonction qui assigne un nombre réel à tous les résultats possibles d’une expérience aléatoire.
Échantillon aléatoire : Il est choisi par une méthode qui fait intervenir un élément imprévisible.
Distribution de Bernoulli : C’est une probabilité discrète qui prend la valeur 1 avec la probabilité du succès p, et la valeur 0 avec la probabilité d’échec q = 1 – p.
Distribution binomiale : C’est une distribution de probabilités discrètes qui exprime la probabilité d’un nombre de succès dans une séquence de n essais indépendants d’expériences de Bernoulli, c’est-à-dire à deux issues exclusives oui / non, selon laquelle chaque essai produit un succès avec la probabilité p.
Distribution hypergéométrique : C’est une distribution de probabilités dis- crètes qui décrit le nombre de succès dans une séquence n tirée à partir d’une population finie sans remplacement.
Distribution de Poisson : C’est une distribution de probabilités discrètes qui exprime la probabilité qu’un nombre d’évènements qui se produisent dans une période de temps prédéterminée, si ces évènements se produisent avec un taux moyen connu, et ils sont indépendants du temps depuis le dernier évènement.
C’est une loi des événements rares.
Corrélation : C’est une mesure d’association entre deux variables.
Régression : C’est la relation fonctionnelle explicite qui existe entre une
variable dépendante et une variable indépendante.
Khi carré : C’est n’importe quel test d’hypothèse statistique dans lequel le test de statistiques a une distribution khi carré lorsque l’hypothèse nulle est vrai, ou lorsque la distribution de probabilités du test de statistique (en prenant pour acquis que l’hypothèse soitvraie) peut être faite pour estimer une distribution khi carré au près que voulu en faisant un espace d’échantillon assez grand.
Distribution normale à plusieurs variables : C’est une distribution de pro- babilités spécifique qui peut faire penser à la généralisation de plus grandes dimensions que la distribution normale unidimensionnelle.
Test T : C’est n’importe quelle hypothèse de statistique pour deux groupes dans lequel le test de statistiques a une distribution d’un élève t lorsque l’hy- pothèse nulle est vraie.
Termes de statistiques
1. Donnée brute : C’est une donnée qui n’a pas été classée numériquement.
2. Série statistique : C’est un arrangement de données brutes et de données numé- riques dans un ordre ascendant de magnitude.
3. Étendue : C’est la différence entre le plus gros et le plus petit nombre dans des données.
4. Intervalle de classe : Dans une étendue de données regroupées. Ex. : 21-30, 31-40, etc.), alors 21-30 sera l’intervalle de classe.
5. Limites de classe : Dans l’intervalle de classe de 21-30, 21 et 30 sont appelés les limites de classe.
6. Limites inférieures de classe (l.i.c.) : Dans l’intervalle de classe 21-30, la limite inférieure de classe est 21.
7. Limites supérieures de classe (l.s.c.) : Dans l’intervalle de classe 21-30, la limite supérieure de classe est 30.
8. Limites inférieures et supérieures de classe : Dans l’intervalle de classe inférieure 21-30, la limite de classe est 20.5 et la limite de classe supérieure est 30.5. Ces limites prennent pour acquis que les mesures théoriques d’un intervalle de classe de 21-30 incluent tous les nombres de 20.5 à 30.5.
9. Intervalle de classe : Dans une classe de 21-30, l’intervalle de classe est la différence entre la limite supérieure de classe et la limite inférieure de classe. Ex. : 30.5-20.5 = 10. L’intervalle de classe est aussi connu en tant que l’amplitude de classe.
10. Centre de classe ou point milieu : Dans un intervalle de classe de 21-30, le point médian est la moyenne de 21 et 30. Ex. :
25.52 30
21+ =
11. Distribution statistique : C’est plusieurs données brutes classées dans des classes dans un tableau avec leurs fréquences correspondantes. Ex. :
Masse (kg) 10-19 20-29 30-39 40-49
Nombre d’élèves (f) 5 7 10 6
Ce tableau est appelé une fréquence de distributions ou un tableau de statistiques.
12. Fréquences cumulées : Pour les fréquences de distributions suivantes, les fré- quences cumulées sont calculées comme des aditions de fréquences individuelles.
Masse (X) 20-24 25-29 30-34 35-39 40-44
Fréquence (f) 4 10 16 8 2
Fréquence cu-
mulée 4 4+10=14 14=16=30 30+8=38 38+2=40
La fréquence cumulée d’une valeur est sa fréquence plus la fréquence de toutes les valeurs inférieures.
Le tableau ci-dessus est appelé un tableau de fréquences cumulées.
13. Distribution de fréquences relatives : Dans une fréquence de distributions
Masse (X) 20-35 25-29 30-34 35-39 40-44
Fréquence (f) 4 10 16 8 2
Σ
f = 40La fréquence relative d’une classe de 25-29 est la fréquence de la classe divisée par la fréquence totale de toutes les classes (fréquence cumulée) et est généralement exprimée en pourcentage.
Exemple :
La fréquence relative de la classe 25-29 =
× 100 %
∑ f
f
à= 40×100
10 25%
Note : la somme des fréquences relatives est 100 % ou 1.
14. Courbe des fréquences cumulées (Ogive) :
Masse (X) 20-24 25-29 30-34 35-39 40-44
Fréquence (f) 4 10 16 8 2
Fréquence cu-
mulée (F.C) 4 4+10=14 14=16=30 30+8=38 38+2=40
À partir du tableau de fréquences cumulées ci-dessus, nous pouvons dessiner un gra- phique de fréquences cumulées par opposition aux limites de classes supérieures.
Limites de classes
supérieures 24.5 29.5 34.5 39.5 44.5
Fréquences cu-
mulées 3 14 30 38 40
Note : À partir des données de fréquences cumulées, le premier point de res-
titution est (24.5, 3). Si nous avions commencé notre graphique à ce point, il
serait suspendu sur l’axe des y. Nous créons un autre point (19.5, 0) en tant
que point de départ. 19.5 est la limite de classe supérieure prévue de la classe
précédente.
Formes des courbes de fréquences
Symétrique ou en forme de cloche
3 Symmetrical or bell-shaped. Skewed to the right ( positive skewness)
Skewed to the left ( Negative skewness) J –Shaped Has equal frequency to the left and right
of the central maximum e.g. normal curve Has the maximum towards the left and the longer tail to the right
Has the maximum towards the right of
the and the longer tail to the left Has the maximum occurring at the right end
A une fréquence égale à gauche et à droite du centre maximum. Ex. : courbe normale.
Asymétrique à droite (asymétrie positive)
3 Symmetrical or bell-shaped. Skewed to the right ( positive skewness)
Skewed to the left ( Negative skewness) J –Shaped Has equal frequency to the left and right
of the central maximum e.g. normal curve Has the maximum towards the left and the longer tail to the right
Has the maximum towards the right of
the and the longer tail to the left Has the maximum occurring at the right end
Elle a le maximum vers la gauche et une queue plus longue vers la droite.
Asymétrique à gauche (asymétrie négative)
3 Symmetrical or bell-shaped. Skewed to the right ( positive skewness)
Skewed to the left ( Negative skewness) J –Shaped Has equal frequency to the left and right
of the central maximum e.g. normal curve Has the maximum towards the left and the longer tail to the right
Has the maximum towards the right of
the and the longer tail to the left Has the maximum occurring at the right end
Elle a le maximum vers la droite et une queue plus longue vers la gauche.
Université Virtuelle Africaine
En forme de J
3 Skewed to the left ( Negative skewness) J –Shaped
Has equal frequency to the left and right
of the central maximum e.g. normal curve Has the maximum towards the left and the longer tail to the right
Has the maximum towards the right of
the and the longer tail to the left Has the maximum occurring at the right end
Elle a le maximum qui se produit du côté droit.
En forme de J inversé
4 Reverse J-Shaped U- shaped
Bimodal Multimodal
Has the maximum occurring at the left
end Has maxima at both ends
Has two maxima Has more than two maxima.
Elle a le maximum qui se produit du côté gauche.
En forme de U
4 Reverse J-Shaped U- shaped
Bimodal Multimodal
Has the maximum occurring at the left
end Has maxima at both ends
Has two maxima Has more than two maxima.
Elle a les maximums des deux côtés.
Université Virtuelle Africaine
Bimodal
4
Bimodal Multimodal
Has the maximum occurring at the left
end Has maxima at both ends
Has two maxima Has more than two maxima.
Elle a deux maximums.
Multimodal
4 Reverse J-Shaped U- shaped
Bimodal Multimodal
Has the maximum occurring at the left
end Has maxima at both ends
Has two maxima
Elle a plus de deux maximums.Has more than two maxima.
Xi. lectures obligatoires
Lecture #1 : Wolfram MathWorld (visité le 05/06/07)
Référence complète : http://mathworld.wolfram.com/Probability
Résumé : Cette référence donne du matériel essentiel en probabilités et statisti- ques. Elle comporte plusieurs illustrations qui permettent à l’élève d’apprendre par lui-même à partir de différentes approches méthodologiques. Wolfram MathWorld est une encyclopédie en ligne spécialisée en mathématiques.
Motif : Il donne des références détaillées sur tous les sujets de mathématiques.
Les élèves devraient commencer en utilisant la faculté de recherche pour le module titre. En tout temps, l’étudiant devrait chercher pour des mots clés qu’ils doivent comprendre. L’entrée devrait être étudiée consciencieusement.
Lecture #2 : Wikipédia (visité le 05/06/07)
Référence complète : http://en.wikipedia.org/wiki/statistics
Résumé : Wikipédia est un dictionnaire en ligne. Il est écrit par ses propres lecteurs. Il est mis à jour très souvent puisque les entrées sont révisées constam- ment. De plus, il a été prouvé pour être très précis. Les entrées mathématiques sont très détaillées.
Motif : Il donne des définitions, des explications et des exemples que les élèves ne peuvent pas avoir accès dans d’autres ressources. Le fait que Wikipedia est souvent mis à jour donne à l’étudiant les approches les plus récentes, les arguments abstraits, des illustrations et se réfères à d’autres sources pour permettre à l’élève d’acquérir d’autres approches dans les probabilités et les statistiques.
Lecture #3: MacTutor history of mathematics (visité le 05/03/07)
Référence complète: http://www-history.mcs.standrews.ac.uk/Indexes Résumé : Le MacTutor Archive est l’histoire des mathématiques la plus compréhensive disponible sur internet. Les ressources sont organisées par personnages et par thèmes historiques.
Motif : Les étudiants devraient pouvoir chercher sur MacTutor pour des mots
clés dans les sujets qu’ils étudient (ou le module lui-même). Il est important
d’avoir une vue d’ensemble d’où les mathématiques qui sont étudiées vont dans
l’histoire des mathématiques. Lorsque l’étudiant termine un cours et enseigne
les mathématiques au secondaire, les personnages historiques des mathémati- ques donneront un peu plus de vie à la matière pour les étudiants. De plus, le rôle de la femme dans l’histoire des mathématiques devrait être étudié pour aider les étudiants à comprendre les difficultés auxquelles les femmes ont dû faire face tout en y apportant une importante contribution. Également, le rôle du continent africain devrait être étudié pour partager avec les étudiants dans les écoles : notamment les premiers outils de calcul (comme l’os d’Ishango) ainsi que le rôle des mathématiques égyptiennes.
Xii. ressources obligatoires
Ressource #1 : Maxima.
Référence complète : Une copie de Maxima est disponible sur le disque qui accompagne ce cours.
Résumé : La distance à laquelle les élèves sont occasionnellement confrontés à des mathématiques plus difficiles sans ressources pour les aider. L’absence de leçons avec un professeur en chair et en os rend parfois l’élève complète- ment handicapé s’il n’est pas bien équipé avec des ressources pour résoudre leurs problèmes mathématiques. Ce handicap peut être résolu en utilisant une ressource d’accompagnement : Maxima.
Motif : Maxima est un logiciel gratuit qui peut aider les élèves à résoudre des équations linéaires et quadratiques, des équations simultanées, des intégrations et des différentiels et qui peut aider à faire des manipulations algébriques : des factorisations, des simplifications, des expansions, etc. Ce logiciel est obligatoire pour les étudiants suivant des cours à distance puisqu’il les aide à apprendre plus vite en utilisant les aptitudes TIC déjà apprises.
Ressource #2 : Graph
Référence complète : Une copie de Graph est disponible sur le disque qui accompagne ce cours.
Résumé : Il est difficile de dessiner des graphiques de fonctions, spécialement avec des fonctions compliquées et plus particulièrement des fonctions en trois dimensions. Les élèves, qui apprennent à distance, vont tomber un jour ou l’autre sur des situations où ils auront besoin de faire des graphiques mathé- matiques. Ce cours est accompagné d’un logiciel appelé Graph qui aidera les élèves à faire des graphiques. Cependant, ils auront besoin de se familiariser avec le logiciel pour être en mesure de l’utiliser.
Motif :Graph est un logiciel gratuit pour créer des graphiques auquel les élèves
pourront avoir accès sur le CD fournit. Il est facile à utiliser lorsqu’un étudiant
investit du temps pour apprendre comment il fonctionne. Les élèves devraient
tirer avantage du logiciel parce qu’il peut les assister pour faire des graphiques
dans d’autres sujets pendant et après le cours. Ils le trouveront extrêmement
utile pour enseigner les mathématiques au niveau secondaire.
Xiii. liens utiles
Lien #1
Titre : Wikipédia
URL : http://en.wikipedia.org/wiki/Statistics
Description: Wikipédia est le dictionnaire de n’importe quel mathématicien.
Il est gratuit est mis à jour régulièrement. La plupart des élèves rencontreront des problèmes de matériel de référence de temps en temps. La plupart des livres disponibles ne couvrent que les probabilités et les statistiques. Cette pénurie de matériel de référence peut être vaincue en utilisant Wikipédia. Il est très facile à accéder avec « recherche Google ».
Motif : La disponibilité de Wikipédia résout les problèmes de matériel d’ap- prentissage dans toutes les branches des mathématiques. Les élèves devraient avoir de l’expérience avec Wikipédia pour les aider dans leur apprentissage.
C’est une ressource gratuite très utile qui ne fait pas que résoudre les problèmes des élèves, mais qui les dirige aussi vers d’autres sites internet connexes très utiles d’un simple clic sur les icônes.
Lien #2
Titre : Mathsguru
URL : http://en.wikipedia.org/wiki/Probability
Description: Mathsguru est un site internet qui aide l’élève à comprendre plusieurs branches du module de théorie des nombres. Il est facile à accéder à travers la barre de recherche Google et fournit de l’information très détaillés sur plusieurs questions de probabilités. Il offre des explications et des exemples pour que les élèves apprennent plus facilement.
Motif : Mathsguru donne plusieurs façons d’accéder à d’autres sujets connexes,
à des indices et des solutions qui peuvent être très pratiques pour les élèves
qui souffrent des frustrations pour trouver des livres pertinents qui peuvent
aider à résoudre des problèmes dans les probabilités. Il donne une approche
utile dans le calcul des probabilités eu égard aux diverses branches du module
de probabilités.
Lien #3
Titre : Mathworld Wolfram
URL :http://mathworld.wolfram.com/Probability
Description: Mathworld Wolfram est un site web différent rempli de solutions de probabilités. Les élèves ont accès à ce site très facilement avec la barre de recherche Google.Wolfram guide aussi l’élève vers d’autres sites internet utiles qui couvrent le même sujet pour aider encore plus l’élève à comprendre.
Motif : Wolfram est un site utile qui fournit des aperçus dans plusieurs théories des nombres tout en fournissant de nouveaux défis ainsi qu’une méthodologie dans la théorie des nombres. Le site devient très pratique dans la modélisation et être très recommandée pour les étudiants qui souhaitent étudier la théorie des nombres ainsi que d’autres branches des mathématiques. Il donne des liens vers d’autres sites web en fournissant aux élèves beaucoup d’informations dont ils ont besoin dans les probabilités et les statistiques.
XiV. activités d’apprentissage
Unité 1 40 heures
Les statistiques illustrées et la distribution de probabilités Un curieux fermier entreprend les activités suivantes sur sa ferme.
1. Elle plante 80 arbres le 1er mars. Elle mesure la hauteur des arbres le 1er dé- cembre.
2. Elle pèse les 40 vaches sur sa ferme et enregistre les poids dans sa laiterie.
3. Elle enregistre la production journalière des œufs dans sa section de vo- lailles.
4. Elle enregistre le temps utilisé pour livrer le lait vers l’usine de traitement Voici les enregistrements.
1. La hauteur des arbres en cm :
77 76 68 85 63 68 82 67 75 68
74 85 71 53 78 60 81 80 88 73
75 53 95 71 85 74 73 62 75 61
71 68 69 83 95 94 87 78 82 66
60 83 60 68 77 75 75 78 89 96
72 71 76 63 62 78 61 65 67 79
75 53 65 85 93 88 97 79 73 65
93 85 76 76 90 72 57 84 73 86
2. Le poids des vaches en kg :
Poids (kg) 118-126 127-135 136-144 145-153 154-162 163-171 172-180 Nb de va-
ches 3 5 9 12 5 4 2
3. Le nombre d’œufs pondus :
Œufs 462 480 498 516 534 552 570 588 606 624
Nb de
jours 98 75 56 42 30 21 15 11 6 2
4. Le temps pour livrer le lait dans vers l’usine de traitement :
Temps enminutes 90-100 80-89 70-79 60-69 50-59 40-49 30-39
Nb de jours 9 32 43 21 11 3 1
Problème #1 :
Une entreprise locale commerçant avec des services d’extensions d’agriculture visite le fermier. Il montre fièrement ses enregistrements. L’officier d’agriculture est très impressionné par ses enregistrements, mais il réalise que le fermier a besoin de plus de capacités dans la gestion de données pour pouvoir l’aider à prendre de meilleures décisions en se basant sur les résultats de sa ferme.
L’officier a créé un petit cours sur le traitement de données pour les fermiers ru- raux.
Pendant la planification du cours, les termes suivants ont été définis pour la leçon un pour les fermiers.
a) Donnée : le résultat d’observation. Ex. : la hauteur des arbres.
b) Fréquence : La fréquence. Ex. : Le nombre de vaches pesées.
c) Moyenne : La moyenne des données.
d) Mode : La donnée la plus haute.
e) Médiane : Dans des données ascendantes, la médiane est le nombre au milieu de la suite.
f) Étendue : La différence entre la donnée la plus haute et la plus basse.
Leçon un : Les mesures de dispersion Introduction aux statistiques
Les statistiques descriptives sont utilisées pour indiquer n’importe laquelle des tech- niques utilisées pour résumer un ensemble de données. Dans un sens, nous utilisons les données sur des membres d’un ensemble pour le décrire. Les techniques sont classées comme :
1. Une description graphique dans laquelle nous utilisons des graphiques pour résumer les données.
2. Une description sous forme de tableau dans lequel celui-ci est utilisé pour résumer les données.
3. Des descriptions paramétriques dans lesquelles nous estimons les valeurs de certains paramètres dans lequel nous complétons la description de l’ensemble de données.
En général, les données statistiques peuvent être décrites comme une liste de sujets ou d’unités et les données peuvent être associées avec chacune d’elles. Nous avons deux objectifs pour notre résumé :
1. Nous voulons choisir une statistique qui démontre la différence des unités dans leur similarité. Les livres de statistique appellent la solution de cet objectif une mesure de la tendance centrale.
2. Nous voulons choisir une autre statistique qui montre comment elles sont différentes. Ce genre de statistique est souvent appelé une mesure de la va- riabilité statistique.
Lorsque nous résumons une quantité comme la longueur, le poids ou l’âge, il est commun de répondre à la première question avec une moyenne arithmétique ou avec le mode.Parfois, nous choisissons des valeurs spécifiques de la fonction de distribution cumulative appelée quartiles.
Les mesures de variabilité les plus communes pour les données quantitatives et la variance sont la racine carrée, l’écart type, l’étendue statistique, l’étendue interquartile et l’écart absolu.
Leçons de fermiers
Les fermiers apprennent comment calculer les : a) Moyennes des données suivantes :
La moyenne de données = Somme totale des données divisées par le nombre d’objets dans les données.
Exemple :
Calculer la moyenne des données suivante : 1) 1,3, 4,4, 5,6, 3,7
Réponse : Moyenne =
8
7 3 6 5 4 4 3
1+ + + + + + + = 8
33 = 4.125
2) 650,675, 700, 725, 800, 900, 1050, 1125, 1200, 575
Réponse: Moyenne =
10
575 1200 1125
1050 900 800 725 700 675
650 + + + + + + + + +
= 10 8400 = 840
Leçon deux: La moyenne d’une donnée discrète
Exemple :
1) Trouvez la moyenne des données suivantes :
X 22 24 25 33 36 37 41
f 5 7 8 4 6 9 11
Réponse : Moyenne =
11 9 6 4 8 7 5
) 11 ( 41 ) 9 ( 37 ) 6 ( 36 ) 4 ( 33 ) 8 ( 25 ) 7 ( 24 ) 5 ( 22
+ + + + + +
+ +
+ +
+ +
= 50
1628 = 32.56
2) Trouvez la moyenne du salaire des travailleurs :
Salaire en $ 220 250 300 350 375
Nb de travailleurs 12 15 18 20 5
Réponse :Moyenne =
5 20 18 15 12
) 5 ( 375 ) 20 ( 350 ) 18 ( 300 ) 15 ( 250 ) 12 ( 220
+ + + +
+ +
+
+ =
70 20665
= $ 295.214
Tableaux de fréquences et moyenne d’ensemble de données
Exemple :
Voici le poids de commandes de lait vers une usine de traitement :
45 49 50 46 48 42 39 47 42 51
48 45 45 41 46 37 46 47 43 33
56 36 42 39 52 46 43 51 46 54
39 47 46 45 35 44 45 46 40 47
a) Une utilisant un intervalle de classe de 5, entrez ces données dans un tableau de fréquences.
b) Calculez la masse moyenne du lait livré.
Réponse :
Tableaux de fréquences / Comptage
Classe Comptage Fréquence
33- 37 //// 4
37-42 ///// /// 8
43-47 //////////// /// 19
48-52 //// // 7
53-57 // 2
Total 40
c) La moyenne d’un groupe de données
Classe Comptage Fréquence(f) Point milieu (x) fx
33- 37 //// 4
2 35 37
33+ = 4×35= 140
37-42 ///// /// 8 40 320
43-47 //////////// /// 19 45 855
48-52 //// // 7 50 350
53-57 // 2 55 110
Total 40 1775
Moyenne = 44.375 40
1775 =
∑
=∑
f fx
Exercices
Trouvez la moyenne de :
1) 63, 65, 67, 68, 69 2)
x 1 2 3 4 5
f(x) 11 10 5 3 1
3)
Poids (x) 4-8 9-13 14-18 19-23 24-28 29-33
Fréquence 2 4 7 14 8 5
4) 91,78, 82,73,84
5)
Hauteur (x) 61 64 67 70 73
Fréquence 5 18 42 27 8
6)
Poids (x) 30.5-36.5 36.5-42.5 42.5-48.5 48.5-54.5 54.5-60.5
Fréquence 4 10 14 27 45
Réponses :
1). 66.4 2). 2.1 3). 20.6
4) 80 5) 76.45 6) 51.44
Leçon trois : Le mode Exemple :
1) Trouvez le mode dans les données suivantes :
1,3,4,4,5,6,1,3,3,2,2,3,3,5Solution :
Le mode est la donnée qui apparaît le plus souvent. Dans cette suite, le 3 est celui qui apparaît le plus de fois ou le plus fréquemment : 5 fois. Donc, le mode de cette suite de données est 3.
2) Trouvez le mode dans les données suivantes :
22, 24, 25,22, 27, 22, 25, 30, 25, 31Solution :
22 et 25 apparaissent trois fois chacun. Donc, les modes sont 22 et 25. C’est ce qu’on appelle des données bimodales.
3) Trouvez le mode dans les données suivantes :
Observation ( X) 0 1 2 3 4
Fréquence ( f) 3 7 10 16 11
Solution:
La donnée qui revient le plus souvent est le 3: il apparaît 16 fois.
4) Trouvez la classe modale dans les données suivantes :
Poids ( X) 50 – 54 55-59 60-64 65-69 70-74 75-79 80-84
Fréquence ( f) 3 6 8 5 15 9 13
Solution :
La classe modale est 70-74, car elle a la plus haute fréquence d’occurrence.
Exercices
Trouvez les modes ou les classes modales des données suivantes : 1) 6, 8, 3,5,2,6,5,9,5
2) 20.4, 20.8, 22.1, 23.4, 19.7, 31.2, 23.4, 20.8, 25.5,23.4 3)
Poids (x) 4-8 9-13 14-18 19-23 24-28 29-33
Fréquence 2 4 7 14 8 5
4)
Poids (x) 30.5-36.5 36.5-42.5 42.5-48.5 48.5-54.5 54.5-60.5
Fréquence 4 10 14 27 45
Réponses :
1) 5 2) 23.4 3) 19-23 4) 54.5-60.5
Leçon quatre : La médiane
La médiane
La médiane est la valeur au centre d’une distribution. Dans une suite 1, 2, 3, 4, 5, la médiane est 3, car elle est exactement au centre de la distribution. Pour la suite 1, 2, 2, 3, 4, 5, 6, 7, 7, 8; il y a 10 nombres et aucun nombre au centre. Dans un cas comme celui-là, la médiane est la moyenne des deux nombres du centre.
Ex. : 1,2,2,3, 4, 5 ,6,7,7, 8
Donc, la médiane est 2
4 +5 = 4.5
La médiane d’ensemble de données Exemple:
Trouvez la médiane des ensembles de données suivants:
Masse ( X) 20-24 25-29 30-34 35-39 40-44
Féquence (f) 4 10 16 8 2
Solution :
∑ f = 40
, donc la médiane est la moyenne de la 20e et de la 21e donnée 220 +21 =10.5
Définition : Les limites de classe supérieures et inférieures
La limite de classe inférieure (LCI) et la limite de classe supérieure (LCS) sont les limites d’un intervalle de classe. Ex. : Les limites inférieures et supérieures d’un intervalle de classe 20-24 sont 19.5 et 20.5 et la LCI ainsi que la LCS d’un intervalle de classe 35-39 sont 34.5 et 39.5.
Masse ( X) 20-24 25-29 30- 34 35-39 40-44
Fréquence (f) 4 10 16 8 2
Fréquence cumulative 4 4+10=14 14 + 16 = 30 30+8=38 39+2 =40
Voici la procédure pour calculer la médiane :
Étape 1 : La médiane apparaît dans l’intervalle de classe 30-34 Étape 2 : La LCI ainsi que la LCS de 30-34 sont 29.5 et 34.5.
Étape 3 : Trouver la fréquence cumulative (FC).
Étape 4 : Trouver l’intervalle de classe, LCI et LCS.
Étape 5 : Avoir le 10.5e terme.
10.5e terme = LCI de la classe avec la médiane + Différence de sommation x Intervalle de classe.
Fréquence de classe
La différence de sommation 20.5 – 14 = 6.5 où 14 est la FC de l’intervalle de classe 25-29.
Étape 6 : La médiane 29.5 +
5 16
6.5 ×
= 31.53125.Notez que le dénominateur 16 est la fréquence de classe dans l’intervalle de classe 30-34.
L’étendue
L’étendue est tout simplement la différence entre le chiffre le plus haut et le chiffre le plus bas dans une suite de données.
Exemple : 23, 26, 34, 47, 63, l’étendue est 63-23 = 40, et dans 121, 65, 78, 203, 298,174, l’étendue est 298-65= 233.
Leçon cinq : Les mesures de dispersion 1) Les quartiles :
Ce sont des données placées dans un ordre de magnitude qui peuvent être divisées en quatre portions égales, 25 % chacune. La première portion est le quartile le plus bas qui apparaît à 25 %. Celui du milieu, ou du centre, à 50 % est appelée la médiane, tandis que le troisième quart qui apparaît à 75 % s’appelle le quartile supérieur. Les trois points sont généralement écrits comme ceci : Q1, Q2 , Q3.
2) L’étendue semi-interquartile :
L’étendue semi-interquartile ou la déviation quartile est définie comme :
2
1
3 Q
Q Q −
=
3) Les déciles :
Si les données sont placées dans un ordre de magnitude et divisées en 10 portions égales (10 % chacune), donc chaque portion constitue un décile. Les déciles sont écrits comme ceci : D1, D2, D3,……D9.
4) Les percentiles :
Si les données sont divisées et placées dans un ordre de magnitude subdivisé en 100 parties égales (1 % chacune), donc la portion constitue un percentile. Les percentiles sont écrits comme ceci : P1, P2, P3…, P99.
7
L’écart moyen
L’écart moyen d’un ensemble de N nombres X1 ,X2, X3, X4,X5,……, XN est défini par :
Écart moyen (EM) =
N N j
j X
∑ X
=
−
1 =
N X
∑
X − = X − X , oùX
est lamoyenne arithmétique des nombres et X − X est la valeur absolue de la déviation de Xj à partir de
X
.Exemple
Trouvez l’écart moyen de la suite 3, 4, 6, 8, 9.
Solution
Moyenne arithmétique = 6
5 30 5
9 8 6 4
3+ + + + = =
Écart moyen (
X
) =5
6 9 6 8 6 6 6 4 6
3 − + − − + − + −
=
5
3 2 0 2
3 + − + + +
− = 5
2 10 5
3 2 0 2
3+ + + + = =
L’écart moyen d’un groupe de données Pour les données
Valeurs X1 X2 X3 …… XN
Fréquences f1 f2 f3 …. Fm
L’écart moyen peut être calculé ainsi :
Écart moyen = X X
N X X f N
m j
j X j X f
−
∑ − =
=
∑
=
− 1
L’écart-type
L’écart-type d’un ensemble de N nombres X1 ,X2, X3, X4, X5,……, XN est représenté par s et est défini par :
s = N
N j
j X
∑ X
=
− 1
)2 (
= N
X
∑
(X − )2 = N∑
x2 = (X − X)2où x représente la déviation des nombres X
j de la moyenne
X
. Il suit que l’écart- type est la variance des déviations de la moyenne.L’écart-type d’un groupe de données
Valeurs X1 X2 X3 …… XN
Fréquences f1 f2 f3 …. Fm
L’écart-type est calculé ainsi :
s =
1 ( ) 2 2 ( ) 2
) 2 (
X N X
fx N
X X f N
m
j f j X X
−
∑ =
∑ − =
=
∑
=
−
oú N= ∑ = ∑
= m f j fj
1
.
La variance
La variance d’un ensemble de données est définie comme le carré de l’écart-type : variance = s2. Nous utilisons parfois s pour représenter l’écart-type d’un échantillon de population et
σ
(sigma en lettre grecque) pour représenter l’écart-type d’une po- pulation. De plus,σ 2
peut représenter la variance d’une population et s2, la variance d’un échantillon d’une population.Exemples
Trouvez la moyenne et l’étendue des données suivantes : 5, 5, 4, 4, 4, 2, 2, 2.
Solution
Moyenne = mm n N
∑
x =
5 5 4 4 4 4 2 2 2
9
+ + + + + + + +
= 356 .
Étendue 5-2=3
Observation de la médiane Exemple
Dans 13 observations 1,1,2,3,4,4,5,6,8,10,14,15,17
La médiane = n +
= =
1 2
14 2 607 La valeur
2
14 = 7th position. La médiane est 5.
Si n est impair, la médiane est la valeur dans la position n + 1
2
Par contre, si elle est paire, nous ferons la moyenne des deux nombres du centre.
Exemple
1,1,2,2,3,4,4,5,6,8,10,14,15,17
La médiane = la moyenne des deux nombres du centre = 4 5 2 4 5 + = .
La médiane et les groupes de données
Lorsque des données sont regroupées ensemble, la médiane
χ
2est la valeur exacte ou en dessous de 50 % du point d’observation.Exercices
Trouvez la médiane des données suivantes.
1. 1,1,2,2,3,4,5,7,7,7,9 2. 7,8,1,1,9,19,11,2,3,4,8
Définition
La moyenne de l’écart mis au carré est appelée la variance :
N x s x
h 2
2 Σ ( − −)
=
Où : x− x− est la déviation de la moyenne, N est le nombre d’observations, s est 2 la variance et s est l’écart type.2
Exemple
Les données 2, 4, 5, 8, 11 vous sont données. Trouvez la variance et l’écart type.
X −
x− x (x− x−)2
2 -4 16
4 -2 4
5 -1 1
8 2 4
11 5 25
∑
x=5 ∑
(x− x−)2=50
q Travail d’équipe
1. Étudiez le calcul de la va-
riance et de l’écart type des
exemples
Donc, 6 5 30 =
− =
x 10
5 52 = 50 =
Variance = 10
5
2 50
= s =
Écart type = √10
Exercices
1. Calculez l’étendue des données : 1,1,1,2,2,3,3,3,4,5 2. Calculez la variance et l’écart type : 1,2,3,4,5 Asymétrie
Notons que lorsque la distribution d’une variable à travers son histogramme est sy- métrique, alors les trois caractéristiques de tendance centrale, à savoir : le mode, la médiane et la moyenne de cette variable, sont égaux. Dans le cas unimodal, lorsque la distribution est asymétrique, la médiane est généralement comprise entre le mode et la moyenne arithmétique : deux cas se présentent alors :
• mode<médiane<moyenne la distribution est étalée vers la droite ;
• mode>médiane>moyenne la distribution est étalée vers la gauche.
Définition : L’asymétrie est le degré de déviation de la symétrie d’une distribution.
(Voir les asymétries positives et négatives plus haut.)
Pour les distributions asymétriques, la moyenne tend à aller dans le même sens que celui du mode avec la queue la plus longue.
Le premier coefficient d’asymétrie de Pearson Le premier coefficient d’asymétrie est défini par :
Asymétrie =
€
moyenne−mode
écart − type = X −mode s
Le deuxième coefficient d’asymétrie de Pearson Le second coefficient de Pearson est défini par :
Asymétrie =
€
3(moyenne(X )− médiane(X ))
écart − type(X ) = 3(X − mediane(X )) s
Coefficient quartile d’asymétrie Il est défini comme par :
Coefficient quartile d’asymétrie =
1 3
1 2 2
3 1
3
1) ( 2
2) ( 3
Q Q
Q Q Q Q
Q
Q Q Q
Q
− +
= −
−
−
−
−
L’asymétrie 10-90 percentile Elle est définie comme ceci :
Asymétrie 10-90 percentile =
10 90
10 2 50
90 10
90
10 ) ( 50
50 ) ( 90
P P
P P P
P P
P P P
P
− +
= −
−
−
−
−
Exemple : Trouvez le 25e percentile des données 1, 2, 3, 4, 5, 6, 7, 9
25e percentile =
€
(n +1)x0.25
9(.25) = 22.5(centile) 2e = 2
3e = 3 2.25 ⇒ 0.25(1)+2 = 2.25
Trouvez le 50e percentile
50e percentile =
( 8 + 1 ) x . 50 = 9 (. 5 ) = 4 . 5 percentile
4e = 45e = 5 0.5(5) =0.5+4 =4.5 Le (1) est l’étendue 5-4=1.
q Travail d’équipe
1. Étudiez le calcul des percen- tiles et tentez de répondre à la prochaine question…
suivants.
Exercices
Trouvez le 25e percentile, le 50e percentile et le 90e percentile.
46,21,89,42,35,36,67,53,42,75,42,75,47,85,40,73,48,32,41,20,75,48,48,32,52,61,49 ,50,69,59,30,40,31,25,43,52,62,50
Réponses
a) 36 b) 48 c) 73
Kurtosis ou le coefficient d’aplatissement
Définition : Le kurtosis est le degré d’aplatissement d’une distribution, comparé à la distribution normale.
Exemples
1) Distribution leptokurtique ou hypernormale :
Une distribution avec un sommet plutôt élevé
2) Distribution platicurtique ou hyponormale :Une distribution ayant un sommet plat
3) Distribution mésocurtique
Une distribution normale – ni élevée, ni plate
Exercices
Trouvez le mode des collectes de données suivantes : 1) 1,3,4,4,2,3,5,1,3,3,5,4,2,2,2,3,3,4,4,5
2) Nombre de mariages pour 1000 personnes dans la population africaine pour les années 1965 à 1975.
Année Taux
1965 9.3
1966 9.5
1967 9.7
1968 10.4
1969 10.6
1970 10.6
1971 10.6
1972 10.9
1973 10.8
1974 10.5
1975 10.0
3) Nombre de morts pour 1000 personnes pour les années 1960 et 1965 à 1975.
1960 9.5
1965 9.4
1966 9.5
1967 9.4
1968 9.7 1969 9.5
1970 9.5
1971 9.3
1972 9.4
1973 9.3
1974 9.1
1975 8.8
Réponses 1. 3 2. 10.6 3. 9.5
À lire
An introduction to probability par Charles M. Grinstead, pages 247 à 263.
Faire les exercices des pages 263 à 267, numéros 4, 7, 8, 9.
Probabilités
1) Univers des possibles (ou Espace d’échantillon) et évènements
Terminologies
a) Une expérience de probabilités
Lorsque vous lancez une pièce de monnaie, lorsque vous prenez une carte dans un paquet de cartes ou lorsque vous lancez un dé, vous faites une expérience de proba- bilités. Dans une expérience de probabilités, les chances sont bien définies avec des chances égales d’occurrence – il y a seulement deux chances possibles lorsque vous lancez une pièce de monnaie. Vous aurez soit pile, soit face. Le côté face et le côté pile ont des chances égales.
b) Un résultat
Il est défini comme le résultat d’un seul essai d’une expérience de probabilités – lorsque vous lancez une pièce de monnaie une seule fois, vous aurez soit pile, soit face.
c) Un essai
Il se réfère à l’activité de faire une expérience, comme tirer une carte d’un paquet de cartes ou bien de lancer des dés.
d) Un Univers des possibles
Il se réfère à toutes les possibilités d’une expérience de probabilités – lorsque vous lancez une pièce de monnaie, vous obtiendrez soit face (F), soit pile (P). Il n’y a que deux résultats possibles lorsque vous lancez une pièce de monnaie. Les chances d’obtenir pile ou face sont égales.
e) Un évènement simple et un événement composé
Dans une expérience de probabilités, un évènement avec une seule possibilité de résultat est appelé un évènement simple. Si un évènement a plus de deux possibilités, il est appelé évènement composé.
2) Définition des probabilités
Les probabilités peuvent être définies comme les mathématiques de la chance. Il y a quatre approches principales aux probabilités;
i. L’approche classique ou a priori ou approche pascalienne
ii. La fréquence relative ou l’approche expérimentale : l’approche fréquentiste iii. L’approche axiomatique
iv. L’approche subjective (ou approche personnaliste) L’approche classique ou a priori
Les probabilités sont le ratio du nombre de cas favorables comparé au total de cas possibles. C’était la conception originelle des probabilités initiée le physicien ma- thématicien Pascal vers l’an 1654 dans le contexte de loterie basée sur un jeu de hasard. Cette idée fut poursuivie par Fermat, contemporain de Pascal. Imaginez qu’un événement se produit N fois sur un total M de manières possibles. La probabilité d’occurrence de l’évènement est désignée par :
p=Pr(N)=
M
N . La probabilité se réfère au rapport de résultats favorables sur tous les résultats possibles.
La probabilité de non-occurrence du même évènement est donnée par (1-p(occurrence)).
La probabilité d’occurrence plus celle de la non-occurrence est égale à un.
Si la probabilité d’occurrence est P(O) et la probabilité de non-occurrence P(Oc), alors P(O)+P(Oc)=1.
Les probabilités expérimentales : les fréquences relatives
Les probabilités expérimentales surviennent lorsque la fréquence des distributions n’est pas utilisée. On s’intéresse à un événement A attaché à une expérience; on pro- cède à un nombre assez élevé n de répétitions de ladite expérience dans les mêmes conditions et indépendamment les unes des autres : la probabilité de l’événement A est définie comme la limite de sa fréquence relative lorsque n tend vers plus l’infinie, soit :
P(A) =
€
n lim⎯ ⎯ ⎯ ⎯ ⎯ ⎯ ⎯ Fréquence(A)⎯ +∞→
Ainsi, dans la pratique on interprète une fréquence relative comme une probabilité, approximativement au moins : Fréquence(A) @ P(A).
Exemple :
Observation ( X) 0 1 2 3 4
Fréquence ( f) 3 7 10 16 11
La probabilité d’observation (X) qui apparaît 2 fois est donnée par la formule :
P(2)=
€
fréquence de 2
somme des fréquences= f(2)
∑f = 10
3+ 7 +10 +16 +11= 10 47
L’approche axiomatique
Genèse des probabilités. Sur le plan historique, de l’année 1663 jusqu’en 1933, notons que les probabilités constituaient une discipline des sciences physiques, vraisemblablement parce que la majorité des promoteurs du calcul des probabilités furent plutôt des physiciens comme Pascal, Fermat, Huyghens, Bernoulli(vers 1700), Gauss (1809), Laplace(1812), etc. Il a fallu attendre les travaux du mathématicien russe N. Kolmogorov publiés en 1933 qui a démontré la possibilité d’une approche axiomatique des probabilités, y compris le concept dfe probabilité conditionnelle, pour que celles soient enfin acceptées d’intégrer les domaines des sciences mathé- matiques. En 1955 et 1956, A. RENYI démontra dans théorie d’espace de probabilité conditionnelle,la possibilité de généraliser l’axiome de Kolmogorov. Ensuite, récem- ment, Sylvia Pulmannova (1991), dans les algèbres de Von Neumann, a construit une généralisation de l’axiomatique de A. RENYI. Tout ceci montre un rapide essor de la théorie de probabilité à partir du moment où l’on s’est aperçu que toute probabilité peut être considérée comme probabilité conditionnelle. S’il a fallu ainsi presque trois siècles (de 1663 à 1933) pour découvrir cette approche axiomatique, le concept de probabilité étant alors dégagé à la fois du contexte numérique, de la chronologie et de la causalité, ce grand bond en avant n’a demandé que quelques dizaines d’an- nées. Cependant, l’emploi des mots de Formule et Loi demeurent toujours jusqu’à
aujourd’hui : c’est une trace indélébile de l’origine physicienne des probabilités!
Il est heureux d’apprécier par la suite l’impact positif de cette reconnaissance du statut de discipline mathématique des probabilités sur l’avancement notable des mathématiques et surtout celui de l’informatique, laquelle s’est avérée un moteur de la nouvelle technologie de l’information et de communication de notre ère moderne.
Ceci amène à penser que trop s’attacher au contexte numérique ou expérimental pour introduire les probabilités, et attacher trop de chronologie ou de causalité à la notion de probabilité conditionnelle, seraient des sources d’obstacles épistémologiques dans la compréhension des concepts de probabilité et de probabilité conditionnelle.
Axiomes de Kolmogorov et définition. On considère un ensemble non vide E des résultats possibles d’une expérience et une famille T des parties de E qui contient E lui-même et à la fois stable par complémentation et par réunion dénombrable, famille appelée une tribu sur E. Alors le couple (E, T) porte le nom d’espace proba- bilisable.
On appelle probabilité définie sur l’espace probabilisable (E, T), toute application de type P définie sur la tribu T à valeurs réelles positives et qui satisfait aux deux propriétés suivantes :
(i) Axiome de normalisation : P(E) = 1.
(ii) Axiome d’additivité dénombrable :
Pour toute suite (An)n d’événements dans T, deux à deux incompatibles, on a :
P(
€
An n=0
+∞U ) =
€
p( nA ) n=0
+∞∑ .
Terminologies : Soit P une probabilité définie sur un espace probabilisable (E, T).
On dit alors que (E, T, P) est un espace probabilisé. Pour tout événement A de T, le nombre P(A) est la probabilité pour que l’événement se réalise, ou la probabilité de l’événement A.
Interprétation : Il y aurait 100P(A) % de chance pour que l’événement A se pro- duise.