et statistiques

(1)

Par Paul CHEGE

African Virtual university Université Virtuelle Africaine Universidade Virtual Africana

et statistiques

(2)

Note

Ce document est publié sous une licence Creative Commons.

http://en.wikipedia.org/wiki/Creative_Commons Attribution

http://creativecommons.org/licenses/by/2.5/

License (abréviation « cc-by »), Version 2.5.

(3)

I. Probabilités et statistiques ___________________________________ 3 II. Prérequis / connaissances préalables nécessaires _________________ 3 III. Volume horaire/temps _______________________________________ 3 IV. Matériels didactiques _______________________________________ 3 V. Justification/Importance du module ____________________________ 3 VI. Contenu__________________________________________________ 5 6.1 Résumé _______________________________________________ 5 6.2 Contour/grandes lignes ___________________________________ 6 6.3 Représentation graphique _________________________________ 7 VII. Objectif général ____________________________________________ 8 VIII. Objectifs spécifiques aux activités d’apprentissage _________________ 8 IX. Activités d’enseignement et d’apprentissage ______________________ 10 X. Concepts-clés (glossaire) ____________________________________ 13 XI. Lectures obligatoires ________________________________________ 20 XII. Ressources obligatoires _____________________________________ 22 XIII. Liens utiles _______________________________________________ 23 XIV. Activités d’apprentissage ____________________________________ 25 XV. Synthèse du module _______________________________________ 119 XVI. Évaluation sommative ______________________________________ 120 XVII. Références bibliographiques _________________________________ 128 XVIII.Fiche d’évaluation _________________________________________ 129 XIX. Auteur du module _________________________________________ 129 XX. Structure _______________________________________________ 130

Table des maTières

(4)

i. Probabilités et statistiques

Par Paul Chege

ii. Prérequis/ connaissances préalables nécessaires

Cours de statistiques et probabilités au secondaire.

iii. Volume horaire/temps

La durée de ce module est de 120 heures.

iV. matériels didactiques

Les étudiants devraient avoir accès aux lectures mentionnées plus loin. De plus, ils auront besoin d’un ordinateur pour avoir accès à ces lectures. Par ailleurs, les étu- diants devraient pouvoir installer le logiciel wxMaxima et l’utiliser pour pratiquer des concepts algébriques. Ils doivent également avoir accès au logiciel du microsoft office Excel qui traite les lois de probabilités usuelles, les tests statistiques, et analyses statistiques descriptives et inférentielles classiques.

V. Justification/importance du module

Les probabilités et les statistiques, en plus d’être un élément clé dans l’ensei-

gnement au secondaire, fournissent un bagage important pour les mathéma-

tiques avancées au niveau tertiaire. Les statistiques font partie de la base des

mathématiques appliquées dans la plupart des sujets académiques et sont très

utiles pour l’analyse dans des industries de production. Les spécialistes de

statistiques appelés statisticiens analyseront des données brutes cueillies dans

le domaine pour fournir un aperçu sur le comportement de la population. Les

statistiques fournissent aux gouvernements et aux organisations un résumé

concret d’une situation qui aidera les dirigeants à prendre une décision. Par

exemple, le taux de propagation des maladies, des rumeurs, des incendies de

forêt, la modélisation de la pluviométrie et les évolutions de population ou le

mouvement démographique.

(5)

D’autre part, l’étude des probabilités aidera à la prise de décision des agents gouvernementaux et des organisations basées sur la théorie de la chance. Par exemple : prédire les sexes nouveau-nés sur une certaine période et projeter le niveau de la quantité des pluies sur des régions, eu égard aux données histori- ques sur le sujet. Les probabilités sont aussi utilisées dans le choix du niveau de qualité de certains produits dans la production industrielle, (comme) par exemple, le nombre de pièces défectueuses prévues dans le processus manu- facturier d’une industrie.

Enfin, à un niveau plus avancé, en cette ère de la nouvelle technologie de l’information, grâce à la puissance accrue des ordinateurs et à la performance des algorithmes pour traiter de gros volumes des données, l’étude statistique des tickets de caisse permet de mieux optimiser la liquidation des articles dans une grande surface en tenant compte des associations des produits vendus.

Cela relève du domaine communément appelé la fouille des données ou le data mining qui traite différents types des données, données qualitatives et / ou quantitatives, et qui comprend plusieurs méthodes telles l’analyse des règles d’association, les analyses factorielles de composantes principales, de correspondances, etc.

Dans ce module de cours, on se limitera essentiellement à l’étude des données

quantitatives. Le logiciel Excel du microsoft office fait partie d’outils didac-

tiques à travers son module Outils/Utilitaires d’Analyses.

(6)

Vi. Contenu

6.1 Résumé

Ce module est divisé en trois unités :

Unité 1 : Les statistiques illustrées (qualificatives**) et la distribution de proba- bilités

Les statistiques illustrées dans l’unité 1 sont développées, soit par extension aux mathématiques au niveau secondaire, soit comme une introduction pour ceux qui apprennent les statistiques pour la première fois. Cette unité introduit la mesure de la dispersion dans les statistiques. Elle introduira aussi les concepts de probabilités et le traitement théorique des probabilités.

Unité 2 : Les variables aléatoires et la distribution

Cette unité requiert l’unité 1 en prérequis. Elle parle du moment et des fonctions produisant le moment, les inégalités de Markov et Chebychev, les distributions spéciales à une variable, les distributions des probabilités à deux variables et l’analyse des probabilités conditionnelles. Cette unité donne un aperçu sur l’analyse des coefficients de corrélation linéaires et la distribution des fonctions de variables aléa- toires, comme, par exemple, le khi carré, T et F. Utilisation de Excel sous Outils/

Utilitaires d’analyse.

Unité 3 : La théorie des probabilités

Cette unité a été conçue à partir de l’unité 2. Elle analyse la probabilité en utilisant un indicateur de fonctions. Elle introduit les vecteurs aléatoires inégaux de Bonfe- roni, les fonctions de production, les fonctions caractéristiques et les échantillons aléatoires de statistiques indépendantes. Cette unité montre en détail les concepts de fonctions de plusieurs variables et l’indépendance de X et de S2 dans des échantillons gaussiens de statistiques d’ordre. Cette unité résume le traitement de divers modes de convergence et des théorèmes limites.

(7)

6.2 Contour/grandes lignes

Unité 1 (40 heures) : Les statistiques illustrées et la distribution de probabilités

Niveau 1. Priorité A. Sans prérequis.

La fréquence des distributions relatives et cumulatives, les courbes à fréquence variables, les moyennes, le mode et la médiane. Les quartiles et les percentiles, les écarts-types, les distributions symétriques et asymétriques. La probabilité; les échantillonnages et les événements; la définition des probabilités; les propriétés des probabilités; les variables aléatoires; la probabilité des distributions; Bernouli, lois binômiales, lois de Poisson, lois géométriques, lois hypergéométriques, lois uniformes, lois exponentielles et lois normales. Des distributions à deux variables. Les tables des lois de probabilité jointes et les lois de probabilité marginales.

Unité 2 (40 heures) : Les variables aléatoires et la distribution

Niveau 2. Priorité B. Prérequis : Statistiques 1.

Moments et fonction génératrice de moments. Les inégalités de Markov et Cheby- chev, des distributions univariées spéciales. La probabilité de distributions à deux variables; les distributions marginales et conditionnelles communes; l’indépendance;

l’anticipation de la régression et de la corrélation à deux variables; l’analyse de la régression et du coefficient de corrélation pour des données à deux variables. La distribution de variables aléatoires, la distribution normale à deux variables. Les distributions dérivées comme le khi carré, T. et F.

Unité 3. (40 heures) : La théorie des probabilités Niveau 3. Priorité C. Prérequis : Statistiques 2.

Probabilités : Utilisation des fonctions indicatrices. Les inégalités de Bonferoni et les vecteurs aléatoires. Les fonctions génératrices. Les fonctions caractéristi- ques. L’indépendance des statistiques et échantillons aléatoires. La distribution multinomiale. Les fonctions de plusieurs variables aléatoires.

L’indépendance de

€

X et de S

²

dans des échantillons normaux. Statistique d’or- dre. Lois normales multidimensionnelles. Convergence et théorèmes limites.

Exercices pratiques.

(8)

6.3 Représentation graphique de l’organisation

Les inégalités de Markov et de

Chebychev

Les distributions dérivées, le khi

deux, t et F.

Les lois à une variable et à deux variables

DONNÉES

Les

tableaux de probabilités usuelles La

moyenne, le mode et la médiane

Les courbes à fréquence variable, les quartiles et les percentiles

Les fonctions génératrices et caractéristiques et les échantillons aléatoires

Les indicateur s de fonctions

La probabilité des

distributions

Le moment et fonction génératrice des moments

Les inégalités de Bonferoni, les vecteurs aléatoires

Loi multinomiale, les fonctions de variables aléatoires

Variance et écart type

Les probabilités

La régression et la

corrélation

Les lois marginales et conditionnelles usuelles

Les lois

multidimensionnelles , la convergence et théorèmes limites

(9)

Vii. Objectif général

À la fin de ce module, l’étudiant devrait être en mesure de calculer les diffé- rentes mesures de dispersions dans les statistiques et d’effectuer des probabi- lités basées sur les lois de la probabilité, de faire des tests sur des données en utilisant les théories de la probabilité.

Viii. Objectifs spécifiques aux activités d’apprentissage

Unité 1 : Les statistiques illustrées et la distribution de probabilités (40 heures) À la fin de l’unité 1, l’étudiant devrait être en mesure de :

• Dessiner diverses courbes de fréquences

• Trouver la moyenne, le mode, la médiane, les quartiles, les percentiles et les écarts-types de données regroupées

• Définir et énoncer les propriétés des probabilités

• Illustrer des variables aléatoires, des probabilités de distributions, et les valeurs attendues de variables aléatoires

• Illustrer les distributions de Bernoulli, les lois binomiales, lois de Poisson, lois géométriques, hypergéométriques, uniformes, exponentielles et normales

• Faire des enquêtes sur les fréquences de distribution à deux variables

• Construire des tableaux de probabilités communes et marginales Unité 2 : Les variables aléatoires et la distribution (40 heures)

À la fin de l’unité 2, l’étudiant devrait être en mesure de :

• Illustrer le moment et le moment générant des fonctions

• Analyser les inégalités de Markov et de Chebychev

• Examiner les distributions spéciales à une variable, les probabilités de distributions à deux variables, les distributions marginales communes et conditionnelles

• Montrer l’indépendance, l’anticipation à deux variables, la régression et la corrélation

• Analyser la régression et la corrélation du coefficient pour des données à deux variables

• Montrer les fonctions de distribution de variables aléatoires

• Examiner les distributions normales à deux variables

• Illustrer les distributions dérivées comme le khi carré, T et F.

(10)

Unité 3 : La théorie des probabilités (40 heures)

À la fin de l’unité 3, l’étudiant devrait être en mesure de :

• Utiliser des indicateurs de fonctions dans les probabilités

• Montrer les inégalités de vecteurs aléatoires de Bonferoni

• Illustrer les fonctions génératrices et caractéristiques

• Examiner l’indépendance d’échantillons aléatoires de statistiques et les distributions multinomiales

• Évaluer les fonctions de plusieurs variables aléatoires

• Illustrer l’indépendance de X et de S2 dans des échantillons normaux de statistiques

• Montrer les distributions normales multidimensionnelles

• Illustrer la convergence et les théorèmes limites

• Faire des exercices pratiques

(11)

iX. activités d’enseignement et d’apprentissage

9.1 Évaluation préliminaire/initiale

Les mathématiques de base constituent un prérequis pour les probabilités et les statistiques.

Questions

1. Lorsqu’un dé est lancé, la probabilité d’avoir un nombre supérieur à 4 est de : a. 1/6

b. 1/3 c. 1/2 d. 1

2. Une seule carte est tirée au hasard d’un paquet de cartes. Trouvez la probabilité de tirer une reine.

a. 1/13 b. 1/52 c. 4/13 d. 1/2

3. Sur 100 nombres, il y avait vingt 4, quarante 5, trente 6 et le restant étaient des 7. Trouvez la moyenne arithmétique des nombres.

a. 0.22 b. 0.53 c. 2.20 d. 5.30

4. Calculez la moyenne des données suivantes :

Grandeur (cm) Indice de classement (x)

60-62 61

63-65 64

66-68 67

69-71 70

72-74 73

a. 57.40 b. 62.00 c. 67.45 d. 72.25

(12)

5. Trouvez le mode des données suivantes : 5, 3, 6, 5, 4, 5, 2, 8, 6, 5, 4, 8, 3, 4, 5, 4, 8, 2, 5 et 4é

a. 4 b. 5 c. 6 d. 8

6. L’étendue des valeurs qu’une probabilité peut présumer est : a. De 0 à 1

b. De -1 à +1 c. De 1 à 100 d. De 0 à ½

7. Trouvez la médiane des données suivantes : 8, 7, 11, 5, 6, 4, 3, 12, 10, 8, 2, 5, 1, 6, 4.

a. 12 b. 5 c. 8 d. 6

8. Trouvez l’étendue de ces chiffres : 7, 4, 10, 9, 15, 12, 7, 9.

a. 9 b. 11 c. 7 d. 8.88

9. Lorsque deux pièces de monnaie sont lancées, l’espace d’échantillon est : a. P, F et PF

b. PP, PF, FP, FF c. PP, PF, FF d. P, F

10. Si une lettre est sélectionnée au hasard dans le mot « Mississippi », trouvez la probabilité que ce soit un « i ».

a. 1/8 b. 1/2 c. 3/11 d. 4/11

(13)

Corrigé 1. B 2. A 3. D 4. C 5. B 6. A 7. D 8. B 9. B 10. D

Commentaires pédagogiques pour les étudiants

Cette évaluation préliminaire a été conçue pour donner un aperçu aux étudiants sur ce qu’ils peuvent se rappeler en probabilités et en statistiques. Une note inférieure à 50 % dans cette évaluation préliminaire indique que l’élève doit réviser les proba- bilités et les statistiques vues en mathématiques du niveau secondaire. L’évaluation préliminaire couvre les concepts de base que les étudiants doivent connaître avant de continuer dans ce module. Si vous avez eu des problèmes avec cette évaluation, vous devriez réviser les probabilités et statistiques vues en mathématiques du secondaire, et vous devriez maîtriser les bases.

(14)

X. Concepts-clés (glossaire)

Absolument exclusifs / incompatibles : Deux événements sont mutuellement exclusifs s’ils ne peuvent pas intervenir en même temps.

La variance d’un ensemble de données est définie comme le carré de l’écart -type. Ex. : variance

= s².

Essai : Ce terme se rapporte à une activité qui applique une expérience, comme, par exemple, prendre une carte dans un paquet de 52 cartes ou lancer un ou plusieurs dés.

Espace d’échantillon ou univers des possibles: Ce terme désigne toutes les possibilités d’une expérience de probabilités. On l’appelle l’événement certain ou l’événement sûr attaché à l’expérience considérée. Ex. : En laçant une pièce de monnaie, le résultat sera soit pile (P) ou face (F).

Variable aléatoire : C’est une fonction qui assigne un nombre réel à tous les résultats possibles d’une expérience aléatoire.

Échantillon aléatoire : Il est choisi par une méthode qui fait intervenir un élément imprévisible.

Distribution de Bernoulli : C’est une probabilité discrète qui prend la valeur 1 avec la probabilité du succès p, et la valeur 0 avec la probabilité d’échec q = 1 – p.

Distribution binomiale : C’est une distribution de probabilités discrètes qui exprime la probabilité d’un nombre de succès dans une séquence de n essais indépendants d’expériences de Bernoulli, c’est-à-dire à deux issues exclusives oui / non, selon laquelle chaque essai produit un succès avec la probabilité p.

Distribution hypergéométrique : C’est une distribution de probabilités dis- crètes qui décrit le nombre de succès dans une séquence n tirée à partir d’une population finie sans remplacement.

Distribution de Poisson : C’est une distribution de probabilités discrètes qui exprime la probabilité qu’un nombre d’évènements qui se produisent dans une période de temps prédéterminée, si ces évènements se produisent avec un taux moyen connu, et ils sont indépendants du temps depuis le dernier évènement.

C’est une loi des événements rares.

Corrélation : C’est une mesure d’association entre deux variables.

Régression : C’est la relation fonctionnelle explicite qui existe entre une

variable dépendante et une variable indépendante.

(15)

Khi carré : C’est n’importe quel test d’hypothèse statistique dans lequel le test de statistiques a une distribution khi carré lorsque l’hypothèse nulle est vrai, ou lorsque la distribution de probabilités du test de statistique (en prenant pour acquis que l’hypothèse soitvraie) peut être faite pour estimer une distribution khi carré au près que voulu en faisant un espace d’échantillon assez grand.

Distribution normale à plusieurs variables : C’est une distribution de pro- babilités spécifique qui peut faire penser à la généralisation de plus grandes dimensions que la distribution normale unidimensionnelle.

Test T : C’est n’importe quelle hypothèse de statistique pour deux groupes dans lequel le test de statistiques a une distribution d’un élève t lorsque l’hy- pothèse nulle est vraie.

Termes de statistiques

1. Donnée brute : C’est une donnée qui n’a pas été classée numériquement.

2. Série statistique : C’est un arrangement de données brutes et de données numé- riques dans un ordre ascendant de magnitude.

3. Étendue : C’est la différence entre le plus gros et le plus petit nombre dans des données.

4. Intervalle de classe : Dans une étendue de données regroupées. Ex. : 21-30, 31-40, etc.), alors 21-30 sera l’intervalle de classe.

5. Limites de classe : Dans l’intervalle de classe de 21-30, 21 et 30 sont appelés les limites de classe.

6. Limites inférieures de classe (l.i.c.) : Dans l’intervalle de classe 21-30, la limite inférieure de classe est 21.

7. Limites supérieures de classe (l.s.c.) : Dans l’intervalle de classe 21-30, la limite supérieure de classe est 30.

8. Limites inférieures et supérieures de classe : Dans l’intervalle de classe inférieure 21-30, la limite de classe est 20.5 et la limite de classe supérieure est 30.5. Ces limites prennent pour acquis que les mesures théoriques d’un intervalle de classe de 21-30 incluent tous les nombres de 20.5 à 30.5.

9. Intervalle de classe : Dans une classe de 21-30, l’intervalle de classe est la différence entre la limite supérieure de classe et la limite inférieure de classe. Ex. : 30.5-20.5 = 10. L’intervalle de classe est aussi connu en tant que l’amplitude de classe.

10. Centre de classe ou point milieu : Dans un intervalle de classe de 21-30, le point médian est la moyenne de 21 et 30. Ex. :

25.5

2 30

21+ =

(16)

11. Distribution statistique : C’est plusieurs données brutes classées dans des classes dans un tableau avec leurs fréquences correspondantes. Ex. :

Masse (kg) 10-19 20-29 30-39 40-49

Nombre d’élèves (f) 5 7 10 6

Ce tableau est appelé une fréquence de distributions ou un tableau de statistiques.

12. Fréquences cumulées : Pour les fréquences de distributions suivantes, les fré- quences cumulées sont calculées comme des aditions de fréquences individuelles.

Masse (X) 20-24 25-29 30-34 35-39 40-44

Fréquence (f) 4 10 16 8 2

Fréquence cu-

mulée 4 4+10=14 14=16=30 30+8=38 38+2=40

La fréquence cumulée d’une valeur est sa fréquence plus la fréquence de toutes les valeurs inférieures.

Le tableau ci-dessus est appelé un tableau de fréquences cumulées.

13. Distribution de fréquences relatives : Dans une fréquence de distributions

Masse (X) 20-35 25-29 30-34 35-39 40-44

Σ

^{f = 40}

La fréquence relative d’une classe de 25-29 est la fréquence de la classe divisée par la fréquence totale de toutes les classes (fréquence cumulée) et est généralement exprimée en pourcentage.

Exemple :

La fréquence relative de la classe 25-29 =

× 100 %

∑ ^f

f

_à

= 40×100

10 25%

Note : la somme des fréquences relatives est 100 % ou 1.

(17)

14. Courbe des fréquences cumulées (Ogive) :

Masse (X) 20-24 25-29 30-34 35-39 40-44

Fréquence cu-

mulée (F.C) 4 4+10=14 14=16=30 30+8=38 38+2=40

À partir du tableau de fréquences cumulées ci-dessus, nous pouvons dessiner un graphique de fréquences cumulées par opposition aux limites de classes supérieures.

Limites de classes

supérieures 24.5 29.5 34.5 39.5 44.5

Fréquences cu-

mulées 3 14 30 38 40

Note : À partir des données de fréquences cumulées, le premier point de res-

titution est (24.5, 3). Si nous avions commencé notre graphique à ce point, il

serait suspendu sur l’axe des y. Nous créons un autre point (19.5, 0) en tant

que point de départ. 19.5 est la limite de classe supérieure prévue de la classe

précédente.

(18)

Formes des courbes de fréquences

Symétrique ou en forme de cloche

3 Symmetrical or bell-shaped. Skewed to the right ( positive skewness)

Skewed to the left ( Negative skewness) J –Shaped Has equal frequency to the left and right

of the central maximum e.g. normal curve Has the maximum towards the left and the longer tail to the right

Has the maximum towards the right of

the and the longer tail to the left Has the maximum occurring at the right end

A une fréquence égale à gauche et à droite du centre maximum. Ex. : courbe normale.

Asymétrique à droite (asymétrie positive)

Elle a le maximum vers la gauche et une queue plus longue vers la droite.

Asymétrique à gauche (asymétrie négative)

Elle a le maximum vers la droite et une queue plus longue vers la gauche.

(19)

Université Virtuelle Africaine

En forme de J

3 Skewed to the left ( Negative skewness) J –Shaped

Has equal frequency to the left and right

Elle a le maximum qui se produit du côté droit.

En forme de J inversé

4 Reverse J-Shaped U- shaped

Bimodal Multimodal

Has the maximum occurring at the left

end Has maxima at both ends

Has two maxima Has more than two maxima.

Elle a le maximum qui se produit du côté gauche.

En forme de U

4 Reverse J-Shaped U- shaped

Bimodal Multimodal

Elle a les maximums des deux côtés.

(20)

Université Virtuelle Africaine

Bimodal

4

Bimodal Multimodal

Elle a deux maximums.

Multimodal

4 Reverse J-Shaped U- shaped

Bimodal Multimodal

Has the maximum occurring at the left

end Has maxima at both ends

Has two maxima

Elle a plus de deux maximums.

Has more than two maxima.

(21)

Xi. lectures obligatoires

Lecture #1 : Wolfram MathWorld (visité le 05/06/07)

Référence complète : http://mathworld.wolfram.com/Probability

Résumé : Cette référence donne du matériel essentiel en probabilités et statisti- ques. Elle comporte plusieurs illustrations qui permettent à l’élève d’apprendre par lui-même à partir de différentes approches méthodologiques. Wolfram MathWorld est une encyclopédie en ligne spécialisée en mathématiques.

Motif : Il donne des références détaillées sur tous les sujets de mathématiques.

Les élèves devraient commencer en utilisant la faculté de recherche pour le module titre. En tout temps, l’étudiant devrait chercher pour des mots clés qu’ils doivent comprendre. L’entrée devrait être étudiée consciencieusement.

Lecture #2 : Wikipédia (visité le 05/06/07)

Référence complète : http://en.wikipedia.org/wiki/statistics

Résumé : Wikipédia est un dictionnaire en ligne. Il est écrit par ses propres lecteurs. Il est mis à jour très souvent puisque les entrées sont révisées constam- ment. De plus, il a été prouvé pour être très précis. Les entrées mathématiques sont très détaillées.

Motif : Il donne des définitions, des explications et des exemples que les élèves ne peuvent pas avoir accès dans d’autres ressources. Le fait que Wikipedia est souvent mis à jour donne à l’étudiant les approches les plus récentes, les arguments abstraits, des illustrations et se réfères à d’autres sources pour permettre à l’élève d’acquérir d’autres approches dans les probabilités et les statistiques.

Lecture #3: MacTutor history of mathematics (visité le 05/03/07)

Référence complète: http://www-history.mcs.standrews.ac.uk/Indexes Résumé : Le MacTutor Archive est l’histoire des mathématiques la plus compréhensive disponible sur internet. Les ressources sont organisées par personnages et par thèmes historiques.

Motif : Les étudiants devraient pouvoir chercher sur MacTutor pour des mots

clés dans les sujets qu’ils étudient (ou le module lui-même). Il est important

d’avoir une vue d’ensemble d’où les mathématiques qui sont étudiées vont dans

l’histoire des mathématiques. Lorsque l’étudiant termine un cours et enseigne

(22)

les mathématiques au secondaire, les personnages historiques des mathémati- ques donneront un peu plus de vie à la matière pour les étudiants. De plus, le rôle de la femme dans l’histoire des mathématiques devrait être étudié pour aider les étudiants à comprendre les difficultés auxquelles les femmes ont dû faire face tout en y apportant une importante contribution. Également, le rôle du continent africain devrait être étudié pour partager avec les étudiants dans les écoles : notamment les premiers outils de calcul (comme l’os d’Ishango) ainsi que le rôle des mathématiques égyptiennes.

(23)

Xii. ressources obligatoires

Ressource #1 : Maxima.

Référence complète : Une copie de Maxima est disponible sur le disque qui accompagne ce cours.

Résumé : La distance à laquelle les élèves sont occasionnellement confrontés à des mathématiques plus difficiles sans ressources pour les aider. L’absence de leçons avec un professeur en chair et en os rend parfois l’élève complète- ment handicapé s’il n’est pas bien équipé avec des ressources pour résoudre leurs problèmes mathématiques. Ce handicap peut être résolu en utilisant une ressource d’accompagnement : Maxima.

Motif : Maxima est un logiciel gratuit qui peut aider les élèves à résoudre des équations linéaires et quadratiques, des équations simultanées, des intégrations et des différentiels et qui peut aider à faire des manipulations algébriques : des factorisations, des simplifications, des expansions, etc. Ce logiciel est obligatoire pour les étudiants suivant des cours à distance puisqu’il les aide à apprendre plus vite en utilisant les aptitudes TIC déjà apprises.

Ressource #2 : Graph

Référence complète : Une copie de Graph est disponible sur le disque qui accompagne ce cours.

Résumé : Il est difficile de dessiner des graphiques de fonctions, spécialement avec des fonctions compliquées et plus particulièrement des fonctions en trois dimensions. Les élèves, qui apprennent à distance, vont tomber un jour ou l’autre sur des situations où ils auront besoin de faire des graphiques mathé- matiques. Ce cours est accompagné d’un logiciel appelé Graph qui aidera les élèves à faire des graphiques. Cependant, ils auront besoin de se familiariser avec le logiciel pour être en mesure de l’utiliser.

Motif :Graph est un logiciel gratuit pour créer des graphiques auquel les élèves

pourront avoir accès sur le CD fournit. Il est facile à utiliser lorsqu’un étudiant

investit du temps pour apprendre comment il fonctionne. Les élèves devraient

tirer avantage du logiciel parce qu’il peut les assister pour faire des graphiques

dans d’autres sujets pendant et après le cours. Ils le trouveront extrêmement

utile pour enseigner les mathématiques au niveau secondaire.

(24)

Xiii. liens utiles

Lien #1

Titre : Wikipédia

URL : http://en.wikipedia.org/wiki/Statistics

Description: Wikipédia est le dictionnaire de n’importe quel mathématicien.

Il est gratuit est mis à jour régulièrement. La plupart des élèves rencontreront des problèmes de matériel de référence de temps en temps. La plupart des livres disponibles ne couvrent que les probabilités et les statistiques. Cette pénurie de matériel de référence peut être vaincue en utilisant Wikipédia. Il est très facile à accéder avec « recherche Google ».

Motif : La disponibilité de Wikipédia résout les problèmes de matériel d’ap- prentissage dans toutes les branches des mathématiques. Les élèves devraient avoir de l’expérience avec Wikipédia pour les aider dans leur apprentissage.

C’est une ressource gratuite très utile qui ne fait pas que résoudre les problèmes des élèves, mais qui les dirige aussi vers d’autres sites internet connexes très utiles d’un simple clic sur les icônes.

Lien #2

Titre : Mathsguru

URL : http://en.wikipedia.org/wiki/Probability

Description: Mathsguru est un site internet qui aide l’élève à comprendre plusieurs branches du module de théorie des nombres. Il est facile à accéder à travers la barre de recherche Google et fournit de l’information très détaillés sur plusieurs questions de probabilités. Il offre des explications et des exemples pour que les élèves apprennent plus facilement.

Motif : Mathsguru donne plusieurs façons d’accéder à d’autres sujets connexes,

à des indices et des solutions qui peuvent être très pratiques pour les élèves

qui souffrent des frustrations pour trouver des livres pertinents qui peuvent

aider à résoudre des problèmes dans les probabilités. Il donne une approche

utile dans le calcul des probabilités eu égard aux diverses branches du module

de probabilités.

(25)

Lien #3

Titre : Mathworld Wolfram

URL :http://mathworld.wolfram.com/Probability

Description: Mathworld Wolfram est un site web différent rempli de solutions de probabilités. Les élèves ont accès à ce site très facilement avec la barre de recherche Google.Wolfram guide aussi l’élève vers d’autres sites internet utiles qui couvrent le même sujet pour aider encore plus l’élève à comprendre.

Motif : Wolfram est un site utile qui fournit des aperçus dans plusieurs théories des nombres tout en fournissant de nouveaux défis ainsi qu’une méthodologie dans la théorie des nombres. Le site devient très pratique dans la modélisation et être très recommandée pour les étudiants qui souhaitent étudier la théorie des nombres ainsi que d’autres branches des mathématiques. Il donne des liens vers d’autres sites web en fournissant aux élèves beaucoup d’informations dont ils ont besoin dans les probabilités et les statistiques.

(26)

XiV. activités d’apprentissage

Unité 1 40 heures

Les statistiques illustrées et la distribution de probabilités Un curieux fermier entreprend les activités suivantes sur sa ferme.

1. Elle plante 80 arbres le 1^er mars. Elle mesure la hauteur des arbres le 1^er dé- cembre.

2. Elle pèse les 40 vaches sur sa ferme et enregistre les poids dans sa laiterie.

3. Elle enregistre la production journalière des œufs dans sa section de vo- lailles.

4. Elle enregistre le temps utilisé pour livrer le lait vers l’usine de traitement Voici les enregistrements.

1. La hauteur des arbres en cm :

77 76 68 85 63 68 82 67 75 68

74 85 71 53 78 60 81 80 88 73

75 53 95 71 85 74 73 62 75 61

71 68 69 83 95 94 87 78 82 66

60 83 60 68 77 75 75 78 89 96

72 71 76 63 62 78 61 65 67 79

75 53 65 85 93 88 97 79 73 65

93 85 76 76 90 72 57 84 73 86

2. Le poids des vaches en kg :

Poids (kg) 118-126 127-135 136-144 145-153 154-162 163-171 172-180 Nb de va-

ches 3 5 9 12 5 4 2

(27)

3. Le nombre d’œufs pondus :

Œufs 462 480 498 516 534 552 570 588 606 624

Nb de

jours 98 75 56 42 30 21 15 11 6 2

4. Le temps pour livrer le lait dans vers l’usine de traitement :

Temps en

minutes 90-100 80-89 70-79 60-69 50-59 40-49 30-39

Nb de jours 9 32 43 21 11 3 1

Problème #1 :

Une entreprise locale commerçant avec des services d’extensions d’agriculture visite le fermier. Il montre fièrement ses enregistrements. L’officier d’agriculture est très impressionné par ses enregistrements, mais il réalise que le fermier a besoin de plus de capacités dans la gestion de données pour pouvoir l’aider à prendre de meilleures décisions en se basant sur les résultats de sa ferme.

L’officier a créé un petit cours sur le traitement de données pour les fermiers ru- raux.

Pendant la planification du cours, les termes suivants ont été définis pour la leçon un pour les fermiers.

a) Donnée : le résultat d’observation. Ex. : la hauteur des arbres.

b) Fréquence : La fréquence. Ex. : Le nombre de vaches pesées.

c) Moyenne : La moyenne des données.

d) Mode : La donnée la plus haute.

e) Médiane : Dans des données ascendantes, la médiane est le nombre au milieu de la suite.

f) Étendue : La différence entre la donnée la plus haute et la plus basse.

Leçon un : Les mesures de dispersion Introduction aux statistiques

Les statistiques descriptives sont utilisées pour indiquer n’importe laquelle des techniques utilisées pour résumer un ensemble de données. Dans un sens, nous utilisons les données sur des membres d’un ensemble pour le décrire. Les techniques sont classées comme :

1. Une description graphique dans laquelle nous utilisons des graphiques pour résumer les données.

(28)

2. Une description sous forme de tableau dans lequel celui-ci est utilisé pour résumer les données.

3. Des descriptions paramétriques dans lesquelles nous estimons les valeurs de certains paramètres dans lequel nous complétons la description de l’ensemble de données.

En général, les données statistiques peuvent être décrites comme une liste de sujets ou d’unités et les données peuvent être associées avec chacune d’elles. Nous avons deux objectifs pour notre résumé :

1. Nous voulons choisir une statistique qui démontre la différence des unités dans leur similarité. Les livres de statistique appellent la solution de cet objectif une mesure de la tendance centrale.

2. Nous voulons choisir une autre statistique qui montre comment elles sont différentes. Ce genre de statistique est souvent appelé une mesure de la va- riabilité statistique.

Lorsque nous résumons une quantité comme la longueur, le poids ou l’âge, il est commun de répondre à la première question avec une moyenne arithmétique ou avec le mode.Parfois, nous choisissons des valeurs spécifiques de la fonction de distribution cumulative appelée quartiles.

Les mesures de variabilité les plus communes pour les données quantitatives et la variance sont la racine carrée, l’écart type, l’étendue statistique, l’étendue interquartile et l’écart absolu.

Leçons de fermiers

Les fermiers apprennent comment calculer les : a) Moyennes des données suivantes :

La moyenne de données = Somme totale des données divisées par le nombre d’objets dans les données.

Exemple :

Calculer la moyenne des données suivante : 1) 1,3, 4,4, 5,6, 3,7

Réponse : Moyenne =

8

7 3 6 5 4 4 3

1+ + + + + + + = 8

33 = 4.125

2) 650,675, 700, 725, 800, 900, 1050, 1125, 1200, 575

(29)

Réponse: Moyenne =

10

575 1200 1125

1050 900 800 725 700 675

650 + + + + + + + + +

= 10 8400 = 840

Leçon deux: La moyenne d’une donnée discrète

Exemple :

1) Trouvez la moyenne des données suivantes :

X 22 24 25 33 36 37 41

f 5 7 8 4 6 9 11

Réponse : Moyenne =

11 9 6 4 8 7 5

) 11 ( 41 ) 9 ( 37 ) 6 ( 36 ) 4 ( 33 ) 8 ( 25 ) 7 ( 24 ) 5 ( 22

+ + + + + +

+ +

= 50

1628 = 32.56

2) Trouvez la moyenne du salaire des travailleurs :

Salaire en $ 220 250 300 350 375

Nb de travailleurs 12 15 18 20 5

Réponse :Moyenne =

5 20 18 15 12

) 5 ( 375 ) 20 ( 350 ) 18 ( 300 ) 15 ( 250 ) 12 ( 220

+ + + +

+ +

+

+ =

70 20665

= $ 295.214

(30)

Tableaux de fréquences et moyenne d’ensemble de données

Exemple :

Voici le poids de commandes de lait vers une usine de traitement :

45 49 50 46 48 42 39 47 42 51

48 45 45 41 46 37 46 47 43 33

56 36 42 39 52 46 43 51 46 54

39 47 46 45 35 44 45 46 40 47

a) Une utilisant un intervalle de classe de 5, entrez ces données dans un tableau de fréquences.

b) Calculez la masse moyenne du lait livré.

Réponse :

Tableaux de fréquences / Comptage

Classe Comptage Fréquence

33- 37 //// 4

37-42 ///// /// 8

43-47 //////////// /// 19

48-52 //// // 7

53-57 // 2

Total 40

c) La moyenne d’un groupe de données

Classe Comptage Fréquence(f) Point milieu (x) fx

33- 37 //// 4

2 35 37

33+ = 4×35= 140

37-42 ///// /// 8 40 320

43-47 //////////// /// 19 45 855

48-52 //// // 7 50 350

53-57 // 2 55 110

Total 40 1775

(31)

Moyenne = 44.375 40

1775 =

∑

=

∑

f fx

Exercices

Trouvez la moyenne de :

1) 63, 65, 67, 68, 69 2)

x 1 2 3 4 5

f(x) 11 10 5 3 1

3)

Poids (x) 4-8 9-13 14-18 19-23 24-28 29-33

Fréquence 2 4 7 14 8 5

4) 91,78, 82,73,84

5)

Hauteur (x) 61 64 67 70 73

Fréquence 5 18 42 27 8

6)

Poids (x) 30.5-36.5 36.5-42.5 42.5-48.5 48.5-54.5 54.5-60.5

Fréquence 4 10 14 27 45

Réponses :

1). 66.4 2). 2.1 3). 20.6

4) 80 5) 76.45 6) 51.44

(32)

Leçon trois : Le mode Exemple :

1) Trouvez le mode dans les données suivantes :

1,3,4,4,5,6,1,3,3,2,2,3,3,5

Solution :

Le mode est la donnée qui apparaît le plus souvent. Dans cette suite, le 3 est celui qui apparaît le plus de fois ou le plus fréquemment : 5 fois. Donc, le mode de cette suite de données est 3.

2) Trouvez le mode dans les données suivantes :

22, 24, 25,22, 27, 22, 25, 30, 25, 31

Solution :

22 et 25 apparaissent trois fois chacun. Donc, les modes sont 22 et 25. C’est ce qu’on appelle des données bimodales.

3) Trouvez le mode dans les données suivantes :

Observation ( X) 0 1 2 3 4

Fréquence ( f) 3 7 10 16 11

Solution:

La donnée qui revient le plus souvent est le 3: il apparaît 16 fois.

4) Trouvez la classe modale dans les données suivantes :

Poids ( X) 50 – 54 55-59 60-64 65-69 70-74 75-79 80-84

Fréquence ( f) 3 6 8 5 15 9 13

Solution :

La classe modale est 70-74, car elle a la plus haute fréquence d’occurrence.

(33)

Exercices

Trouvez les modes ou les classes modales des données suivantes : 1) 6, 8, 3,5,2,6,5,9,5

2) 20.4, 20.8, 22.1, 23.4, 19.7, 31.2, 23.4, 20.8, 25.5,23.4 3)

Poids (x) 4-8 9-13 14-18 19-23 24-28 29-33

Fréquence 2 4 7 14 8 5

4)

Poids (x) 30.5-36.5 36.5-42.5 42.5-48.5 48.5-54.5 54.5-60.5

Fréquence 4 10 14 27 45

Réponses :

1) 5 2) 23.4 3) 19-23 4) 54.5-60.5

Leçon quatre : La médiane

La médiane

La médiane est la valeur au centre d’une distribution. Dans une suite 1, 2, 3, 4, 5, la médiane est 3, car elle est exactement au centre de la distribution. Pour la suite 1, 2, 2, 3, 4, 5, 6, 7, 7, 8; il y a 10 nombres et aucun nombre au centre. Dans un cas comme celui-là, la médiane est la moyenne des deux nombres du centre.

Ex. : 1,2,2,3, 4, 5 ,6,7,7, 8

Donc, la médiane est 2

4 +5_{= 4.5}

(34)

La médiane d’ensemble de données Exemple:

Trouvez la médiane des ensembles de données suivants:

Masse ( X) 20-24 25-29 30-34 35-39 40-44

Féquence (f) 4 10 16 8 2

Solution :

∑ ^f ^{= 40}

, donc la médiane est la moyenne de la 20^e et de la 21^e donnée 2

20 +21_=10.5

Définition : Les limites de classe supérieures et inférieures

La limite de classe inférieure (LCI) et la limite de classe supérieure (LCS) sont les limites d’un intervalle de classe. Ex. : Les limites inférieures et supérieures d’un intervalle de classe 20-24 sont 19.5 et 20.5 et la LCI ainsi que la LCS d’un intervalle de classe 35-39 sont 34.5 et 39.5.

Masse ( X) 20-24 25-29 30- 34 35-39 40-44

Fréquence cumulative 4 4+10=14 14 + 16 = 30 30+8=38 39+2 =40

Voici la procédure pour calculer la médiane :

Étape 1 : La médiane apparaît dans l’intervalle de classe 30-34 Étape 2 : La LCI ainsi que la LCS de 30-34 sont 29.5 et 34.5.

Étape 3 : Trouver la fréquence cumulative (FC).

Étape 4 : Trouver l’intervalle de classe, LCI et LCS.

Étape 5 : Avoir le 10.5^e terme.

10.5^e terme = LCI de la classe avec la médiane + Différence de sommation x Intervalle de classe.

Fréquence de classe

(35)

La différence de sommation 20.5 – 14 = 6.5 où 14 est la FC de l’intervalle de classe 25-29.

Étape 6 : La médiane 29.5 +

5 16

6.5 ×

= 31.53125.

Notez que le dénominateur 16 est la fréquence de classe dans l’intervalle de classe 30-34.

L’étendue

L’étendue est tout simplement la différence entre le chiffre le plus haut et le chiffre le plus bas dans une suite de données.

Exemple : 23, 26, 34, 47, 63, l’étendue est 63-23 = 40, et dans 121, 65, 78, 203, 298,174, l’étendue est 298-65= 233.

Leçon cinq : Les mesures de dispersion 1) Les quartiles :

Ce sont des données placées dans un ordre de magnitude qui peuvent être divisées en quatre portions égales, 25 % chacune. La première portion est le quartile le plus bas qui apparaît à 25 %. Celui du milieu, ou du centre, à 50 % est appelée la médiane, tandis que le troisième quart qui apparaît à 75 % s’appelle le quartile supérieur. Les trois points sont généralement écrits comme ceci : Q₁, Q₂ , Q_3.

2) L’étendue semi-interquartile :

L’étendue semi-interquartile ou la déviation quartile est définie comme :

2

1

3 Q

Q Q −

=

3) Les déciles :

Si les données sont placées dans un ordre de magnitude et divisées en 10 portions égales (10 % chacune), donc chaque portion constitue un décile. Les déciles sont écrits comme ceci : D₁, D₂, D₃,……D_9.

4) Les percentiles :

Si les données sont divisées et placées dans un ordre de magnitude subdivisé en 100 parties égales (1 % chacune), donc la portion constitue un percentile. Les percentiles sont écrits comme ceci : P₁, P₂, P₃…, P_99.

7

(36)

L’écart moyen

L’écart moyen d’un ensemble de N nombres X₁ ,X₂, X₃, X₄,X₅,……, X_Nest défini par :

Écart moyen (EM) =

N N j

j X

∑ X

=

−

1 =

N X

∑

X ⁻ ₌ _{X −} _X _{, où}

_X

_{est la}

moyenne arithmétique des nombres et X − X est la valeur absolue de la déviation de Xj à partir de

X

^.

Exemple

Trouvez l’écart moyen de la suite 3, 4, 6, 8, 9.

Solution

Moyenne arithmétique = 6

5 30 5

9 8 6 4

3+ + + + = =

Écart moyen (

X

) =

5 6 9 6 8 6 6 6 4 6

3 − + − − + − + −

=

5

3 2 0 2

3 + − + + +

− = 5

2 10 5

3 2 0 2

3+ + + + = =

(37)

L’écart moyen d’un groupe de données Pour les données

Valeurs X₁ X₂ X₃ …… X_N

Fréquences f₁ f₂ f₃ …. F_m

L’écart moyen peut être calculé ainsi :

Écart moyen = X X

N X X f N

m j

j X j X f

−

∑ − =

=

∑

=

− 1

L’écart-type

L’écart-type d’un ensemble de N nombres X₁ ,X₂, X₃, X₄, X₅,……, X_Nest représenté par s et est défini par :

s = N

N j

j X

∑ X

=

− 1

)2 (

= N

X

∑

⁽X ⁻ ⁾² ₌ N

∑

x² ₌ ₍_{X −} _X₎²

où x représente la déviation des nombres X

j de la moyenne

X

. Il suit que l’écart- type est la variance des déviations de la moyenne.

L’écart-type d’un groupe de données

Valeurs X₁ X₂ X₃ …… X_N

Fréquences f₁ f₂ f₃ …. F_m

L’écart-type est calculé ainsi :

s =

1 ( ) 2 2 ( ) 2

) 2 (

X N X

fx N

X X f N

m

j f j X X

−

∑ =

∑ − =

=

∑

=

−

(38)

oú N= ∑ = ∑

= m f j fj

1

.

La variance

La variance d’un ensemble de données est définie comme le carré de l’écart-type : variance = s². Nous utilisons parfois s pour représenter l’écart-type d’un échantillon de population et

σ

(sigma en lettre grecque) pour représenter l’écart-type d’une population. De plus,

σ 2

peut représenter la variance d’une population et s², la variance d’un échantillon d’une population.

Exemples

Trouvez la moyenne et l’étendue des données suivantes : 5, 5, 4, 4, 4, 2, 2, 2.

Solution

Moyenne = mm n N

∑

x =

5 5 4 4 4 4 2 2 2

9 + + + + + + + +

= 356 .

Étendue 5-2=3

Observation de la médiane Exemple

Dans 13 observations 1,1,2,3,4,4,5,6,8,10,14,15,17

La médiane = n +

= =

1 2

14 2 607 La valeur

2

14 = 7^th position. La médiane est 5.

Si n est impair, la médiane est la valeur dans la position n + 1

2

Par contre, si elle est paire, nous ferons la moyenne des deux nombres du centre.

(39)

Exemple

1,1,2,2,3,4,4,5,6,8,10,14,15,17

La médiane = la moyenne des deux nombres du centre = 4 5 2 4 5 + = .

La médiane et les groupes de données

Lorsque des données sont regroupées ensemble, la médiane

χ

²est la valeur exacte ou en dessous de 50 % du point d’observation.

Exercices

Trouvez la médiane des données suivantes.

1. 1,1,2,2,3,4,5,7,7,7,9 2. 7,8,1,1,9,19,11,2,3,4,8

Définition

La moyenne de l’écart mis au carré est appelée la variance :

N x s x

h 2

2 Σ ( − ⁻)

=

Où : x− x⁻ est la déviation de la moyenne, N est le nombre d’observations, s est ² la variance et s est l’écart type.²

Exemple

Les données 2, 4, 5, 8, 11 vous sont données. Trouvez la variance et l’écart type.

X ₋

x− x (x− x⁻)²

2 -4 16

4 -2 4

5 -1 1

8 2 4

11 5 25

∑

^x

=5 ∑

⁽^x^{− x}⁻⁾²

=50

q Travail d’équipe

1. Étudiez le calcul de la va-

riance et de l’écart type des

exemples

(40)

Donc, 6 5 30 =

− =

x 10

5 5² = 50 =

Variance = 10

5

2 50

= s =

Écart type = √10

Exercices

1. Calculez l’étendue des données : 1,1,1,2,2,3,3,3,4,5 2. Calculez la variance et l’écart type : 1,2,3,4,5 Asymétrie

Notons que lorsque la distribution d’une variable à travers son histogramme est sy- métrique, alors les trois caractéristiques de tendance centrale, à savoir : le mode, la médiane et la moyenne de cette variable, sont égaux. Dans le cas unimodal, lorsque la distribution est asymétrique, la médiane est généralement comprise entre le mode et la moyenne arithmétique : deux cas se présentent alors :

• mode<médiane<moyenne la distribution est étalée vers la droite ;

• mode>médiane>moyenne la distribution est étalée vers la gauche.

Définition : L’asymétrie est le degré de déviation de la symétrie d’une distribution.

(Voir les asymétries positives et négatives plus haut.)

Pour les distributions asymétriques, la moyenne tend à aller dans le même sens que celui du mode avec la queue la plus longue.

Le premier coefficient d’asymétrie de Pearson Le premier coefficient d’asymétrie est défini par :

Asymétrie =

€

moyenne−mode

écart − type = X −mode s

Le deuxième coefficient d’asymétrie de Pearson Le second coefficient de Pearson est défini par :

Asymétrie =

€

3(moyenne(X )− médiane(X ))

écart − type(X ) = 3(X − mediane(X )) s

(41)

Coefficient quartile d’asymétrie Il est défini comme par :

Coefficient quartile d’asymétrie =

1 3

1 2 2

3 1

3

1) ( 2

2) ( 3

Q Q

Q Q Q Q

Q

Q Q Q

Q

− +

= −

−

L’asymétrie 10-90 percentile Elle est définie comme ceci :

Asymétrie 10-90 percentile =

10 90

10 2 50

90 10

90 10 ) ( 50

50 ) ( 90

P P

P P P

P P

P P P

P

− +

= −

−

Exemple : Trouvez le 25^e percentile des données 1, 2, 3, 4, 5, 6, 7, 9

25^e percentile =

€

(n +1)x0.25

9(.25) = 22.5(centile) 2^e = 2

3^e = 3 2.25 ⇒ 0.25(1)+2 = 2.25

Trouvez le 50^e percentile

50^e percentile =

( 8 + 1 ) x . 50 = 9 (. 5 ) = 4 . 5 percentile

4^e = 4

5^e = 5 0.5(5) =0.5+4 =4.5 Le (1) est l’étendue 5-4=1.

q Travail d’équipe

1. Étudiez le calcul des percen- tiles et tentez de répondre à la prochaine question…

suivants.

(42)

Exercices

Trouvez le 25ê percentile, le 50ê percentile et le 90ê percentile.

46,21,89,42,35,36,67,53,42,75,42,75,47,85,40,73,48,32,41,20,75,48,48,32,52,61,49 ,50,69,59,30,40,31,25,43,52,62,50

Réponses

a) 36 b) 48 c) 73

Kurtosis ou le coefficient d’aplatissement

Définition : Le kurtosis est le degré d’aplatissement d’une distribution, comparé à la distribution normale.

Exemples

1) Distribution leptokurtique ou hypernormale :

Une distribution avec un sommet plutôt élevé

2) Distribution platicurtique ou hyponormale :

Une distribution ayant un sommet plat

(43)

3) Distribution mésocurtique

Une distribution normale – ni élevée, ni plate

Exercices

Trouvez le mode des collectes de données suivantes : 1) 1,3,4,4,2,3,5,1,3,3,5,4,2,2,2,3,3,4,4,5

2) Nombre de mariages pour 1000 personnes dans la population africaine pour les années 1965 à 1975.

Année Taux

1965 9.3

1966 9.5

1967 9.7

1968 10.4

1969 10.6

1970 10.6

1971 10.6

1972 10.9

1973 10.8

1974 10.5

1975 10.0

3) Nombre de morts pour 1000 personnes pour les années 1960 et 1965 à 1975.

1960 9.5

1965 9.4

1966 9.5

1967 9.4

(44)

1968 9.7 1969 9.5

1970 9.5

1971 9.3

1972 9.4

1973 9.3

1974 9.1

1975 8.8

Réponses 1. 3 2. 10.6 3. 9.5

À lire

An introduction to probability par Charles M. Grinstead, pages 247 à 263.

Faire les exercices des pages 263 à 267, numéros 4, 7, 8, 9.

Probabilités

1) Univers des possibles (ou Espace d’échantillon) et évènements

Terminologies

a) Une expérience de probabilités

Lorsque vous lancez une pièce de monnaie, lorsque vous prenez une carte dans un paquet de cartes ou lorsque vous lancez un dé, vous faites une expérience de proba- bilités. Dans une expérience de probabilités, les chances sont bien définies avec des chances égales d’occurrence – il y a seulement deux chances possibles lorsque vous lancez une pièce de monnaie. Vous aurez soit pile, soit face. Le côté face et le côté pile ont des chances égales.

b) Un résultat

Il est défini comme le résultat d’un seul essai d’une expérience de probabilités – lorsque vous lancez une pièce de monnaie une seule fois, vous aurez soit pile, soit face.

(45)

c) Un essai

Il se réfère à l’activité de faire une expérience, comme tirer une carte d’un paquet de cartes ou bien de lancer des dés.

d) Un Univers des possibles

Il se réfère à toutes les possibilités d’une expérience de probabilités – lorsque vous lancez une pièce de monnaie, vous obtiendrez soit face (F), soit pile (P). Il n’y a que deux résultats possibles lorsque vous lancez une pièce de monnaie. Les chances d’obtenir pile ou face sont égales.

e) Un évènement simple et un événement composé

Dans une expérience de probabilités, un évènement avec une seule possibilité de résultat est appelé un évènement simple. Si un évènement a plus de deux possibilités, il est appelé évènement composé.

2) Définition des probabilités

Les probabilités peuvent être définies comme les mathématiques de la chance. Il y a quatre approches principales aux probabilités;

i. L’approche classique ou a priori ou approche pascalienne

ii. La fréquence relative ou l’approche expérimentale : l’approche fréquentiste iii. L’approche axiomatique

iv. L’approche subjective (ou approche personnaliste) L’approche classique ou a priori

Les probabilités sont le ratio du nombre de cas favorables comparé au total de cas possibles. C’était la conception originelle des probabilités initiée le physicien ma- thématicien Pascal vers l’an 1654 dans le contexte de loterie basée sur un jeu de hasard. Cette idée fut poursuivie par Fermat, contemporain de Pascal. Imaginez qu’un événement se produit N fois sur un total M de manières possibles. La probabilité d’occurrence de l’évènement est désignée par :

p=Pr(N)=

M

N . La probabilité se réfère au rapport de résultats favorables sur tous les résultats possibles.

La probabilité de non-occurrence du même évènement est donnée par (1-p(occurrence)).

La probabilité d’occurrence plus celle de la non-occurrence est égale à un.

Si la probabilité d’occurrence est P(O) et la probabilité de non-occurrence P(O^c), alors P(O)+P(O^c)=1.

(46)

Les probabilités expérimentales : les fréquences relatives

Les probabilités expérimentales surviennent lorsque la fréquence des distributions n’est pas utilisée. On s’intéresse à un événement A attaché à une expérience; on pro- cède à un nombre assez élevé n de répétitions de ladite expérience dans les mêmes conditions et indépendamment les unes des autres : la probabilité de l’événement A est définie comme la limite de sa fréquence relative lorsque n tend vers plus l’infinie, soit :

P(A) =

€

n lim⎯ ⎯ ⎯ ⎯ ⎯ ⎯ ⎯ Fréquence(A)⎯ +∞→

Ainsi, dans la pratique on interprète une fréquence relative comme une probabilité, approximativement au moins : Fréquence(A) @ P(A).

Exemple :

Observation ( X) 0 1 2 3 4

Fréquence ( f) 3 7 10 16 11

La probabilité d’observation (X) qui apparaît 2 fois est donnée par la formule :

P(2)=

€

fréquence de 2

somme des fréquences= f(2)

∑f = 10

3+ 7 +10 +16 +11= 10 47

L’approche axiomatique

Genèse des probabilités. Sur le plan historique, de l’année 1663 jusqu’en 1933, notons que les probabilités constituaient une discipline des sciences physiques, vraisemblablement parce que la majorité des promoteurs du calcul des probabilités furent plutôt des physiciens comme Pascal, Fermat, Huyghens, Bernoulli(vers 1700), Gauss (1809), Laplace(1812), etc. Il a fallu attendre les travaux du mathématicien russe N. Kolmogorov publiés en 1933 qui a démontré la possibilité d’une approche axiomatique des probabilités, y compris le concept dfe probabilité conditionnelle, pour que celles soient enfin acceptées d’intégrer les domaines des sciences mathé- matiques. En 1955 et 1956, A. RENYI démontra dans théorie d’espace de probabilité conditionnelle,la possibilité de généraliser l’axiome de Kolmogorov. Ensuite, récem- ment, Sylvia Pulmannova (1991), dans les algèbres de Von Neumann, a construit une généralisation de l’axiomatique de A. RENYI. Tout ceci montre un rapide essor de la théorie de probabilité à partir du moment où l’on s’est aperçu que toute probabilité peut être considérée comme probabilité conditionnelle. S’il a fallu ainsi presque trois siècles (de 1663 à 1933) pour découvrir cette approche axiomatique, le concept de probabilité étant alors dégagé à la fois du contexte numérique, de la chronologie et de la causalité, ce grand bond en avant n’a demandé que quelques dizaines d’an- nées. Cependant, l’emploi des mots de Formule et Loi demeurent toujours jusqu’à

(47)

aujourd’hui : c’est une trace indélébile de l’origine physicienne des probabilités!

Il est heureux d’apprécier par la suite l’impact positif de cette reconnaissance du statut de discipline mathématique des probabilités sur l’avancement notable des mathématiques et surtout celui de l’informatique, laquelle s’est avérée un moteur de la nouvelle technologie de l’information et de communication de notre ère moderne.

Ceci amène à penser que trop s’attacher au contexte numérique ou expérimental pour introduire les probabilités, et attacher trop de chronologie ou de causalité à la notion de probabilité conditionnelle, seraient des sources d’obstacles épistémologiques dans la compréhension des concepts de probabilité et de probabilité conditionnelle.

Axiomes de Kolmogorov et définition. On considère un ensemble non vide E des résultats possibles d’une expérience et une famille T des parties de E qui contient E lui-même et à la fois stable par complémentation et par réunion dénombrable, famille appelée une tribu sur E. Alors le couple (E, T) porte le nom d’espace probabilisable.

On appelle probabilité définie sur l’espace probabilisable (E, T), toute application de type P définie sur la tribu T à valeurs réelles positives et qui satisfait aux deux propriétés suivantes :

(i) Axiome de normalisation : P(E) = 1.

(ii) Axiome d’additivité dénombrable :

Pour toute suite (A_n)_n d’événements dans T, deux à deux incompatibles, on a :

P(

€

An n=0

+∞U ) =

€

p( nA ) n=0

+∞∑ .

Terminologies : Soit P une probabilité définie sur un espace probabilisable (E, T).

On dit alors que (E, T, P) est un espace probabilisé. Pour tout événement A de T, le nombre P(A) est la probabilité pour que l’événement se réalise, ou la probabilité de l’événement A.

Interprétation : Il y aurait 100P(A) % de chance pour que l’événement A se pro- duise.