INTRODUCTION A LA STATISTIQUE ET A LA PROBABILITE

(1)

INFORMATIQUE APPLIQUÉE: MAT 1202

INTRODUCTION A LA STATISTIQUE ET A LA PROBABILITE

Diby Diarra

(2)

Avant-propos

L’Université Virtuelle Africaine (UVA) est fière de participer à accès à l’éducation dans les pays africains en produisant du matériel d’apprentissage de qualité. Nous sommes également fiers de contribuer à la connaissance globale, pour nos ressources éducatives sont principalement accessibles de l’extérieur du continent africain.

Ce module a été développé dans le cadre d’un programme de diplôme et diplôme en

informatique appliquée, en collaboration avec 18 institutions partenaires dans 16 pays africains.

Un total de 156 modules ont été développés ou traduits pour assurer la disponibilité en anglais, français et portugais. Ces modules sont également disponibles en tant que ressources éducatives ouvertes (OER) à oer.avu.org.

Au nom de l’Université Virtuelle Africaine et notre patron, nos institutions partenaires, la Banque africaine de développement, je vous invite à utiliser ce module dans votre

établissement, pour leur propre éducation, partager aussi largement que possible et participer activement aux communautés AVU de pratique d’intérêt. Nous nous engageons à être à l’avant-garde du développement et de partage ouvert de ressources pédagogiques.

L’Université Virtuelle Africaine (UVA) est une organisation intergouvernementale

panafricaine mis en place par lettre recommandée avec un mandat d’augmenter l’accès à l’enseignement supérieur et de formation de qualité grâce à l’utilisation novatrice des technologies de communication de l’information. Une charte instituant la UVA Organisation intergouvernementale, signée à ce jour par dix-neuf (19) Les gouvernements africains - Kenya, Sénégal, Mauritanie, Mali, Côte d’Ivoire, Tanzanie, Mozambique, République démocratique du Congo, Bénin, Ghana, République de Guinée, le Burkina Faso, le Niger, le Soudan du Sud, le Soudan, la Gambie, la Guinée-Bissau, l’Ethiopie et le Cap-Vert.

Les institutions suivantes ont participé au programme informatique appliquée: (1) Université d’Abomey Calavi au Bénin; (2) University of Ougagadougou au Burkina Faso; (3) Université Lumière Bujumbura Burundi; (4) Université de Douala au Cameroun; (5) Université de Nouakchott en Mauritanie; (6) Université Gaston Berger Sénégal; (7) Université des Sciences, Techniques et Technologies de Bamako au Mali (8) Institut de la gestion et de l’administration publique du Ghana; (9) Université des sciences et de la technologie Kwame Nkrumah au Ghana; (10) Université Kenyatta au Kenya; (11) Université Egerton au Kenya; (12) Université d’Addis-Abeba en Ethiopie (13) Université du Rwanda; (14) University of Salaam en Tanzanie Dar; (15) Université Abdou Moumouni Niamey Niger; (16) Université Cheikh Anta Diop au Sénégal; (17) Université pédagogique au Mozambique; E (18) L’Université de la Gambie en Gambie.

Bakary Diallo le Recteur

Université Virtuelle Africaine

(3)

Crédits de production

Auteur

Diby Diarra

Pair Réviseur

Marie Françoise Ouedraogo

UVA – Coordination Académique

Dr. Marilena Cabral

Coordinateur global Sciences Informatiques Apliquées

Prof Tim Mwololo Waema

Coordinateur du module

Florence Tushabe

Concepteurs pédagogiques

Elizabeth Mbasu Benta Ochola Diana Tuel

Equipe Média

Sidney McGregor Michal Abigael Koyier

Barry Savala Mercy Tabi Ojwang

Edwin Kiprono Josiah Mutsogu

Kelvin Muriithi Kefa Murimi

Victor Oluoch Otieno Gerisson Mulongo

(4)

Droits d’auteur

Ce document est publié dans les conditions de la Creative Commons Http://fr.wikipedia.org/wiki/Creative_Commons

Attribution http://creativecommons.org/licenses/by/2.5/

Le gabarit est copyright African Virtual University sous licence Creative Commons Attribution- ShareAlike 4.0 International License. CC-BY, SA

Supporté par

Projet Multinational II de l’UVA financé par la Banque africaine de développement.

(5)

Table Des Matières

Avant-propos 2

Crédits de production 3

Droits d’auteur 4

Supporté par 4

Cousre Overview 8

Evaluation 8

Unité 0. Évaluation diagnostique 9

Vocabulaire de la statistique 9

Activité 0 - GENERALITES. 9

Unité 1 : Analyse Univariee 13

1 1 REPRESENTATION GRAPHIQUE 13

1. 1. 1. Caractère qualitatif 13

1. 1. 2. Caractère quantitatif 15

II. 2. PARAMETRES CARACTERISTIQUES 19

II. 2. 1. Paramètres de position 19

II. 2. 1. 1. Le mode 19

II. 2. 1. 2. La médiane 20

Unité 2: Probabilité Sur un Espace Fini 21

Introduction 21 Dénombrement et loi de probabilité 21

I. Dénombrement. 21

Factorielle d’un entier naturel. 21

3. Combinaisons. 22

II. Loi de Bernoulli et loi binomiale. 23

1.3 Loi uniforme : densité homogène 25

Unit 3: La loi Normale 34

Du discret au continu 34

La loi normale centrée réduite 34

(6)

3.4 Théorème Central-Limit (hors programme) 42

Probabilité sur un espace fini 42

II. CONDITIONNEMENT 43

III. INDÉPENDANCE 45

II. CONDITIONNEMENT 48

III. INDÉPENDANCE 50

IV. DENOMBREMENT 53

Probabilités – Terminale S11 54

Types de tirages 55

Unit 4. Danslavie Quotidiennenous 56

Introduction 56

Objectifs de l’unité 56

Termes clés 57

Activités d’apprentissage 60

Activité 1.1 Concepts de base 60 Détails de l’activité 60

ÉTAPES DE CALCULLA PROBABILITÉ D’UN ÉVÉNEMENT 61

probabilité conditionnelle 62

Exemple 63 Solution: 63 Instructions: Résoudre l’exercice suivant 64 Conclusion 64 Affectation 65

scanner d’attaque 65 Mobile en Gambie 65 activité 1.2 - Variables aléatoires et leurs distributions 65 Activité Détails 65

Propriétés 67

Indépendance de variables aléatoires: 67

Propriétés:. 67

(7)

Propriétés covariance: 68

Conclusion 70

Affectation 70

réponsetoutes les questions 70

Activité 1.3 Probabilité conjointe Distributions 71 Activité Détails 71 Convolutionsde distributions discrètes communes 72

Propriétés covariance: 73

Propriétés pour X et Y indépendants: 73

de(leX,Y)Properties: 74

Propriété distribution 74

Objectifs du cours 75

(8)

Cousre Overview

Evaluation

Les évaluations formatives (vérification de progrès) sont incluses dans chaque unité.

Les évaluations sommatives (tests et travaux finaux) sont fournies à la fin de chaque module et traitent des connaissances et compétences du module.

Les évaluations sommatives sont gérées à la discrétion de l’établissement qui offre le cours. Le plan d’évaluation proposé est le suivant:

Outils d’évaluation formative pour vérifier les progressions de l’élève ou des élèves.

A la fin de chaque module sont présentés les outils d’évaluation sommative, comme les tests et Travaux finaux, qui comprennent les connaissances et les compétences étudiées dans le module.

La mise en œuvre des instruments d’évaluation sommative est à la discrétion de l’institution qui offre le cours.

La stratégie d’évaluation proposée se résume dans le tableau suivant.

1 2 3 4 5

Unité0:(évaluation formative) Unité 1 (évaluation formative) Unité 2 (évaluation formative) Unité 3 (évaluation formative) Module (évaluation sommative)

10%

20%

30%

10%

unité de synchronisation

sujets et des activités Temps estimés

Unité 0 Conférences + pratique + évaluation de la formation 12 heures Unité 1 Conférences + pratique + évaluation de la formation 24 heures Unité 2 Conférences + pratique + évaluation de la formation 36 heures Unité 3 Conférences + pratique + évaluation de la formation 36 heures Evaluation

finale

Evaluation de sortie 12 heures

(9)

Unité 0. Évaluation diagnostique

Unité 0. Évaluation diagnostique

Vocabulaire de la statistique

Activité 0 - GENERALITES.

0. 1. OBJET DE LA STATISTIQUE

Le but de la statistique est de dégager les significations de données, numériques ou non, obtenues au cours de l’étude d’un phénomène.

Il faut distinguer les données statistiques qui sont les résultats d’observations recueillies lors de l’étude d’un phénomène, et la méthode statistique qui a pour objet l’étude rationnelle des données. La méthode statistique comporte plusieurs étapes.

0. 1. 1. La statistique descriptive ou déductive.

C’est l’ensemble des méthodes à partir desquelles on recueille, ordonne, réduit, et condense les données.A cette fin, la statistique descriptive utilise des paramètres, ou synthétiseurs, des graphiques et des méthodes dites d’analyse des données (l’ordinateur a facilité le développement de ces méthodes).

0. 1. 2. La statistique mathématique ou inductive

C’est l’ensemble des méthodes qui permettent de faire des prévisions, des interpolations sur une population à partir des résultats recueillis sur un échantillon.

Nous utilisons des raisonnements inductifs c’est-à-dire des raisonnements de passage du particulier au général.

Cette statistique utilise des repères de référence qui sont les modèles théoriques (lois de probabilités).

Cette statistique nécessite la recherche d’échantillons qui représentent le mieux possible la diversité de la population entière ; il est nécessaire qu’ils soient constitués au hasard ; on dit qu’ils résultent d’un tirage non exhaustif.

L’étude sur échantillon se justifie pour réduire le coût élevé et limiter la destruction d’individus pour obtenir la réponse statistique.

0. 2. VOCABULAIRE STATISTIQUE

0. 2. 1. Population

C’est l’ensemble des unités ou individus sur lequel on effectue une analyse statistique. ? = {? 1, ... , ? N} avec card(? ) = N fini

Ce vocabulaire est hérité du 1er champ d’application de la statistique : la démographie (Vauban (1633-1707) effectua des recensements pour des études économiques et militaires).

(10)

Exemples de populations.

Les véhicules automobiles immatriculés en France La population des P.M.E. d’un pays

Les salariés d’une entreprise Les habitants d’un quartier 0. 2. 2. Echantillon

C’est un ensemble d’individus prélevés dans une population déterminée Exemple d’échantillon.

L’échantillon des véhicules automobiles immatriculés dans un département.

0. 2. 3. Caractère

C’est un trait déterminé C présent chez tous les individus d’une population sur laquelle on effectue une étude statistique.

- Un caractère est dit quantitatif s’il est mesurable.

Exemples de caractères quantitatifs.

La puissance fiscale d’un véhicule automobile.

Le chiffre d’affaire d’une P.M.E.

L’âge, le salaire des salariés d’une entreprise.

- Un caractère est dit qualitatif s’il est repérable sans être mesurable.

Exemples de caractères qualitatifs.

La couleur de la carrosserie d’un véhicule automobile Le lieu de travail des habitants d’un quartier

Le sexe et la situation matrimoniale des salariés d’une entreprise 0. 2. 4. Modalités

Ce sont les différentes situations Mi possibles du caractère.

Les modalités d’un caractère doivent être incompatibles et exhaustives ; tout individu doit présenter une et une seule modalité.

Les modalités d’un caractère qualitatif sont les différentes rubriques d’une nomenclature ; celles d’un caractère quantitatif sont les mesures de ce caractère. L’ensemble des modalités est noté E.Pour un caractère quantitatif, la mesure du caractère peut être un nombre entier pris parmi un ensemble limité ; nous dirons qu’il est discret.

Exemple de caractère quantitatif discret.

(11)

Unité 0. Évaluation diagnostique

Le nombre d’enfants d’une famille (fratrie)

Dans certains cas la mesure du caractère peut être un nombre décimal pris parmi un ensemble de valeurs possibles très important (plusieurs dizaines ou plusieurs centaines).

Pour permettre une étude et notamment une représentation graphique plus simple, nous sommes conduits à effectuer un regroupement en classes (5 à 20 classes) ; nous dirons alors que le caractère est continu.

Dans ces deux situations, nous dirons que le caractère quantitatif est défini par ses modalités (valeurs discrètes ou classes).

Les modalités d’un caractère quantitatif peuvent être prises dans ou n.

Exemples d’ensembles de modalités.

Nombre d’enfants dans une fratrie : {Mi} = {xi}={0, 1, 2, 3, ...}, Mi ? .

L’âge, la taille et le poids d’un groupe d’individus représentent globalement une modalité définie dans 3 (à condition que chacune de ces variables soit discrète)

L’ensemble des modalités d’un caractère peut être établi à priori avant l’enquête (une liste, une nomenclature, un code) ou après enquête.

On constitue l’ensemble des valeurs prises par le caractère.

Les caractères étudiés sur une population peuvent être mixtes : Exemple de caractère mixte.

L’ensemble des salariés d’une entreprise peut être représenté par un caractère mixte que nous pourrons exploiter globalement ou plus efficacement en extrayant une partie des données.

Le sexe, de modalités : H ou F (codé par 1 ou 2)

L’âge, de modalités : 18, 19, 20, ... ou [16, 20], [21, 25], ...

Le salaire mensuel, de modalités : 6000, 6500, 7000, ... ou [6000, 6500[, [6500, 7500[,...

La situation matrimoniale, de modalités : marié, célibataire, veuf, divorcé, vivant maritalement.

0. 3. NOTION DE DISTRIBUTION STATISTIQUE

Considérons une population ? = {? 1, ... , ? N}.

Dans cette population, considérons un caractère C et soit E l’ensemble des modalités du caractère C, card (E) = p.

On note Ai l’ensemble des individus de ? présentant la modalité Mi du caractère C, i = 1, ... , p.

Les Ai forment une partition de ? : Ai ? Aj = Ø pour i ? j, et Ai = ? . Nous définissons ni = card (Ai). ni est l’effectif de la modalité Mi.

(12)

On appelle variable statistique toute application X de ? dans E qui, à chaque individu ? de la population, associe une modalité Mi du caractère C.

L’effectif ni d’une modalité Mi est le cardinal de l’image réciproque Ai de Mi par X : ni = card (Ai) = Card (X – 1 (Mi))

Une variable statistique s’identifie à l’ensemble des triplets {(Mi, Ai, ni)}, i ? [ 1, p ].

En pratique, le statisticien se contente souvent de l’ensemble des doublets {(Mi, ni)}, i ? [ 1, p ], sans se préoccuper de savoir qui sont les ni individus de la population présentant la modalité Mi du caractère C et constituant l’ensemble Ai.

On appelle aussi distribution statistique l’ensemble des double marque.

Si le caractère C ne présente qu’une modalité a dans la population, on parle de variable, ou de distribution, statistique constante {(a, ? , N)}.

(13)

Unité 1 : Analyse Univariee

Unité 1 : Analyse Univariee

(Statistique descriptive à un caractère)

1. 1. REPRESENTATION GRAPHIQUE

La représentation graphique des données relatives à un caractère unique repose sur la

proportionnalité des longueurs, ou des aires, des graphiques, aux effectifs, ou aux fréquences, des différentes modalités du caractère.

1. 1. 1. Caractère qualitatif

Pour un caractère qualitatif, on utilise principalement trois types de représentation graphique : le diagramme en bâtons, la représentation par tuyaux d’orgue et la représentation par secteurs.

Lorsque le caractère étudié est la répartition géographique d’une population, la représentation graphique est un cartogramme.

a) Diagramme en bâtons

Nous portons en abscisse les modalités, de façon arbitraire.

Nous portons en ordonnée des segments dont la longueur est proportionnelle aux effectifs (ou aux fréquences) de chaque modalité.

Nous appelons polygone statistique, ou diagramme polygonal, la ligne obtenue en joignant les sommets des bâtons.

b) Tuyaux d’orgue

Nous portons en abscisses les modalités, de façon arbitraire.

Nous portons en ordonnées des rectangles dont la longueur est proportionnelle aux effectifs, ou aux fréquences, de chaque modalité.

c) Secteurs

Les diagrammes circulaires, ou semi-circulaires, consistent à partager un disque ou un demi- disque, en tranches, ou secteurs, correspondant aux modalités observées et dont la surface est proportionnelle à l’effectif, ou à la fréquence, de la modalité.

Ces diagrammes conviennent très bien pour des données politiques ou socio-économiques.

d) Exemple

En 1982, les recettes du budget de l’Etat se présentaient de la façon suivante (en milliards de francs) : Le caractère étudié, la nature des recettes du budget de l’Etat, est un caractère qualitatif.

Dans la représentation en tuyaux d’orgue, les différentes modalités du caractère (les diverses sources de recettes du budget de l’Etat) sont représentées par des segments sur l’axe des ordonnées. Pour chaque abscisse on porte un rectangle dont la longueur est proportionnelle au montant correspondant de la recette (effectif).

(14)

Dans la représentation par diagramme en bâtons, les différentes modalités du caractère (les diverses sources de recettes du budget de l’Etat) sont représentées par des points sur l’axe des ordonnées. Pour chaque

abscisse, on porte un segment vertical dont la longueur est proportionnelle au montant correspondant de la recette (rectangle de largeur nulle).

Dans le diagramme circulaire, chaque secteur a une surface proportionnelle à l’importance de la recette dans le budget. L’angle au centre représentant une modalité est donc

proportionnelle à l’importance de la recette dans le budget.

e) Cartogrammes

Un cartogramme est une carte géographique dont les secteurs géographiques sont coloriés avec une couleur différente suivant l’effectif ou suivant la fréquence du caractère étudié.

(15)

1. 1. 2. Caractère quantitatif

La variable statistique est la mesure du caractère. Celle-ci peut être discrète ou continue.

Il existe deux types de représentation graphique d’une distribution statistique à caractère quantitatif : — Le diagramme différentiel correspond à une représentation des effectifs ou des fréquences.

— Le diagramme intégral correspond à une représentation des effectifs cumulés, ou des fréquences cumulées.

a) Variable statistique discrète

— Diagramme différentiel : diagramme en bâtons, des effectifs ou des fréquences.

La différence avec le cas qualitatif consiste en ce que les abscisses ici sont les valeurs de la variable statistique.

— Diagramme intégral : courbe en escaliers des effectifs cumulés ou des fréquences cumulées.

Exemple.

En vue d’établir rationnellement le nombre de postes de travail nécessaires pour assurer à sa clientèle un service satisfaisant, une agence de voyage a fait relever, minute par minute, le nombre d’appels téléphoniques reçus au cours d’une période de 30 jours. Cette opération a fourni, pour la tranche horaire de pointe qui se situe entre onze heures et midi, les résultats suivants :

La population étudiée est celle des 1 800 minutes composant la durée totale des appels dans la tranche horaire de onze heures à midi pendant 30 jours.

Le caractère observé est le nombre d’appels téléphoniques : c’est un caractère quantitatif et la variable statistique correspondante, qui ne peut prendre que des valeurs entières, est discrète.

(16)

La représentation des effectifs est identique à celle des fréquences : seule change l’échelle verticale.

La représentation graphique différentielle correcte est le diagramme en bâtons.

A chaque valeur xi de la variable, portée en abscisse, on fait correspondre un segment vertical de longueur proportionnelle à la fréquence fi de cette valeur.

Le regroupement des valeurs extrêmes de la variable en une seule classe (nombre d’appels supérieur ou égal à 8) interdit normalement la représentation graphique de ce dernier segment.

Mais, étant donnée la fréquence quasi négligeable de cette classe, l’inconvénient n’est pas bien grand et l’on pourra représenter par un segment à l’abscisse 8, la fréquence des appels de durée 8 ou plus.

Représentation graphique:

(17)

La représentation graphique intégrale correcte est la courbe en escalier : les fréquences des diverses valeurs de la variable statistique correspondent aux hauteurs des marches de la courbe en escalier.

b) Variable statistique continue

Les observations sont regroupées en classes.

Chaque classe possède une certaine amplitude, qui est la longueur de l’intervalle définissant la classe. Le rapport entre l’effectif d’une classe et son amplitude s’appelle la densité d’effectif.

Le rapport entre la fréquence d’une classe et son amplitude s’appelle la densité de fréquence.

— Diagramme différentiel : histogramme des densités.

Nous portons en abscisse les classes représentant les modalités et en ordonnées des rectangles dont la longueur est proportionnelle à la densité d’effectif ou à la densité de fréquence.L’aire d’un rectangle de cet histogramme est alors proportionnelle à l’effectif ou à la fréquence de la classe.

— Diagramme intégral : courbe cumulative des effectifs ou des fréquences.

La courbe cumulative des fréquences doit représenter la fonction de répartition de la variable statistique.

Exemple.

La Fédération nationale de la réparation et du commerce de l’automobile a effectué une enquête auprès de ses adhérents visant à mieux connaître la structure de ce secteur. Cette opération a fourni la répartition suivante des entreprises de la réparation de du commerce de l’automobile selon leur chiffre d’affaires annuel.

La masse de chiffres d’affaires correspondant aux entreprises de la première et de la dernière classe s’élève respectivement à 1 714 et 110 145 millions de francs.

(18)

La population étudiée est celle des entreprises de la réparation et du commerce de l’automobile. Le caractère observé est le chiffre d’affaires.

C’est un caractère quantitatif et la variable statistique correspondante est continue.

La représentation graphique différentielle correcte est l’histogramme des densités de fréquences.

Pour la première et la dernière classe, l’amplitude de la classe n’est pas connue.

On détermine alors la moyenne de la classe, qu’on considère comme la valeur centrale de la classe (quand on construit un histogramme, on fait l’hypothèse implicite que les effectifs sont répartis uniformément à l’intérieur de la classe, la moyenne de la classe est alors le centre de la classe).

Diagramme intégral : courbe cumulative des effectifs ou des fréquences.

La courbe cumulative des fréquences doit représenter la fonction de répartition de la variable statistique.

Exemple. La Fédération nationale de la réparation et du commerce de l’automobile a effectué une enquête auprès de ses adhérents visant à mieux connaître la structure de ce secteur. Cette opération a fourni la répartition suivante des entreprises de la réparation de du commerce de l’automobile selon leur chiffre d’affaires annuel.

La masse de chiffres d’affaires correspondant aux entreprises de la première et de la dernière classe s’élève respectivement à 1 714 et 110 145 millions de francs.

La population étudiée est celle des entreprises de la réparation et du commerce de

l’automobile. Le caractère observé est le chiffre d’affaires. C’est un caractère quantitatif et la variable statistique correspondante est continue.

La représentation graphique différentielle correcte est l’histogramme des densités de fréquences.

Pour la première et la dernière classe, l’amplitude de la classe n’est pas connue. On détermine alors la moyenne de la classe, qu’on considère comme la valeur centrale de la classe (quand on construit un histogramme, on fait l’hypothèse implicite que les effectifs sont répartis uniformément à l’intérieur de la classe, la moyenne de la classe est alors le centre de la classe).

Pour la première classe, la moyenne du chiffre d’affaires est= 0,125, de sorte que la première classe est la classe [ 0,00 , 0,25 [.

Pour la dernière classe, la moyenne du chiffre d’affaires est = 35, de sorte que la dernière classe est la classe [ 10,00 ,60,00 [.

(19)

La représentation graphique intégrale correcte est la courbe cumulative des fréquences.

Pour que chaque point expérimental représente la fonction de répartition, il faut prendre pour abscisses les limites supérieures des classes et, pour ordonnées, les fréquences cumulées correspondantes.

II. 2. PARAMETRES CARACTERISTIQUES

Le but de l’étude statistique est aussi de résumer des données par des paramètres ou synthétiseurs.

Il existe 3 types de paramètres :

—paramètres de position (ou de tendance centrale)

—paramètres de dispersion

—paramètres de forme (asymétrie, aplatissement, concentration)

II. 2. 1. Paramètres de position

Les paramètres de position (mode, médiane, moyenne) permettent de savoir autour de quelles valeurs se situent les valeurs d’une variable statistique.

II. 2. 1. 1. Le mode

Le mode, noté Mo, est la modalité qui admet la plus grande fréquence : f(Mo) =Max(fi ) ;i∈[ 1,p]

Il est parfaitement défini pour une variable qualitative ou une variable quantitative discrète.

Pour une variable quantitative continue nous parlons de classe modale : c’est la classe dont la densité de fréquence est maximum.Si les classes ont même amplitude la densité est remplacée par l’effectif ou la fréquence et nous retrouvons la définition précédente.

Nous définissons le mode, pour une variable quantitative continue, en tenant compte des densités de fréquence des 2 classes adjacentes par la méthode suivante. La classe modale [xi,xi+ 1[ étant déterminée, le mode Mo vérifie :=

Dans une proportion, on ne change pas la valeur du rapport en additionnant les numérateurs et en additionnant les dénominateurs := =Mo=xi+ (xi+ 1–xi).

(20)

Remarques.

Lorsque les classes adjacentes à la classe modale ont des densités de fréquences égales, le mode coïncide avec le centre de la classe modale.

Le mode dépend beaucoup de la répartition en classes.

Une variable statistique peut présenter plusieurs modes locaux : on dit alors qu’elle est plurimodale.

Cette situation est intéressante : elle met en évidence l’existence de plusieurs sous- populations, donc l’hétérogénéité de la population étudiée.

II. 2. 1. 2. La médiane

La médiane Me est telle que l’effectif des observations dont les modalités sont inférieures à Me est égal à l’effectif des observations dont les modalités sont supérieures à Me

Cette définition n’a de sens que si les modalités sont toutes ordonnées.

Dans le cas d’une variable qualitative il est parfois possible de choisir un ordre.

Exemple : niveau d’études scolaires : école primaire < 1er cycle < CAP < BEP < Bac < BTS <

DEUG < ....

Une variable quantitative X doit être définie dans . Détermination pratique de la médiane.

· Cas d›une variable discrète.

Reprenons l’exemple de II.1.2.a de variable discrète (appels téléphoniques).

La fréquence cumulée est 42,8 % pour x= 2, et 64,6 % pour x= 3.

L’intervalle [ 2, 3 [ est appelé intervalle médian.

Dans l’intervalle médian, la médiane est calculée par interpolation linéaire.

· Cas d›une variable continue :

Reprenons l’exemple de II.1.2.b de variable continue (entreprises automobiles).

La fréquence cumulée est 36,1 % pour x= 0,50, et 52,7 % pour x= 1,00. L’intervalle [0,50, 1,00 [ est l’intervalle médian.

Dans l’intervalle médian, la médiane est calculée par interpolation linéaire. Paramètres caractéristiques

(21)

Unité 2: Probabilité Sur un Espace Fini

Unité 2: Probabilité Sur un Espace Fini

Introduction

Lorsque l’on s’intéresse à la durée d’une communication téléphonique, à la durée de vie d’un composant électronique ou à la température de l’eau d’un lac, la variable aléatoire X associée au temps ou à la température, peut prendre une infinité de valeurs dans un intervalle donné.

On dit alors que cette variable X est continue (qui s’oppose à discrète comme c’est le cas par exemple dans la loi binomiale). On ne peut plus parler de probabilité d’événements car les événements élémentaires sont en nombre infini. La probabilité d’une valeur isolée de X est alors nulle. On contourne cette difficulté en associant à la variable X un intervalle de R et en

Dénombrement et loi de probabilité.

I. Dénombrement.

Qu’est-ce que dénombrer ?

En situation d’équiprobabilité, il est important de connaître le nombre total de résultats

possibles d’une expérience donnée. Aussi on compte ces résultats : on dit qu’on les dénombre.

Ex : principe multiplicatif.

Dans un puzzle pour enfant, un personnage se compose de 4 pièces : les jambes, le buste, les bras et la tête. Il y a 2 paires de jambes différentes, 3 bustes, 2 paires de bras et 3 têtes. Un seul personnage complet est un clown. Quelle chance a-t-on de l’obtenir en montant le puzzle au hasard ?

Nous sommes dans une situation d’équiprobabilité. Dénombrons le nombre total de personnages que l’on peut créer :

Il y a donc 2 × 3 × 2 × 3 possibilités, soit 36 personnages différents dont 1 seul est le clown.

La probabilité d’obtenir ce clown est donc 1/36.

Factorielle d’un entier naturel.

Déf :

Soit n un entier naturel non nul. On appelle factorielle de n le réel noté n!=n×(n−1)×(n−2)×...×2

×1 .

Par convention, on décide que 0!=1.

Ex :

4!=4 ×3 ×2 ×1=24 5!=5 ×4 ×3 ×2 =120 Prop :

Soit a1 ;a2 ;...; an .

(22)

L’ordre des éléments étant pris en compte. En permutant les places de deux éléments, on modifie cette liste. Par exemple, an ,a2 ;...;a1 est une autre liste possible ou on a permuter an et a1 Le nombre de listes différentes que l’on peut obtenir par permutation est n!

Ex : 5 chevaux sont au départ d’une course. Combien y-a-t-il d’arrivées possibles ? Il s’agit de permuter les ordres d’arrivé des chevaux : il y en a donc 5!=120.

3. Combinaisons.

Soit n un entier naturel non nul. On appelle factorielle de n le réel noté n!=n×(n−1)×(n−2)×...×2

×1 .

Par convention, on décide que 0!=1.

Ex :

4!=4 ×3 ×2 ×1=24 5!=5 ×4 ×3 ×2 =120 Prop :

Soit a1 ;a2 ;...; an . L’ordre des éléments étant pris en compte. En permutant les places de deux éléments, on modifie cette liste. Par exemple, an ,a2 ;...;a1 est une autre liste possible ou on a permuter an et a1 Le nombre de listes différentes que l’on peut obtenir par permutation est n!

Ex :

5 chevaux sont au départ d’une course. Combien y-a-t-il d’arrivées possibles ? Il s’agit de permuter les ordres d’arrivé des chevaux : il y en a donc 5!=120.

a. Définition.

Déf :

Soit A={ x1 ; x2 ;...; xn } un ensemble de n éléments. On appelle combinaison de p éléments de A, un sous ensemble de A contenant p éléments.

Ex :A={bleu; rouge; noir;vert}

E={bleu;rouge} est un combinaison de 2 éléments de A.

On remarque que l’ordre des éléments n’a pas d’importance.

Prop :

Le nombre de combinaisons de p élément de A est Ex :49

Au loto, on choisit 7 nombres parmi 49. Il y a doncest combinaisons possibles soit 7

=85900584 combinaisons possibles.

(23)

Une personne qui joue une grille a donc une probabilité de gagner de . Formule et triangle de Pascal.

Formule de Pascal :

Soit n un entier naturel non nul.

Si 0 ≤p≤n alors Si 0 ≤ p≤n−1 alors . Dém :

Il suffit de poser les calculs et de simplifier.

Triangle de Pascal :

En utilisant la formule , en remarquant que et , on peut dresser La formule traduit la symétrie de chaque ligne du triangle.

Formule du binôme.

Prop :

Soit a et b deux réels ( ou complexes) et n un entier naturel non nul. On a la formule du binôme de Newton

: ce produit est composé de n facteurs de (a+b).

Si on développe ces n facteurs, on fait apparaître les termes an ,an−1×b ,an−2×b2, ... ,a1

×bn−1et a×bn , c’est à dire des termes de la forme an−k×bk où k varie de 0 à n.

Le terme an−k×bk est obtenu en prenant k fois le terme b parmi les n facteurs et donc, automatiquement, a dans les n-k autres facteurs : il y a donc termes an−k×bk .

étant la somme de ces termes pour k allant de 0 à n, on obtient CQFD

Ex :

Pour les valeurs des combinaisons, on utilise le triangle de Pascal.

II. Loi de Bernoulli et loi binomiale.

Loi de Bernoulli.

Déf :

On appelle loi de Bernoulli, notée Ba où a∈[0,1] , une loi définie sur un univers E formé de deux possibilités p1 et p2 telle que :

(24)

pi p1 p2

p( ) a 1- a

Ex :

On joue à pile ou face avec une pièce truquée telle que face ait deux fois plus de chance que pile de sortir.

Si p(« face »)=a alors p(« pile »)=1- a.

On doit alors avoir : a=2(1-a). D’où 3a=2 et a= . Nous avons la loi de Bernoulli B2 suivante :

pi face Pile

p( ) 2

3

1− =

Loi binomiale Déf / prop:

Soit a∈[0

1.2 Densité de probabilité et espérance mathématique

(25)

• Commeune valeurla probabilitéisolée est nulle,que Xqueprennel’intervalle J soit ouvert ou fermé importe peu. Ainsi :

P(X ∈[α, β]) = P(X ∈ [α, β[)

= P(X ∈]α,β])

= P(X ∈]α, β[)

• L’écriturela fonction(Xqui∈associeI) est uneunenotationissue à unabusivenombre.carElleX n’estprolongepas unlanombre,notationmaisdéjà utilisée pour des variables discrètes (X = a)

1.3 Loi uniforme : densité homogène 1.3.1 Définition

Définition 3 : Une variable aléatoire X suit une loi uniforme dans l’intervalle I = [a, b], avec a 6= b, lorsque la densité f est constante sur cet intervalle. On en déduit alors la fonction f :

1 f(t) =

b − a

(26)

Conséquence Pour tout intervalle J = [α, β] inclus dans I, on a alors : P(X ∈ J) = βb −− aα = longueurlongueur dede IJ

La probabilité est donc proportionnelle à la longueur de l’intervalle considéré.

Exemple : On choisit un nombre réel au hasard dans l’intervalle [0 ;5]. On associe à X le nombre choisi. Quelle est la probabilité que ce nombre soit supérieur à 4 ? compris entre e et π ?

P P(e 6 X 6π) = π 5 − e ≃ 0, 085 1.3.2 Espérance mathématique

E

Remarque : Dans notre exemple précédent, on trouve : E(X) = 2, 5 ce qui n’a rien de surprenant !

1.3.3 Application : méthode de Monte-Carlo

Méthode de Monte-Carlo : méthode probabiliste très utilisée pour la résolution approchée de problèmes variés allant de la théorie des nombres à la physique mathématique en passant par la production industrielle.

Application : Calcul d’une valeur approchée du nombre π

• La méthode de tirage au hasard et du rejet : On admet un point dans un carré de côté 1, que la probabilité de tirer un point dans un domaine situé dans ce carré unité est proportionnelle à l’aire de ce domaine. Comme il s’agit du carré unité, cette probabilité est donc égale à l’aire du domaine.

(27)

On tire un grand nombre de points (par exemple 10 000). D’après la loi des grands nombres, la probabilité p d’avoir un point dans la zone d’acceptation vaut :

nombre de points dans la zone d’acceptation p = nombre total de points

p correspond à l’aire du quart du cercle unité soit On peut alors écrire l’algorithme suivant : Variables : N, D, I : entiers

X, Y : réels dans [0 ; 1] Entrées et initialisation Effacer l’écran

Lire N 0 → D

Traitement pour I de 1 à N faire random(0,1)random(0,1) →→ YX si Y 6 √1 − X2 alors

Tracer D + 1 →le pointD (X, Y) fin Sorties : Afficher D, 4 × ND

On obtient le graphe suivant pour N = 10 000 :

(28)

On trouve les résultats suivants : D = 7 893 π≃ 3,157 2

La précision est de l’ordre de √N ≃ 0, 01

• Par la méthode de l’espérance : On choisit au hasard N valeurs de Variables : N, I : entiers l’abscisse X d’un point M dans [0 ;1]. X, S, p réels

Entrées et initialisation

On calcule la somme S des N valeurs Lire N prises par f(X) = √1 − X2. Traitement 0 → S La moyenne des N valeurs de f(X) pour I de 1 à N faire est une valeur approchée de la va- random(0,1)√1 − X → X leur moyenne µ de f donc de l’aire du S + 2 S →

quart de cercle. fin

On trouve alors pour N = 10 000 : S/N → p π≃ 3,151 5 Sorties : Afficher 4p Pour a = 0, b = 1 et f(t) = √1 − t2 N

− Z dt ⇔ µ = Z 1 p1 − t π ≃ i∑=1 f(x i) µ = 1 b f(t) 2 dt =

b a a 0 4 N 1.4 Loi exponentielle : loi sans mémoire 1.4.1 Définition

Définition 4 : Une variable aléatoire X suit une loi exponentielle de paramètre réel λ> 0 lorsque sa densité est la fonction f définie sur [0; +∞[ par :

f(t) = λe−λt

(29)

Conséquence On peut vérifier que :

• la fonction de répartition F vaut : F(x) = P(X 6 x) = 1 − e−∈ x car

F x + 1

• f est bien une densité de probabilité, car la fonction f est continue, positive et : lim F(x) = lim 1 − e−λ x = 1 x→+∞ x→+∞

• P(X 6 a) = F(a) = 1 − e−λ a

• Par l’événement contraire, on a : P(X > a) = 1 − P(X 6 a) = 1 − F(a) = e−λ a

• Si X se trouve dans [a, b], on a : P(a 6 X 6 b) = F(b) − F(a) = e−λ a − e−λb

1.4.2 Loi sans mémoire ou sans vieillissement

ROC Démonstration : On applique la formule des probabilités conditionnelles :

PX>t(X > t + h) = P(X > tP( etX > Xt>) t + h) = P(PX(X>>t +t)h) e−λ(t+h) e−λt × e−λh

= e−λ t = e−λt

= e−λh = P(X > h)

Remarque : On dit que la durée de vie d’un appareil est sans mémoire ou sans vieillissement lorsque la probabilité que l’appareil fonctionne encore h années supplémentaires sachant qu’il fonctionne à l’instant t, ne dépend pas de t.

On admettra que la loi exponentielle est la seule loi sans vieillissement

Ceci est valable si l’appareil n’est pas sujet à un phénomène d’usure. On retrouve cette propriété en ce qui concerne la durée de vie d’un noyau radioactif.

(30)

1.4.3 Espérance mathématique

ROC Démonstration : D’après la définition, en posant g(t) = tf(t) = ∈te−∈t, on a :

x

E(X) = lim Z g(t) dt x∈+∞ 0

Il faut trouver une primitive de la fonction g, pour cela on dérive la fonction g

x

On a alors :

On pose : Y = −λx , d’où si x → +∞ alors Y →−∞

On a alors : x→lim+ e−λx = lim eY = 0 et x lim∞λxe−λx = Y→−lim∞−YeY = 0

∞ Y→−∞ →+

Par somme et produit, on a alors : lim

1.4.4 Un exemple

La durée de vie, en année, d’un composant électronique est une variable aléatoire notée T qui suit une loi sans vieillissement de paramètre λ. Une étude statistique a montré que pour ce type de composant, la durée de vie ne dépasse pas 5 ans avec une probabilité de 0,675.

1. Calculer la valeur λ arrondie à trois décimales.

2. Quelle est la probabilité, arrondie à trois décimales, qu’un composant de ce type dure :

a) moins de 8 ans b) plus de 10 ans

3. c) au moins 8 ans sachant qu’il fonctionne encore au bout de trois ans Quelle est l’espérance de vie de ce composant.

4. Si T vérifie une loi sans vieillissement, T suit donc une loi exponentielle. Si la durée de vie ne dépasse pas 5 ans avec une probabilité de 0,675, on a donc :

(31)

P

On a alors : −e−5λ + 1 = 0, 675 ⇔ e−5λ = 0, 325 ⇔ −5λ = ln 0, 325 On trouve alors :

5. On a :

a) P(T < 8) = P(T 6 8) = 1 − e−0,225×8 ≃ 0, 835 b) P(T > 10) = P(T > 10) = e−0,225×10 ≃ 0, 105 c) PT>3(T > 8) = P(T > 5) = e−0.225×5 ≃ 0, 325

6. E 4, 44 soit à peu près 4 ans et demi

1.4.5 Application à la physique

La désintégration radioactive est un phénomène aléatoire. c’est à dire que l’on ne peut pas, à l’échelle « microscopique », dire quand un noyau va se désintégrer. Néanmoins, à l’échelle macroscopique, on a pu établir que la durée de vie d’un noyau radioactif suit une loi de durée de vie sans vieillissement c’est à dire une loi exponentielle de paramètre λ. λ étant la constante radioactive (en s-1) qui caractérise un radionucléide.

On appelle T la variable aléatoire associée à la durée de vie d’un noyau. La probabilité p qu’un noyau ne soit pas désintégré à l’instant t est donc :

p = P(T > t) = e−λt

Si au départ on compte N0 noyaux au bout d’un temps t, on en comptera N(t) qui vérifie : N(t) = N0e−λt

(32)

On appelle demi-vie t1/2, le temps nécessaire pour que le nombre de radionucléides soit divisé par 2. On a alors :

e

Enfin la durée de vie moyenne τ d’un radionucéide est donnée par l’espérance mathématique :

1 ln 2 t ln1/2 2 ≃ 1, 44 t1 / 2∈ = or ∈ = donc ∈ =

λ t1/2

1.5 Lien entre le discret et le continu

(33)

Univers Ω Intervalle I ou R

Événement E Événement J

sous-ensemble de Ω sous-intervalle de I Probabilités pi des

événements élémentaires Densité de probabilité

∑ pi = 1 Z f(t) dt = 1( I)

Espérance de la variable

aléatoire X Espérance de la variable aléatoire X

E(X) = ∑ pixi E(X) = Z t f(t) dt( I)

Équiprobabilité Loi uniforme

nbre de cas favorables P(E) = nbre de cas possibles

longueur de J P(X ∈ J) = longueur de I

(34)

Unit 3: La loi Normale

Du discret au continu

Lorsqu’on étudie la loi binomiale sur un grand nombre d’expériences (n > 50 par exemple) à condition que la probabilité de succès sur une expérience ne soit pas trop petite (p > 0, 1), on peut approximer cette loi binomiale par une loi normale dont la représentation est une courbe en cloche ou courbe de Gauss. On passe ainsi d’une distribution discrète à une distribution continue beaucoup plus souple.

Cette loi normale intervient dans de nombreuses distributions statistiques, lorsqu’un critère d’un individu - par exemple la taille d’une femme adulte - dépend d’un grand nombre de facteurs ou paramètres. La répartition de la taille d’une femme adulte dans une population suit alors une loi normale (Théorème central limit)

La loi normale centrée réduite

La densité de probabilité de Laplace-Gauss

Remarque : Cette fonction ∈ correspond bien à une densité de probabilité :

Fonction ϕ est bien exponentielle continue et est positive sur R(composée). de fonctions continues et la

Cette fonction est paire et admet en 0 un maximum :

Sa démonstration intégrale est sur admise. R est égale Il faut à 1. cependant savoir qu’il n’existe pas de primitive s’exprimant avec des fonctions élémentaires pour cette fonction et que le calcul de l’aire sous la courbe demande des méthodes plus ou moins détournées tel un changement de variable.

La cloche en courbe ou courbe Cϕ est appelée courbe de Gauss.

Comme la fonction ϕ est paire, on a alors :

(35)

Unit 3: La loi Normale

a→lim+∞Z− a √[1]πe− dt = a→lim+∞Z0 √2πe− dt = 21

2.2.3 Calcul de probabilités

Démonstration : La première égalité est liée à la relation de Chasles pour l’intégrale (soustraction des aires sous la courbe)

La deuxième égalité est liée à l’événement contraire : P(X > a) = 1 − P(X 6 a) Enfin la troisième égalité est liée à la parité de la fonction ϕ. L’aire sous la courbe de la partie gauche est égale à l’aire sous la courbe de la partie droite.

Exemples : Une variable aléatoire X suit une loi normale centrée réduite. A l’aide d’une table des valeurs de Φ, déterminer les probabilités suivantes :a v²

P(X > 1, 35) P(X 6−0, 56)

P(−0, 56 6 X 6 1, 35) P(X 6−0, 56 ou X > 1, 35)

On repère sur la table les valeurs : Φ(0, 56) ≃ 0,712 3 et Φ(1, 35) ≃ 0,911 5 a) P(X > 1, 35) = 1 − P(X 6 1, 35) = 1 −Φ(1, 35) = 1 − 0,911 5 = 0,088 5

P(X 6−0, 56) = Φ(−0, 56) = 1 −Φ(0, 56) = 1 − 0,712 3 = 0,287 7

P(−0, 56 6 X 6 1, 35) = Φ(1, 35) −Φ(−0, 56) = 0,911 5 − 0,287 7 = 0,623 8

(36)

P(X 6−0, 56 ou X P(X 6−0, 56

ou X

Remarque : Certaines valeurs interviennent souvent, il est bon de les mémoriser.

P(−1 6 X 6 1) = 0, 683 P(−2 6 X 6 2) = 0, 954

P( 3 6 X 6 3) = 0, 997

2.2.4 Espérance et variance

Théorème 5 : Si une variable aléatoire X suit une loi normale centrée réduite alors son espérance est nulle et sa variance est égale à 1

Remarque : C’est pour cette raison que cette loi normale est centrée (E(X) = 0) et réduite (V(X)

= 1)

2.2.5 Probabilité d’intervalle centré en 0

Théorème 6 : X est une variable aléatoire qui suit une loi normale centrée réduite. Soit α un réel de l’intervalle ]0 ;1[. Il existe un unique réel strictement positif uα tel que :

P(−uα 6 X 6 uα) = 1 −α

ROC Démonstration : On cherche un réel x strictement positif tel que : P(−x 6 X 6 x) = 1 −α

(37)

On sait que la fonction Φ est continue et strictement croissante sur ]0; +∞[. De plus :1 lim Φ(x) = Φ(0) = et lim Φ(x) = 1 x→0 2 x→+∞

et 0

donc d’après le théorème des valeurs intermédiaires, il existe un unique x = uα strictement positif tel que

Remarque : Il est bon de retenir les valeurs de u0,05 et u0,01, On obtient ainsi :

P(−1.96 6 X 6 1.96) = 0, 95 P( 2.58 6 X 6 2.58) = 0, 99

Exemple : X est une variable aléatoire qui suit une loi normale centrée réduite.

Déterminer l’intervalle I centré en 0 tel que P(X ∈ I) = 0,de8. 10−2. On donnera les bornes de l’intervalle avec une précision

On a donc : 1 −α = 0, 8 ⇔ α = 0, 2

On doit donc avoir : uα = Φ−1(0, 9).

A l’aide de la calculatrice avec la fonction “FracNorm(0.9)” ou à l’aide d’une table, on trouve : uα ≃ 1, 28 donc I = [−1, 28; 1, 28]

2.3 Loi normale générale

2.3.1 Loi normale d’espérance µ et d’écart type σ

(38)

Définition 9 : Si une variable aléatoire X suit une loi normale de paramètres µ et σ notée N (µ, σ2), alors la variable aléatoire Z = X −µ suit une loi normale σ centrée réduite N (0, 1) et réciproquement.

Propriété 1 : Si une variable aléatoire X suit une loi normale N (µ, σ2) alors son espérance vaut µ et sa variance vaut σ2.

Démonstration : De la linéarité de l’espérance, on en déduit :

E 0 comme E(Z) = 0 alors E(X) = µ

De plus, comme V(aX) = a2V(X), on a :

V comme V(Z) = 1 alors V(X) = σ2

Exemple : Les températures de l’eau du mois de juillet, autour du lac Léman, suivent la loi normale d’espérance 18,2˚C et d’écart-type 3,6 ˚C.

Une personne part camper en juillet sur le pourtour du lac Léman. Que peut-on lui indiquer comme probabilité de température de l’eau des plages dans les cas suivants :

températures inférieures à 16 ˚C

températures comprises entre 20˚C et 24 ,5˚C températures supérieures à 21 ˚C.

On appelle T la variable aléatoire associée aux températures et Z la variable aléatoire associée à la loi normale centrée réduite.

Il y a deux façons d’obtenir les résultats, soit on utilise une table et alors on doit revenir à la loi normale centrée réduite, soit on utilise la calculette et alors on peut utiliser la loi normale de l’énoncé.

On veut calculer : P(T 6 16) Avec la calculatrice, on tape :

“normalFRép(−1 E 99, 16, 18.2, 3.6)”, on trouve alors : 0,271 Avec une table, on revient à la variable X, on a alors :

T

On a alors : Φ(−0, 611) = 1 −Φ(0, 611) = 1 − 0, 729 = 0, 271 On veut calculer : P(20 6 T 6 24, 5)

Avec la calculatrice, on tape :

“normalFRép(20, 24.5, 18.2, 3.6)”, on trouve alors : 0,268 Avec une table, on revient à la variable X, on a alors :

20 6 T 6 24, 5 ⇔ 20 −3,186 , 2 6 Z 6 24, 53−, 618, 2 ⇔ 0, 5 6 Z 6 1, 75

(39)

On a alors : Φ(1, 75) −Φ(0, 5) = 0, 960 − 0, 692 = 0, 268 On veut calculer : P(T > 21)

Avec la calculatrice, on tape :

“normalFRép(21, 1 E 99, 18.2, 3.6)”, on trouve alors : 0,218 Avec une table, on revient à la variable X, on a alors :

T

On a alors : 1 −Φ(0, 78) = 1 − 0, 782 = 0, 218 2.3.2 Influence de l’écart type

Voici ci-dessous les courbes des densités correspondantes à une espérance de 4 et aux écarts types respectifs de : , 1 et 2.

On constate que plus l’écart type est important, plus la courbe de densité est évasée et plus le maximum est petit. En effet un écart type important signifie que la dispersion des données est importante.

Ces différentes courbes peuvent être repérées par 3 intervalles caractéristiques : [µ−σ, µ + σ], [µ− 2σ; µ + 2σ] et [µ− 3σ; µ + 3σ]

(40)

On a alors :

P(µ−σ6 X 6µ + σ) = 0, 68 P(µ− 2σ6 X 6µ + 2σ) = 0, 95 P(µ− 3σ6 X 6µ + 3σ) = 0, 997

2.3.3 Approximation normale d’une loi binomiale

En pratique, on pourra faire l’approximation d’une loi binomiale par une loi normale lorsque l’on aura les conditions suivantes :

n > 30, np > 5 et n(1 − p) > 5

Dans l’exemple ci-dessous, on a tracé B(20; 0, 5) et la densité de la loi normale correspondante (µ = 20 × 0, 5 = 10 et σ = p20 × 0, 52 = √5). Les deux dernières conditions sont respectées (np

= 10 et n(1 − p) = 10)

Calculons P(9 6 X 6 11) avec la loi binomiale B(20; 0, 5) puis avec la loi normale N (10, 5).

Avec la loi binomiale. Sur la calculette “binomFdP(20;0.5,{9,10,11})”

P(9 6 X 6 11) ≃ 0, 4966

togramme,Avec la loi normale.il faut intégrerCommetroison

remplacerectanglesuncentrésdiagrammeen 9, 10enetbâton11. dparoncunil fauthiscalculer 8, 5

(41)

6 X 6 11, 5. C’est ce qu’on appelle la correction de continuité.

Avec la calculette : “NormalFRép(8.5,11.5,10,√5) “ P(8, 5 6 X 6 11, 5) ≃ 0, 4977 L’erreur est donc de 0 ,1%

Il se peut par contre que n soit grand et cependant p trop petit pour qu’on soit dans les conditions de l’approximation normale. Cela se produit par exemple lorsque l’on considère le nombre d’accidents provoqués par un vaccin, le nombre de suicides dans une grande ville, pour une période donnée.

Dans le cas des petites valeurs de p c’est à dire pour p < 0, 1, l’approximation de la loi binomiale ne pourra pas se faire avec une loi normale Dans l’exemple ci-dessous, on a :

Exemple : On lance 180 fois un dé à jouer et on note X la variable aléatoire qui représente le nombre d’apparition du 6. En utilisant l’approximation normale calculer au millième les probabilités suivantes :

a) P(X 6 20) b) P(X > 40) c) P(X 6 20 ou X > 40)

Il faut d’abord calculer les paramètres de la loi normale correspondante à cette loi binomiale B(180, 1/6)

E 30 et

Il faut vérifier qu’on se trouve dans les hypothèses de l’approximation : np = 30 > 5 et n(1 − p)

= 150 > 5

A l’aide d’une calculatrice, on trouve alors :

P(X 6 20) = PN(X 6 20, 5) = NormalFRép(-1 E 99,20.5, 30,5) ≃ 0, 029 P(X > 40) = PN(X > 40, 5) = NormalFRép(40.5,1 E 99, 30,5) ≃ 0, 018 P(X 6 20 ou X > 40) = PN(X 6 20.5) + PN(X > 40, 5) ≃ 0, 047

Si on utilise une table, il faut changer de variable : Z = X − 30. 5 P

P(X 6 20) = PN(Z 6−1, 9) = Φ(−1, 9) = 1 −Φ(1.9) ≃ 0, 029

(42)

P(X > 40) = PN(X > 40, 5) = P(Z > [2], 1) ≃ 0, 018 [1] .2.2 Loi normale centrée réduite

3.4 Théorème Central-Limit (hors programme)

Théorème 8 : Lorsque l’on fait la somme d’un très grand nombre de variables aléatoires de loi quelconque, cette somme suit une loi normale.

Remarque : Un grand nombre de distributions dans la nature suivent une loi normale car ces distributions décrivent des phénomènes qui résultent d’un grand nombre de causes de fluctuations indépendantes comme la taille d’un individu.

Probabilité sur un espace fini

Loi de probabilité de X et calculer son espérance mathématique et son écart-type.

2°) Le jeu est-il favorable au joueur ?

(43)

II. CONDITIONNEMENT a. Arbres pondérés

Règles de construction

La somme des probabilités des branches issues d’un même nœud est 1.

La probabilité de l’événement correspondant à un trajet est le produit des probabilités des différentes branches composant ce trajet.

Exemple

On jette une pièce.

▪ Si on obtient pile, on tire une boule dans l’urne P contenant 1boule blanche et 2 boules noires.

▪ Si on obtient face, on tire une boule dans l’urne F contenant 3 boules blanches et 2 boules noires.On peut représenter cette expérience par l’arbre pondéré ci dessous:

b. Probabilité conditionnelle Exercice n°6 :

En fin de 1eS, chaque élève choisit une et une seule spécialité en terminale suivant les répartitions ci –dessous :2/5 , ⅗ , 2/3 ,1/3 ½, ½, F ,B ,N ,B ,N Pp(P∩B)=⅙, p(P∩N)=⅓ ,p(F∩B)=3/10 , p(F∩N)=1/5

Par spécialité :Mathématiques Sciences Physiques SVT 40% 25% 35%

Sexe de l’élève selon la spécialité :

Sexe / Spécialité Mathématiques Sciences physiques SVT Fille 45% 24% 60%

Garçon 55% 76% 40%

On choisit un élève au hasard.

1. Construire l’arbre pondéré de cette expérience aléatoire.

2. a) Quelle est la probabilité de chacun des événements suivants ?F : « l’élève est une fille », M : « l’élève est en spécialité maths ».

b) Quelle est la probabilité que ce soit une fille ayant choisi spécialité mathématiques ?

c) Sachant que cet élève a choisi spécialité mathématiques, quelle est la probabilité que ce soit une fille ?

On appelle probabilité de F sachant M cette probabilité(conditionnelle) et on la note pM(F) ou P(F/M)

(44)

Quelle égalité faisant intervenir p(F∩M), p(F) et pM (F) peut-on écrire ?Comparer p(F) et pM(F) et en donner une interprétation.

d) Sachant que cet élève a choisi spécialité SVT, quelle est la probabilité que ce soit une fille ?

e) Comparer pS(F) et p(F) , et en donner une interprétation.

Définition: p désigne une probabilité sur un univers fini Ω.

A et B étant deux événements de Ω,B étant de probabilité non nulle.

On appelle probabilité conditionnelle de l’événement A sachant que B est réalisé le réel noté P(B/A)Le réel p(A/B) se note aussi pB(A) et se lit aussi probabilité de A sachant B.

Remarque :

Si A et B sont tous deux de probabilité non nulle, alors les probabilités conditionnelles p(A/B) et p(B/A) sont toutes les deux définie set on a:p(A∩B)=p(A/B)p(B)=p(B/A)p(A).

Exercice n°7 : Efficacité d’un test »

Une maladie atteint 3% d’une population donnée. Un test de dépistage donne les résultats suivants :

Chez les individus malades, 95% des tests sont positifs et 5% négatifs.

Chez les individus non malades, 1% des tests sont positifs et 99% négatifs.

On choisit un individu au hasard.

1. Construire l’arbre pondéré de cette expérience aléatoire.

2. Quelle est la probabilité

a) qu’il soit malade et qu’il ait un test positif ? b) qu’il ne soit pas malade et qu’il ait un test négatif ? c) qu’il ait un test positif ?

d) qu’il ait un test négatif ? 3. Calculer la probabilité

a) qu’il ne soit pas malade, sachant que le test est positif ? b) qu’il soit malade, sachant que

le test est négatif ?

4. Interpréter les résultats obtenus aux questions 3a et 3b.

(45)

III. INDÉPENDANCE

a. Événements indépendants

Définition : A et B sont 2événements de probabilité non nulle.

• A et B sont indépendants lors que la réalisation de l’un ne change pas la réalisation de l’autre.

• A et B sont indépendants si et seulement si p(A/B)=p(A) ou p(B/A)=p(A).

Théorème:

Deux événements A et B de probabilité non nulle sont indépendants si et seulement si ils vérifient une des trois conditions:p(A/B)=p(A) ou p(B/A)=p(B) ou p(A∩B)=p(A)p(B).

Démonstration :

▪ Par définition, les deux premières sont équivalentes

▪ si p(A/B)=p(A)commep(A∩B)=

p(A/B)p(B) alors p(A∩B)=p(A)p(B)

▪ si p(A∩B)=p(A)p(B),comme p(B)≠0( )( )BpBAp∩=p(A) c’est à dire pB(A)=p(A) Remarque :

Ne pas confondre événements indépendants et événements incompatibles.

▪ 2événements A et B sont indépendants si p(A∩B)=p(A)p(B)

▪ 2événements A et B sont incompatibles si A∩B=∅ Exercice n°8

On extrait au hasard un jeton d’un sac contenant six jetons : trois rouges numérotés 1, 2 et 3, deux jaunes numérotés 1 et 2, et un bleu numéroté 1.

On désigne respectivement par R, U et D les événements : « le jeton est rouge », « le numéro est 1 » et « le numéro est 2 ».

Les événements R et U sont-ils indépendants ? Et les événements R et D ?

b) Indépendance de deux variables aléatoires

Définition :X et Y sont deux variables définies sur l’univers Ω d’une expérience aléatoire; X prend les valeurs x1,x2,...,xn et Y prend les valeurs y1,y2,...,yq.

Définir la loi du couple (X,Y) c’est donner la probabilité pi,j de chaque événement[(X=xi) et(Y=yj)].

(46)

Remarque :

Les événements (X=xi) et (Y=yj) sont indépendants si: p[(X=xi)et(Y=yj)]=p(X=xi)×p(Y=yj) Exercice n° 9

1. On tire au hasard une carte d’un jeu de 32 cartes.

2. L’ensemble Ω des issues est alors l’ensemble des 32 cartes et le fait de tirer au hasard implique que les événements élémentaires sont équiprobables.

3. On définit sur Ω la variable aléatoire X qui, à chaque issue, associe 1 si cette issue est un valet, 2 si c’est une dame, 3 si c’est un roi, 4 si c’est un as et 0 si ce n’est pas l’une de ces figures.

4. Les valeurs de X sont donc x= 0, x2= 1, x= 2, x4= 3, x5= 4. On définit sur Ω la variable aléatoire Y qui, à chaque issue, associe 1 si cette issue est un trèfle ou un carreau, 2 si c’est un cœur, 3 si c’est un pique.

Les valeurs de Y sont y1= 1,y2= 2, y3= 3.

1°) Définir la loi du couple (X, Y).( on pourra dresser un tableau à double entrée) 2°) Donner les lois de X et de Y.

3°) X et Y sont-elles indépendantes ?

c) Probabilités totales

Définition: Soient Ω un univers associé à une expérience aléatoire et n un entier

2. Les événementsA1,A2,...,An forment une partition de Ω si les trois conditions suivantes sont réalisées:

▪ pourtout i∈{1;2;...;n},Ai≠0.

▪ pour tous i et j(avec i≠j)de{1;2;...n},Ai∩Aj≠∅A1∪A2∪...∪An=E.

Formule des probabilités totales

Soient A1,A2,...,An une partition de l’univers Ω constituée d’événements de probabilités non nulles et B unévénement quelconque contenu dans Ω. Alors: p(B)=p(B∩A1)+p(B∩A2)+...+p (B∩An) Ou p(B)3

Exercice n°2 : avec un dé

On lance deux fois de suite un dé équilibré.

1°) Représenter dans un tableau les 36 issues équiprobables . 2°) Calculer la probabilité des événements :

(47)

A : « on obtient un double » ; B : « on obtient 2 numéros consécutifs » C : « on obtient au moins un 6 » ; D :

« la somme des numéros dépasse 7 ».

Exercice n°3 : avec une pièce

On lance 4 fois de suite une pièce équilibrée.

1°) Dresser la liste des issues équiprobables.

2°) Quel est l’événement le plus probable : A ou B?

A : « 2 piles et 2 faces »

B : « 3 piles et 1 face ou 3 faces et 1pile ».

c. Variables aléatoires

Exercice n°4 :

On lance trois fois de suite une pièce de monnaie é quilibrée. On gagne 2 € pour chaque résultat « pile » et on perd 1 € pour chaque résultat « face».

1°) Quel est l’ensemble E des issues possibles ?

2°) Soit X l’application de E dans qui, à chaque issue, associe le gain correspondant .a) Quelles sont les valeurs prises par X ?

b) Quelle est la probabilité de l’événement

« obtenir un gain de 3 € » ? On note cette probabilité p(X = 3).

On obtient une nouvelle loi de probabilité sur l’ensemble des gains E’=X(E)={3;0;3;6}; nous la nommons loi de probabilité de X:

• Gain xi x1=3x2=0x3=3x4=6

• Probabilité pi=p(X=xi)8183 381 Définition:▪ Une variable aléatoire

X est une application définie sur un ensemble E muni d’une probabilité P, à valeurs dans.

▪ X prend les valeurs x1,x2,...,xn avec les probabilités p1,p2,...,pn définies par : pi=p(X=xi).

▪ L’affectation des pi aux xi permet de définir une nouvelle loi de probabilité.

Cette loi notée PX, est appelée loi de probabilité de X.

(48)

Remarque : Soit X une variable aléatoire prenant les valeurs x 1,x2,...,xn avec les probabilités p1,p2,...,pn

On appelle respectivement espérance mathématique de X,variance de X et écart-type de X, les nombres suivants:

▪l’espérance mathématique est le nombre E(X) défini par:E(X)=pixi

▪lavariance est lenombre V défini par:V(X)=(pixi -E(X))²=pixi²–E(X)².

▪l’écart type est lenombre σ défini par: V=σ.

Exercice n°5 :

Un joueur lance un dé : si le numéro est un nombre premier, le joueur gagne une somme égale au nombre considéré (en euros) ; sinon il perd ce mêmenombre d’euros.

1°) Si X est le gain algébrique réalisé, donner la loi de probabilité de X et calculer son espérance mathématique et son écart-type.

2°) Le jeu est-il favorable au joueur ? II. CONDITIONNEMENT

a. Arbres pondérés

Règles de construction La somme des probabilités des branches issues d’un même nœud est 1.

La probabilité de l’événement correspondant à un trajet est le produit des probabilités des différentes branches composant ce trajet.

Exemple

On jette une pièce.

▪Si on obtient pile,on tire une boule dans l’urne P contenant 1 boule blanche et 2 boules noires.

▪Si on obtient face,on tire une boule dans l’urne F contenant 3boules blanches et 2 boules noires.

On peut représenter cette expérience par l’arbre pondéré ci dessous:

b. Probabilité conditionnelle

Exercice n°6 :En fin de 1e S, chaque élève choisit une et une seule spécialité en terminale suivant les répartitions ci –dessous :

⅖,3/5 ,2/3,1/3,1/2,1/2 F B N B N P p(P∩B)=1/6 p(P∩N)=1/3 p(F∩B)=3/10p(F∩N)=1/5 Par spécialité :Mathématiques Sciences Physiques SVT40% 25% 35%

(49)

Sexe de l’élève selon la spécialité : Sexe / Spécialité Mathématiques Sciences physiques SVT

Fille 45% 24% 60%

Garçon 55% 76% 40%

On choisit un élève au hasard.

1°) Construire l’arbre pondéré de cette expérience aléatoire.

2°) a) Quelle est la probabilité de chacun des événements suivants ? F : « l’élève est une fille », M : « l’élève est en spécialité maths ».

b) Quelle est la probabilité que ce soit une fille ayant choisi spécialité mathématiques ?

c) Sachant que cet élève a choisi spécialit

E mathématiques, quelle est la probabilité que ce soit une fille ?

On appelle probabilité de F sachant M cette probabilité(conditionnelle)et on la note pM(F)ou P(F/M)

Quelle égalité faisant intervenir p(F∩M), p(F) et pM(F) peut-on écrire ? Comparer p(F) et pM(F) et en donner une interprétation.

d) Sachant que cet élève a choisi spécialité SVT, quelle est la probabilité que ce soit une fille ?

e) Comparer pS(F) et p(F) , et en donner une interprétation.

Définition : p désigne une probabilité sur un univers fini Ω.

A et B étant deux événements de Ω, B étant de probabilité non nulle.

▪On appelle probabilité conditionnelle de l’événement A sachant que B est réalisé le réel noté ApBAPB/Ap∩∩∩

Le réel p(A/B) se note aussi pB(A) et se lit aussi probabilité de A sachant B.

Remarque : Si A et B sont tous deux de probabilité non nulle, alors les probabilités conditionnelles p(A/B) et p(B/A) sont toutes les deux définies et on a : p(A∩B)=p(A/B) p(B)=p(B/A)p(A).