• Aucun résultat trouvé

introduction à la statistique descriptive Cours PDF • Economie et Gestion

N/A
N/A
Protected

Academic year: 2021

Partager "introduction à la statistique descriptive Cours PDF • Economie et Gestion"

Copied!
150
0
0

Texte intégral

(1)Université Abdelmalek Essaâdi. Faculté Polydisciplinaire à Larache. LEF Sciences Économiques et de Gestion. Statistique Descriptive Prof. Mohamed EL OTMANI. Année Universitaire 2014-2015.

(2) Introduction à la Statistique.

(3) Définition de la Statistique: « La statistique est l'ensemble des méthodes et techniques permettant de traiter les données numériques associées à une situation ou un phénomène, dans le but de rendre compte de la réalité, de présenter et d’analyser des données, et d’en tirer des conclusions et de prendre des décisions ».. Autres définitions: Selon l’Encyclopédie Universalis: le mot statistique désigne à la fois un ensemble de données d’observations et l’activité qui consiste dans leur recueil, leur traitement et leur interprétation. 3.

(4) Selon le Petit Larousse: 1. Ensemble de données d’observations relatives à un groupe d’individus ou d’unités 2. Ensemble des méthodes qui ont pour objet la collecte, le traitement et l’interprétation de ces données. 3. Ensemble des données numériques concernant un phénomène quelconque et dont on tire certaines conclusions. Remarque: Ne pas confondre « La statistique » et « Les statistiques »: • La statistique est la science qui vient d’être définie • Les statistiques est l’ensemble des données chiffrées ou le résultat numérique de la statistique 4.

(5) Vocabulaire statistique  Population: ensemble des unités statistiques ou individus. sur lesquels on effectue une analyse statistique. Exemple : étudiants de la FP Larache; salariés d’une entreprise, voitures ….  Unités statistiques (individus): élément de la population sur. lequel porte l’observation Exemple : étudiant; salarié, voiture.  Échantillon: sous-ensemble d’individus prélevés de la. population Exemple : étudiants de moins de 20 ans; jeunes salariés, voitures Renault.  Variable statistique (Caractère): désigne une grandeur. observable sur un individu et susceptible de varier prenant ainsi différents états appelés modalités. Exemple : âge des étudiants, nombre d’heures du travail des salariés , couleur de voiture.. 5.

(6) La collecte des données statistiques Avant la collecte des données, il faut 1. Fixer une problématique de recherche et poser les objectifs à atteindre soit d’exploration et description d’un phénomène, soit d’explication d’une relation ou soit de prévision et d’anticipation. 2. Fixer la population cible de l’étude ainsi que les éléments de cette population qu’il faut observer. Pour recueillir des informations sur une population statistique, on dispose de deux principales sources de données statistiques : exhaustive et non exhaustive.. 6.

(7)  Les recensements (méthode exhaustive): sont des opérations issues du dénombrement où chaque individu de la population est étudié selon le ou les caractères étudiés.  Les enquêtes (méthode de sondage ou échantillonnage= méthode non exhaustive): elle portent sur un sousensemble d’une population appelé échantillon Remarques: o Ne pas confondre « dénombrement » et « recensement » : • Le dénombrement : comptage des individus d’une population • Le recensement : chiffrer les données selon plusieurs aspects o La qualité de l’enquête et des résultats dépend du choix de l’échantillon. 7.

(8) Nature des données: Il est important d’avoir en permanence dans la mémoire, au moment du choix des méthodes d’analyse statistique, les différents types de données statistiques schématisés par le diagramme suivant: Données. Quantitatives. Continues. Discrètes. Qualitatives. Nominales. Ordinales. 8.

(9) 1) Caractères quantitatifs: se sont des variables numériques et mesurables exprimant une quantité. Les variables quantitatives peuvent être classées en : a) Variables quantitatives discrètes ou discontinues: représentées par un nombre fini de valeurs Exemple: nombre d’enfant par ménage; nombre d’heures de travail par jour des salariés d’une entreprise… b) Variables quantitatives continues: un caractère continu. peut prendre un nombre infini de valeurs dans son intervalle de définition. Ces valeurs peuvent être regroupées en classes. Exemple: revenu mensuel par ménage, poids ou taille des salariés d’une entreprise. 9.

(10) 2) Caractères qualitatifs: ils ne peuvent pas faire l’objet d’une mesure car ils ne se présentent pas sous forme numérique. Exemple: sexe, mention du baccalauréat, type de contrat de travail des salariés …. Les caractères qualitatifs se présentent en plusieurs modalités (différentes valeurs prises par un caractère qualitatif) Exemple: la variable ‘sexe’ a deux modalités: masculin et féminin La variable ‘mention du baccalauréat ’ a plusieurs modalités: passable, A. Bien, Bien ….. a) Variables qualitatives nominales: dont les modalités ne peuvent pas être classées ou hiérarchisées 10.

(11) Exemple: Pour le caractère ‘sexe des étudiants’, les modalités féminin et masculin ne peuvent pas être classées ou hiérarchisées.. b) Variables qualitatives ordinales: dont les modalités peuvent être classées ou hiérarchisées Exemple: pour le caractère ‘mention du baccalauréat’, les modalités sont ordonnées par ordre croissement comme suit : passable, Assez bien, Bien, Très bien, Excellent. Remarques: i. Les modalités d’un caractère qualitatif sont: Intégrales: à chaque individu doit correspondre une modalité du caractère Incompatibles: Chaque individu doit pouvoir être classé dans une seule modalité du caractère ii. Chaque individu d’un caractère doit pouvoir être classé dans une et une seule modalité 11.

(12) Exercice : Pour les nouveaux inscrits à la faculté polydisciplinaire à Larache, on veut étudier le type de baccalauréat obtenu par les étudiants, l’année d’obtention de baccalauréat et l’âge des étudiants. Pour réaliser cette étude, on choisit au hasard 30 étudiants pour les questionner. 1. Donner la population étudiée 2. La collecte des données était elle exhaustive ou non exhaustive? 3. Donner les caractères étudiés et préciser leur nature.. 12.

(13) Les tableaux statistiques.

(14) Les tableaux statistiques L’un des objectifs de la statistique descriptive est de résumer les données brutes recueillies sur une population dans des tableaux statistiques afin d’avoir une présentation des données d’une façon lisible. Exemple : Enquête auprès d’un échantillon de 60 familles de la région Larache-El Kser El Kebir sur le nombre d’enfant par ménage. Les résultats brutes des nombres d’enfants sont: 2142201230452542626421321333111323324 25233151526252312201431 Remarquons que les données brutes ne sont pas lisibles d’où la nécessité de regrouper ces données dans un tableau pour faciliter leur traitement. 14.

(15) La présentation d’un tableau statistique La présentation d’un tableau statistique doit respecter des principes généraux : • Le tableau doit porter des intitulés de lignes et de colonnes clairement définis ainsi que préciser les unités utilisés. • Le tableau doit porter un titre précisant son contenu et la source des informations lorsque les données sont empruntées à une publication ou à un organisme. Dans un tableau statistique: o La première colonne du reprend les différentes modalités (xi ) prises par le caractère étudié. o La deuxième colonne présente les effectifs (ni ) nombre d’individus correspondant à chaque modalité (xi ) du caractère . 15.

(16) Considérons une population statistique de n individus décrite selon le caractère x dont les k modalités sont x1, x2, ..., xi, ...., xk Modalité (xi ). Effectif (ni ). x1 x2. n1 n2. . . .. . . .. xi. ni. . . .. . . .. xk. nk. Total. n.  ni représente le nombre d’individus,. appelé « effectif partiel » présentant la modalité xi  n: la somme des effectifs partiels ni est appelé « effectif total » de la population k. n   ni i 1. 16.

(17) Exemples: Nombre d’enfants observé dans un échantillon des ménages de la région Larache-ElKser Elkebir Nombre d’enfants par ménage (xi ). Effectif des ménages (ni ). 0 1 2 3 4 5 6. 3 12 18 12 6 6 3. Total. 60. 17.

(18) Source: www.hcp.ma (site institutionnel du haut commissariat au plan du royaume du Maroc 18.

(19) La fréquence relative La fréquence relative ou fréquence notée fi est la proportion d’individus présentant la même modalité dans la population. Elle est obtenue en divisant chaque effectif ni par l’effectif total n:. ni fi  n Remarques : • Il est recommandé d’exprimer la fréquence fi en pourcentage. • La somme des fréquences fi est égale à 1 et la somme des fréquences exprimées en pourcentage est égale à 100. 19.

(20) Le tableau statistique de la distribution du caractère étudié se présentera donc sous la forme suivante : Modalité (xi). Effectif (ni). Fréquence (fi). x1 x2. n1 n2. f1 f2. . . .. . . .. . . .. xi. ni. fi. . . .. . . .. . . .. xk. nk. fk. Il en est de même si on considère les fréquences en pourcentage au lieu des fréquences. 20.

(21) Exemple: le tableau statistique de la distribution de nombre d’enfants par ménage dans la région de Larache-ElKser ElKebir est présenté comme suit: Nombre d’enfants par ménage. Effectif des ménages. Fréquence des ménages en %. 0 1 2 3 4 5 6. 3 12 18 12 6 6 3 60. 5 20 30 20 10 10 5 100. Total. 21.

(22) Effectifs cumulés et fréquences cumulées Dans l’exemple précédent, s’il est demandé de répondre à certains questions de type • Combien de familles ont moins de quatre enfants? • Combien de familles ont au moins quatre enfants? • Quelle est la proportion de familles ayant au plus quatre enfants? • Quelle est la proportion de familles ayant plus de quatre enfants? Le calcul des effectifs cumulés, notés Ni, et des fréquences cumulées, notées Fi, nous permet de donner ces valeurs. Ce calcul se fait en cumulant (sommant) les effectifs et les fréquences relatives dans une colonne du tableau. En effet :. 22.

(23) Pour calculer un effectif cumulé croissant d’une valeur d’un caractère, il suffit d’ajouter à l’effectif de cette valeur le ou les effectifs des valeurs précédentes. Pour calculer une fréquence cumulée croissante d’une valeur d’un caractère, il suffit d’ajouter à la fréquence de cette valeur la ou les fréquences des valeurs précédentes. Pour calculer un effectif cumulé décroissant d’une valeur d’un caractère, il suffit d’ajouter à l’effectif de cette valeur le ou les effectifs des valeurs suivantes.  Pour calculer une fréquence cumulée décroissante d’une valeur d’un caractère, il suffit d’ajouter à la fréquence de cette valeur la ou les fréquences des valeurs suivantes.. 23.

(24) Sommer de haut en bas. Sommer de bas en haut. Calculer les effectifs cumulés croissants et les fréquences cumulées croissantes. Calculer les effectifs cumulés décroissants et les fréquences cumulées décroissantes. Répondre aux questions « moins de » et « au plus ». Répondre aux questions « plus de » et «au moins ». Exemple: Pour répondre aux questions posées au début de ce paragraphe, il suffit de calculer les effectifs cumulés et les fréquences cumulées du caractère représentant le nombre d’enfants par ménage dans la région Larache-ElKser ElKebir. 24.

(25) Nombre d’enfants par ménage. Effectifs des Ménages. Fréquence s des Ménage en %. Effectifs cumulés croissants. Effectifs cumulés décroissant s. Fréquence s cumulées croissantes en %. Fréquences cumulées décroissante s en %. 0. 3. 5. 3. 60. 5. 100. 1. 12. 20. 15. 57. 25. 95. 2. 18. 30. 33. 45. 55. 75. 3. 12. 20. 45. 27. 75. 45. 4. 6. 10. 51. 15. 85. 25. 5. 6. 10. 57. 9. 95. 15. 6. 3. 5. 60. 3. 100. 5. Total. 60. 100. D’après le tableau: • 45 ménages ont moins de 4 enfants • 15 ménages ont au moins 4 enfants • 85% des ménages ont au plus de 4 enfants • 15% des ménages ont plus de 4 enfants 25.

(26) Exercice : Lors d’une enquête d’opinion réalisée auprès de 250 étudiants de la FPL, il était demandé de remplir le questionnaire suivant: Nom:. Prénom:. Âge (en années):. Lieu de naissance :. Taille (en cm):. Avis sur l’architecture de la FPL: Médiocre. Moyenne. Bonne. Très bonne. Excellente. □. □. □. □. □. 1. Tableau statistique d’un caractère qualitatif nominal: La répartition des étudiants interrogés selon leur lieu de naissance est donnée par le tableau ci-dessous: Lieu de naissance Effectif des étudiants Larache. 98. El Ksar El Kebir. 87. Tanger. 22. Tétouan. 13. Autres. 30. Calculer les fréquences des étudiants (avec une précision de 10-2). 26.

(27) 2. Tableau statistique d’un caractère qualitatif ordinale: la. distribution des avis des étudiants sur l’architecture de la FPL est résumée dans le tableau suivant: Avis. Effectif. Excellente. 38. Très bonne. 84. Bonne. 75. Moyenne. 37. Médiocre. 16. a) Calculer les fréquences et les fréquences cumulées des étudiants. b) Quel est le pourcentage des étudiants qui estiment que l’architecture de. la FPL est plus que moyenne? 3. Tableau statistique d’un caractère quantitatif discret: l’âge des étudiants questionnés est présenté dans le tableau statistique ci-après.. 27.

(28) Âge <18 18 19 20 21 22 23  24. effectif 8 82 70 28 20 14 16 12. a) Quel est l’effectif des étudiants qui sont âgés de moins de 20 ans? b) Quel est le pourcentage des étudiants qui sont âgés au moins de 19 ans?. 4. Tableau statistique d’un caractère quantitatif continu: la distribution de la taille des étudiants (en cm): Taille effectif a) Quel est l’effectif des étudiants qui [130; 150[ 2 ont une taille moins que 1,5m ou [150; 160[ 30 plus que 1,8m? [160; 165[ 60 b) Quel est la proportion des étudiants [165;170[ 62 [170; 175[ 44 qui ont une taille plus que 165cm? [175; 180[ 28 c) Quel est la proportion des étudiants [180; 190[ 16 qui ont une taille au plus165cm? [190; 220]. 8. 28.

(29) Représentation graphique des données statistiques.

(30) Les représentations graphiques Les graphiques permettent de donner une synthèse visuelle de la distribution d’une variable et mettre en évidence certaines informations données par le tableau. Les représentations graphiques sont spécifiques à chaque type de variables ou de caractères (qualitatif, quantitatif discret ou quantitatif continu).. Représentations des caractères qualitatifs Les variables qualitatives peuvent être représentées graphiquement de différentes manières . Les diagrammes les plus utilisés sont le diagramme à bandes (ou diagramme en tuyaux d’orgues) et le diagramme à secteurs circulaires. 30.

(31) 1. Diagrammes en bâtons: Un diagramme en bâtons est constitué d’une suite de bâtons (verticaux ou horizontaux). À chaque modalité du caractère, on associe un « bâton» de longueur proportionnelle à l’effectif ou à la fréquence de cette modalité. Exemple: Répartition des salariés de l’entreprise X selon le contrat de travail CSP. Effectif des salariés. Cadres supérieurs. Contremaîtres. Employés. 10. 5. 20. Ouvriers Autres spécialisés catégories 40. 5. 31.

(32) Répartition des salariés de l’entreprise selon la CSP Fréquence en % Effectifs. 50. 40. 40. 30. 30. 20. 20. 10. 10. Autres catég.. Ouvriers. Employés. Contremaîtres. CSP Cadres. Autres catég.. Ouvriers. Employés. Contremaîtres. Cadres. CSP. 32.

(33) 2. Diagrammes à bandes : Dans un diagramme à bandes, on associe une bande verticale à chaque modalité. La largeur de chacune de bande est la même et sa hauteur est proportionnelle à l’effectif ou la fréquence de la modalité correspondante. La distance entre les bandes est constante. Au dessus de chaque bande on note des étiquettes permettant connaître l’effectif ou la fréquence de la modalité associée. Exemple: le diagramme à bandes correspondant aux effectifs des salariés de l’entreprise X Effectif 45. 40. 40 35 30. 25. 20. 20 15 10. 10 5. 5. 5. 0 Cadres. Contremaîtres. Employés. Effectif. Ouvriers. Autres. CSP. 33.

(34) 3. Diagrammes à secteurs: C’est un disque divisé en secteurs angulaires représentant l’ensemble de la population. Les différentes modalités du caractère sont représentées par des angles aux centres proportionnelles aux effectifs ou fréquences de leurs modalités respectives. L’angle de chaque secteur αi est proportionnel à la fréquence fi :.  i  360  fi. Exemple : Répartition des salariés de l’entreprise X selon la CSP CSP xi. Effectif ni. Fréquence fi. Angle αi. Cadres. 10. 0,125. 45. Contremaîtres. 5. 0,0625. 22,5. Employés. 20. 0,25. 90. Ouvriers. 40. 0,50. 180. Autres. 5. 0,0625. 22,5 34.

(35) Répartition par secteurs des salariés de l’entreprise selon la CSP Autres 6% Cadres 13%. Ouvriers 50%. Cadres. Contremaîtres. Contremaîtres 6%. Employés 25%. Employés. Ouvriers. Autres. 35.

(36) Représentations des caractères quantitatifs 1. Représentation graphique des caractères quantitatifs discrets: a) Représentation d’une distribution de fréquences (ou effectifs) :. On présente une distribution à variable quantitative discrète par un diagramme en bâtons. Exemple :Nombre d’enfants de 40 salariés d’une entreprise: Nb. d’enfants. Effectifs. Fréquences en %. 0. 8. 20. 1. 7. 17,5. 2. 12. 30. 3. 6. 15. 4. 3. 7,5. 5. 4. 10. Total. 40. 100. 36.

(37) Distribution des fréquences des salariés selon leur nombre d’enfants Fréquences % 30%. Polygone des fréquences: En joignant les sommets des bâtons par une ligne brisée, on obtient le polygone de fréquences. 25% 20%. 15% 10% 5%. 0. 1. 2. 3. 4. 5. Nb. d’enfants. 37.

(38) 2.Représentation graphique des caractères quantitatifs continus : a) Histogramme : Un histogramme est constitué d’une suite de rectangles, dont les bases coïncident avec les classes divisant le domaine de variation de la variable et dont les hauteurs soient telles que les effectifs (ou les fréquences) sont traduits par les surfaces des rectangles. Exemple : Dans le cadre de l’étude de la population des adolescents d’un cartier populaire, les valeurs de leurs tailles peuvent être réparties de la façon suivante :. 38.

(39) Taille. effectif. Fréquence en %. [140,145[. 1. 2. [145,150[. 1. 2. [150,155[. 9. 18. [155,160[. 17. 34. [160,165[. 16. 32. [165,170[. 3. 6. [170,175[. 3. 6. L’histogramme des effectifs de cette série est présenté par le graphique suivant: Effectifs des adolescents selon leurs tailles 20. 17. 16. 15 9. 10 5 0. 1. 1. 3. 3 39.

(40) Sur le même graphique des effectifs (resp. des fréquences) , on présente le polygone des effectifs (resp. des fréquences). Ce polygone permet de représenter la distribution sous la forme d’une courbe en joignant les milieux des bases supérieures de chaque rectangle de l’histogramme par des segments de droite. Fréquences des adolescents selon leurs tailles Polygone des fréquences 34. 32. 18 2. 2. 6. 6. 40.

(41) Polygones cumulatifs: On construit dans un repère cartésien orthogonal les points dont les abscisses sont égales aux bornes supérieurs des classes (sauf pour le premier point), et dont les ordonnées sont les effectifs cumulés croissant correspondants. En joignant ces points par des segments de droites nous obtenons le polygone cumulatif croissant de la distribution donnée. Exemple: On calcule les effectifs cumulés croissant: Taille. effectif. Effectif cumulé. [140,145[. 1. 1. [145,150[. 1. 2. [150,155[. 9. 11. [155,160[. 17. 28. [160,165[. 16. 44. [165,170[. 3. 47. [170,175[. 3. 50. 41.

(42) Polygone des actifs cumulés des adolescents selon leurs tailles 60 50 40. 30 20 10 0 140. 145. 150. 155. 160. 165. 170. 175. 42.

(43) Exercice 1 : On a interrogé 50 personnes sur leur dernier diplôme obtenu. On a obtenu le tableau statistique suivant: Dernier diplôme obtenu. effectif. Sans diplôme. 4. Primaire. 11. Secondaire. 14. Supérieur non-universitaire. 9. Universitaire. 12. Fréquence en %. 1. Calculer les fréquences des diplômes obtenus 2. Tracer le diagramme en bâtons représentatif des effectifs des diplômes obtenus 3. Tracer le diagramme en bandes représentatif des fréquences des diplômes obtenus. 43.

(44) Exercice 2 : On mesure la taille de 40 étudiants choisis au hasard. Les mesures sont données par la série statistique suivante: {150; 151; 153; 154; 154; 155 ; 156 ; 156 ; 156; 156; 157; 157; 157 ;158 ; 158 ; 159; 159; 160; 160; 160; 161 ; 160 ; 161; 162 ; 162; 162; 163 ; 164 ; 164; 164; 164; 165; 166; 167; 168; 168; 169 ; 170; 171; 173}. I. On construit le tableau statistique suivant: Classes des tailles. Effectifs ni. Effectifs cumulés croissants Ni. Fréquences fi en %. Fréquences cumulées croissants Fi en %. [1,50-1,55[. 5. 5. 12,5. 12,5. [1,55-1,60[. 12. 17. 30. 42,5. [1,60-1,65[. 14. 31. 35. 77,5. [1,65-1,70[. 6. 37. 15. 92,5. [1,70-1,75[. 3. 40. 7,5. 100. 1. Remplir le tableau 2. Tracer l’histogramme des fréquences et le polygone cumulatif des effectifs 44.

(45) Exercice 3 : Afin d’établir un rapport éventuel entre l’âge et les loisirs, un psychosociologue enquête auprès d’une population de 20 personnes et obtient les informations suivantes : Individu. 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. Age. 12. 14. 40. 35. 26. 30. 50. 55. 25. 40. Loisir. S. S. C. C. S. T. L. C. L. C. Individu. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. Age. 30. 50. 69. 45. 28. 25. 50. 30. 35. 25. Loisir. T. L. L. C. S. C. L. T. T. T. S = Sport *** C = Cinéma *** T =Théâtre *** L =Lecture. 1. Combien a-t-on de variables? Quel est le type de chaque variable ? 2. Pour la variable « Loisir » a. dresser le tableau des modalités et des effectifs b. calculer les fréquences. c. Représenter les fréquences en diagramme de bâtons 45.

(46) 3. Quel est le pourcentage des individus a. Qui préfèrent le cinéma ? b. qui ne préfèrent pas la lecture ? 4. Remplir le tableau suivant: Age. [10,20[ [20,30[. [30,40[. [40,50[. [50,60[. [60,70]. Effectif. a. Calculer les fréquences, les fréquences cumulées croissantes et décroissantes b. Tracer l’histogramme et le polygone des fréquences c. Représenter dans le même graphe, le polygone cumulatif croissant et décroissant des fréquences. d. Quel est le pourcentage des individus âgés de moins de 30 ans? e. Quel est le pourcentage des individus âgés d’au moins de 30 ans?. 46.

(47) L’âge des étudiants (en années) Âge 17 18 19 20 21 22 23 24. effectif 8 82 70 28 20 14 16 12. a) Calculer les fréquences (en %) b) Tracer le diagramme en bâtons et le polygone des fréquences. Distribution de la taille des étudiants (en cm): Taille < 155 [155; 160[ [160; 165[ [165;170[ [170; 175[ [175; 180[ [180; 185[  185. effectif 2 30 60 62 44 28 16 8. a) Calculer les fréquences et les fréquences cumulées croissantes b) Tracer l’histogramme et le polygone des fréquences c) Tracer le polygone des fréquences cumulées croissantes. 47.

(48) Caractéristiques de position: mode, médiane et moyenne.

(49) Mode Le mode (ou valeur modale), noté Mo, est la valeur que la variable statistique prend le plus souvent ( la valeur qui a le plus grand effectif ). Le mode peut être calculé pour les caractère qualitatifs comme pour les caractères quantitatifs. Exemple : Soit la série : {8,4,4,3,4,3,8,2,5} La valeur la plus fréquente de cette série est 4. Le mode est Mo=4. Remarques: 1. Une série peut avoir plusieurs modes : Soit la série S = {4, 0, 1, 1, 2, 2, 2, 3, 3, 4, 2, 3, 4, 5, 2, 1, 3, 3, 4, 5}. "2" et "3" sont les valeurs qui reviennent le plus souvent : 5 fois chacune. Cette série a deux modes: 2 et 3. On peut avoir des séries avec 3, 4, … modes. Ce sont alors des séries multimodales. 49.

(50) Le mode n’existe pas forcément : C'est le cas lorsque toutes les valeurs ont le même effectif comme dans l'exemple suivant : {8,6,5,7,3,1}. Dans ce cas, on peut aussi dire que toutes les valeurs sont modales. 3. Le mode n’est pas la valeur la plus élevée : Il ne faut pas confondre le mode, qui est la valeur la plus fréquente, avec la valeur la plus élevée de la série. Dans la série {8,6,5,7,3,1}, il n'y a pas de mode, mais la valeur la plus élevée est 8. Il peut arriver que le mode soit aussi la valeur la plus élevée, mais ce n’est alors qu’une coïncidence. 2.. I.. Le mode dans le cas d’une variable qualitative:. Le mode est la modalité correspondante à l’effectif le plus important. Exemple: Répartition des salariés de l’entreprise X selon le contrat de travail CSP. Effectif des salariés. Cadres supérieurs. Contremaîtres. Employés. 10. 5. 20. Ouvriers Autres spécialisés catégories 40. 5. 50.

(51) Le mode de ce caractère est la modalité « ouvriers spécialisés » Le mode dans le cas d’une variable quantitative discrète: Le mode est la valeur correspondante à l’effectif le plus important Exemple :Nombre d’enfants de 40 salariés d’une entreprise Nb. d’enfants. Effectifs. Fréquences en %. 0. 8. 20. 1. 7. 17,5. 2. 12. 30. 3. 6. 15. 4. 3. 7,5. 5. 4. 10. Total. 40. 100. Le mode de ce caractère est égal à 2 enfants 51.

(52) La classe modale dans le cas d’une variable quantitative continue: Si les classes sont toutes de même amplitude, la classe modale est la classe d’effectif le plus élevé ou de fréquence la plus élevée. Si les classes ne sont pas toutes de même amplitude, la classe modale est la classe dont l’effectif corrigé ou la fréquence corrigée est maximum Exemples: 1. On considère la distribution statistique d’une population d’étudiants selon leur taille (en cm): Taille (cm). <160. [160;170[. [170;180[. [180;190[. ≥ 190. total. effectif. 6. 7. 8. 2. 1. 24. Fréquences en %. 25. 29,1. 33,3. 8,3. 4,3. 100. L’effectif ou la fréquence les plus élevés montrent que le classe modale est [170;180[ 52.

(53) 2. Soit la distribution d’une population des étudiants répartis suivant leur poids (en kg) Poids (en kg). Effectif (ni). Fréquence (fi) en %. Amplitude (ai). fréquence corrigée fico=fi/ai. <55. 2. 8,33. 5. 1,67. [55;60[. 3. 12,5. 5. 2,5. [60;70[. 4. 16,67. 10. 1,67. [70;75[. 5. 20,83. 5. 4,17. [75;85[. 6. 25. 10. 2,5. 85. 4. 16,67. 10. 1,67. Total. 24. 100. La classe modale, à laquelle est associée la fréquence corrigée la plus grande, est la classe [70; 75[. 53.

(54) Le mode dans le cas d’une variable quantitative continu: On peut calculer le mode pour un caractère quantitatif continu par la formule suivante:. M 0  LI CMo  ACMo. 1 1   2. où • LICMo est la borne inférieur de la classe modale • ACMo est l’amplitude de la classe modale • ∆1= fCMO-fCMO-1: différence entre la fréquence de la classe modale et la fréquence de la classe précédente •∆2= fCMO-fCMO+1: différence entre la fréquence de la classe modale et la fréquence de la classe suivante. 54.

(55) Exemple: Soit le tableau suivant décrivant la distribution des salaires de 75 employés: Salaires. [215,235[. [235,255[. [255,275[. [275,295[. Effectifs. 4. 6. 13. 22. Fréquences. 5,33. 8. 17,33. 29,33. Salaires. [295,315[. [315,335[. [335,355[. [355,375[. Effectifs. 15. 6. 5. 4. Fréquences. 20. 8. 6,67. 5,33. Le mode calculé par la relation précédente est. M 0  LI CMo  ACMo. 1 1   2. 29,33  17,33  275  20 (29,33  17,33)  (29,33  20)  286, 25 55.

(56) La médiane: Définition: La médiane Me est telle que l'effectif des observations dont les modalités sont inférieures à Me est égal à l'effectif des observations dont les modalités sont supérieures à Me. Détermination pratique: • On classe les données par ordre croissant, la médiane est la valeur centrale qui sépare la série en deux parties égales. • On la détermine à partir des effectifs cumulés ou du diagramme cumulatif.. 56.

(57) Cas d'une variable discrète: 1. À partir de la série statistique: On classe les donner par ordre croissant : x1<x2<…<xn  Si n paire (n=2k), la médiane est égale à. xk 1  xk Me  2 Exemple: S={0 ; 0 ; 1 ; 1 ; 2 ; 2 ; 3 ; 4}. La médiane est égale à Me . 1 2  1,5 2.  Si n est impaire (n=2k+1), la médiane est égale à la (k+1)ème valeur de la série. Me  xk 1 Exemple: S={0 ; 1 ; 1 ; 2 ; 2 ; 3 ; 4}. La médiane est égale à Me  2. 57.

(58) 2. À partir du tableau statistique: On la détermine à partir des fréquence cumulées. Exemple: Nombre d’enfants observés dans un échantillon de 55 familles xi. ni. Ni. fi (%). Fi (%). 0. 3. 3. 5%. 5%. 1. 4. 7. 7%. 12 %. 2. 8. 15. 15 %. 27 %. 3. 7. 22. 13 %. 40 %. 4. 14. 36. 25 %. 65 %. 5. 9. 45. 16 %. 81 %. 6. 6. 51. 11 %. 92 %. 7. 2. 53. 4%. 96 %. 8. 1. 54. 2%. 98 %. 9. 1. 55. 2%. 100 %. Me  4 58.

(59) Exemple : les notes obtenues pour 250 étudiants Notes. Effectifs. Effectifs cumulés croissants. 0. 5. 5. 1. 10. 15. 2. 7. 22. 3. 9. 31. 4. 4. 35. 5. 11. 45. 6. 5. 50. 7. 8. 58. 8. 12. 70. 9. 10. 80. 10. 21. 101. 11. 14. 115. 12. 26. 141. 13. 22. 163. 14. 14. 177. 15. 17. 194. 16. 10. 204. 17. 16. 220. 18. 12. 232. 19. 15. 247. 20. 3. 250. Me  12. 59.

(60) Exemple: nombre d’enfants par foyer xi. ni. Ni. fi (%). Fi (%). 0. 22. 22. 27,5. 27,5. 1. 18. 40. 22,5. 50. 2. 16. 56. 20. 70. 3. 10. 66. 12,5. 82,5. 4. 7. 73. 8,75. 91,25. 5. 5. 78. 6,25. 97,5. 6. 2. 80. 2,5. 100. TOTAL. 80. 100. x40  x41 1  2 Me    1,5 2 2. 60.

(61) Cas d'une variable continue: En général, la médiane se trouve à l’intérieur d’une classe. Sa valeur exacte est déterminée par interpolation linéaire. Détermination analytique de la médiane: Déterminer la classe médiane [a; b[ telle que F(a)<= 50% et F(b) > 50%. F(b). 50  F (a) Me  a  (b  a) F (b)  F (a). 50 %. F(a). a Médiane. b 61.

(62) Exemple: La distribution statistique d’une population d’étudiants selon leur taille (en cm): Taille (cm). <160. [160;170[. [170;180[. [180;190[. ≥ 190. total. effectif. 6. 7. 8. 2. 1. 24. Fréquences en %. 25. 29,1. 33,3. 8,3. 4,3. 100. Fréquences cumulées croissantes en %. 25. 54,1. 87,4. 95,7. 100. La médiane de cette distribution est. 50  25 Me  160  (170  160) 54,1  25  168, 6. 62.

(63) La moyenne: 1. Moyenne Arithmétique: La moyenne (arithmétique ) est la somme des valeurs observées divisée par leur nombre. Remarque: La moyenne ne peut être définie que sur une variable quantitative..  La moyenne d’une variable discrète {(xi; ni)}. x. n1 x 1 n2 x2  ...  n p x p n1  n2  ...  n p. 1 p   ni xi n i 1. 63.

(64) Exemple: L'étude de 20 familles a conduit à la distribution des nombres d'enfants dans chaque famille : Nombre d'enfants xi. 0. 1. 2. 3. 4. 5. Nombre de familles ni. 5. 3. 6. 1. 3. 2. Le nombre moyen d'enfants par famille est:. (0  5)  (1 3)  (2  6)  (3 1)  (4  3)  (5  2) 5  3  6 1 3  2 45   2, 25 20 x. 64.

(65)  La moyenne d’une variable continue: La variable est connue par ses classes [ai;bi] et les effectifs ni associée à chaque classe.. x. n1c 1 n2c2  ...  n p c p n1  n2  ...  n p. p. 1   ni ci n i 1. où ci est le centre de la classe [ai;bi[. Exemple: La distribution des tailles de 40 étudiants est donnée par le tableau Taille en cm xi Nombre d’étudiants ni. [150-160[. [160-165[. [165-170[. [170-175[. [175-185 ]. 4. 8. 10. 16. 2. La moyenne des tailles des étudiants:. (155  4)  (162,5  8)  (167,5  10)  (172,5  16)  (180  2) x 4  8  10  16  2 620  1300  1675  2760  360   167,875 40 65.

(66) Exercice : Un bureau d'étude stratégique désire étudier le nombre d'enfants et le revenu mensuel des ménages de la province de Larache. Pour réaliser cette enquête, on considère un échantillon de 120 ménages choisis au hasard. I) La distribution de la variable ``Nombre d'enfants'' est donnée par le tableau suivant: Nombre d’enfants Effectif des ménages. 0 1 2 3 4 18 12 54 30 6. 1. Tracer le diagramme en bâtons de cette distributio 2. Quel est le mode de cette distribution?. 3. Calculer la médiane de la distribution. 4. Calculer la moyenne des enfants par ménages 66.

(67) II) Les revenus mensuels des ménages sont répartis suivant le tableau ci-après: Revenus Entre 2000 et 3000 Effectifs 24. Entre 3000 et 4000 18. Entre 4000 et 5000 42. Entre 5000 et 6000 18. Entre 6000 et 7000 12. Entre 7000 et 8000 6. 1. Calculer les fréquences fi et tracer le polygone des fréquences des revenus 2. Calculer le mode de la distribution des revenus 3. Calculer les fréquences cumulées croissantes Fi et tracer le polygone cumulatif 4. Calculer la médiane de la distribution des revenus 5. Quel est le revenu moyen des ménages? 67.

(68) Caractéristiques de dispersion: variance et écart-type.

(69) La variance La variance est un indicateur de la dispersion d’une série par rapport à sa moyenne. 1. La variance d’une série est donnée par la formule suivante :. 1 n V ( X )   ( xi  x ) 2 n i 1. 2. La variance d’une variable quantitatif discrète {(xi,ni); i=1,…,p} est exprimée par 1 p. V (X ) . n. 2 n ( x  x ) i i i 1. 3. La variance d’une variable quantitative continue {([ei;ei+1[,ni); i=1,…,p} est donnée par: p. 1 V ( X )   ni (ci  x ) 2 n i 1. où ci est le centre de la classe [ei;ei+1[. 69.

(70) Remarques: 1. On peut dire que plus la variance est élevée, plus la dispersion autour de la moyenne est élevée. Mais comme les écarts à la moyenne ont été élevés au carré, le chiffre obtenu est assez élevé. C’est pourquoi, on utilise surtout la variance comme calcul intermédiaire pour obtenir l’écart-type et le coefficient de variation. 2. La variance peut s’écrire encore de la forma suivante: • Pour une variable quantitative discrète:. 1 p V ( X )   ni x 2i  ( x ) 2 n i 1 • Pour une variable quantitative continue:. 1 p V ( X )   ni ci 2  ( x ) 2 n i 1 70.

(71) Exemple : L'étude de 20 familles a conduit à la distribution des nombres d'enfants dans chaque famille : Nombre d'enfants xi. 0. 1. 2. 3. 4. 5. Nombre de familles ni. 5. 3. 6. 1. 3. 2. On a déjà calculé x=2,25. xi. ni. (xi)2. ni(xi)2. 0. 5. 0. 0. 1. 3. 1. 3. 2. 6. 4. 24. 3. 1. 9. 9. 4. 3. 16. 48. 5. 2. 25. 50. 1 2 var( X )  ( 134)  (2, 25)  1, 6375 20 71.

(72) Exemple: La distribution des tailles de 40 étudiants est donnée. par le tableau suivant Taille en cm xi Nombre d’étudiants ni. [150-160[. [160-165[. [165-170[. [170-175[. [175-185 ]. 4. 8. 10. 16. 2. ni(ci)2 96100. La moyenne est déjà calculée: x=167,875 Taille (en cm). ni. ci. [150;160[. 4. 155. (ci)2 24025. [160;165[. 8. 162,5. 26406. 211250. [165;170[. 10. 167,5. 28056. 280562,5. [170;175[. 16. 172,5. 29756. 476100. [175;185]. 2. 180. 32400. 64800. Total. 40. 1 var( X )  ( 1128813)  (167,875) 2 40. 1128813. 38,3 72.

(73) L’écart-type Par définition, l’écart-type d’une variable est la racine carrée de la variance.  X  V (X ) • si l’écart-type est faible, cela signifie que les valeurs sont. assez concentrées autour de la moyenne. • si l’écart-type est élevé, cela veut dire au contraire que les valeurs sont plus dispersées autour de la moyenne. Remarque : Quelque soit la distribution statistique étudiée, un intervalle dont les extrémités sont « x-2σ » et « x+2σ » contient toujours au moins 75% des unités constituant la population étudiée. 73.

(74) Les indices statistiques.

(75) Introduction Les économistes, les sociologues et les gestionnaires étudient l’évolution dans le temps de grandeurs représentatives de phénomènes économiques et sociaux tels que l’indice de confiance des consommateurs, l’indice de compétitivité des nations, l’indice du développement humain, l’indice de chômage, l’indice du bonheur, etc. Pour évaluer ces évolutions ou effectuer ces comparaisons, on utilise principalement les indices statistiques.. 75.

(76) Indice statistique simple Soit X une grandeur simple observée dans plusieurs situations. Soit Xt la valeur de X à la situation t et X0 la valeur de X à la situation 0. La situation t est appelée situation courante et la situation 0 est appelée situation de base ou situation de référence. L’indice simple de X à la situation t base 100 à la situation 0, noté est le rapport entre Xt et X0 multiplié par 100: It /0. I t /0. Xt  100 X0 76.

(77) Il mesure la variation relative de la valeur entre la période de base et la période courante et permet de calculer et de comparer facilement les évolutions de plusieurs grandeurs entre deux périodes données. Souvent, on multiplie le rapport par 100; on dit : indice base 100 à telle période. Exemple : le prix du dollar par rapport au franc suisse a passé de 2.50 en 2003 à 1.25 en 2009. L’indice du prix du dollar est alors:. I 09/03. 1, 25  100  50. 2,5. 77.

(78) Indice statistique élémentaire Définition: L'indice élémentaire d'une grandeur est le rapport entre la valeur de cette grandeur au cours d'une période courante et sa valeur au cours d'une période de base. En général, le rapport entre deux grandeurs simples entre deux périodes différentes est appelé un indice élémentaire.. It /t '. Xt  100 Xt' 78.

(79) Exemple: le prix P d’un bien entre 2007 et 2009: Année. 2007. 2008. 2009. t Pt. 0. 1. 2. 2. 2.30. 2.40. Le tableau des indices élémentaires des prix du bien est le suivant:. t’ t 2007. 2008 2009. 2007. 2008. 2009. 100. 115. 120. 86.96. 100. 104.35. 83.33. 95.83. 100 79.

(80) Propriétés des indices élémentaires Les indices élémentaires vérifient les propriétés de transitivité (ou circularité) et de réversibilité. Soit t, r et s trois situations différentes:. It / r  I r / s It / s  Transitivité: 100 2 100 Ir/s  Réversibilité: Is/r Identité:. I t / t  100 80.

(81) Les indices synthétiques Définition : Un indice synthétique est un indice calculé sur une grandeur complexe ( ensemble de prix, ensemble de deux ou plusieurs produits …) Les indices calculés sont donc essentiellement des indices de prix, des indices de quantités et des indices des valeurs monétaires. Les situations d’observations sont presque souvent des périodes.. 81.

(82) Indice de LASPEYRES a) Indice d’évolution des prix: L’indice de LASPEYRES d’évolution des prix mesure l’évolution, entre deux dates 0 et t, des prix des biens qui composent un panier, en prenant comme référence la valeur du panier à la date initiale (t = 0) et en supposant que les quantités de biens dans le panier n’ont pas varié entre 0 et t. n. L  p t /0. j j p  t q0 j 1 n. p q j 1. 100. j j 0 0. L’indice de Laspeyres des prix traduit l’évolution de l’ensemble des prix des n produits à la date t puisque entre le numérateur et le dénominateur seuls les prix différent. 82.

(83) Exemple: Une grande surface propose trois types de piles AAA(1.5v). Les prix (en DHs) et les quantités (en milliers de pièces) de ces trois types pendant les années 2012 et 2013 sont résumés dans le tableau ci-dessous: 2012 2013 prix quantité prix quantité Type 1 25 120 22 125 Type 2 Type 3. 8 6. 115 100. 10 9. 85 95. L’indice de LASPEYRES d’évolution des prix entre 2012 et 2013 est 3. p 13/12. L. . j j p q  13 12 j 1 3. j j p q  12 12. (22 120)  (10 115)  (9  100) 100   100 (25 120)  (8 115)  (6 100). j 1.  103, 76. 83.

(84) b) Indice d'évolution des quantités L’indice de LASPEYRES d’évolution des quantités mesure l’évolution, entre deux dates 0 et t, des quantités des biens qui composent un panier, en prenant comme référence la valeur du panier à la date initiale (t=0) et en supposant que les prix des biens dans le panier n’ont pas varié entre 0 et t. n. q t /0. L. . j j p  0 qt j 1 n. p q j 1. j 0. 100. j 0. Cet indice traduit l’évolution de l’ensemble des quantités des n produits de la date 0 à la date t puisque entre le numérateur et dénominateur seuls les prix différent. 84.

(85) Exemple: Pour le même exemple. Type 1 Type 2 Type 3. 2012 prix quantité. 2013 prix quantité. 25 8 6. 22 10 9. 120 115 100. 125 85 95. l’indice de LASPEYRES d’évolution des quantités entre 2012 et 2013 est 3. q 13/12. L. . j j p q  12 13 j 1 3. p j 1. j j 12 12. q. (25 125)  (8  85)  (6  95) 100  100 (25 120)  (8 115)  (6  100).  96,8 85.

(86) Indice de Paasche a) Indice d’évolution des prix : L’indice de Paasche d’évolution des prix mesure l’évolution, entre deux dates 0 et t, des prix des biens qui composent un panier, en prenant comme référence la valeur du panier à la date courante t et en supposant que les quantités de biens dans le panier n’ont pas varié entre 0 et t. n j j p q  t t j 1 Pt /p0  n 100 j j p q  0 t j 1. L’indice de Paasche traduit l’évolution de l’ensemble des prix des n produits de la date 0 à la date t puisque entre le numérateur et le dénominateur seuls les prix différent. 86.

(87) Exemple: Pour le même exemple. Type 1 Type 2 Type 3. 2012 prix quantité. 2013 prix quantité. 25 8 6. 22 10 9. 120 115 100. 125 85 95. l’indice de Paasche d’évolution des prix entre 2012 et 2013 est 3. p 13/12. P. . j j p q  13 13 j 1 3. p j 1. j j 12 13. q. (22 125)  (10  85)  (9  95) 100   100 (25 125)  (8  85)  (6  95).  101,83 87.

(88) b) Indice d'évolution des quantités : L’indice de Paasche d’évolution des quantités mesure l’évolution, entre deux dates 0 et t, des quantités des biens qui composent un panier, en prenant comme référence la valeur du panier à la date courante t et en supposant que les prix des biens dans le panier n’ont pas varié entre 0 et t. n. Pt q/0 .  j 1 n. ptj qtj. p j 1. t. 100 j. j 0. q. 88.

(89) Exemple: Pour le même exemple. Type 1 Type 2 Type 3. 2012 prix quantité. 2013 prix quantité. 25 8 6. 22 10 9. 120 115 100. 125 85 95. l’indice de Paasche d’évolution des quantités entre 2012 et 2013 est 3. q 13/12. P. . j j p q  13 13 j 1 3. j j p q  13 12. (22 125)  (10  85)  (9  95) 100  100 (22 120)  (10 115)  (9 100). j 1.  95 89.

(90) Indice de Fisher: Il serait souhaitable que les indices synthétiques satisfont aux mêmes propriétés des indices élémentaires. Fisher a proposé un indice qui satisfait à la propriété de réversibilité. L’indice de Fisher est défini par:. Ft /0  Lt /0  Pt /0 L’indice de Fisher est défini de la même manière pour les prix que pour les quantités. 90.

(91) L'indice de Sidgwick L'indice de Sidgwick est la moyenne arithmétique des indices de Paasche et de Laspeyres:. St /0. Lt /0  Pt /0  . 2. Exercice: Calculer les indices de Fisher et de Sidgwick de l’évolution des prix et des quantités des trois types de piles entre 2012 et 2013 (voir exemple précédent) et donner une interprétation des résultats.. 91.

(92) Exercice : L'évolution des prix de vente (hors taxes) des flacons de 100 ml de huile d'Argan alimentaire, fabriqués et vendus par l'entreprise ``EFAS'', pour les années 2007 à 2013 est donnée par le tableau suivant: Année (t). Prix (pt). 2007 2008 2009 2010 2011 2012 2013. 25. 28. 31. 36. 39. 42. 45. 1. a) Calculer l'indice élémentaire en 2012, base 100, par rapport à 2007. b) Calculer l'indice élémentaire en 2010, base 100, par rapport à 2009. c) Donner une interprétation de l'évolution des prix entre 2007 et 2012 et entre 2009 et 2010. 2. Calculer, par deux méthodes différentes, l'indice élémentaire en 2007, base 100, par rapport à 2012. 92.

(93) Le directeur commercial de l'entreprise EFAS cherche maintenant à apprécier l'évolution de ses ventes annuelles des flacons de l'huile d'Argan entre les années 2007 et 2013. On considère pour ceci trois types de produits: 2007 2013 prix quantité prix quantité. Huile alimentaire Huile cosmétique Huile solaire. 25 20 50. 146 220 39. 45 42,5 79. 210 180 100. Entre 2007 et 2013: 1. calculer l'indice de Laspeyres des quantités 2. calculer l'indice de Paasche des quantités 3. Calculer l'indice de Fischer et donner une interprétation des résultats. 93.

(94) Statistique Descriptive Bivariée.

(95) Introduction • Lorsque l’on étudie plusieurs caractères simultanément, on souhaite évaluer le lien entre les caractères et leur dépendance. On parle donc de Statistique multivariée • On va se limiter ici à deux dimensions, c.à.d la statistique bivariée. Statistique descriptive bivariée Le but est d’étudier simultanément deux variables X et Y sur une même population.. 95.

(96) Plusieurs cas se présentent selon la nature de ces deux variables :  X et Y sont deux variables qualitatives. Exemple : L’acceptation du crédit X est-elle associée au type de contrat de travail Y?.  X est qualitative (ou quantitative discrète avec peu de valeurs distinctes) et Y est continue. Exemple : On observe le prix Y d’un produit de consommation courante dans des grandes surfaces de 3 régions différentes X.  X et Y sont deux variables quantitatives (continues ou discrètes) Exemples :On veut étudier le rapport entre l’âge des femmes (ayant au moins un enfant) et le nombre de leurs enfants. Quel est le rapport entre les salaires et les dépenses d’une catégorie des fonctionnaires?. 96.

(97) Les tableaux à deux caractères Une population statistique peut être décrite à l’aide de deux caractères simultanément Les tableaux statistiques correspondant sont à deux dimensions, ils sont appelés tableaux de contingence ou croisés dynamiques ou à double entrées. Présentation générale des tableaux de contingence Considérons une population statistique décrite par deux caractères Un caractère X dont les p modalités xi sont x1, x2, ...,xp et un caractère Y dont les k modalités yj sont y1, y2, ..., yq. 97.

(98) Les q modalités de Y yj Les p modalités de X. xi x1 x2 . . .. xi . . .. xp. n.j. y1. Les effectifs partiels apparaissent à. y2 . . . . . yj . . . . . . yq. ni.. n11 n21. n12 . . . . .n1j . . . . . n1q n22 . . . . .n2j . . . . . n2q. n1. n2.. ni1. ni2 . . . . . nij . . . . . . niq. ni.. . . . . . . . .. np1 np2 . . . . . npj . . . . . npq n.1 n.2 . . . . . n.j . . . . . n.q. . . . . . . . .. np. n... l’intérieur du tableau: nij est l’effectif de la population présentant à la fois la modalité xi et la modalité yj. Les marges ou effectifs marginaux  ni. : somme des effectifs de la ième ligne,. l’indice j variant de 1 à q est remplacé par «.»  n.j : somme des effectifs de la modalité yj , l’indice i = 1 à p est remplacé par «.». 98.

(99) Présentation générale des tableaux de contingence 1. Le tableau contient : Dans la 1ère colonne les n modalités x1, x2, ..., xi, ...., xp du caractère X Dans la 1ère ligne les k modalités y1, y2, ..., yj, ...., yq du caractère Y 2. L’effectif nij correspond à l’intersection d’une ligne i et d’une colonne j. L’effectif de la population présentant à la fois la modalité xi et la modalité yj 3. Pour les effectifs marginaux ni. et n.j , on remplace l’indice qui varie par «.» ni. : somme des effectifs de la ième ligne, j =1, ..., q est remplacé par « . » n.j : somme des effectifs de la jème colonne, i =1, ..., p est remplacé par «.» 4. L’effectif général marginal de X est noté « ni. » et celui de Y « n.j » 5. L’effectif total du tableau est noté « n.. » : il s’agit de l’effectif total de la population étudiée 99.

(100) Exemple: Une enquête réalisée auprès des familles de la ville de Larache comporte les deux questions suivantes : – Combien avez-vous eu d’enfants jusqu’`a ce jour ? – Combien de télévisions avez-vous ? En ne considérant que 120 familles ayant au moins une télévision et au moins un enfant, on construit un tableau de contingence résumant les réponses données à ces deux questions. Le tableau de contingence observé est le suivant : X. Y. 1. 2. 3. 4. 1. 12. 4. 5. 11. 2. 18. 16. 11. 3. 3. 10. 4. 20. 6. 100.

(101) Propriétés des tableaux de contingence Les modalités xi et yj étant incompatibles et exhaustives, on peut écrire plusieurs séries d’égalités. q. Σ nij = ni.. j=1. p. Σ nij = n.j. i=1. représente le nombre d’individus présentant la modalité xi de X quelle que soit la modalité de Y représente le nombre d’individus présentant la modalité yj de Y quelle que soit la modalité de X 101.

(102) L’effectif total de la population Il apparaît à l’intersection de la dernière ligne et de la dernière colonne Il est égal à la somme de la dernière ligne ou de la dernière colonne p q. n.. = Σ ni. = i=1. Σ n.j. j=1. En remplaçant ni. et n.j par les expressions précédentes, on obtient p. q. q. p. Σ Σ nij = Σ Σ nij n.. = i=1 j=1 i=1 j=1 102.

(103) Les fréquences partielles La fréquence partielle est le rapport de l’effectif partiel par l’effectif total La fréquence partielle des modalités xi , yj est égale à :. fij =. nij n... C’est la proportion d’individus satisfaisant à la fois la modalité xi et la modalité yj Remarque: La somme des fréquences partielles est égale à 1. 103.

(104) Distributions marginales Un tableau de contingence compte deux distributions marginales: la distribution marginale du caractère X et la distribution marginale du caractère Y La distribution marginale du caractère X. Elle est composée des modalités du caractère X et des effectifs correspondant quelles que soit les modalités du caractère Y. 104.

(105) La distribution marginale du caractère X est donnée par le tableau suivant Caractère. Effectifs marginaux. Fréquences marginales. x1 x2. n1. n2.. f1. f2.. . . .. . . .. . . .. xi. ni.. fi.. . . .. . . .. . . .. xp. np.. fp.. Total. n... 1. On peut calculer les « fréquences marginales »: rapport de l’effectif marginal sur l’effectif total. fi. =. ni. n... 105.

(106) La distribution marginale du caractère Y Elle est composée des modalités du caractère Y et des effectifs correspondant quelles que soit les modalités du caractère X La fréquence marginale de la modalité yj est égale à :. n.j n... f.j = Caractère. Effectifs marginaux. Fréquences marginales. y1 y2. n.1 n.2. f.1 f.2. . . .. . . .. . . .. yi. n.j. f.j. . . .. . . .. . . .. yq. n.q. f.q. Total. n... 1 106.

(107) Exemple: En ne considérant que 120 familles ayant au moins une télévision et au moins un enfant, on construit un tableau de contingence ci-dessous où X représente le nombre de télévision par foyer et Y le nombre d’enfants par foyer. Y. 1. 2. 3. 4. 1. 12. 4. 5. 11. 2. 18. 16. 11. 3. 3. 10. 4. 20. 6. X. 107.

(108) Distribution marginale de X: xi. ni.. fi. (en %). 1. 32. 26,67. 2. 48. 40. 3. 40. 33,33. total. 120. 100. yj. n.j. f.j (en %). 1. 40. 33,33. 2. 24. 20. 3. 36. 30. 4. 20. 16,67. total. 120. 100. Distribution marginale de Y:. 108.

(109) Distributions conditionnelles 1.. Distributions conditionnelles du caractère X liées par yj. Ce sont les modalités de X et des effectifs de chacune de ces modalités dans la sous population présentant la modalité yj de Y Caractère. Effectifs de yj. Fréquences conditionnelles. x1 x2. n1j n2j. f1/ j f2/ j. . . .. . . .. . . .. xi. nij. fi/ j. . . .. . . .. . . .. Xp. npj. fp/ j. Total. n.j. 1. On peut calculer la fréquence conditionnelle de la modalité xi de X n sous condition que Y=yj : f = ij xi/y j. n.j. 109.

(110) 2. Distributions conditionnelles du caractère Y liées par xi Ce sont les modalités de Y et des effectifs de chacune de ces modalités dans la sous population présentant la modalité xi de X Caractère. Effectifs de yj. Fréquences conditionnelles. y1 y2. ni1 ni2. f1/ i f2/ i. . . .. . . .. . . .. yj. nij. fj/ i. . . .. . . .. . . .. yk. nik. fk/ i. Total. ni.. 1. La fréquence conditionnelle de la modalité yj de Y sous condition que x = xi. fyj/ xi = nij ni.. 110.

(111) Exemple: Pour l’exemple précédent, la distribution de X sous la condition Y=2 xi. ni2. fi2 (en %). 1. 4. 16,67. 2. 16. 66,67. 3. 4. 16,67. total. 24. 100,01≈ 100. la distribution de Y sous la condition X=1 yj. n1j. f1j (en %). 1. 12. 37,5. 2. 4. 12,5. 3. 5. 15, 625. 4. 11. 34,375. total. 32. 100. 111.

(112) Caractéristiques numériques des distributions marginales Soient X et Y deux caractères quantitatifs discrets. { xi , ni. } est la distribution marginale d’effectifs du caractère X et { yj , n.j } est la distribution marginale d’effectifs du caractère Y. Ces deux distributions peuvent être étudiées comme dans le cas des statistiques univariées. En particulier, elles peuvent être caractérisées par leur moyenne et variance. p La moyenne de du caractère X: 1. x. nx  n.. i 1. La moyenne de du caractère Y:. i. i. q. 1 y   n. j y j n.. j 1. 112.

(113) La variance du caractère X:. 1 p Var ( X )   ni. ( xi  x) 2 n.. i 1 p. 2 1 2   ni. xi  x n.. i 1. La variance du caractère Y:. 1 q Var (Y )   n. j ( y j  y ) 2 n.. j 1 2 1 p 2   n. j y j  y n.. j 1. Remarque: Dans le cas où l’un des caractères X et Y est quantitatif continu, on remplace les formules de la moyenne et de la variance les valeurs xi par les centres ci des classes du caractère. 113.

(114) Caractéristiques numériques des distributions conditionnelles Chacune des distributions conditionnelles peut être étudiée comme dans le cas des statistiques univariées. On peut définir les moyennes et les variances conditionnelles. La moyenne conditionnelle du caractère X sachant que Y=yj. 1 xj  n. j. p. n x i 1. ij i. La moyenne conditionnelle du caractère Y sachant que X=xi. 1 q yi   nij y j ni. j 1 114.

(115) La variance de X sachant que Y=yj. 1 Var ( X | Y  y j )  n. j 1  n. j. p. 2 n ( x  x )  ij i j i 1. p. 2 2 n x  ( x )  ij i j i 1. La variance de Y sachant que X=xi. 1 q Var (Y | X  xi )   nij ( y j  y j ) 2 ni. j 1 1 q   nij y 2 j  ( yi ) 2 ni. j 1 115.

(116) Exemple: Soit le tableau de contingence suivant représentant X (nombre de télévision par foyer) et Y (nombre d’enfants par foyer) Y 1 2 3 4 X 1. 12. 4. 5. 11. 2. 18. 16. 11. 3. 3. 10. 4. 20. 6. 1 3 ni. xi Moyenne de X : x   120 i 1 1   248  2, 07 120 1 3 2 2 n x  x Variance de X : Var ( X )   i. i 120. i 1. 1   584  (2, 07) 2  0,58 120. xi. ni.. ni.*xi. 1 2 3 somme. 32 48 40 120. 32 96 120 248. xi 1 2 3 somme. ni. 32 48 40 120. ni.*xi2 32 192 360 584 116.

(117) Moyenne de Y sous la condition X=1 : 1 4 y1   n1 j y j 32 j 1. yj. n1j. n1j*yj. 1 2 3 4 somme. 12 4 5 11 32. 12 8 15 44 79. 1   79  2, 47 32 Variance de Y sous la condition X=1 :. 1 4 Var (Y | X  1)   n1 j y j 2  ( y1 ) 2 32 j 1 1   249  (2, 47) 2  1, 68 32. yj. n1j. n1j*yj2. 1 2 3 4 somme. 12 4 5 11 32. 12 16 45 176 249. 117.

(118) Exercice: Dans une étude de l'une des filiales de la société ``DigiTech'', on s'intéresse simultanément aux salaires mensuels et à l'ancienneté des salariés. On note par « X » la variable statistique associée au caractère `` ancienneté des salariés'' en années et par « Y » la variable statistique associée au caractère ``salaires mensuels des salariés'' en Dirhams. Les résultats obtenus sont consignés dans le tableau suivant: Y. 2000. 3000. 4000. 6000. 1. 3. 3. 3. 1. 3. 1. 3. 4. 1. 5. 1. 4. 5. 2. 8. 1. 5. 7. 7. X. 1. 2. 3. 4. 5.. Déterminer les distributions marginales de X et Y Donner une signification des termes n3., n.1, f2. et f.4 Calculer la moyenne, la variance et l’écart-type de Y Déterminer la distribution conditionnelle de X sous la condition Y=6000 Calculer X4 et Var(X|Y=6000).. 118.

(119) Exercice : Les données suivantes concernent 120 offres de ventes d’appartements dans la ville de Larache. Le caractère X représente la surface (en m2) et le caractère Y représente le prix (en 104dhs).. 1) 2) 3) 4) 5) 1.. [30,40[ [40,60[ [60,80[ X Y [20,30[ 16 7 5 2 60 4 10 9 4 75 3 3 11 9 80 2 5 4 4 100 1 5 5 11 120 Calculer f43 et f34 et donner une interprétation des résultats. Donner les distributions marginales de X et de Y Donner une interprétation des valeurs f4. et f.2 Calculer la moyenne, la variance et l’écart-type de X Déterminer la distribution conditionnelle de X sous la condition Y€[30,40[ Calculer X2 et Var(X| Y€[30,40[). 119.

(120) Séries chronologiques.

(121) Introduction: • Une série chronologique ou chronique est constituée par une suite d'observations au cours du temps. Ces observations sont chiffrés, ordonnées dans le temps et portant sur une même grandeur. • En économie et gestion, le temps est défini comme une variable discrète et les données observées pourront être journalières, hebdomadaires, mensuelles ou trimestrielles. Remarque: Une série chronologique peut être définie comme une distribution à deux variables dont l'une est le temps. 121.

(122) Exemple 1 : On considère le nombre de ventes d’un bien effectuées par une entreprises dans les 3 dernières années.. 122.

(123) • Une série chronologique peut être représentée graphiquement en portant en abscisse le temps t  en ordonnée les valeurs des observations Exemple 1 : pour la série de vente 2500 2000 1500. 1000 500 0. 123.

(124) Composantes d'une série chronologique • L'analyse d'une série chronologique vise à fournir un modèle quantitatif permettant de résoudre les problèmes que l'on se pose à son propos. • Le principe consiste à considérer que la série chronologique étudiée est constituée d'un nombre de composantes que l'on peut isoler et quantifier. Ces composantes sont la tendance ou trend la variation saisonnière la variation résiduelle ou résidus.. 124.

(125) • La tendance (mouvement de long durée): c'est le mouvement profond de l'évolution à longue durée. Elle schématise l'orientation générale du phénomène étudié. On note Tt sa valeur à l'instant t. • Le mouvement saisonnier: c'est une composante périodique dont les fluctuations s'équilibrent autour de la tendance. Ce mouvement se déploie généralement sur des périodes à l'intérieur d'une année .En notant St sa valeur à l'instant t et p la période, nous avons St+p=St. • La composante résiduelle: Elle correspond à des mouvements perturbateurs, irréguliers et imprévisibles. On la note E à l'instant t.. 125.

(126) Modèle additif • Il s'applique à une variable dont l'amplitude du mouvement saisonnier est constante. 2500 2000 1500 Vente 1000 500 0 126.

(127) Le modèle additif permet de décomposer la variable étudiée Y en somme des trois composantes:. Yt  Tt  St   t Remarque: Dans la pratique on calcule. Yth  T  S C’est avec ce modèle qu’on peut faire des prévisions.. 127.

(128) Analyse de la tendance: Par la méthode des moindres carrées On cherche à déterminer la relation entre les valeurs observables (yi) et le temps (t) sous la forme de l’équation d’une droite. Tr (t )  at  b où « a » et «b » sont deux réels telle que cette droite soit le “plus près” possible du nuage de points.. 128.

(129) Méthode des moindres carrés y. Question: Comment déterminer les coefficients « a » et « b » de l’équation de la droite approximative. X. e2. y  ax  b. e3 X. e1 X. x. La détermination des coefficients « a » et « b », appelées coefficients de la régression linéaire, est de telle sorte que l’on minimise la quantité ∑ (ei)2 où ei est l’écart entre la droite de régression et l’observation d’ordre i. Ceci est équivalent à minimiser la quantité: n. n. i 1. i 1. S (a, b)   ei2   ( yi  axi  b) 2 129.

(130) Rappel: Si une fonction à deux variables admets des dérivées partielles du premier ordre où elle présente un extremum relatif (a,b), alors ces dérivées s’annulent en ce point. Détermination des coefficient de la régression affine: Les dérivées partielles de S par rapport à a et b sont nulles si et seulement si. 130.

(131) On obtient donc le système de deux équations à deux inconnus a et b. Ce qui est équivalent à. 131.

(132) Rappelons que. En conclusion. Cov( X , Y ) a et b  y  ax Var ( X ) 132.

(133) Calcul des valeurs du trend par la méthode des moindres carrés Par la méthode des moindres carrés, l’équation de trend est. Tr (t )  at  b Les coefficients « a » et « b » sont tels que. avec. Cov(t , y) a et b  y  at Var (t ). 1 n 1 n t   ti et y   yi n i 1 n i 1 1 n 2 Var (t )    ti   ( t )2  n i 1  1 n  Cov(t; y)    ti yi  _  t y   n i 1 . 133.

(134) Exemple d’application: On considère le nombre de ventes d’un bien effectuées par une entreprises dans les trois dernières années.. 134.

(135) 1. Calcul de la moyenne de t et de y:. 1 12 t   ti 12 i 1 1  1  2  3  4  5  6  7  8  9  10  11  12  12  6,5 1 12 y   yi 12 i 1  1  860  941+360  1148+1096+1021    12  +1705+1505+1436+1363+2047+2000  1  16335 12  1361, 25 135.

(136) 2. Calcul de Var(t):.  1 12 2  2 Var (t )    ti   ( t )  12 i 1  ti. 1 2 3 4 5 6 7 8 9 10 11 12 Somme. ti2. 1 4 9 16 25 36 49 64 81 100 121 144. 650. 2 1  Var (t )    650    6,5   12   54,17  42, 25.  11,92 136.

(137) 3. Calcul de Cov(t,y): ti 1 2 3 4 5 6 7 8 9 10 11 12. yi 860 794 1360 1148 1096 1021 1705 1505 1436 1363 2047 2000. tiyi 860 1588 4080 4592 5480 6126 11935 12040 12924 13630 22517 24000. 12 1   Cov(t ; y )    ti yi  _  t y   12 i 1 . 1     119772    6,5  1361, 25   12   9981  8848,125  1132,875. 137.

(138) 4. Calcule de a et b:. Cov(t , y ) a Var (t ) 1132,875  11,92  95, 04. b  y  at  1361, 25   95, 04  6,5   743, 49. 5. Equation du Trend. Tr (t )  95,04  t  743, 49 138.

Figure

tableau ci-dessous:  Lieu de naissance  Effectif des étudiants

Références

Documents relatifs

A l'aide de la calculatrice et en rappelant les formules utilisées, déterminer la moyenne x et l'écart type σ de la série statistique arrondis à 0,001.. Il n'est pas

Le diagramme en barres ci-contre donne la répartition des notes obtenues à un contrôle de mathématiques par les élèves d’une classe de 3

Lire la note pour laquelle on peut dire que la moitié des élèves a eu moins de cette note.. (Il s'agit de la médiane de

Pulmonary sequestration is a rare congenital malforma- tion characterised by a mass of non-functioning lung tissue separated from the normal bronchopulmonary tree and vas- cularised

Transesophageal view of an elongated thrombus crossing the intera- trial septum with its major portion in the left atrium (LA, left atrium; RA, right atrium; AO,

En admettant que les données sont à l'intérieur strict des classes (les bornes des classes ne sont pas observées), on peut alors donner les effectifs cumulés croissants des bornes

• Une fréquence peut être donnée sous forme d’un %, d’une fraction irréductible ou d’un nombre décimal. Fréquence du caractère O

Un triangle est rectangle quand le carré d’un de ses côtés vaut la somme des carrés des deux autres1. Ou plus exactement, il répond une égalité, ce qui est