• Aucun résultat trouvé

Variables groupées (continues ou discrètes)

Dans le document Les statistiques : le pouvoir des données! (Page 143-149)

Lorsqu'on groupe des variables continues ou discrètes à l'intérieur de tableaux, on définit le mode comme étant l'intervalle de classe à l'intérieur duquel se situent la plupart des observations. On l'appelle l'intervalle de classe modale.

Dans l'exemple des tailles des 50 filles de 10e année, l'intervalle de classe modale serait 160 à 165 cm, puisqu'il s'agit de l'intervalle qui compte le plus grand nombre d'observations.

On utilise rarement le mode comme mesure de tendance centrale pour des variables numériques. Pour des variables nominales, cependant, le mode est plus utile, parce que la moyenne et la médiane n'ont aucun sens.

Vous pourriez ensuite déterminer le milieu de l'étendue de la classe modale. Le milieu de l'étendue est simplement le point milieu entre la valeur la plus élevée et la valeur la plus faible d'une classe modale. On n'utilise pas très souvent le mode de concert avec le milieu de l'étendue, parce qu'il ne donne qu'une estimation très grossière de la moyenne.

Contrairement à la moyenne et à la médiane, le mode peut être utilisé avec des données nominales. Il peut y avoir un mode comme il peut ne pas y en avoir, et il est possible que le mode comporte plus d'une valeur.

Résumé

En règle générale, ce sont les circonstances qui dictent le choix entre la moyenne, la médiane ou le mode comme mesure de tendance centrale. La moyenne tend à être la mesure de la tendance centrale qui convient le plus pour obtenir un total, parce qu'on divise le total par le nombre de données. Par exemple, le revenu moyen des membres d'une famille vous permet de savoir combien chacun d'entre eux dépense sur les nécessités courantes de la vie. La médiane est utile dans le cas des moyennes, alors que le mode sert à décrire le cas le plus typique.

Exercices

1. Pour les ensembles de données suivants, trouvez (à une décimale près) : i. la moyenne; 2. Pour les ensembles de données suivants, trouvez :

i. la moyenne;

ii. la médiane;

iii. le mode.

Décrivez brièvement les positions de la moyenne, de la médiane et du mode et leur relation les unes par rapport aux autres pour chaque ensemble de données.

3. Pour chacun des diagrammes à tiges et à feuilles suivants, trouvez : i. la moyenne;

ii. l'intervalle de classe modale.

4. Imaginez que les augmentations annuelles de la population durant une période de dix ans sont fournies dans le tableau ci-dessous :

Tableau 6. Accroissement de la population

Années Augmentation par rapport à l'année précédente

1 53 377

a. Calculez l'augmentation annuelle moyenne de la population durant une période de dix ans.

b. Calculez l'augmentation annuelle médiane de la population durant une période de dix ans.

c. Croyez-vous que la différence entre ces deux mesures est significative? Expliquez votre réponse et quel résultat donne une meilleure indication du centre des données.

d. À quelles fins utiliserait-on des mesures comme celles mentionnées ci-dessus?

5. Quarante (40) élèves ont passé un examen de mathématiques pour lequel la note maximale qu'ils pouvaient obtenir était 10. Voici les résultats qu'ils ont obtenus :

9, 10, 7, 8, 9, 6, 5, 9, 4, 7, 1, 7, 2, 7, 8, 5, 4, 3, 10, 7, 3, 7, 8, 6, 9, 7, 4, 2, 3, 9, 4, 3, 7, 5, 5, 2, 7, 9, 7, 1

a. Construisez un tableau de fréquences de leurs notes.

b. À l'aide du tableau de fréquences, calculez la moyenne, la médiane et le mode.

Tableau 7. Chômage

a. Copiez le tableau dans votre cahier et trouvez le point milieu de chaque intervalle. Calculez l'âge moyen d'une personne en chômage à l'aide du point milieu.

b. Quel est l'intervalle de classe modale?

c. Dans quel groupe d'âge la médiane se situe-t-elle?

d. Traitez brièvement de la comparaison de ces trois résultats.

e. Pourquoi pensez-vous que le nombre de chômeurs diminue après le groupe des 25 à 34 ans?

f. Comment les organismes d'aide sociale pourraient-ils utiliser ces chiffres?

7. Une enquête aléatoire de 100 hommes mariés a donné la distribution suivante d'heures qu'ils consacraient par semaine à un travail ménager non rémunéré :

Tableau 8. Heures consacrées par semaine à un travail ménager non rémunéré par 100 hommes

a. Copiez le tableau dans votre cahier et incluez dans le tableau des colonnes pour trouver l'extrémité (valeur la plus élevée) de chaque intervalle. Calculez les fréquences cumulées et les pourcentages cumulés, puis inscrivez-les dans votre tableau.

b. Dessinez l'ogive (ou la courbe de distribution) à l'aide de la fréquence cumulée de l'axe y.

c. À partir de la courbe, trouvez une valeur médiane approximative. Qu'est-ce que cette valeur indique?

d. Quel est l'intervalle de classe modale?

e. Calculez la moyenne. Qu'est-ce que cette valeur indique?

f. Décrivez brièvement la comparaison entre les valeurs moyenne, médiane et modale.

g. Comment détermineriez-vous si les femmes ont consacré plus d'heures par semaine que les hommes à un travail ménager non rémunéré?

8. Voici un tableau hypothétique de revenus annuels de personnes de 15 ans ou plus :

Tableau 9. Revenus annuels des personnes de 15 ans et plus

Revenu ($) Nombre de personnes

a. Quel est l'intervalle de classe modale?

b. Copiez le tableau dans votre cahier et incluez dans le tableau des colonnes pour trouver l'extrémité supérieure de chaque intervalle. Calculez les fréquences cumulées et les pourcentages cumulés.

c. Dessinez l'ogive (ou la courbe de distribution).

d. À partir de la courbe, donnez une valeur approximative pour le revenu annuel médian hypothétique des personnes.

e. Calculez leur revenu annuel moyen hypothétique. (Tuyau : dans le tableau ci-dessus, l'intervalle 2 080 à 4 159 représente, en fait, 2 080 à <

4 160; le point milieu est donc 3 120.)

f. Comparez les valeurs moyenne, médiane et modale.

g. Quelle mesure donne l'indication la plus exacte du centre des données?

h. Quels types d'organisation utiliseraient ce genre d'information?

Activités en classe

1. Mesurez la taille, en l'arrondissant au centimètre près, de chaque élève de votre classe. Y a-t-il des valeurs aberrantes? Utilisez une méthode appropriée pour trouver la moyenne, la médiane et le mode. Comparez les trois mesures. Quelle valeur donne la meilleure mesure de tendance générale? Pourquoi? Quelles organisations ou entreprises trouveraient de telles statistiques utiles?

2. Calculez la population des élèves de votre année scolaire ou de votre école ces 10 dernières années. Y a-t-il des valeurs aberrantes? Utilisez une méthode appropriée pour trouver la moyenne, la médiane et le mode. Comparez les trois mesures. Quelle valeur donne la meilleure mesure de tendance centrale? Pourquoi? Comment de telles statistiques pourraient-elles être utilisées par votre école, votre commission ou votre conseil scolaire?

3. Trouvez les résultats finals du sport favori à votre école à partir des dossiers de l'établissement. Rassemblez les données sur les résultats, tant ceux des victoires que ceux des défaites, des 10 dernières années. (Si les données ne sont pas disponibles, utilisez de l'information relative à votre équipe sportive favorite.)

Quel a été le résultat final moyen des dix dernières années, en incluant aussi bien ceux des victoires que des défaites?

Quel a été le résultat final médian des dix dernières années, en incluant aussi bien ceux des victoires que des défaites?

L'un des résultats finals moyens est-il semblable au résultat final médian correspondant?

Compte tenu de ces valeurs, que peut-on dire au sujet des distributions?

Énumérez certains des problèmes que vous pourriez éprouver en essayant d'utiliser des statistiques pour comparer des équipes sportives de votre école ou d'autres équipes sportives du passé à des équipes d'aujourd'hui?

4. Pour des données ordinales, pouvez-vous citer des cas où le mode serait plus utile que la médiane ou que la moyenne? Discutez-en en classe.

Réponses

iv. La moyenne, la médiane et le mode sont égaux. Cette distribution est presque symétrique.

b.

i. 6,6 ii. 6,7 iii. 6,7

iv. La distribution est désaxée vers la gauche; la moyenne est donc inférieure à la médiane. Le mode et la médiane sont les mêmes. La médiane est une meilleure mesure de tendance centrale lorsque les distributions sont désaxées.

c.

i. 1,85 ii. 1 iii. 1

iv. La médiane et le mode sont les mêmes. La distribution est désaxée vers la droite; la moyenne est donc supérieure à la médiane. La médiane est une meilleure mesure de tendance centrale lorsque les distributions sont désaxées. Dans b) et c), la moyenne a été influencée par quelques valeurs faibles et d'autres élevées.

a.

c. Les mesures sont assez rapprochées, étant donné la longueur de chaque observation. C'est la médiane qui donne probablement la meilleure indication du centre des données, puisqu'il y a une grande diversité de valeurs d'observation. La médiane ne serait influencée ni par les très grandes ni par les très petites valeurs.

d. Un gouvernement pourrait utiliser ces mesures lorsqu'il planifierait la construction d'écoles, d'hôpitaux et de routes. Il pourrait aussi s'en servir pour prévoir plus facilement ses recettes fiscales.

5.

c. La médiane est supérieure à la moyenne, parce que les valeurs de la plupart des observations sont élevées. La moyenne est influencée par les notes plus faibles. Le mode est égal à la médiane.

6.

a. 36,2

b. 25 à 34 (Nota : les longueurs des intervalles ne sont pas les mêmes. Si elles l'étaient, l'intervalle 15 à 24 serait l'intervalle de classe modale.)

c. 25 à 34

d. Les trois résultats se situent à l'intérieur du même intervalle, mais la distribution est désaxée (ou inclinée) vers la droite.

e. Les groupes d'âge plus jeunes, les 15 à 19 ans et les 20 à 24 ans, sont constitués de jeunes qui sont toujours aux études ou de diplômés qui sont incapables de se trouver un emploi. Les groupes d'âge après celui des 25 à 34 ans ont une plus faible proportion de personnes en chômage, puisqu'elles travaillent à plein temps et ne sont plus aux études.

f. Les organismes d'aide sociale pourraient utiliser ces chiffres pour planifier des programmes d'emploi qui s'adresseraient à des gens plus jeunes.

7.

a.

Dans le document Les statistiques : le pouvoir des données! (Page 143-149)