• Aucun résultat trouvé

Un exemple concret

Dans le document Apprentissage des statistiques avec Jamovi (Page 65-69)

Pour essayer de comprendre pourquoi vous devez prêter attention aux différences entre la moyenne et la médiane, considérons un exemple réel. Comme j’ai tendance à me moquer des journalistes pour leurs faibles connaissances scientifiques et statistiques, je dois rendre à César ce qui est à César. Voici un excellent article sur le site d’ABC news22 du 24

septembre 2010 :

Au cours des deux dernières semaines, des cadres supérieurs de la Commonwealth Bank ont parcouru le monde avec une présentation montrant que les prix des maisons en Australie et les principaux ratios prix-revenus se comparent avantageusement à ceux de pays similaires. « En fait, l’accessibilité à la propriété a dérapé au cours des cinq ou six dernières années », a déclaré Craig James, économiste en chef de la division commerciale de la banque, CommSec.

C’est probablement une énorme surprise pour quiconque a un prêt hypothécaire, ou qui veut un prêt

hypothécaire, ou qui paie un loyer, ou qui n’est pas complètement inconscient de ce qui se passe sur le marché australien du logement depuis plusieurs années. Retournons à l’article :

L’ABC a mené sa guerre contre ce qu’elle croit être des prophètes de malheur avec des graphiques, des chiffres et des comparaisons internationales. Dans sa présentation, la banque rejette les arguments selon lesquels le logement en Australie est relativement cher par rapport aux revenus. Il indique que le ratio du prix des maisons par rapport au revenu des ménages, qui est de 5,6 dans les grandes villes et de 4,3 à l’échelle nationale, est

comparable à celui de nombreux autres pays développés. Il est dit que San Francisco et New York ont des ratios de 7, Auckland est à 6,7 et Vancouver à 9,3.

Encore une excellente nouvelle ! Sauf que l’article poursuit en disant que :

De nombreux analystes disent que cela a conduit la banque à utiliser des chiffres trompeurs et des comparaisons. Si vous allez à la page 4 de l’exposé de l’ABC et que vous lisez l’information de la source au bas du graphique et du tableau, vous remarquerez qu’il y a une autre source sur la comparaison internationale - Demographia. Toutefois, si la Commonwealth Bank avait également utilisé l’analyse de Demographia sur le ratio prix/revenu des maisons en Australie, elle aurait obtenu un chiffre plus proche de 9 plutôt que 5,6 ou 4,3.

C’est, euh, un écart assez sérieux. Un groupe de personnes dit 9, un autre dit 4-5. Devrions- nous simplement couper en deux la différence et dire que la vérité se situe quelque part entre les deux ? Absolument pas ! C’est une situation où il y a une bonne et une mauvaise réponse. La démographie est correcte, et la Banque du Commonwealth a tort. Comme le souligne l’article :

[Un] problème évident avec les chiffres des prix intérieurs de la Banque du Commonwealth par rapport au revenu est qu’elle compare les revenus moyens aux prix médians des maisons (contrairement aux chiffres démographiques qui comparent les revenus médians aux prix médians). La médiane est le point central, ce qui signifie que la

moyenne est généralement plus élevée lorsqu’il s’agit des revenus et des prix des actifs, car elle inclut les revenus des personnes les plus riches de l’Australie. En d’autres termes, les chiffres de la Commonwealth Bank comptent le salaire de plusieurs millions de dollars de Ralph Norris du côté des revenus, mais pas sa maison (sans doute) très chère dans les chiffres du prix de l’immobilier, ce qui sous-estime le ratio prix/revenu des maisons pour les Australiens à revenu moyen.

Je n’aurais pas pu mieux dire. La façon dont Demographia a calculé le ratio est la bonne. La façon dont la Banque l’a fait est incorrecte. Quant à savoir pourquoi une organisation

extrêmement sophistiquée sur le plan quantitatif, comme une grande banque, a commis une erreur aussi élémentaire, eh bien… Je ne peux pas le dire avec certitude puisque je n’ai aucune idée précise de ce qu’ils pensent. Mais l’article lui-même mentionne les faits suivants, qui peuvent ou non être pertinents :

En tant que premier prêteur immobilier australien, la Banque du Commonwealth a l’un des intérêts les plus importants dans la hausse des prix de l’immobilier. Elle possède en effet une grande partie des logements australiens en garantie de ses prêts immobiliers ainsi que de nombreux prêts aux petites entreprises. Mon Dieu, mon Dieu.

Mode

Le mode d’un échantillon est très simple. C’est la valeur qui s’observe le plus fréquemment. Nous pouvons illustrer le mode en utilisant une variable AFL différente : qui a joué le plus de finales ? Ouvrez le fichier des petits finalistes aflsmall et jetez un coup d’œil à la variable afl.finalists, voir Figure 4‑5. Cette variable contient les noms des 400 équipes qui ont participé aux 200 matches de la phase finale disputés entre 1987 et 2010.

Ce que nous pourrions faire, c’est lire l’ensemble des 400 inscriptions et compter le nombre d’occasions où chaque nom d’équipe apparaît dans notre liste de finalistes, produisant ainsi un tableau de fréquence. Cependant, ce serait stupide et ennuyeux : exactement le genre de tâche pour laquelle les ordinateurs sont très doués. Alors utilisons Jamovi pour faire ça

pour nous. Sous « Exploration » - « Descriptives », cliquez sur la petite case à cocher intitulée « Frequency table » et vous devriez obtenir quelque chose comme Figure 4‑6. Maintenant que nous avons notre tableau de fréquence, nous pouvons le regarder et

constater qu’au cours des 24 années pour lesquelles nous disposons de données, Geelong a participé à plus de finales que toute autre équipe. Ainsi, le mode des données des données afl.finalistes est « Geelong ». On constate que Geelong (39 finales) a disputé plus de finales que toute autre équipe au cours de la période 1987-2010. Il convient également de noter que dans le tableau des statistiques descriptives, aucun résultat n’est calculé pour la moyenne, la médiane, le minimum ou le maximum. C’est parce que la variable afl.finalists est une variable nominale et que cela n’a pas de sens de calculer ces valeurs.

Figure 4‑5 Une capture d’écran de Jamovi montrant la variable stockée dans le fichier

Figure 4‑6 : Une capture d’écran de Jamovi montrant la table de fréquence pour la variable afl.finalists

Une dernière remarque concernant le mode. Bien que le mode soit le plus souvent calculé lorsque vous disposez de données nominales, parce que les moyennes et les médianes sont inutiles pour ce genre de variables, il y a des situations dans lesquelles vous voulez

vraiment connaître le mode d’une variable ordinale, d’intervalle ou de rapport. Par

exemple, revenons à notre variable afl.margins. Cette variable est clairement une échelle de ratio (si vous ne comprenez pas bien, il peut être utile de relire la section 2.2) et, dans la plupart des cas, la moyenne ou la médiane est la mesure de la tendance centrale que vous voulez. Mais considérez ce scénario : un de vos amis propose un pari et il choisit un match de football au hasard. Sans savoir qui joue, vous devez deviner la marge de gain exacte. Si vous devinez correctement, vous gagnez 50 $. Si vous ne le faite pas, vous perdez 1 $, il n’y a pas de prix de consolation pour avoir « presque » obtenu la bonne réponse. Vous devez deviner exactement la bonne marge. Pour ce pari, la moyenne et la médiane vous sont complètement inutiles. C’est le mode sur lequel vous devriez parier. Pour calculer le mode de la variable afl.margins dans Jamovi, retournez à cet ensemble de données et sur l’écran « Exploration » -« Descriptives » vous verrez que vous pouvez développer la section

marquée « Statistics». Cliquez sur la case à cocher « Mode » et vous verrez la valeur modale apparaitre dans le tableau « Descriptives », comme dans la Figure 4‑7. Les données de 2010 suggèrent donc que vous devriez miser sur une marge de 3 points.

Figure 4‑7 : Une capture d’écran de Jamovi montrant la valeur modale de la variable afl.margins

Dans le document Apprentissage des statistiques avec Jamovi (Page 65-69)