• Aucun résultat trouvé

L’analyse de l’expérience de Weldon par Pearson

Dans le document Le concept de biais en épidémiologie (Page 51-54)

PARTIE 1 : DE L’IDEE DE BIAIS AU CONCEPT DE BIAIS

1. Chapitre 1 : Archéologie du concept de biais

1.2 L’expérience du lancer de dés de Weldon :

1.2.2 L’analyse de l’expérience de Weldon par Pearson

L’objectif de l’article de Pearson, qui parait en 1900, soit six ans après l’expérience du lancer de dés, qui n’apparait d’ailleurs dans l’article qu’à titre d’illustration33, est d’exposer sa découverte du critère qui permet de déterminer si les déviations des valeurs observées d’une ou de plusieurs variables (ou d’un ensemble de variables) en corrélation, par rapport à leurs valeurs probables, sont dues ou non au hasard. Ce test, le test du 2, aussi appelé test de la qualité d’ajustement ou d’adéquation (« goodness of fit ») permet en d’autres termes de vérifier si un échantillon d'une variable aléatoire Y donne des observations comparables à celles d'une loi de probabilité P définie a priori dont on pense, pour des raisons théoriques ou pratiques, qu'elle devrait être la loi de Y. Autrement dit, il s’agit de comparer le théorique avec l’empirique, l’a priori avec l’a posteriori, afin de déterminer si l’observation ou les données observées s’accordent ou s’ajustent (« fit ») aux hypothèses théoriques. Le terme « biais » va alors apparaitre dans la sixième partie

30 Pearson, Karl, « Contributions to the Mathematical Theory of Evolution. II. Skew Variation in

Homogeneous Material », Philosophical Transactions of the Royal Society A: Mathematical, Physical

and Engineering Sciences, vol. 186, 1895, p. 343‑414.

31 Pearson, Karl, « Mathematical contributions to the theory of evolution. XIX. Second supplement to a

memoir on skew variation », Philosophical Transactions of the Royal Society of London. Series A,

Containing Papers of a Mathematical or Physical Character, vol. 216, 1916, p. 429–457.

32https://en.oxforddictionaries.com/definition/skew. Accédéle 6 juin 2017.

33 L’expérience du lancer de dés occupe les deux premières illustrations parmi les trois illustrations qui

concernent la « fréquence connue ou supposée connue a priori », tandis qu’il y a quatre illustrations pour la « fréquence de population générale inconnue a priori».

51

de l’article, intitulée : « Fréquences connues ou supposées connues a priori ». Voici le tableau en question :

Figure 1-1: Valeur observée et valeur théorique de 26306 lancers de 12

dés de Weldon par Pearson34

Pearson commente les résultats ainsi:

« The results show a bias from the theoretical results, 5 and 6 points occurring more frequently than they should do. Are the deviations such as to forbid us to suppose the results due to random selection? Is there in apparently true dice a real bias towards those faces with the maximum number of points appearing uppermost? » (Pearson, 1900, in Kotz et Johnson, 1992, p. 21).

La question est donc de savoir si ces écarts ou ces déviations par rapport à la fréquence théorique sont dus au hasard ou bien à un biais dans le dé. On peut noter que le biais apparait ici d’abord comme une déviation « par rapport aux résultats théoriques », donc comme une propriété de la distribution, puis comme une propriété physique du dé, au sens où il aurait été mal fabriqué (volontairement ou non), comme c’était le cas pour la boule dans le jeu de boules. L’hypothèse de Pearson est que dans

52

la mesure où les points sur chaque face du dé sont obtenus en enlevant de la matière, alors il est logique que les faces 5 et 6 soient plus légères que les autres. De même, il faut souligner que la fréquence théorique du dé est connue : si on ne peut pas prédire quelle face du dé va apparaître à chaque lancer, on sait néanmoins que chaque face a en moyenne une chance sur six d’apparaitre, et donc que deux faces ont 1 chance sur 3 d’apparaitre à chaque lancer. Pearson va alors mettre les différentes déviations au carré (e2) et les diviser par la moyenne m de la fréquence théorique, donc faire la

somme des écarts des carrés à la moyenne :

Figure 1-2 : Test du 2 appliqué par Pearson

aux 26306 lancers de 12 dés de Weldon 35

La somme totale des écarts des carrés à la moyenne (soit 43,87241) est donc égale au 2 et est donc égal à 6,623625. Or il y a seulement une chance sur 62 499 d’arriver à un tel résultat. Pearson va alors refaire le calcul en se fondant non plus sur la fréquence théorique mais sur la fréquence réelle de l’échantillon, très large, de 26 306 lancers, c'est-à-dire 0,3377 :

« Le Professeur Weldon m’a suggéré que nous devrions prendre la 26 306 x (0,337 + 0, 6623) plutôt que la binomiale 26 306 x (1/3+2/3) pour représenter la

53

distribution théorique, la différence entre 0,337 et 1/3 représentant le biais du dé » [« …the difference between .3377 and 1/3 representing the bias of the dice. »]. (Pearson, 1900, in Kotz et Johnson, 1992, p. 22).

Effectivement si l’on prend la fréquence observée et non la fréquence théorique, à ce moment-là les chances que les dés soient pipés ne sont plus que d’1 sur 8.

Nous tenons donc là une première approximation du sens du mot « biais », qui n’apparait d’ailleurs pas comme un concept important ou décisif dans la pensée de Karl Pearson : le biais est donc la différence entre la distribution d’une fréquence qui est connue ou supposée connue a priori et sa fréquence réelle ou observée, c'est-à- dire sa fréquence a posteriori. Le problème vient du fait que dans le cas du dé, la distribution du dé est bien connue a priori, puisque chaque face a théoriquement 1 chance sur 6 de sortir, ce qui en retour permet de calculer ou de quantifier précisément le biais en question (ici, Biais = 0,3377 – 0,3333). La question qui reste en suspens est donc de savoir comment détecter un tel biais si la fréquence n’est pas connue ou supposée connue a priori, question à laquelle l’article de Pearson ne donne malheureusement pas de réponse.

Dans le document Le concept de biais en épidémiologie (Page 51-54)