• Aucun résultat trouvé

L’analyse de l’expérience de Weldon par Fisher

Dans le document Le concept de biais en épidémiologie (Page 54-57)

PARTIE 1 : DE L’IDEE DE BIAIS AU CONCEPT DE BIAIS

1. Chapitre 1 : Archéologie du concept de biais

1.2 L’expérience du lancer de dés de Weldon :

1.2.3 L’analyse de l’expérience de Weldon par Fisher

L’expérience du lancer de dés de Weldon va être à nouveau analysée, quoique d’une manière différente, dans l’ouvrage de Fisher, intitulé, Statistical Methods for Research Workers36, publié en 1925, dans le chapitre III, consacrée aux

« Distributions », c’est-à-dire aux distributions de fréquence. Les distributions de fréquence permettent en effet d’étudier la variation, cette étude de la variation étant définie par Fisher comme une des trois définitions ou comme un des trois objectifs possibles de la science des statistiques (Fisher, 1950, p. 1). Plus précisément, nous dit Fisher, les distributions de fréquence (Fisher va étudier successivement la loi normale, les séries de Poisson et la loi binomiale, où apparait l’expérience de Weldon) permettent de déterminer, grâce aux tests statistiques, si un échantillon donné d’une population est semblable à un autre échantillon, et donc de déterminer à quelle

36 Fisher, Sir Ronald Aylmer, Statistical Methods For Research Workers, Edinburgh, Oliver and Boyd,

1925. Nous utilisons pour notre étude sur la 11ème édition: Fisher, Sir Ronald Aylmer, Statistical

54

population les conclusions tirées à partir d’un échantillon vont pouvoir s’appliquer. Il dit ainsi au début du chapitre III :

« L’idée d’une population infinie distribuée dans une distribution de fréquence en fonction d’une ou de plusieurs caractéristiques est fondamentale pour tout travail statistique. A partir d’une expérience limitée, par exemple les individus d’une espèce, ou du temps qu’il fait dans une certaine localité, nous pouvons obtenir quelque idée d’une population infinie hypothétique d’où notre échantillon est tiré, et par là de la nature probable des futurs échantillons auxquels nos conclusions seront appliquées. Si un second échantillon contredit cette attente [« expectation »], nous concluons, en langage statistique, qu’il est tiré d’une population différente ; que le traitement auquel le second échantillon d’organismes a été exposé a réellement fait une différence matérielle, ou que le climat (ou les méthodes pour le mesurer) s’est matériellement altéré. Les tests critiques de ce genre peuvent être appelés des tests de signification [« tests of significance »], et quand de tels tests sont disponibles nous pouvons découvrir si un second échantillon est ou n’est pas significativement différent du premier » (Fisher, 1950, p. 31).

Parmi ces tests, il y a bien évidemment le test du 2, inventé par K. Pearson, mais aussi le test inventé par Fisher, à savoir l’analyse de la variance (ANOVA pour ANalysis of VAriance) , outil qui permet de vérifier que plusieurs échantillons sont issus d'une même population par la comparaison de leur moyenne ou de leur espérance. Fisher pose le problème ainsi : si le dé est bien équilibré, alors p=1/3 (en effet, si on jette un dé équilibré, il y a une chance sur trois qu’il fasse plus de 4), la loi binomiale étant normalement : (2/3 + 1/3)12. Or,

« si un ou plusieurs dés ne sont pas équilibrés, et si tous conservent le même biais tout au long de l’expérience, les fréquences devraient être approximativement déterminées par (q+p)12, où p est une fraction à déterminer d’après les données »(Fisher, 1950, p. 63-64).

Fisher reprend alors le tableau donné par Pearson, en intégrant toutes les données (c'est-à-dire avec la fréquence théorique de 1/3 et celle observée sur l’échantillon de 0,3377). Voici le tableau en question :

55

Figure 1-3: Analyse de la variance appliquée par Fisher aux 26306 lancers de 12 dés de

Weldon 37

Fisher conclut immédiatement que « les observations ne sont pas compatibles avec l’assertion que les dés ne sont pas pipés [« unbiased »]. » (Fisher, 1950, p. 64). Fisher va alors appliquer le test du 2 hérité de Karl Pearson et défini par Fisher comme « un moyen de tester l’accord entre l’observation et l’hypothèse » (Fisher, 1950, p. 79). L’hypothèse nulle est donc ici que l’observation est proche de la théorie, c'est-à- dire que les dés ne sont pas truqués. Fisher refait le raisonnement de Pearson pour montrer qu’il n’y a que 0,001% de chances que le 2 dépasse 35.49 (Fisher, 1950, p.

65). Fisher va alors utiliser son propre test de la variance pour montrer que les dés sont pipés, c'est-à-dire que les valeurs observées dévient des valeurs théoriques :

« La variance des séries binomiales est pqn. Ainsi avec un dé équilibré [« true dice »] et 315 672 essais, le nombre attendu [« expected »] de dés marquant plus de 4 est de 105,224 avec une variance de 70149,3 et un écart-type de

56

264,9; le nombre observé dépasse l’espérance [« exceeds expectation »] de 1378, soit 5,20 fois son écart-type » (Fisher, 1950, p. 65).

Or « une déviation normale ne dépasse cinq fois son écart-type qu’une fois sur 5 millions »(Fisher, 1950, p. 65). Pour Fisher, ce test est le « test le plus sensible de la présence d’un biais » 38, c'est-à-dire plus sensible et donc plus efficace que le test du 2, au sens où il donne des « cotes beaucoup plus élevées »39 que le test de Pearson, en se concentrant non pas sur les « divergences de toute sorte »40, mais en testant séparément la divergence liée à la valeur de p.

Le biais apparait donc ici comme une déviation par rapport à la normale, ou plus précisément comme une déviation par rapport à l’écart-type qui est beaucoup trop élevée (5 fois plus que l’écart-type) pour être normale, et qui, en tant que telle, est hautement improbable (1 chance sur 5 million que cela arrive). Dès lors, cette distribution de la fréquence d’apparition des numéros 5 et 6 dans une longue série de lancers de dés doit permettre de conclure, étant donné son caractère hautement improbable, que les dés sont pipés, c'est-à-dire que le 5 et le 6 ont plus de chances d’apparaitre que les autres faces des 12 dés, pour une raison à déterminer. Et c’est précisément le test statistique, en l’espèce ici l’analyse de la variance, qui permet de déceler la présence d’un biais.

Dans le document Le concept de biais en épidémiologie (Page 54-57)