• Aucun résultat trouvé

Mainland et la première définition du biais en épidémiologie : le biais

Dans le document Le concept de biais en épidémiologie (Page 134-141)

PARTIE 1 : DE L’IDEE DE BIAIS AU CONCEPT DE BIAIS

3. Chapitre 3 : Du problème de l’échantillonnage au problème de la validité de

3.2 Mainland et le problème du biais

3.2.2 Mainland et la première définition du biais en épidémiologie : le biais

Un biais, selon Mainland, est donc une entité indéfinie, un « quelque chose » (dans l’exemple, une compétition entre les taux de létalité de différentes maladies) qui va venir « masquer une réelle association ou bien créer une association fallacieuse » (Mainland, 1953, p. 654), et qui va se manifester auprès de l’enquêteur essentiellement à travers ses effets. Ainsi dans la partie suivante, Mainland va procéder à des modifications des valeurs numériques à l’exemple qu’il a donné précédemment, en réduisant notamment la taille de l’échantillon : cette réduction de l’échantillon conduit à la conclusion qu’il n’y pas de différence significative entre la fréquence de X chez les A et la fréquence de X chez les B. Selon lui, cela « souligne la présence d’un biais, car cela conduit à la situation paradoxale où avec un échantillon plus petit, c'est-à-dire avec moins d’information, il semble que nous nous rapprochions de la vérité (aucune différence réelle dans la fréquence de X entre A et B) , qu’avec un échantillon plus large , c'est-à-dire avec plus d’information, obtenu de la même manière» (Mainland, 1953, p. 647).

Dans un autre article publié deux ans plus tard, en 1955, qui est la première partie d’une série d’articles consacrés à « L'emploi des dossiers des malades dans l'étude de la thérapie et d'autres traits d'une maladie chronique » 38, et qui porte plus

37 « We should rightly conclude, therefore, that something more than chance was operating; but we should

be wrong if we thought that this “something” was a closer association in the parent population between X and B than between X and A. The “something” is in reality a bias in the sampling, due to the lower fatality of B, which causes a higher proportion of the dead B’s to be afflicted with X than is found among the dead A’s. The phenomenon can be described as a competition among fatality rates. », in Mainland,

1953, p. 646.

38 Mainland, Donald, « Use of Case Records in the Study of Therapy and Other Features in Chronic

Disease I. Planning the Survey », Annals of the Rheumatic Diseases, vol. 14 / 4, décembre 1955, p. 337‑352

134

précisément sur la planification ou le « projet » de l’enquête (« Planning the survey »), donc la partie proprement méthodologique, Mainland, après avoir énoncé les neuf questions qu’il faut se poser en planifiant l’enquête39 va proposer une définition un peu plus précise, ou plutôt un peu moins vague, de la notion de biais :

« The nine questions are designed to show: (1) How far such pessimism is justified,

(2) How forethought can reduce biases, which can be defined here for reference as "things that make a sample different from what it purports to be". » (Mainland, 1955, p. 338).

Les biais, ce sont donc les choses qui modifient un échantillon de telle sorte qu’il en devient différent de ce qu’il prétend être ou de ce qu’il est censé être. Il reprendra la même définition tout en la précisant à nouveau un peu plus, dans un autre article en trois parties40, publié trois ans plus tard en 1958, et consacré intégralement à la planification et à l’évaluation des recherches (« planning and evaluation of research »). Cette définition apparait dans la troisième partie de la méthode proposée par Mainland, consacrée à la « Subdivision de la population », et plus spécifiquement à une sous-partie intitulée : « Réduction des biais » (« Reduction of bias ») :

« Bias is anything that makes a sample different from what it purports to be – it is a mislabeling. »41

Un biais est donc une erreur d’étiquetage ou de caractérisation de l’échantillon : en d’autres termes, les propriétés assignées à l’échantillon ne sont pas correctes, ce

39 « (I) Who ?-Persons responsible for the original observations and for the survey.

(2) Why ?-The purposes of the survey. (3) What?-The population sampled.

(4) Where?-Location and environment (e.g. of a clinic and its patients). (5) When ?-Time factors.

(6) How?-Methods of clinical observation and of survey.

(7) How much ?-Measurement. (In the broad sense of assessing results, this is covered by Question 6.) (8) How many ?-Enumeration (numbers of patients and observations).

(9) Why ?-Why did this happen ?-Causal relationships. », in Mainland, 1955, p. 338.

40 Mainland, Donald, « Notes on the planning and evaluation of research, with examples from

cardiovascular investigations. Part I », American Heart Journal, vol. 55 / 5, 1958, p. 644–655. Nous ferons référence à ce texte sous la forme abrégée: Mainland, 1958a.

Mainland, Donald, « Notes on the planning and evaluation of research, with examples from cardiovascular investigations. Part II », American Heart Journal, vol. 55 / 6, 1958, p. 824–837. Nous ferons référence à ce texte sous la forme abrégée: Mainland, 1958b

Mainland, Donald, « Notes on the planning and evaluation of research, with examples from cardiovascular investigations. Part III », American Heart Journal, vol. 55 / 6, 1958, p. 838-850. Nous ferons référence à ce texte sous la forme abrégée: Mainland, 1958c.

135

qui risque d’induire des erreurs au niveau des conclusions qu’on va pouvoir tirer à partir de cet échantillon. Mainland donne un exemple pour expliquer ce qu’il veut dire : « For example, if children and adults had been grouped together in the Rheumatic Fever Trial, an excess of children in, say, the aspirin group, as compared with the cortisone group, might have produced a difference in outcome that was not due to any treatment difference at all, or it might have masked a real benefit due to one of the treatments. The true labels of the groups would have been “Aspirin (Many Children)” and “Cortisone (Few Children).” We should always ask: “What may our labels be hiding?” » (Mainland, 1958a, p. 647-648).

Ici, l’erreur de caractérisation ou d’étiquetage renvoie à l’âge des membres de l’échantillon : les échantillons ne sont pas comparables entre eux car les membres de l’échantillon A et de l’échantillon B ne sont pas comparables en âge. Il s’agit donc ici plutôt du problème de la comparabilité entre les échantillons, que du problème de la représentativité de l’échantillon par rapport à la population générale ou à l’univers dont l’échantillon est issu, comme c’était le cas dans l’article de 1953.

De façon intéressante pour notre propos, Mainland précise implicitement que cette notion de biais est différente de la notion psychologique et populaire du mot « biais », qui renvoie à la notion de préjugé ou de parti-pris. Il semble même faire ironiquement référence à certains chercheurs médicaux qui en seraient restés à cette signification populaire, le verbe « to linger » renvoyant en anglais à l’idée de « persister » ou de « s’attarder » :

« The popular notion of bias as a psychologic phenomenon still lingers with some medical investigators. » (Mainland, 1958a, p. 647).

Et pourtant, dans son article de 1955, où apparait la première définition du mot « biais » que donne Mainland, la notion de biais est précisément traduite, par l’éditeur de la revue, en français par « parti-pris » et en espagnol par « factor de parcialidad » (Mainland, 1955, p. 351), ce qui renvoie non pas au problème d’un échantillon qui ne serait pas ce qu’il prétend être mais à la notion populaire et psychologique du biais, avec laquelle Mainland prend pourtant ses distances. Est-ce une simple erreur de traduction de la part de l’éditeur, ce qui soulignerait d’ailleurs l’ambiguïté qui règne autour de cette notion ? Ou bien faut-il comprendre à l’inverse qu’il existe un lien entre les deux notions, ou plutôt entre les deux sens de cette même notion ?

136

Une clé de compréhension se trouve peut-être dans un autre article de Mainland, publié celui-ci en 1956 et intitulé « The risk of biased selection in forward- going surveys with nonprofessional interviewers »42. Cet article, relativement court, est en fait une étude menée par Mainland et sa collègue Lee Herrera, sur un échantillon de leurs propres étudiants en première année de la faculté de médecine de New York, durant le premier cours de l’année universitaire 1955-1956. Ce questionnaire vise à évaluer le surgissement d’un biais dans la sélection des patients dans le cadre d’une enquête prospective et constitue une critique de la méthode adoptée par Hammond et Horn dans leur étude sur la relation entre le tabagisme et les taux de mortalité menée sur 187 766 hommes43. En effet ceux-ci, afin de pouvoir interroger autant de personnes ont choisi de faire appel à des volontaires, en l’occurrence à 22 000 membres de diverses divisions locales de l’American Cancer Society, volontaires qui avaient notamment pour tâche de « sélectionner les sujets, distribuer les questionnaires, les récupérer, et de revoir les sujets à intervalles annuels » (Mainland et Herrera, 1956, p. 240). Ces volontaires ont reçu des instructions, aussi bien orales qu’écrites, par les statisticiens de l’American Cancer Society quant à la marche à suivre. Mais pour Mainland cela ne garantit en rien la validité scientifique de l’investigation car selon lui :

« The characteristics of a scientific investigation (objectivity, avoidance of biased sampling, the use of controls) are, however, not very easy to comprehend, for even a complete medical course does not always eradicate unscientific concepts regarding the requirements of valid evidence. » (Mainland et Herrera, 1956, p. 240).

Or, justement, il est fort probable, selon Mainland, que les volontaires en question aient sélectionné les « bons cas », c'est-à-dire par exemple ceux qui ont à la fois le comportement (ici, fumer) et la maladie en question ou au moins des symptômes en rapport avec la maladie comme la toux du fumeur, non pas tant dans le but de truquer les résultats mais simplement par acquit de conscience :

« It is conceivable, therefore, that some nonprofessional interviewers might believe that the best kind of subject in a habit-disease survey was one who

42 Mainland, Donald et Herrera, Lee, « The risk of biased selection in forward-going surveys with

nonprofessional interviewers », Journal of Chronic Diseases, vol. 4 / 3, 1956, p. 240–244.

43Hammond, E. Cuyler et Horn, Daniel, « The relationship between human smoking habits and death

rates: a follow-up study of 187,766 men. », Journal of the American Medical Association, vol. 155 / 15, août 1954, p. 1316-1328

137

showed both the habit and the disease. This does not imply a desire to distort the evidence, nor does it imply ability to diagnose a disease. It simply implies that some interviewers might feel that they would be doing a better job if they selected subjects who practiced the habit under investigation, and also had some symptoms attributable to the habit. In a smoking survey, the symptoms might be “smoker’s cough” or “chest trouble. » (Mainland et Herrera, 1956, p. 240)

Pour tester l’hypothèse selon laquelle les volontaires auraient sélectionné leur échantillon de telle manière qu’il s’en trouve biaisé, c'est-à-dire ici non représentatif de la population dont il est issu, et afin de quantifier le risque que ce soit le cas, Mainland et Herrera ont ainsi créé un bref questionnaire (6 questions) à destination de leurs 129 étudiants afin de voir ce qui pour eux constituerait un bon sujet («a good case ») pour ce genre d’études évaluant le lien entre un comportement et une maladie. Voici le questionnaire avec, entre crochets, les résultats :

138

Figure 3-2 : Questionnaire donné par Mainland et Herrera à leurs étudiants pour évaluer le risque de biais dans le choix des sujets d’une étude44

139

Ainsi, si les réponses aux questions 2, 4, 5 (Mainland et Herrera ont exclu la 3 car ils ont considéré qu’elle était mal formulée) sont « Certainement » ou « Probablement » suivies d’une lettre (A, B, E, F, G, H), alors il y un risque de biais. A l’inverse, si la réponse est « D’égale valeur » (« Both equally valuable »), il n’y a pas de risque de biais (Mainland et Herrera, 1956, p. 243). Cela donne le tableau 2x2 suivant, que nous reproduisons et traduisons ici :

Figure 3-3 : Tableau à double entrée sur le risque de biais dans la sélection par les étudiants des sujets de l’étude (Mainland et Herrera) 45

Nombre d’étudiants Pourcentage

Risque avéré de biais 71 55.0

Douteux 28 21.7

Pas de preuve de biais 28 21.7

Sans opinion 2 1.6

129 100.0

Ainsi, plus de la moitié des étudiants auraient sélectionné des sujets qui auraient pu en dernier ressort biaiser l’échantillon et fausser les résultats. Pour Mainland il n’y a d’ailleurs pas de solution à ce problème, si ce n’est la sélection automatique des sujets de l’échantillon. En effet :

« Indeed, the basic fault lies not in the interviewer, but in the nonautomatic selection of subjects. » (Mainland et Herrera, 1956, p. 244).

Il ajoute dans le résumé de son article :

« The only safe method is automatic selection. » (Mainland et Herrera, 1956, p. 244).

Si Mainland n’emploie pas explicitement le mot « biais » pour désigner le parti- pris des volontaires qui sélectionnent les patients dans l’étude de Hammond et Horn, ou ici des étudiants qui sélectionneraient les sujets inclus dans l’étude selon des critères de pertinence qui auraient pour effet de biaiser les résultats, il est néanmoins possible de penser que la signification familière et psychologique du mot « biais », comme synonyme de parti-pris ou de préjugé, rejoint ici la signification proprement

140

statistique de ce mot conçue comme une absence de représentativité de l’échantillon par rapport à l’univers dont il est issu, ou comme un problème de comparabilité entre les différents groupes de l’échantillon, ce qui, dans ces deux cas, empêche de tirer la moindre conclusion valide à partir de l’étude qui aurait été menée.

Plus précisément il semble que Mainland considère que le sens psychologique du mot « biais » est beaucoup trop restrictif et ne semble finalement n’être qu’une sous-catégorie d’un ensemble de phénomènes qui sont susceptibles de fausser les résultats d’une étude. Ainsi dit-il dans la deuxième partie de son article de 1958 :

« This kind of procedure46, now familiar to many clinical investigators, is

apparently often thought to be simply a device for avoiding conscious or unconscious psychological bias. It plays a far more fundamental role, which has nothing to do with sealed envelopes. » (Mainland, 1958c, p. 825).

Quel est donc ce « rôle beaucoup plus fondamental », qui n’a rien à voir avec les enveloppes scellées, que remplit ce « genre de procédures » ? Et quel est précisément ce « genre de procédures » auquel Mainland fait référence ?

Dans le document Le concept de biais en épidémiologie (Page 134-141)