Taux d’admission différentiel et représentativité de l’échantillon

PARTIE 1 : DE L’IDEE DE BIAIS AU CONCEPT DE BIAIS

3. Chapitre 3 : Du problème de l’échantillonnage au problème de la validité de

3.1 Le biais de Berkson

3.1.3 Taux d’admission différentiel et représentativité de l’échantillon

Ainsi, si l’on assigne à chaque maladie une probabilité sélective indépendante de 0.05, la probabilité d’avoir la cholécystite et des problèmes de vue (P=0.93) est supérieure à celle d’avoir la cholécystite et un diabète (P=0.91), tandis que si l’on

25_{« It would be quite unrepresentative of the situation in the general population and of no biologic}

127

assigne la probabilité de 0.15 à la cholécystite, de 0.05 au diabète, et de 0.2 aux problèmes de vue, on constate que la probabilité d’avoir la cholécystite et des problèmes de vue (P=0.22) est inférieure à celle d’avoir la cholécystite et le diabète (P=0.31). Dès lors, tout dépend effectivement de la probabilité initiale, qui est par ailleurs inconnue et inconnaissable, que la pathologie en question induise ou non une hospitalisation : on peut donc en conclure que toutes les corrélations qui sont mises en évidence dans les différents tableaux ne traduisent pas une corrélation (ou une absence de corrélation) entre une pathologie et une autre, mais sont le reflet d’une probabilité différentielle d’être admis à l’hôpital en fonction de la pathologie ou des pathologies dont la personne souffre, ou, comme le dit Greenland, que « des maladies puissent paraître associées, dans une étude cas-témoins fondée sur une population hospitalisée, uniquement en raison de taux d’admission supérieurs parmi les personnes qui ont plusieurs maladies, même si ces maladies déterminent de façon indépendante les taux d’admission »26_.

L’article se termine par un commentaire de Berkson où il va se justifier et conclure. Tout d’abord il pose que le taux de sélection différentielle appliquée aux différentes maladies est assez conforme à la réalité dans la mesure où un patient a plus de chances d’aller à l’hôpital en fonction de la maladie dont il souffre. Par contre il précise que le fait que ces probabilités soient indépendantes est très simplificateur (« oversimple » ) car, « en général, on peut supposer que si un patient souffre de deux maladies, leurs symptômes vont mutuellement s’aggraver, et le patient va plus facilement s’en apercevoir », ce qui va mécaniquement surreprésenter les polypathologies à l’hôpital, et donc accroitre la discordance entre la population générale et la population à l’hôpital27_{. Berkson peut ainsi conclure qu’il est « dangereux} d’appliquer à une population hospitalisée la méthode de l’analyse du tableau 2x2 dans le cadre d’une enquête sur une corrélation entre différentes maladies 28_{», ainsi que}

26_{« Described in modern terminology, Berkson studied the phenomenon that diseases can appear}

associated in a hospital-based case-control study solely on account of higher admission rates among persons with multiple conditions, even if the conditions affect admission rates independently », in

Greenland, 1987, p. 86.

27_{« In general we may guess that if a patient is suffering from two diseases, each disease is itself}

aggravated in its symptoms and more likely to be noted by the patient. So far as this difference of fact from assumption goes, its effect would be to increase relatively the representation of multiple diagnoses in the hospital, and in general to increase the discrepancy between hospital and parent population, even more than if the probabilities were independent. », in Berkson, 1946, p. 50.

28_{« It appears from the development that it is hazardous to apply in a hospital population the method of}

128

dans d’autres cas, comme la comparaison entre les ouvriers et les agriculteurs, puisqu’ils ne sont pas représentés dans les mêmes proportions à l’hôpital que dans la population générale.

Par contre, il ajoute que dans certains cas, la « comparaison n’est pas fondamentalement invalide », notamment quand le taux de sélection pour une condition particulière (comme la couleur des yeux, ou le type anthropologique) est égal à zéro et qu’on cherche à savoir si ces caractéristiques particulières sont en corrélation avec une maladie particulière, par exemple les yeux bleus et des problèmes de vue ; ou encore quand chacun des groupes de cas souffre d’une seule maladie, et que le taux de sélection (pour entrer à l’hôpital) est globalement identique. Dans tous les autres cas, la comparaison n’est pas valide et il ne semble y avoir aucun moyen de corriger cette corrélation artificielle qui existe au sein de la population hospitalisée29_. C’est pourquoi Berkson insiste dès le début de son article sur la distinction entre la méthode du laboratoire et la méthode statistique : dans le premier cas on va de l’exposition à la maladie (de la cause à l’effet), tandis que dans le cas statistique, on va de la maladie à l’exposition (de l’effet à la cause). Or dans la mesure où la maladie influence la sélection des patients dans le groupe ou dans l’échantillon (ici le taux d’admission des patients à l’hôpital), il est impossible de déterminer une corrélation entre l’exposition et la maladie qui ne soit pas le simple effet d’un taux d’admission différentiel qui ferait que telle pathologie serait sous ou sur-représentée dans l’échantillon, d’autant plus si le fait d’avoir plusieurs pathologies augmente d’autant la probabilité d’être admis à l’hôpital.

Dès lors, l’affirmation de Berkson selon laquelle les données hospitalières (« Hospital data ») ne sont qu’un « cas particulier d’un problème plus général » (« a specific case of a kind »30_{) et que « des résultats identiques à ceux de cet article}

apparaitraient si l’échantillonnage était appliqué à des cartes distribuées au hasard plutôt qu’à des patients »(Berkson, 1946, p. 51), est logique car il s’agit simplement

29_{« However, the formulas given indicate some special cases in which comparison is not basically invalid.}

If the selective rate for any particular condition is zero, the relative incidence of that condition in several disease groups may be validly examined, regardless of the selective rates affecting the other groups. This refers to inquiries in which for instance eye color or anthropologic type is examined in various disease groups to ascertain whether there is correlation between these characters and disease. If each of the disease groups examined consists of only one disease, for example, diabetes or refractive errors but not both, and if the selective rates for these two groups do not differ appreciably then also it is valid to compare the incidence in them of cholecystitis, even though the latter disease is not fairly represented in the hospital », in Berkson, 1946, p. 50.

129

du « résultat de la combinaison de probabilités indépendantes » (Berkson, 1946, p. 48). Nous retrouvons en fait ici le problème tel qu’il est soulevé par Bradford Hill dans ses Principles of Medical Statistics : la population d’un hôpital est biaisée au sens où c’est un échantillon qui n’est pas représentatif de la population générale, car la probabilité d’être admis à l’hôpital varie en fonction de la maladie en question mais aussi de la présence ou non de plusieurs maladies. Comme le dirait Hill, « un membre de cet univers d’où est tiré l’échantillon a plus de chances d’apparaître qu’un autre»31_, ce qui empêche toute généralisation qui irait de la population à l’hôpital vers la population générale, donc toute inférence statistique. C’est d’ailleurs ce problème de la représentativité de l’échantillon qui va occuper Donald Mainland dans son article de 1953, qu’il convient à présent d’examiner.

Dans le document Le concept de biais en épidémiologie (Page 127-130)