ORGANISATION MONDIALE DE LA SANTE

(1)

Vv'ORLD HEALTH ORGANIZATION

SYMPOSIUM INTERREGIONAL SUR LES CRITERES ET IES METHODES DE ME8URE DE LA PURETE DE L'AIR

~~1.ève, 6-12 aoO.t 1963

~~~

1

.. 1.· ,.-

.·. ~· ')

,,

"

ORGANISATION MONDIALE DE LA SANTE

HHO/AP/6

9 juillet 1963

:· •. 1

..

^,._ ^}.) / ORIGINAL : ANGLAIS

METHODES EPIDEMIOLOGIQUES D'ESTIMATION DES CONCENTRATIONS r.'lAXIMUMS ADMISSIBLES (CMA), NOTAMMENT EN RAPPORT AVEC LES METHODES MEDICO-SOCIOLOGIQUES ET STATISTIQUES

par

R. Cederlëf, L. Friberg et E. Jonsson

Plusieurs facteurs interviennent dans la planification, l'exécution et lvévaluation des enqu@tes épidémiologiques. Nous nous bornerons cependant ici à examiner certaines questions spéciales, p~us prééisément les problèmes médico-sociologiques qui intéressent la réunion et l'évaluation des sympt8mes subjectifs, et ~

discuter certains aspec'ts statistiques de la planification des enqu@tes et de l'inter- prétation de leurs résultats.

La principale raison qui nous a poussés à porter notre attention sur les problèmes r~~dico-sociolog~ques, c'est que l'absence d'une méthodologie uniforme et clairement défini~ pour l'évaluation des sympt8mes subje9tifs dans les enqu@tes portant sur des groupes n'a guère préoccupé les chercheurs jusqu'ici. Les questions statistiques que nous aborderons ci-après visent à illustrer les problèmes les plus essentiels - quoique peut-@tre peu apparents - qui surgissent continuell~ment dans les comparaisons entre groupes exposés et groupes témoins, surtou~ lorsque l'on constate qu'il n'y a pas de différences entre les deux types de groupes pour ce qui est de certains sympt8- mes, .subjectifs ou objectifs.

Si nous admettons que les sympt8mes subjectifs peuvent valablement intervenir dans la détermination de la CMA, alors nous devons fonder nos déterminations sur des données que no~s ne pouvons nous procurer qu'au moyen do qUI:lt>t:.ionna:fros. ~En effet, la seule m&1ière d~obtenir des renseignements sur les sympt8mes subjectifs d'un sujet donné et sur ce qu ¹il éprouve de désagréable est de nous fonder sur ses propres d4cJ.ar-

rations.

(2)

AP/6

Page 2

D'ans les enqu@tes où l'on a affaire à des données objectives, la méthode de mesure est presque toujours décrite~ ce qui n'est en revanche presque jamais le cas avec les études épidémiologiques qui traitent de sympt8mes subjectifs. Il existe pour- tant une large diversité de méthodes d'interview qui~ dans différentes conditions, ne donnent pas des résultats également sûrs. Or, précisément une description des méthodes employées permettrait ici, comme ailleurs, à ceux qui les lisent de tirer d~s conclusions quant à leur validité et à la comparabilité des résultats avec ceux d'autres enqu@tes.

Nous allons ci-après passer en revue quelques-unes des sources possibles d'erreurs dans les enqu@tes par sondage. En principe, ces erreurs peuvent @tre imputées soit aux enqu@teurs - qui sont souvent des médecins~ - soit aux enquêtés, soit encore à 1¹instrument de me·sure, c ¹est-à-dire au questionnaire.

La déformation due à l'enqu@teur procède de ce que celui-ci, soit parce qu'il influence le sujet, soit parce qu'il interprète faussement sa réponse~ n'enre- gistre pas la réponse d'une manière tout à fait juste. Dans les études épidémiologiques, i1 est p1•obable que les erreurs d ¹interprétation viennent en règle générale de ce que l!enquêteur a une idée préconçue de la réponse du sujet et a donc tendance, si elle n'est pas complètement claire~ à l'interpréter selon cette idée préconçue.

Il s'agit~ par exemple, de déterminer la relation qui existe entre la pré- sence d'oxyde de carbone sous une certaine concentration et la fréquence des maux de

t~te. Pour établir si cette fréquence est plus grand0 chez les individus exposés à l'oxyde de carbone, on interroge un certain nombre de sujets ainsi exposés et un certain nombre de sujets choisis parmi des personnes non exposées. Les réponses à la ques-

t~on ¹¹souffrez-vous de maux de tête ?¹¹ sont souvent ambiguës, et un enquêteur qui

s'attend à une fréquence exceptionnellement élevée de maux de t@te dans un group~ exposé à l'oxyde de carbone sera beaucoup plus porté à donner à ces réponzes ambiguës l'inter- prétation "souffre de maux de tête¹¹ qu'un enqu@teur qui n'a pas cette idée préconçue.

(3)

AP/6

Page 3

Une façon de réduire ou du moins de contrôler cet effet est d'employer plusieurs enquêteurs et de répartir au hasard les sujets entre eux. C'est ce que nous avons fait d~s une ~nquête médico-sociologique sur le terrain. La figure l montre que la proportion de sujets qui, directement questionnés par différents enquêteurs, ont répondu qu'ils souffraient d'asthme et/ou de bronchite variait entre 10% et 34

%.

Les différences entre les résultats des divers enquêteurs sont significatives au niveau.de 5

%.

Le risque de déformation due à l'enquêteur est lié entre autres choses à

l'entraînement et à l'expérience de ce dernier. Ainsi, pour le genre d'enquêtes présen~.

tement.·cons_idéré, les enquêteurs doivent avoir subi une mise au courant convenable et.

avoir été mis en gard~ contre des risques tels que l'influence d'idées préconçues. Il y a en outre intérêt à pratiquer des interviews d'essai pour se rendre compte de l'aptitude des enquêteurs à enregistrer les réponses avec exactitude.

FigUl:e 1

Comparaison entre el!:~u~~~urs t?u~h<:l!tJ~ mention des_?ymp~Ômes_asi;..h!n~ et/o .. l1 .. t>r_oncJ::l,:!-te ...

{en

%)

chez les enquêtés •

. ---·---.Enquêteur- No ^.-- . -^..-Nombre ··de· personnes ^{.. ·-} -kstbme·-·et/ ou ·bromrh'ite · ··

interrogées {en%)

1

l

1 ₆₀ ₁₇

2

1 63 24

3 1 60 22

- ... 4. -^..^- 1 . . . .. 52'- ^... . .. ^- .... · · .. -lo-^.. ^"'^{. .} ^{" '}^....^'

1

5 1 49 12

6

1 47 23

7

i

⁵⁸ ²⁶

8 ¹ 49 12

9

1

41 16

10 59 17

11

1

53 17

12

1

64 34

13 57 12

14 ¹ 54 15

1 1

(4)

AP/6 Page

4

La déformation due à l'enqu@té~ qui probablement prend en règle générale la forme de fréquences trop élevées de symptômes~ résulte d'un désir conscient ou subconscient de l'intéressé d'obtenir un changement dans les conditions d'exposition.

Dans une enqu@te sur la gêne résultant de la pollution de l'air causée par une fabri- que d'huile de schiste~ nous avons interrogé deux groupes équivalents~ à cela près que le premier n'avait pas été informé de l'objet de lrenquête alors que le second l'avait été. Comme on le voit dans la figure 2~ la fréquence des symptômes a été plus élevée dans le second groupe~ ce qui tient sans doute principalement au désir de celui-ci de provoquer un changement dans les conditions de pollution de l'air~ joint à une attitude négative vis-à-vis de l'industrie en tant que telle.

Figure 2

Fréquence relative {en

%)

de sujets présentant certains symptômes parmi les

"non informés" et les "informés".

Symptômes

Peroeption d'odeurs

ITrès forte g&ne causée par des odeurs tsthme et/ou bronchite

Non informés

52

13 11

Informés

69

20 20

Les principaux remèdes à la situation consistent à présenter convenablement l'enqu@te et à poser des questions aussi concrètes que possible. Ainsi~ on donnera une explication neutre de l'objet de l'enquête et l'on posera des questions de fait~

plutôt que des questions générales à évaluation.

(5)

· ·~ , AP/6 Page

5

Par exemple, on évitera de demander à un sujet s'il est incommodé par le stimulus en général, mais on l'interrogera - sans se référer directement aux conditions d'exposition - sur 1~ présence de symptômes spéciaux.

La déforma~ion due à l'instrument.ne se rapporte pas seulement au type de questionnaire employé, mais aussi, peut-être même surtout, au libellé des questions effectivement posées. Nombreux sont les exemples de ma~vais interrogatoires qui ont entra1né des résultats .trompeurs. Prenons,.par exemple, les "questions orientées"

- c¹est-à ... dire les questions dont le libellé n'offre pas des chances égales aux diverses réponses possibles ...:. ou les "questions à postulat" - c'est-à-dire les questions qui présupposent l'existence d'un certain état chez l'individu interrogé.

Voici un exemple typique de question impérative :

"Ne pensez-vous pas que vos maux de tête sont si intenses qu'ils affectent votre travail ?"

Le libellé est tel, qu'un sujet hésitant donnera plus facilement une réponse positive qu'une réponse négative. La question suggère en fait que la réponse la plus naturelle est que les maux de tête sont si violents qu'ils affectent le travail de l'intéressé.

Voici maintenant un exemple typique de question à postulat :

"Souffrez-vous régulièrement de maux de tête plus souvent dans la moitié hivernale que Q.ans la moitié estivale de l'année ?"

Ici, il est tacitement supposé que le sujet souffre régulièrement de maux de tête; en conséquence, un certain nombre de sujets pour lesquels la question serait sans objet sont incités à répondre, ce qui diminue d'autant la validité des résultats.

Ce troisième type de déformation est le plus difficile à éviter. Les principaux remèdes consistent à soumettre divers questionnaires possibles à un essai préalable et à aménager les questionnaires de manière que les questions soient

accompagnées d'un certain nombre de réponses possibles parmi lesqu01les le sujet est invité à choisir.

(6)

AP/6

Page 6

Les exigences énoncées dans un rapport sur les méthodes de mesure à employer dans les études de symptômes objectifs devraient, bien entendu, être·aussi strictes que

celles qui sont prescrites pour les rapports analogues dans d'autres travaux scienti- fiques, tels que des expériences de laboratoire. Cela. sig;nifie qu '_il faut reproduire tout le questionnaire, sauf évidemment stil est d'un type standard courant. Il faut en outre préciser les conditions de mesure, en particulier la compétence des enquêteurs, les ca- ractéristiques de la situation d'enquête, etc. Pour être complète, la description des méthodes doit également comprendre un rapport sur les tests qui ont été pratiqués pour repérer les erreurs et sur les résultats de ces tests. Ce n'est que lorsqu'un ra9port

compl~t du genre esquissé ci-dessus sur la méthode de mesure aura été soumis que ceux qui étudient les rapports des enquêtes sur les symptômes subjectifs pourront se former une opinion bien fondée quant à la validité des résultats.

Pour obtenir des comptes rendus objectifs de symptômes subjectifs, il y a donc intérêt à prendre les précautions suivantes au cours des enquêtes :

1. Donner ~ entratnement spécial aux enquêteurs préalablement à chaque enquête pour éviter l'influence d'idées préconçues;

2. Distribuer au hasard les sujets entre les enquêteurs pour remédier aux défor- mations dues aux enquêteurs;

3.

Dissimuler dans toute la mesure possible l'objet réel de l'enquête pour favo- riser une attitude neutre chez les sujets interrogés;

4.

Camoufler les intentions particulières qui inspirent la question pour éviter des libellés qui accouplent stimulus et réponse;

5. Employer des questionnaires soigneusement étudiés qui appellent un nombre bien déterminé de réponses possibles, de manière à obtenir des données comparables;

6.

Soumettre divers questionnaires possibles à des tests préalables pour éviter les questions orientées, à postulat ou vagues;

7.

Prévoir des rapports sur la technique d'interview employée pour permettre une évaluation süre des résultats.

(7)

AP/6 Page

7

Nous venons d ¹examiner un certain nombre de facteurs qui affectent la validité des mesures de réponses individuelles et nous avons présenté par la même occasion un certain nombre de propositions visant à rendre objectives les méthodes de mesure. Admettons que nous avons réussi à surmonter ^C3S problèmes et que nos résultats rendent fidèlement compte des réponses des sujets interrogés. Reste la question de l'évaluation des résultats et c'est ici que la méthodologie statistique entre en jeu.

Comme chacun sait, la méthode statistique est une méthode inductive qui permet, en prenant des échantillons au hasard, d'aboutir à certaines conclusions quant à la population tout entière. Mais encore faut-il, et c'est là une condition absolue, que les

échantillons soient choisis complètement au hasard et dans la population adéquate. Il n'est pas inutile de bien le souligner, puisqu'il arrive que l'on emploie des méthodes statistiques dans des sondages non probabilistes, par exemple dans les sondages par quotas dans l'échantillonnage pratiqué par des experts. Mais, même dans les cas où les échantillons ont été tirés au sort, il faut s'assurer que la population au sein de laquelle ils ont été prélevés est réellement la même que la population à étudier, c'est-à-aire la "population visée". Par exemple, les salariés peuvent constituer, dans certaines professions, une sé- lection biaisée en ce qui concerne leur sensibilité au stimulus. Ainsi, si 25

%

d'une

population normale sont nettement plus sensibles au trichloréthylène que les

75 %

restants, ils abandonneront tout naturelle~nt un type de travail qui les met en contact avec ce composé,_avec ce résultat que les personnes continuant de travailler dans ce domaine ces- seront d~être représentatives de la population normale, d'où danger de sous-estimation du risque d'exposition et de fixation de la CMA à une valeur trop élevée. De tels processus naturels de sélection se produisent vraisemblablement dans de nombreuses professions ct pourraient fort bien intervenir aussi parmi les personnes exposées aux polluants de l'air~

L'évaluation de la fréquence de domrr.ages au sein d'un groupe de personnes exposées exige presque toujours une comparaison avec un groupe de sujets n'ayant pas été exposés.

(8)

/AP/6

Page 3

C'est particulièrement important dans le cas des symptômes subjectifs~ pour lesquels font souvent défaut des "valeurs normales Il du type correspondant, par exemple dans les réac- tions sanglJiries. Il faut bien entendu quo le groupe normal satisfasse aux m~mes conditions touchant l'échantillonnage au hasard et la détermination de la population.Il convient ici de prendre particulièrement soin d'éviter de transformer un matériel normal en un matériel excessivement bien portant par urie sélection exagérée qui éliminerait les individus atteints de certains troubles. De plus~ il faut tacher de réaliser la meilleure concordance possible pour ce qui est de la fréquence des variables liées aux arrière-plans démographique et sociologique.

· Nous supposerons dans ce qui va suivre que nous disposons de deux échantillons au hasard qui~ sans erreur systématique~ représentent une population exposée et une population non exposée et qu'il y a une différence dans la direction attendue entre les moyennes des deux échantillons. Comme il s'agit âe moyennes d'échantillons~ nous savons

que chaque moyenne comporte une certaine marge d'erreur et que la diff~1~ce contient aussi une marge d'erreur. Ces renseignements ne suffisent certainement pas pour déterminer nettement si la différence entre les moyennes des échantillons reflète une différence réelle entre les moyennes des populations elles-m~mes. Nous pourrons cependant~ à l'aide de méthodes statistiques, produire un énoncé ayant certaines chances d'~tre correct. Le niveau de probabilité~ ou niveau de signification~ peut ~~re spécifié d'avance ét doit naturellement être ajusté en fonction des conséquences que pourrait avoir une formulation erronée. Il convienùra de noter que, lorsqu'en procède ainsi, deux formulations seulement sont possibles, à savoir soit qu'une différence existe entre les moyennes des

populations~ soit qu'une différence n'existe pas. Quelle que soit la formulation que nous

choisissons~ il y a, à la suite de l'analyse statistique~ une chance pour qu'elle soit juste ou pour qu'elle soit fausse. La figure 3 illustre cette situation.

(9)

Figure 3

AP/6

Page

9

Relation entre erreëLr du type a et du type ~

Une différence réelle Formulation basée sur la moyenne entre les populations

des échantillons au hasard _'

~ • J.

.t:!,XJ.S t-e ₁ N'existe pas

Il y a une différence entre les Formulation ¹ Formulation

moyennes des populations juste 1 erronée, type a

Il n'y a pas de différence entre les Formulation Formulation

moyennes des populations erronnée, type _~ juste

!

Dans la plupart des recherches, il faut prendre des mesures sérieuses pour s'assurer que des erreurs du type a ne sont pas intervenues, c'est-à-dire pour s'assurer qu'on n'affirmera pas l'intervention d'un "effet" de différence alors qu'en réali-

té il n'existe pas de différence de ce genre. Cela signifie qu'on ne considérera qu'une différence est statistiquement significative que si elle est considérable.

Dans les problèmes relatifs à la CMA, toutefois, la situation est souvent renversée. Il peut en découler des conséquences sérieuses pour l'individu si, dans l'évaluation d'une différence entre sujets exposés et sujets non exposés, une erreur du type ~est commise, c'est-à-dire si l'on affirme que la fréquence d'un dommage n'est pas supérieure à la moyenne alors qu'elle l'est en réalité. Il semble que ce type

d'erreur est rarement pris en considération dans les enquêtes de ce type. Le plus souvent, on se contente de déterminer s'il existe ou non une différence quelconque entre les deux matériels; si l'on ne peut établir aucune différence significative, on pense souvent que cela suffit- du moins par déduction- pour conclure à l'absence réelle de différence.

(10)

AP/6 Page 10

Prenons lli1 cas hypothétique simple pour illustrer ce qui précède. Nous supposerons que dans une enquête sur la concentration d'une certaine substance dans le sang, on a établi que la concentration moye11ne pour un important matériel normal est cie 40 mg %avec un écart type individuel de 5 mg

%.

Nous avons d'autre part étu- dié un échantillon au hasard de, disons, 25 travailleurs exposés et avons trouvé ains1 une certaine concentration moyenne. La question qui se pose est celle de savoir si cette moyenne diffère ou non cle celle du matériel normal. Pour le déterminer, nous calculerons la distribution normale des moyennes des échantillons à partir d'échantil- lons au hasard de cette dimension. Cette distribution d'échantillonnages donne une moyenne de 40 avec une marge de

5/\/25 =

l (figure 4).

Dans cette distribution, nous marquerons la valeur critique, qui détermine s'il faut ou non considérer la moyenne correspondant à l'é~hantillon au hasard comme différant de celle de la population normale. Au niveau de siGnification de 5

%,

^cette

limite se si tue vers

41,6

mg

%.

Si la moyenn.e pour l'échantillon au hasard dépassait

41,6

mg

%,

c'est-à-dire si elle devait se situer à droite de la valeur critique, nous pourrions alors en conclure que la population de travailleurs exposés a une moyenne plus forte que la population normale, c'est-à-dire que l'exposition exerce réellement un effet sur la concentration en question. Cette conclusion implique une erreur possible de 5

%.

Si, en revanche, la moyenne pour l'échantillon au hasard devait se situer à gauche de la valeur critique, par exemple être égale à

41

mg

%,

ce serait une autre conclusion qui s'imposerait et qui, correctement formulée, consisterait à dire qu'au- cun effet de l'exposition n'a été démontré. Il faut cependant souligner que cette dernière conclusion n'exclut pas toute possibilité d' intcorvenUoü d'un effet 1~1ais sim- plement que l'enquête en cause n'a pas fourni de preuve d'intervention d'un effet. Il est cependant possible de rendre plus précise cette formulation négative. Il y a probablement une certaine limite à la dimension de l'effet. On peut se reporter par exemple à la figure

5.

Il est extrêmement improbable que les 25 sujets exposés appartiennent à des populations accusant des moyennes de

48, 47

et

46

^mg

%,

puisque toutes ces populations avoisinaient le niveau zéro dès

43-44

m~;

%.

Mais une moyenne de population de

42

:ng

%,

(11)

37 38 39

40 41

acceptance acceptation

FIG. 4

40 acceptance acceptation

41 FIG. 5

Significance level 5%

Niveau de signification 5%

42

1

43 rejection rejet

44 Probability of rejecting a true hypothesis

Probabilité de rejet d'une hypothèse vraie

Significance level 5%

Niveau de signification 5%

oc/

42 rejection rejet

45

mg%

46 47 48

WHO 3¹H7

(12)

FIG. 6

Probability of accepting a taise hypothesis Probabilité d'acceptation d'une hypothèse fausse

acceptance acceptation

~

-error in percent Erreur ~ en pourcentage

Niveau de si- gnification 5%

FIG. 7

10:

rejection

rejet

(13)

IJ..P/6 Page ll

par exemple, ne devrai t-elle pas être; compatible :.1vec la valeur observée à 1~1 mg r;~ ou avec un nombre de ';alcur inférieure au niveau critique de 41~6 mg

%

? Jetons un coup d'oeil sm~ les deux distributions d'échantillonnage de la f'igure G.

Il apparaît aussit6t qu'une moyenne de population de 42 mg

%

peut donner une série de moyennes d' échan.tillons au hasard à c;auche de la zone cri tique pour la population normale. La théorie statistique nous apprend qu'en fait non moins de

36

% de toutes les moyennes d'échantillons au hasard d'une population accusant une moyenne de 42 tomberont à gauche de la valeur critique de 4l,G mg% ct conduiront ainsi à l'acceptation d'une hypothèse suivant laquelle l'échantillon appartient à la population normale.

Arr~tons-nous un instant sur les conséquences de cette hypothèse. Nous supposerons qu'il n'est médicalement pas indifférent que la concentration dans le sang des sujets exposés augmente d'une moyenne de 2 mg%~ c'est-à-dire que la moyenne vraie pour le groupe exposé monte à 42 mg %. En pareil cas~ un risque de

36 %

d'une erreur de type

1

serait de toute manière trop grande.

On voit donc qu'il est très important de préciser l'erreur possible dans les cas où aucune différence ne peut être mise en évidence. Le résultat indiqué ci-dessus est manifestement non satisfaisant. La seule manière d'atteindre à une plus grande certitude est d'accroître le nombre des observations dans le groupe exposé. Il est possible de calculer mathématiquement le nombre d'observations nécessaires pour obtenir des proportions raisonnables de l'erreur de type ~ • La figure 7 montre comment ~ décroît à mesure que le nombre d'observations augmente. Ce diagramme a été établi en liaison directe avec le présent exemple.

Nous voyons qu'il y a une erreur ~d'environ 10 % pour un échantillon au hasard d'environ 50 sujets et que cette proportion tombe à environ 5% si l'on augmente l'échantillon jusqu'à lui faire embrasser environ 75 sujets. Si l'enquête avait été limitée à 15 sujets ou moins~ l'erreur ~aurait été supérieure à 50%~ ce qui veut dire qu'une différence de 2 mg

%

serait presque certainement passée inaperçue.

(14)

AP/6 Page 12

De ce qui précède, il résulte clairement ~ue dans la planification d'une enquête épidémiologique sur les effets d'un certain stimulus il faut d'abord établir l'ordre de grandeur à.partir duquel la réponse attendue est méclicalement significa- tive, puis, en déterminant le nombre d'observations nécessaires, s'assurer - avec une marge déterminée d'erreur probable - que ces effets seront rep0rés. Comme ces enquêtes portent sur des valeurs marginales - et non sur les effets de surconcentra- tions évidentes - les effets de concentration qui interviennent sont toujours très faibles. I l n'est guère difficile d'aboutir à des conclusions dans les cas où l'on a pu établir des différences clairement sit:;nificatives et médicalement probantes entre groupes exposés et groupes non exposés, mais d'un autre c6té les doses, en pareil cas, dépassent manifestement la

cr1A

qu'il s'a[~it de déterminer. A notre sens, il e;;;t peu de domaines où il soit aussi importar.t de calculer l'erreur ~ que dans l'estimation des CMA.