R EVUE DE STATISTIQUE APPLIQUÉE
P HILIPPE L AZAR
Les essais biologiques
Revue de statistique appliquée, tome 16, n
o3 (1968), p. 5-35
<
http://www.numdam.org/item?id=RSA_1968__16_3_5_0>
© Société française de statistique, 1968, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (
http://www.sfds.asso.fr/publicat/rsa.htm
) implique l’accord avec les conditions générales d’uti- lisation (
http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
5
LES ESSAIS BIOLOGIQUES
par Philippe LAZAR (1)
Professeur
àl’Institut de Statistique de l’Université de
ParisCet article est un
exposé introductif à l’étude
desmé-
thodes
statistiques utilisées
pourorganiser
e tanalyser
unessai
biologique. Il
ne const i tue doncqu’un
survolaeéréral
dela
question ;
pou r deplus amples détails
on sereportera à
labibliographie.
Il estdivisé
enquatre grandes parties : un exposé des principes, l’étude
destechniques statistiques dis- ponibles,
leurapplication
auproblème
central des essais -c’ est-à-di re à
ladé termination de l a puissance
rel ati ve de deuxsubstances et
de saprécision -
et des remarquessur l’ oraeani-
sat i on de
l’expérience.
On s’estefforcé
de donne runeprésen-
tat i on
unifiée
desproblèmes,
que laréponse
dessujets
so i t quan- ti tati ve ou entout-ou-rien, a fin
de ne pasmasquer
lescarac-téristiques fondamentales
des essaisbiologiques derrière des
différences
detechnique statistique
au demeurantléaeères,
etpour
éviter
defastidieuses répétitions.
Le titre et le
langage adopté n’ interdisent évidemment
pas lesextrapolations
desméthodes à
d’autres domaines que celui de labiologie.
lère PARTIE : DEFINITION ET PRINCIPES GENERAUX DES ESSAIS
BIOLOGIQUES
1 - LE PROBLEME POSE
Un "essai
biologique quantitatif"
est uneexpérience
destinée àchiffrer l’efficacité
d’une substance - ouplus généralement
d’un stimulusQuelconque -
au moyen d’une réaction biologique ; on peut donc le définir comme un "dosage
szz moyen d’une réaction
bilogique ;
on peut doncle définir comme
M/2"dosage bioloétque.11
On sait que du fait de la variabilité fondamentale des êtres vivants il ne
peut
êtrequestion
de caractériser l’activitébiologique
d’une subs- tance defaçon absolue, grâce
à ses seulsparamètres physicochimiques,
et que, même
lorsqu’on spécifie
defaçon
aussiprécise
quepossible
lesconditions
d’emploi
et le matérielutilisés,
l’activité reste variable d’un moment ou d’un lieu à l’autre.Cette
difficulté, qui
résulte de la diversité des circonstancesexpé-
rimentales et des
réponses
dessujets,
sedouble
souvent d’une difficultécomplémentaire
du fait de lacomplexité
des substances étudiées. Lors-Revue de Statistique Appliquée, 1968 - vol. XVI - N’ 3
6
qu’on
veut évaluer lepouvoir carcinogène
sur la peau de souris d’une substancechimique
très bien définie etcristallisable,
comme le3,
4Benzopyrène, l’imprécision
de l’évaluation nedépend
que de la varia- bilité du matérielbiologique :
lestimulus, lui,
estparfaitement
connuet
reproductible.
Par contre si l’on s’intéresse aupouvoir carcinogène
d’un condensat de fumée de
cigarette,
cette substance estbeaucoup trop complexe
pourqu’on puisse l’analyser complètement
par voiephysico- chimique :
dans ce cas le stimulus n’est lui-même défini que par lesprocédés qui
l’ontcréé ; l’expérimentation biologique peut
néanmoins per- mettre de lui associer une mesure, en court-circuitantl’étape chimique .
De toute
façon,
que les substances étudiées soient decomposition parfaitement
définie ou au contrairepartiellement
ou totalementinconnue ,
il ne
peut guère
êtrequestion,
du fait de l’inévitable variabilité des ré- ponses, que de comparer des activités. On donnequelquefois
des esti-mations absolues : ce sont, la
plupart
dutemps,
desimples
ordres degrandeur.
Dèsqu’on
veut arriver à uneprécision
nonillusoire,
il fautparler
en termesrelatifs ;
on est enparticulier
souvent amené à évaluer l’activité d’une substance inconnue parrapport
à celle d’une substance de référence ou standard.S’il est
possible
d’utiliser chacune des substances confrontées à des dosesdifférentes,
unefaçon
satisfaisante de les comparer consiste à établir une relationd’équivalence
entre certainesquantités
de l’une etde l’autre. C’est
particulièrement simple lorsque
l’une des substances est(ou
secomporte comme)
une dilution de l’autre : il suffit en effet alors de déterminer la valeur du facteur de dilutionpermettant
de rendre les substancesparfaitement équivalentes
pour résoudrecomplètement
leproblème
de leurcomparaison.
Bien entendu les mots
"substance", "dose", "dilution"
ne doiventintroduire aucune restriction
quant
à la nature du stimulus étudié : ilpeut s’agir
den’importe quel
facteursusceptible
d’être utilisé defaçon quantitative (hormone, vaccin, vitamine, carcinogène, radiation, etc...).
Cette remarque étant
faite,
nous utiliserons les termessubstance"
et
"dose"
afin de ne pas alourdir lelangage.
Nousappellerons
S et Ples deux substances
comparées (c’est-à-dire respectivement,
s’il y a lieu de lesparticulariser,
S la substance de référence et P leproduit inconnu).
L’effet du traitement sur unsujet (ou
unitéexpérimentale)
seraappelé réponse
de cesujet.
2 - ESSAIS
ANALYTIQUES
ET ESSAIS COMPARATIFSDès lors
qu’il s’agit
d’établir une relationd’équivalence
entre les activités de deux substances utilisées à des doses relativesconvenables,
on
peut distinguer
deuxgrands types
de cas : ceux où les substances confrontées sont effectivementidentiques
dans leurpartie
active -c’est- à-dire où elles ne diffèrent que par leur teneur en cettepartie
activeau sein d’un
"excipient"
inerte - et ceux où les substances ne sont quecomparables
dans leur effet - sansqu’il
existe nécessairement une iden- tité decomposition
fondamentale. Les essaiscorrespondants
ont respec- tivement reçu les noms d’essaisanalytiques
et d’essaiscomparatifs.
Un essai
analytique
est un véritabledosage :
il doitpermettre
detrouver le facteur de
dilution, k, qui
existe entre les deux substancescomparées.
L’un des deuxproduits
doit alors secomporter
exactementcomme une dilution de
l’autre,
enparticulier quelle
que soit la dose àRevue de Statistique Appliquée, 1968 - vol. XVI - N* 3
7
laquelle
on les utilise etquelles
que soient les conditionsexpérimentales ,
voire même
quel
que soit letype
desujets utilisé ;
si l’on a des doutessur l’identé réelle des
parties actives,
on pourra faire varier les cir- constancesexpérimentales
afin de réunir un faisceaud’arguments
per- mettantd’accepter
ou derejeter
cettehypothèse (exemples :
fabrication d’unehormone,
d’unvaccin, etc...).
Onappelle puissance relative,
p ,l’inverse du facteur de dilution
(p
=1/k)
etl’on utilise
indifféremment l’une ou l’autre de cesgrandeurs
pour caractériser lerapport
entre les deux substances étudiées.Un essai
comparatif
est moins ambitieux : il vise seulement à éta- blir unparallélisme
entre l’action de deuxsubstances,
en étudiant si l’une d’elles secomporte
comme une dilution de l’autre dans certaines conditionsexpérimentales.
Il estpossible
que cette similitude d’effet doive être limitée à certaines zones dedoses,
etqu’elle
ne soitqualita-
tivement ou
quantitativement
pas la mêmelorsque
l’onchange
les con-ditions ou les
sujets
del’expérience.
Onpeut
donc engénéral
être moinssévère sur la vérification de l’assimilation de l’effet de l’une des subs- tances à celui d’une dilution de l’autre : il ne faut pas oublier
qu’il
nes’agit
de toutefaçon
dans ce cas que d’uneapproximation (exemples : comparaison
de l’activité de deuxantibiotiques
différents sur diverses affectionsexpérimentales, comparaison
dupouvoir carcinogène
de con-densats de fumée de divers
types
decigarettes, etc... ).
Onparle
volon-tiers alors de
puissance
relativeplutôt
que de facteur de dilution.3 - PRINCIPE DE LA SOLUTION
a)
M étho de directeOn
pourrait
d’abord songer à rechercher une solution directe duproblème :
ils’agirait
de trouverquelles
sont les doses(moyennes)
dechacune des substances
qui produisent
le même effet. Maisquel
effetdoit-on choisir ? La
réponse
n’est claire que si la substancepeut agir
ou ne pas
agir
sur unsujet
selon la doseemployée,
en d’autres termessi le résultat est
qualitatif
à deuxclasses,
dutype
succès ou échec(on
dit encore : en
tout-ou-rien).
La dose moyenne caractérisantchaque
subs-tance est alors la moyenne des doses
juste
nécessaires pour obtenir le succès sur chacun dessujets
soumis àl’expérience. Mais, lorsque
laréponse
estquantitative,
l’intensité de l’effet varierégulièrement
pourun
sujet
donné avec la dose utilisée. Aquelle
intensité d’effet convient-il de s’arrêter ? Les résultats obtenus pour une intensité donnée seraient- ils encore valables à un autre niveau ?
En
plus
de ces difficultés dedéfinition,
les essais directsposent
desproblèmes techniques
souvent insurmontables. Il faut en effet que laréponse
soit nette et que la méthode d’administration duproduit permette
de déterminer exactement la dosequi
la provoque. Enparticulier
il nefaut pas
qu’il
y ait de retard entre l’administration et laréponse,
ni d’effet de la durée del’expérience
si on administreprogressivement
desdoses croissantes du
produit,
ni d’accoutumance(positive
ounégative)
si on recommence
plusieurs
foisl’opération
sur un mêmesujet
à la re-cherche de son seuil de sensibilité. Ces
exigences
rendent très souvent les essais de cetype impraticables.
Revue de Statistique Appliquée, 1968 - vol. XVI - N* 3
8
b)
Méthode indirecteLa solution
qui
est engénéral adoptée
pour effectuer un essai est une solutionindirecte,
en ce sensqu’on
yemploie
des doses choisies parl’expérimentateur
etqu’on
déduit des résultats observésquelles
auraient été les doses
équivalentes
de l’une et l’autresubstances.
Les variations de l’effet moyen en fonction de la dose
(cet
effetmoyen étant caractérisé par la moyenne des résultats
lorsque
laréponse
est
quantitative
ou par lepourcentage
de succèslorsqu’elle
est en tout-ou-rien)
sont décrites par la courbe derégression
de y en x. Onpeut
se ramener au cas où cette
régression
est linéaire soit en limitant lazone de doses
utilisées,
soit enprocédant
à deschangements
de variable convenables sur x ou sur y. En cequi
concerne lesdoses,
on utilise defaçon
usuelle soit la doseelle-même, soit, plus fréquemment,
sonlogarithme.
Nous reviendronsplus
loin sur leschangements
de variable concernant lesréponses.
Etudions d’abord le cas où la
régression
est linéairelorsqu’on prend
commeparamètre-dose
la dose elle-même.L’équation
de la droiteest :
pour le
produit
S. La courbe derégression
d’unproduit
S’ obtenu à par- tir de S par dilution d’un facteur k est alors évidemmentégalement
une droite,d’équation
puisqu’il
faut une dose k foisplus grande
de S’ pour obtenir le même effetqu’avec
une dose donnée de S(fig. 1).
Inversement,
pour savoir si unproduit
Ppeut
être assimilé à unedilution
(ou
uneconcentration)
duproduit S,
il suffitd’essayer d’ajuster
aux données
expérimentales
unsystème
de deux droites concourant pourx = 0 ; si c’est
possible,
lerapport
despentes
des deux droites fournitune évaluation du facteur de dilution.
Etudions maintenant le cas où la
régression
est linéairelorsqu’on prend
commeparamètre
lelogarithme
de la dose.L’équation
de la droite est alors :Revue de Statistique Appliquée, 1968 - vol. XVI - Ne 3
9
pour le
produit
S. Pour leproduit S’,
dilution de S par un facteurk,
on voit par un raisonnementanalogue
auprécédent
que la courbe derégres-
sion est encore une
droite, parallèle
à laprécédente
et décalée horizon- talement delog
k(fig. 2), d’équation
Fig. 2
Inversement,
pour savoir si unproduit
Ppeut
être assimilé à unedilution de
S,
il suffitd’essayer d’ajuster
aux donnéesexpérimentales
unsystème
de deux droitesparallèles :
si c’estpossible,
la distance hori- zontale des deux droites est une estimation dulogarithme
du facteur de dilution.2ème PARTIE : ETUDE DETAILLEE DE LA RELATION DOSE-EFFET POUR UNE SUBSTANCE
1 - ELEMENTS DE METHODOLOGIE
La méthode d’estimation de base est celle du maximum de vrai- semblance. Toutefois
lorsque
les effectifs utilisés sont suffisammentgrands
pour
qu’on puisse
admettre laquasi-normalité
des fluctuations dechaque réponse
moyenne autour de sa valeurthéorique,
on sait que les résul- tats ainsi obtenus sontidentiques
à ceux que fournit la méthode des moindres carrésappliquée
à cesréponses
moyennes affectées depoids égaux
aux inverses de leurs variances.Appelant
x leparamètre
doseutilisé,
Y laréponse
moyenne(nous
reviendrons ci-dessous sur la défi- nition de ceterme)
et W l’inverse de la variance deY,
ils’agit
alorsde minimiser
l’expression :
ce
qui
conduit àl’équation
de la droite derégression
Revue de Statistique Appliquée, 1968 - vol. XVI - Ne 3
10
La droite de
régression
passe donc par le centre degravité
de ladistribution des
réponses
moyennes, et a lapente "pondérée"
b.Il convient d’insister sur le fait que les formules
(6)
à(10) s’ap- pliquent
aussi bien au cas où laréponse
individuelle estquantitative (Y
est alors la moyenne des
réponses
àchaque dose) qu’au
cas où la ré- ponse individuelle estqualitative (Y
est alors lepourcentage
desuccès,
ou une valeur obtenue à
partir
de cepourcentage
parchangement
de va-riable). Quand
àl’expression (5),
on montre facilementqu’elle prend,
une fois
minimisée,
la valeurOn se
servira, ultérieurement,
de cetteexpression
pour tester la validité du modèle linéaire.2 - CHANGEMENTS DE VARIABLE SUR LES REPONSES
a)
Cas où laréponse
estquantitative
L’emploi
dulogarithme
de la dose commeparamètre-dose permet
defaçon
trèsgénérale
d’obtenir desrégressions
linéaires.Cependant
ilest
quelquefois
utile depratiquer également
unchangement
de variablesur les
réponses.
Cette deuxième transformationpeut
contribuer à linéari-ser la
régression,
mais aussiégaliser
les variance liées. Lepoids
Waffecté à
chaque
valeur Y est alorssimplement n/02,
où02
est la valeurcommune de la variance liée et n l’effectif utilisé à cette dose. Les transformations les
plus
couramment utilisées sont la transformationlogarithme (si
laréponse
croitexponentiellement
avec leparamètre-dose utilisé)
ou la transformation racine carrée(si
laréponse
est Poisson-nienne).
b)
Cas où laréponse
est en tout-ou-rienOn utilise rarement le
pourcentage
de succès p observé àchaque
dose comme
réponse
moyenne : en effet sa variation nepeut
engénéral
être considérée comme linéaire que dans une zone assez étroite de
doses ;
onpréfère procéder
à unchangement
devariable,
et utilisersoit l’arcsinus de
g
soit leprobit
de p, soit sonlogit.
Revue de Statistique Appliquée, 1968 - vol. XVI - N’ 3
11
L’utilisation de la transformation
angulaire (Y =
arcsinVP) permet
en
général
de traiter lesproblèmes où
lepourcentage théorique
P desuccès varie dans une zone
comprise
entre environ 10%
et 90%,
et oùl’effectif utilisé à
chaque
dose est de l’ordre d’unequinzaine
desujets
au moins
(table 1).
On sait que la variance de Y vaut1/4n (lorsque
Yest
exprimé
enradians),
c’est-à-direqu’elle
nedépend
pas du pourcen-tage
P. Lepoids
W est alorssimplement égal
à 4 n.Table 1.
Valeur de Arc Sin
VP (en radians)
en fonction en PP = 1, arcsin
VP’ =
1, 571La transformation
probit
repose,elle,
sur une basebiologique .
On suppose
qu’il
existe pour chacun dessujets,
dans les conditions del’expérience,
un seuil deréactivité,
c’est-à-dire pour lesujet j
unevaleur
x.
i de la dosejuste
suffisante pour provoquer chez lui le succès de la réaction. Si la dose administrée est inférieure à ce seuil on observeun
échec,
si elle estsupérieure
on observe un succès : la courbe dose- effet s’identifie avec la courbe cumulative des seuils. Si la distribution des seuils est normale onpeut
doncreprésenter
la courbe dose-effet par la droite deHenry, d’équation
où Il
et 0 sontrespectivement
la moyenne etl’écart-type
de la distribu-tion des
seuils,
et où Y est le"probit"
dupourcentage
de succès cor-respondant
à la dose x(table 2).
La variance de Y varie avec la valeur dupourcentage théorique
de succèsP,
et lepoids
W est donné par W =nw où w = f
(P).
La transformation
probit
repose, on vient de levoir,
sur l’exis-tence d’un seuil pour
chaque sujet
soumis àl’expérience -
c’est-à-dire d’un facteur individuel trèsmarqué.
Or il est des cas où cettehypo-
thèse est
biologiquement
peu vraisemblable : dans certainsproblèmes
d’irradiation par
exemple,
onpeut
penser que si l’effet varie avec la dose ce n’est pas tant parce que certains individus sontplus
sensiblesque d’autres que parce que le nombre de
"cibles"
atteintes croit avec leRevue de Statistique Appliquée, 1968 - vol. XVI - N* 3
12
nombre de coups, et que par le seul fait du hasard certains individus sont
plus
touchés que d’autres. Onpourrait
trouver desexemples
ana-logues s’agissant
d’atteintes virales.Table 2
Table des
probits (Y
ouY’)
et des valeurs deRevue de Statistique Appliquée, 1968 - vol. XVI - N’ 3
13 Table 2
(suite)
Revue de Statistique Appliquée, 1968 - vol. XVI - N’ 3
14 Table 2
(suite)
Revue de Statistique Appliquée, 1968 - vol. XVI - N’ 3
15 Table 2
(suite)
Revue de Statistique Appliquée, 1968 - vol. XVI - N* 3
16 Table 2
(suite)
11 reste bien sûr
possible
d’affecter des seuils artificiels aux di-vers
sujets
del’expérience,
mais il estplus
satisfaisant apriori d’adop-
ter un modèle
correspondant plus
concrètement à la réalité. Onpeut
montrer que ce modèle est fourni par la courbe
logistique, qui
fixe larelation entre le
pourcentage théorique
P de succès et la dose x selonl’expression
On vérifie aisément que la courbe
représentative
de cette relationà une allure
sigmo’ide.
De(14)
on déduit immédiatement queLes variations de
Log P/Q (qu’on appelle
lelogit
deP)
en fonctionde x sont donc linéaires. On
conçoit qu’on puisse
àpartir
de là donneraux
logits
undéveloppement analogue
à celui desprobits. Cependant l’expérience
montre que dans lamajorité
des cas les deux méthodes fournissent des résultatsnumériques
très voisins. Aussi nedéveloppe-
rons nous ici que la méthode des
probits.
3 - EXECUTION DES CALCULS
Les calculs ne
présentent
aucune difficultélorsque
lespoids
sontconnus ou
peuvent
être éliminés des formules(6)
à(10).
C’est en par- ticulier le caslorsque
laréponse
estquantitative
etqu’on peut
fairel’hypothèse
d’homocédasticité : toutes les formulespeuvent
êtresimpli-
fiées par la valeur commune de
03C32.
De mêmelorsqu’on peut appliquer
Revue de Statistique Appliquée, 1968 - vol. XVI - Ne 3
17
la transformation
angulaire,
toutes les formulespeuvent
êtresimplifiées
par 4
puisque
W = 4 n. Onpeut
encoresimplifier
les formules par nlorsque
l’effectif utilisé n est le même àchaque
dose.Il n’en est pas de même par contre
lorsque
lespoids
sont inconnuset ne
peuvent
être évalués que parapproximations
successives. Tel est le caslorsqu’on emploie
la transformationprobit.
Force est alors derecourir à une méthode itérative. Le
principe
en est le suivant : on trace unepremière estimation,
à vue, de la droite,passant
d’autantplus près
d’unpoint
que sonpoids
estplus grand (on
constatera que lespoids
élémentaires w décroissent très vite en dehors de la zone desprobits
de4 à
6).
Onprocède
ensuite aux calculs selon les formules(6)
à(10),
en
utilisant,comme
estimations des valeursthéoriques permettant
d’entrer dans la table pour y trouver lespoids, les
valeurs Y’ lues sur la pre- mière droite tracée(probits "attendus").
On définit ainsi une deuxièmedroite,
et onpeut
recommencer lecycle
desopérations jusqu’à
ce que les résultats obtenus soient stabilisés.La méthode ainsi décrite repose, ainsi
qu’on
l’a vu, sur leprin- cipe
des moindres carrés et sonemploi
n’est doncjustifié
que dans lamesure où les effectifs utilisés à
chaque
dose sont suffisammentgrands .
On
peut
montrer quel’emploi
de la méthode du maximum de vraisem-blance, qui permet
de s’affranchir de ces contraintesd’effectifs,
necomplique guère
la résolution duproblème :
il suffit deremplacer,
dansles
calculs,
lesprobits
observés Y par desprobits "de travail"
définis àchaque
itération par la relationoù p est le
pourcentage observé,
A = Y’ -P/Z
et B =1/Z, Y’,
P et Zétant
respectivement
leprobit attendu,
lepourcentage correspondant
et l’ordonnée de la courbe normale réduite
correspondant
au pourcen-tage
cumulé P. Les valeurs A et B sont fournies par la table 2. Le schéma ci-dessous résume le processus de calculEn
pratique
il est souvent suffisant deprocéder
à un seulcalcul,
surtout si les
points
sont assez bienalignés
sur legraphique - quelque-
fois à
deux, exceptionnellement
àplus
de deux.Lorsqu’on
utilise un ordi-nateur on n’est bien entendu pas limité dans le nombre des
itérations,
et on
peut
définir desrègles
d’arrêt moinséconomiques
maispermettant
d’atteindre uneprécision supérieure.
4 - DESCRIPTION DES RESULTATS
Sous réserve de vérification de la
légitimité
dumodèle, l’équation
de la droite de
régression
Revue de Statistique Appliquée, 1968 - vol. XVI - N’ 3
18
définie par les calculs
précédents
décrit defaçon
exhaustive la varia- tion de l’effet moyen en fonction de la dose - mais elle n’est pas très évocatrice. Aussi est-on amené à essayerd’exprimer
defaçon plus frap- pante
les résultats. On calculefréquemment
dans ce but la valeur de la doseproduisant
un effetdonné.
Ainsi la doseproduisant
l’effetYD
est,en
posant
x(Y ) = x
Ce mode de
description
est notamment trèsemployé lorsque
laréponse
est en tout-ou-rien. On définit alors la dose efficace D%
commeétant la dose
produisant
D%
de succès.La
plus
courante des doses efficaces est la dose efficace 50%
ouencore DE 50
(ou
encore dose-létale 50%,
DL50,
dans lesproblèmes
de
toxicité).
Enparticulier lorsqu’on
a utilisé la transformationprobit,
on a
Il faut naturellement un deuxième
paramètre
pour définircomplète-
ment la droite. On
peut
utiliser sapente,
ou encore une doseproduisant
un autre effet que
YD.
Dans le cas desréponses
entout-ou-rien,
onpeut
par
exemple
utiliser une autredose-efficace,
comme la DE 90%.
La variance de la
réponse
moyennecorrespondant
à une dose x est,d’après (17)
et celle de la dose
xp
donnant uneréponse
donnée Y(approximativement puisqu’il s’agit
de la variance d’unrapport),
On montre en effet aisément que
et
Les intervalles de confiance sont établis en utilisant soit la dis- tribution normale réduite
(dans
le cas d’uneréponse
entout-ou-rien),
soit la distribution de Student à v
degrés
deliberté,
v étant le nombre dedegrés
de liberté de l’estimation"intra-dose" s2
de la variance ré- siduelle(dans
le cas d’uneréponse quantitative).
Une estimation
plus
satisfaisante des limites à attribuer à la va-leur x est donnée par la
formule ;
Revue de Statistique Appliquée, 1968 - vol. XVI - N’ 3
19
où
Ka
est selon les cas soit la variable normale réduite(tout-ou-rien)
soit le t à v d. d. 1.
(quantitatif) correspondant
aurisque
a, et où g est lerapport
de la valeur limite aurisque
a du Fpermettant
de tester larégression
à la valeur effectivementprise
par ce F(g
est donc d’autantplus petit
que lasignification
estplus forte).
Ce F a pour valeurb2var
b.D. a pour
degrés
de liberté 1 et l’infini(tout-ou-rien)
ou v(quantitatif).
5 - LEGITIMITE DU MODELE LINEAIRE : FACTEUR
D’HETEROGENEITE
Leprincipe
d’un test de linéarité a étéévoqué
au début de la 2èmepartie, lorsqu’on
a établil’expression
valeur minimale de l’écart entre les
points
moyens et une droite.a)
Dans le cas d’uneréponse quantitative,
lespoids
sont estiméspar les valeurs
nI S2 où s2
est à v d.d.1.L’expression
E s’écrit donc :Le numérateur de cette
expression
est la somme des carrés des distances despoints
moyens à la droite(chaque point
étantpondéré
par l’effectifcorrespondant n) :
c’est une estimation à(L - 2) d.d.l.,
sousl’hypothèse
delinéarité,
de la variance cr2(L
étant le nombre depoints).
L’expression
est donc distribuée selon une loi de F à
(L - 2)
et v d. d. 1.b)
Dans le cas d’uneréponse
entout-ou-rien,
onpeut
montrer de même quel’expression E L -2 est distribuée,
sousl’hypothèse
de linéa-rité,
selon une loi deFL-2~,
cequi
revient à dire quel’expression
E est distribuée selon une loi deX2
à(L - 2)
d. d. 1. Le calcul dece Y, 2
n’estlui-même
légitime
que pour autant que les effectifsthéoriques
corres-pondants
soient suffisants. Enpratique
on l’effectuetoujours
dans unpremier temps
et ce n’est quelorsque
le résultat estsignificatif qu’on
détermine effectivement les valeurs des effectifs observés et calculés afin de
pouvoir
faire s’il y a lieu lesregroupements
nécessaires. Si on a utilisé desprobits
de travail ce sont eux que l’onemploie
dans la for- mule(11).
Lorsque
le test de linéarité estsignificatif,
cepeut-être
soitparce
qu’avec
lesparamètres
utilisés la relation entre la dose et l’effet n’est paslinéaire,
soit parcequ’on
a étéobligé
d’admettre dansl’expé-
Revue de Statistique Appliquée, 1968 - vol. XVI - N’ 3
20
rience des contraintes
qui
ont introduit des fluctuations aléatoires notables entre les doses. Telpeut-être
le cas, parexemple, lorsque
pour des raisonspratiques
on estobligé
de traiter en mêmetemps
tous les su-jets
soumis à une dose donnée. Dans ce dernier cas, et à conditionqu’on
ait
procédé
à untirage
au sort de l’ordre d’utilisation des diversesdoses,
onpeut poursuivre l’analyse,
mais en consentant une notableperte
d’information : ainsi dans le cas d’uneréponse quantitative
suffit-ilde substituer à l’estimation S2 de la variance résiduelle l’estimation
SnY’ - (SnxY )
alors seule valable
L - Snx 2 2 (à
L - 2 d. d.1. )
des fluctuations au- tour de la droite. Cela revient àmultiplier
toutes les variances par la valeur du Fayant permis
de mettre en évidence l’écart à la linéarité et à utiliser la table de t à(L - 2)
d. d. 1. au lieu de la table v d. d. 1.pour le calcul des intervalles de confiance. On
procède
exactement de la mêmefaçon (multipliant
les variances parF)
dans le cas d’une ré-ponse en tout-ou-rien. La valeur de g et le calcul des limites de con-
fiance de
xp
doiventégalement
être modifiés enconséquence.
6 - AUTRES METHODES
Les méthodes
exposées
dans les pagesqui précèdent permettent
de décrire defaçon
trèsgénérale
les relations dose-effet. De nombreuses autres méthodes ont été mises aupoint
pour résoudre defaçon plus avantageuse
desproblèmes particuliers,
et notamment celui de la déter- mination d’une dose-efficace 50%.
Nous en citeronssimplement deux, renvoyant
le lecteur à labibliographie
pour une revueplus générale.
a)
Méthode des KârberLe
principe
de cette méthode est d’évaluer la moyenne des seuils de sensibilité en considérant que la différence despourcentages
de succèsentre deux doses successives est une évaluation du
pourcentage
de seuilscompris
entre ces deux doses. La dose-efficace 50%, égale
à la moyenne des seuils si leur distribution estsymétrique,
vaut alors(en appelant
xi 1 laplus grande
dosen’ayant
donné aucunéchec) :
:En
particulier
si les dosesXi
sontéquidistantes,
la distance entre deux d’entre elles étanth,
cetteexpression peut
s’écrireplus simple-
ment
C’est à ce cas que nous nous limiterons ci-dessous.
La variance de cette évaluation est,
puisque
les divers pourcen-tages
observés sontindépendants,
estimée parRevue de Statistique Appliquée, 1968 - vol. XV I - N’ 3
21
Si l’intervalle couvert par
l’expérience
ne va pasjusqu’à
0 et 100%,
on
peut,
si lespourcentages
observés serapprochent
suffisamment de cesvaleurs, imaginer qu’une
doseimmédiatement
inférieure ou immé- diatementsupérieure
à cellesqu’on
aemployées
auraitpermis
de lesobserver ;
onpeut
alorsappliquer
les formulesprécédentes.
Malgré
lesapproximations qu’elle implique
la méthode de Karber donne enpratique
d’excellents résultats parcomparaison
avec des mé- thodesplus raffinées,
comme la méthode desprobits.
C’estqu’en
réa- litél’imprécision
des estimations est trèsgrande,
même avec les mé-thodes recherchées.
b)
Méthode"d’aller
etretour"
Cette méthode est
également
connue sous le nom de méthode"up
and
down".
C’est une méthodeséquentielle, qui permet
de concentrerles observations dans la zone de la DE 50 et d’arrêter
l’expérience lorsqu’on
atteint laprécision
recherchée. En contrepartie
elleimplique qu’on
attende laréponse
dechaque sujet
avant de traiter lesujet
sui- vant, cequi
suppose évidemment que laréponse
soit suffisamment ra-pide.
Sonprincipe
est le suivant : on définit apriori
une"grille"
dedoses
régulièrement espacées.
On traite unpremier sujet
avec une dose aussiproche
quepossible
de la DE 50%.
Si l’on observe un succèson traite le
sujet
suivant avec une dose immédiatementinférieure ;
sion observe un
échec,
on le traite avec une dose immédiatementsupé- rieure,
et ainsi de suite.7 - CONCLUSION SUR LE CHOIX DES METHODES
Dans le cas d’une
réponse quantitative,
lasimple application
desformules
(6)
à(10) permet
de définir la relationdose-effet, après
d’é- ventuelschangements
de variable sur les doses et lesréponses.
Dans le cas d’un effet entout-ou-rien, après
un éventuelchangement
de va-riable sur la
dose,
onpeut
hésiter entre diverses méthodes. La méthode itérative du maximum devraisemblance, appliquée
auxprobits
des pour-centages
de succès est deportée
trèsgénérale, n’imposant
aucune con-trainte d’effectifs. C’est la méthode de choix
quand
ondispose
de moyens de calcul suffisammentpuissants. Lorsqu’on préfère
sacrifier un peu deprécision
en contrepartie
d’unallègement
considérable descalculs,
onpeut
recommanderl’emploi
de la transformationangulaire (à
conditionque la zone
expérimentale n’atteigne
pas lesrégions
de très faible outrès forte activité et que les effectifs utilisés à
chaque
dose soient del’ordre de la
quinzaine
aumoins),
ou de la méthode de Karber(lorsqu’au
contraire les
pourcentages
0 et 100%
de succès ont été observés et que l’on se contente d’une évaluation de la dose efficace 50%
et de sapré- cision).
3ème PARTIE : PUISSANCE RELATIVE DE DEUX SUBSTANCES
Le schéma de cette étude a été décrit dans la
première partie
decet
article,
et les moyenstechniques
utilisablesexposés
dans la se- conde. L’évaluation d’unepuissance
relative et de saprécision
nécessiteRevue de Statistique Appliquée, 1968 - vol. XVI - N* 3
22
l’analyse conjointe
d’un ensemble de donnéesexpérimentales
relatives à deux substances S etP,
dans laperspective
du tracé de deux droitesparallèles (si
leparamètre-dose
est lelogarithme)
ou concourant pourx = 0
(si
leparamètre-dose
est la doseelle-même).
Ces deux cas se-ront traités
séparément.
A - CAS DU LE PARANETRE-DOSE EST LE LOGARITBME A - ESTIMATION
Nous nous
placerons d’abord,
comme dans le cas d’une seuledroite,
sous leshypothèses justifiant l’emploi
de la méthode des moindres carrés.Le
système
de droitesparallèles
àajuster peut
s’écrireen
appelant
x lelogarithme
de la dose.L’expression
à minimiser estoù les
sommes L
sont àprendre
pour leproduit
Set 03A3
pour le pro-s p
duit P.
Les deux droites ainsi obtenues ont pour
pente
communeoù ESWXY est la somme
des expressions
SWxY relativesà
chacun des deuxproduits
et oùl:SWx2
est de même la somme desSWx2,
Elles
passent chacune
par le centre degravité qui
lui estrelatif,
à savoir le
point (xs’ Yg)
pourS,
et lepoint (x , Y )
pour-P,
où :et où
xp
etYP
ont des définitionsanalogues.
Leurs
équations
s’écrivent donc finalementRevue de Statistique Appliquée, 1968 - vol. XVI - N’ 3
23
Cette solution est valable que la
réponse
soitquantitative
ouquali- tative,
à conditiond’adopter
despoids
convenables. Si l’on utilise desprobits,
on commence par une estimationgraphique, ajustant "à vue"
un
système
de deux droitesparallèles qui respecte approximativement
les
poids
des diverspoints ;
onpeut également recourir,
dans les mêmesconditions que dans le cas d’une seule
droite,
à la méthode itérative du maximum devraisemblance,
cequi
revient àremplacer
dans les cal- culs lesprobits
observés par desprobits
de travail définis àchaque
itération.On calcule ensuite la distance horizontale
M.
des deux droitesqui
n’est
autre,
on lesait, qu’une
estimation dela puissance
relativeppg
de P par
rappot
à S.En
particulier
si laréponse
est entout-ou-rien,
onpeut
calculerM
comme distance entre les doses donnant 50%
de succès. En d’autres termessi l’on
appelle ms
et mp les DE 50(ou
moyennes des seuils de sensibi-lité)
relatives à S et à P.Cette remarque
permet
notamment d’évaluer unepuissance
rela- tive en estimantindépendamment ms
etmp
par une méthoderapide
telleque la méthode de Kârber.
On calcule enfin une estimation R
PS
de
p
enprenant l’antiloga-
rithme de
1BBs.
Ps Ps
2 - VALIDITE DU MODELE
L’expression
Equ’on
a minimiséepeut
s’écrire sous la formeOn
pourrait
songer à s’en servir pour testerglobalement
la vali-dité du modèle
(linéarité
etparallélisme
des deuxdroites).
En réalitéil est très facile de la
décomposer
en deuxtermes,
l’un relatif à la linéarité(El ),
l’autre auparallélisme (E2),
où
et
Revue de Statistique Appliquée, 1968 - vol. XVI - N’ 3
24
a)
Test de linéarité2
(SWxy)2
On
peut
constater queE est
la somme des termesSWY - S Wx 2
SWx2relatif à
chaque produit,
termesqui permettraient
de tester la linéa- rité de l’une et l’autrerégressionst
Leur sommepermet
de testerglo-
balement la linéarité des deux
régressions :
divisée par le nombre dedegrés
de liberté(L - 4) c’est,
sousl’hypothèse
delinéarité,
un F à L - 4 et Kdegrés
deliberté,
où K vaut v dans le cas d’uneréponse quantitative (v
est le nombre dedegrés
de liberté de la variance rési- duelles2)
et est infini dans le cas d’uneréponse
en tout-ou-rien(en
d’autres termes
El
est alors unX 2à (L - 4) d. d. 1. ), L
étant le nombre total depoints
pour l’ensemble des deux substances.Une discussion tout à fait
analogue
à cellequi
a été menée dans le cas d’une seule droitepeut
alors êtreentreprise.
Enparticulier
ilconvient de
s’intèrroger,
si laréponse
est entout-ou-rien,
sur la vali-dité du test
utilisé,
et d’effectuer éventuellement le calculcomplet
deseffets observés et
théoriques,
enprocédant
à desregroupements logi-
ques si c’est nécessaire.
b)
T e st deparallélisme
Si
l’hypothèse
de linéarité estvérifiée,
onpeut
tester leparallé-
lisme des deux droites en étudiant la valeur de
E2 qui est,
sil’hypothèse
de
parallélisme
estvraie,
distribuée selon une loi de F à 1 et Kdegrés
de
liberté,
où K vaut v dans le cas d’uneréponse quantitative
et estinfini dans le cas d’une
réponse
en tout-ou-rien. Onpeut
en effet cons-tater aisément que
E 2
n’est autre que le carré de la différence entre les deuxpentes bs
et4, rapporté
à sa variance. S’il existe un facteurd’hétérogénéité,
le test deparallélisme
doit en tenircompte
et être effec- tué en calculant20132.= .22013-
distribué selon une loi de F à 1 et(L - 4) d.d.l.,
et il est évidemment alors très peupuissant.
Si le test de
parallélisme
n’est passignificatif,
rien nes’oppose
à l’idée que l’une des substances se
comporte
comme une dilution de l’autre. Par contre si ce test estsignificatif,
le modèle n’estplus
accep- table. Il convient alors de mener la discussion endistinguant
les essaisanalytiques
et les essaiscomparatifs (lère partie).
En effet si l’essai est
analytique,
l’une des deux substances doitse
comporter
comme une dilution de l’autre. Si elle ne le fait pas, c’est quel’hypothèse
fondamentale surlaquelle
a été bâti l’essai est miseen cause. Cette constatation
peut
conduire àrejeter complètement l’expé-
rience et même à se poser des
questions
sur la naturerespective
desdeux substances confrontées.
Si au contraire l’essai est
comparatif,
le schémathéorique
deparallélisme -
c’est-à,-dire d’assimilation d’une des substances à une dilution de l’autre - nepeut
être retenu.Cependant
il estpossible qu’on
ne- s’en écarte pas
trop
pour que sa valeurdescriptive
dans une zonedéfinie de doses doive être
complètement négligée.
3 - PRECISION DE L’ESTIMATION
Par un
procédé
tout à faitanalogue
à celui aui a étéemployé
dansle cas d’une seule
droite,
on montre queRevue de Statistique Appliquée, 1968 - vol. XVI - N’ 3