R EVUE DE STATISTIQUE APPLIQUÉE
B. C YFFERS
Analyse discriminatoire II
Revue de statistique appliquée, tome 13, n
o3 (1965), p. 39-65
<
http://www.numdam.org/item?id=RSA_1965__13_3_39_0>
© Société française de statistique, 1965, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (
http://www.sfds.asso.fr/publicat/rsa.htm
) implique l’accord avec les conditions générales d’uti- lisation (
http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
ANALYSE DISCRIMINATOIRE II
B. CYFFERS
Ingénieur
enchef des Manufactures d’état
Dans un
précédent article,
nous avonsexposé
le rôle del’analyse discriminatoire,
et avons donné unexemple d’application.
Nous nous proposons de montrer dans le
présent
article commenton établit les fonctions discriminantes et comment on
peut tester,
paranalogie
avec la théorie de laRégression,
les coefficients de ces fonc- tions.Nous traitons ensuite deux
exemples numériques,
lepremier
serapporte
à deux famillesdépendant
dequatre paramètres,
le second àplusieurs
famillesdépendant
de deuxparamètres
et à centresalignés.
Notations utilisées.
La
population
étudiée est divisée en k familles. Une famille estreprésentée
par l’indice i écrit entreparenthèse
et enexposant.
Sur
chaque individu,
onprocède
à la mesure de pparamètres.
Unparamètre
estreprésenté
par la lettre s ou rposée
en indice à droite.Une mesure individuelle est
représentée
parl’indice j placé
àgauche.
Une mesure individuelle s’écrit donc sous la forme :n(i) étant l’effectif des individus
prélevés appartenant
à la famille(i).
L’effectif total de l’échantillon est :
A - LES FONCTIONS DISCRIMINANTES
1/
Théorèmespréliminaires.
Démontrons tout d’abord les théorèmes suivants
qui
nouspermettront d’interpréter géométriquement
les fonctions discriminantes.Théorème I - Soit dans un
plan
unpoint
aléatoire suivant une loi deLaplace-
Gauss à 2 dimensions. La
projection
de cepoint
sur une droite Dparallèle-
ment à une direction A suit une loi de
Laplace-Gauss
à une dimension,dont le centre est la
projection
du centre, et dontl’écart-type
s’obtienten menant à
l’ellipse
indicatrice lesparallèles
à A.Nous pouvons
prendre
ladroite D
passant
par le centre 0 del’ellipse
sans rien ôter àla
généralité
de la démonstra- tion.Prenons
Ox,
selonD, Oy parallèle
à A.L’équation
del’ellipse
in-dicatrice est :
La fonction
caractéristique
de la loi est :La loi de la
projection
surD, parallèlement
à A de coefficients u,0 ,
c’est-à-dire la loi de x, a pour fonctioncaractéristique :
Ce
qui
démontre que x suit une loi normale de centre0,
d’écart-typeo,.
r(u v) = 1 représente l’équation tangentielle
del’ellipse.
Lesdroites x = ± 03C3x satisfont cette
équation.
Donc lestangentes
àl’ellipse parallèles
à Acoupent
D auxpoints
d’abscisse ± ox ,- Faisons
pivoter
la direction A. Lespoints
d’abscisse ± 03C3x sonttoujours
extérieurs ausegment
ABdécoupé
parl’ellipse
sur D.Ces
points
se confondent avec A et Blorsque A
est la directionconjuguée
de D par
rapport
àl’ellipse.
La loi
projetée
sur D a la dispersion minimum lorsque la directionprojetante A
estcon juguée
de D par rapport àl’ellipse.
Théorème
II - Soit dansl’espace
unpoint
aléatoire suivant une loi deLaplace-Gauss
à 3 dimensions.a)
Laprojection
de cepoint
sur une droite Dparallèlement
à un
plan
11 suit une loi deLaplace-Gauss
à une dimension dont l’écart-type
s’obtient en menant lesplans tangents parallèles
à Il àl’ellipsofde
indicateur.b)
Laprojection
de cepoint
sur unplan
Pparallèlement
àune direction A suit une loi de
Laplace-Gauss
à 2dimensions,
dont l’el-lipse
indicatrice est la section de P par lecylindre parallèle
à ~ cir-conscrit à
l’ellipsofde.
a) Supposons
encore Dpassant
par le centre del’ellipsoïde ;
prenons
OXI
selonD,
x2Ox3 parallèle
à Il.La fonction
caractéristique
de la loi de distribution de xl, x2,x3
ext .
La fonction
caractéristique
de x,projection
d’unpoint
aléatoire pa- rallèlement à un.plan
de coefficients uj,0, 0,
est :Donc xi suit une loi normale
d’écart-type
al, et comme lesplans
Xl = ± 03C31 satisfont
0393(u1
u2u3) = 1, équation tangentielle
del’ellipsorde ,
± 03C31 sont les abscisses des
points
d’intersection de D avec lesplans
tan-gents parallèles
à II.b) Supposons
Ppassant
par lecentre,
prenons le commeplan
Xl
Ox2
etOx3 parallèle
à ~.La fonction
caractéristique
de la loi de laprojection
dupoint
aléa-toire
parallèlement
à A définie parx1 = 0, x2 = 0,
est :r
(ul
u20)
est une fonctionhomogène
du seconddegré
en ul u2 donc laprojection
suit une loi deLaplace-Gauss
à 2 dimensions dontl’ellipse
indicatrice a pour
équation tangentielle :
Considérons dans le
plan
P la famille de droitestangentes
à cetteellipse,
c’est-à-dire les droitesd’équation
u1 x1 + u2 x2 -1,
telles que0393(u1
u20) =
1. Il luicorrespond
une famille deplans parallèles
à~,
dont les coefficients satisfont
l’équation tangentielle
del’ellipsoide,
etpar
conséquent tangents
àl’ellipsoïde. L’ellipse
indicatrice de la loiprojetée
est donc l’intersection de P par lecylindre
circonscrit àl’ellip-
soide
parallèle
à A.Corrolaire - Dans le cas
(a),
on démontre comme nour leplan
que la loi pro-jetée
sur D est la moinsdispersée
lorsque la direction du planprojetant
estconjuguée
de D par rapport àl’ellipsotde.
Dans le cas
(b) l’ellipse
obtenue estbitangente
et extérieure àl’ellipse
section del’ellipsoïde par
P. Elle se confond avec cette der- nièrelorsque
P et 6 sontconjugués.
La loi
projetée
sur P est la moinsdispersée
lorsque la direction ~ estconjuguée
de P par rapport àl’ellipsoide.
Théorème III- Soit
unpoint
aléatoire suivant une loi deLaplace-Gauss
àp dimensions. Sa
projection
sur unemultiplicité
linéaire F à h dimen- sions(h p) parallèlement
à unemultiplicité
linéaire 03A6 àp - h
dimensionssuit une loi de
Laplace-Gauss
à h dimensions dont l’élément indicateur(ellipse, ellipsoïde, hyperellipsoide)
est laprojection
surF, parallèle-
ment à
03A6,
del’hyperellipsolde
indicateur de la loi initiale.Prenons F
passant
par le centre del’hyperellipsorde indicateur,
Oxl’ Ox2 ... Oxh
dansF, Oxh+1 ... OXp parallèles
à 0.La fonction
caractéristique
de la loi à p dimensions est :La loi
projetée
a pour fonctioncaractéristique :
C’est donc une loi de
Laplace-Gauss
à h dimensions.Les
multiplicités
linéairesd’équation Ul x1
+u2 x2 ...
+uh
xh = 1 où ul u2 ...uh
satisfont àr (ul
u2 ... uh,0, 0,
...0) = 1
sonttangentes
à l’élément indicateur de la loi
projetée,
et sont les traces sur F demultiplicités
linéaires à p - 1dimensions, parallèles
à 03A6 ettangentes
àl’hyperellipsorde
indicateur de la loi initiale. L’élément indicateur de la loiprojetée
est donc laprojection
surF, parallèlement
à 03A6 de cethyper- ellipsoïde.
Corollaire - Cette
projection
sera laplus petite lorsqu’elle
sera confon-due avec l’intersection de
l’hyperellipsolde
parF,
doncquand
F etseront
conjugués.
2/
Fonctions discriminantes.1 er cas : Cas de deux familles.
A -Familles dépendant
de 2paramètres.
Soit une
population
d’individus divisée en 2 famillesF’ l’, F (2)
Sur
chaque
individu onprocède
à la mesure xl’x2,
de 2paramètres Xl, X2. Supposons
que la distribution de ces mesures à l’intérieur dechaque
famille suive une loi normale à 2
dimensions,
et supposons deplus
que les distributions à l’intérieur dechaque
famille soientidentiques
et nediffèrent que par les valeurs moyennes.
Nous nous proposons de chercher la fonction discriminante :
définie par
o r maximum,
c’est-à-dire telle que lerapport
dela valeur absolue de la différence des valeurs moyennes de Y à l’inté- rieur de
F(1)
etF(2)
àl’écart-type
de la distribution de Y soit maximum.Interprétation géométrique
de la fonction discriminante.Dans le
plan
desxi, x2 les
deux familles sontreprésentées
par deuxellipses
de centres01, 02,
se déduisant l’une de l’autre par la translation01 02.
Ces
ellipses
sont lesellipses
indicatrices des lois de distribution de xi etx2 à
l’intérieur dechaque
famille.Projetons
les 2 lois pa- rallèlement à une direction~1
sur une droite D
quelconque .
Les centres des lois
proje-
tées s’obtiennent par les pro-
jections
de01, 02,
et lesécarts-types
s’obtiennent à l’aide detangentes
aux el-lipses parallèles
àAi.
Il estclair que le
rapport
de ladistance des centres à l’écart-
type
commun des lois pro-jetées
est constant(pour
unedirection ~1 donnée), quelle
que soit la droite D du
plan
sur
laquelle
onprojette.
Nous pouvons donc sup- poser, sans rien ôter à la
généralité
de la démonstra-tion,
que l’onprojette
tou-jours
sur laligne
des centres01 02.
La distance des centres est alorsconstante,
et lerapport
decette distance à
l’écart-type
commun des loisprojetées
est d’autantplus grand
que cetécart-type
estpetit.
Lerapport
est donc maximumlorsque
la direction
projetante Ai
est la direction Aconjuguée
de laligne
descentres par
rapport
auxellipses.
A
représente
une fonction linéaire03BB1
Xl +À2
x2qui
n’est autreque la fonction discriminante.
En conclusion, la direction A
déf inie
par lafonction
discriminante est la directionconjuguée
de la droi te des centres par rapport auxellipses indicatrices(1).
Dans le
plan
xix2, A
est la direction selonlaquelle
il fautregarder
les 2
ellipses
pour les voirséparées
au maximum l’une de l’autre.S’il existe une
équiprobabilité
pourqu’un
individuappartienne
àchacune des
familles,
la droiteest la droite de direction A
passant
par le milieu deO1 02.
Si lesellipses
se
coupent,
cette droite est la droite d’intersection.Une fois
Yo déterminé,
on sera amené à classer un individu dansune famille ou l’autre selon que le
point représentatif
de cet individu estdans l’une ou l’autre des deux
régions
duplan, séparées
sur la droiteYo = À1
x1+ À2
X2 Laprobabilité
de mal classer est la même pourchaque
famille.Cette
probabilité
estreprésentée
par la masse deprobabilité
d’unedes lois située dans le
demi-plan
délimité par la droiteYo = 03BB1
xl +À2
x2ne contenant pas le centre de cette loi.
(1) Nous devons à M. G. DARMOIS cette interprétation géométrique de la fonction dis- criminante.
Si un individu a la
probabilité
pd’appartenir
à la lère famille et qd’appartenir
à la 2ème(p
+ q =1).
on déterminera encoreYo
de ma-nière que la droite
d’équation Yo = 03BB1
x,+ 03BB2 x2
2partage
leplan
endeux
parties,
telles que la masse deprobabilité
de la loi de la lèrefamille,
située du côté deO2, multipliée
par p, soitégale
à la massede la loi de la 2ème
famille,
située du côté de01, multipliée
par q.Calcul de la fonction discriminante.
L’équation tangentielle
del’ellipse
indicatrice d’une deslois,
ouplutôt
del’ellipse qui
se déduit de cette dernièreaprès
translation pouramener son centre à
l’origine
des coordonnées estou, sous une forme
générale :
avec :
Les
premiers
membres deséquations, correspondant
auxellipses
indicatrices des lois de distribution à l’intérieur de chacune des
familles,
sont
identiques.
Pratiquement,
ondispose,
àpartir
des mesureseffectuées,
des som-mes des carrés et
produits
centrés à l’intérieur dechaque
famille. Soient:les sommes totales relatives aux deux familles.
Désignons par xll’,
la valeur deX1
surle jième
individu de lapremière famille,
par1 x(1)1
la valeur moyenne deXl
à l’intérieur de lapremière famille,
etc...On a,
si n (1) et n(2)représentent
les effectifs observés danschaque
famille
a11, ail2 , a2 2 sont
proportionnels
aux estimations des coefficients in- tervenant dansr(ul U2).
Comme nous ne nous occupons que de directions
conjuguées,
onpeut
considérerl’ellipse d’équation :
homothétique
del’ellipse
indicatrice estimée.Les
paramètres
directeurs de la droite des centres sont :La droite
d’équation PB.i
x1 +03BB2
x2 = Y seraconjuguée
de laligne
des centres si :
ou
Les 03BB. n’étant définis
qu’à
un coefficient deproportionnalité près,
on
peut prendre
pour valeurs de03BB1, 03BB2
les solutions deséquations :
La résolution de ces
équations
estsimple.
Nous nel’expliciterons
pas, nous la rattacherons à celle des
systèmes plus généraux
que nous obtiendrons par la suite.Remarque - Au lieu de
l’ellipse
indicatrice de la loi de distribution ou uneellipse homothétique,
onpeut
considérer touteellipse
parrapport
à la-quelle
la droite01 02
admet même directionconjuguée,
donc touteellipse appartenant
au faisceau linéaired’enveloppes
de secondeclasse,
défini parl’ellipse
indicatrice et une autreenveloppe
satisfaisant à cette condi- tion ; parexemple,
lepoint
double àl’infini,
dans la direction0 1 02.
On sera donc conduit aux mêmes valeurs de
03BB1, "’2 en partant
d’une
ellipse d’équation tangentielle :
jj. étant un
paramètre quelconque.
On aura alors à résoudre deséqua-
tions de la forme :
B - familles
dépendant
de pparamètres.
Supposons
que surchaque
individu des deux famillesprécédentes,
on
puisse procéder
à d’autres mesures. Soient xl, x2 ...xp
les mesuresde p
paramètres
différentsXl X2
...X .
Les deux familles sont
représentées
par deuxhyperellipsoïdes
dansl’espace
à p dimensions. La fonction discriminanteest
l’équation
d’unemultiplicité
linéaire à p - 1 dimensions.Projetons
les 2 lois de distribution à p dimensions sur la droite des centres01 O2 parallèlement
à cettemultiplicité
linéaire : on obtientdeux lois à 1
dimension,
de centresO1 02.
Y étant la fonction discri-minante,
lerapport |Y(2)-Y(1)| 03C3Y
est leplus grand
quepuisse
fournir une fonction linéaire des Xi. Donc pour les loisprojetées,
ladispersion
estminimum,
et parconséquent,
la direction de lamultiplicité
linéaireprojetante
estconjuguée
de la droite des centres parrapport
auxhype- rellipsordes.
Ces
hyperellipsoides
sont déterminés à une homothétieprès,
à par- tir desdonnées,
par la connaissance de la matrice des sommes des carrés etproduits
centrés à l’intérieur des familles.où :
et
avec
L’équation tangentielle
de ceshyperellipsoldes
est :La condition de
conjugaison
entre lamultiplicité
linéaire :et la droite des centres de
paramètres
directeursdl, d2 ... d ,
coor-données du vecteur
01 02
s’écrit :ou
Les n’étant définis
qu’à
un coefficient deproportionnalité près,
on
peut prendre
commesystème
de valeurs la solution dusystème d’équations
linéaires :En considérant les À comme les coordonnées d’un vecteur on
peut
écrire ces relations d’une manière
plus
concentrée sous la forme :Multipliant
àgauche
parâ-1,
il vient :Cette formule donne
B
en fonction dea
etd
Elle
équivaut
à l’ensemble des péquations :
dans
lesquelles
les as r sont les termes dea-1
ou
Remarque -
On sera conduit à unsystème identique
de valeurs A en par- tant au lieu de la matrice de termes asr’ de la matrice de termes asr +03BCds dr, 03BC
étant unparamètre quelconque.
Cette matrice définit eneffet le faisceau linéaire des
hyperellipsoides
parrapport auxquels
lamultiplicité
linéaireconjuguée
de la direction deparamètres
directeursdl, d2
...dp
est lamême, puisque
la matrice des termesds, dr
définitl’enveloppe
de seconde classe constituée par lepoint
double à l’infini dans la directiondl d2
...dp.
2e cas : cas de
plusieurs
familles.Si l’on
dispose
de k famillesdépendant
de pparamètres,
on sup- posera encore que les variances et covariances des mêmes variables sontégales
dans les différentes familles.Ces familles sont
représentées
dansl’espace
à p dimensions par deshyperellipsordes
à p dimensions.Si les centres de ces
hyperellipsoides
sont sur unedroite,
c’est- à-dire unemultiplicité
linéaire à 1dimension,
il existe unemultiplicité
linéaire à
p -1
dimensions dont la"direction"
estconjuguée
de la droitedes centres par
rapport
auxhyperellipsoides.
Ce cas estanalogue
àcelui de deux familles. Il existe donc une fonction discriminante : y =
03BB1
Xi+ 03BB2
x2 +... +03BBp xp
Si les centres des
hyperellipsoides
sont sur unemultiplicité
linéaireà 2
dimensions,
il existe unemultiplicité
linéaire àp - 2
dimensionsqui
lui est
conjuguée.
C’est enprojetant parallèlement
à cettemultiplicité linéaire,
sur leplan
des centres que l’on obtient les loisprojetées
lesmoins
dispersées.
Ces lois ont pour centres les centres desfamilles,
et leur
ellipse
indicatrice est l’intersection deshyperellipsoides
par leplan
des centres.Analytiquement,
lamultiplicité
linéaire à p - 2 dimen- sions est définie comme l’intersection de 2multiplicités
à p - 1 di- mensions.Il Y a donc deux
fonctions
discriminantes.D’une manière
générale,
si les centres sont sur unemultiplicité
linéaire
Ph
à hdimensions,
il existe unemultiplicité
linéaire03C0p-h
àp -h dimensions, conjuguée
de laprécédente.
C’est enprojetant parallèle-
ment à Tu sur
P , qu’on
obtient les loisprojetées
les moinsdispersées.
7L
est défini par héquations (03C0
p-h est l’intersection de h multi-plicités
linéaires àp - 1 dimensions).
On a donc dans ce cas h
fonctions
discriminantes.Il existe donc autant de fonctions discriminantes que la
multiplicité
linéaire contenant les centres a de dimensions.
Nous limiterons notre étude au cas des fonctions discriminantes à 1
dimension,
c’est-à-dire au cas où les centres sontalignés.
Désignons
par T le caractèrequi distingue
les h familles. L’ali-gnement
des centres des familles est alors le reflet d’une réalitéphysique sous-jacente,
T est souvent un caractèremesurable,
et onpeut
consi- dérerqu’il
existe unerégression
linéaire entre lesparamètres
X et lecaractère T. T
prend
alors la même valeurt (i)
pour tous les individus de la famille i.Désignons
par61, 03B42 ... 03B4p les paramètres
directeurs de la droite derégression
deX1 ... Xp
parrapport
à T.Les
équations
de cette droitesont,
endésignant
parx1 ... x
lesmoyennes
générales
des valeurs observées :Si n(i)
représente
le nombre d’individus examinés dans la ième fa- mille on obtient5
s en rendant minimum la somme des carrés des dis- tances despoints expérimentaux
auxpoints
d’intersection de la droite derégression
avec le"plan"
t =tl,
pour la lèrefamille,
avec leplan
t =
t2
pour laseconde,
etc...Soit donc :
ce
qui
donne :On
peut
écrire cetteexpression
sous la forme :les sommations s’entendant :
- au
numérateur ;
pour toutes les valeurs de Xsobservées ,
- au dénominateur : pour la totalité des observations.
Les
paramètres
de la droite des centresestimée,
dansl’espace
des x1 x2 ...
xp peuvent
donc êtrepris égaux
àCe sont ces valeurs
qu’on prendra
comme coordonnées du vecteurd.
Les coefficients de la fonction discriminante s’obtiendront par la relation :
un terme asr de la matrice
a ayant
la mêmeexpression
que dans le cas de 2familles,
iprenant
alors les valeurs1,
2 ... k.(Quand
les centres sont dans unplan,
c’est engénéral
que les familles sedistinguent
entre elles par deux caractères U etV,
et il existe unerégression
linéaire entre les X d’unepart,
U et V d’autrepart).
En
réalité,
pourpouvoir
utiliserl’analogie
avec larégression
pour tester les coefficientsÀ,
on ne calcule pas la fonction discriminante parapplication
de la formuleCompte
tenu de la remarque concernant le faisceaud’enveloppes
deseconde classe admettant mêmes directions
conjuguées,
onpeut,
au lieude la matrice a, utiliser toute matrice de la forme :
où 03BC
est un coefficientquelconque.
En
particulier,
considérons la matrice :C’est la matrice des sommes des carrés et
produits
centrés dusà la
régression
linéaire des X parrapport
à T. Elledépend
d’undegré
de liberté.
On établit la matrice b = a + r
qui dépend
de N - k + 1degrés
de liberté
(N = 03A3
n(i) = nombre total d’individusexaminés)
et on cal-cule 03BB
par :3 -
Analogie
avec larégression,
test des coefficients.Nous allons montrer
qu’en
calculant les coefficients À. par cette dernièreformule,
on obtient des coefficientsqui
sont ceux duplan
derégression
de t parrapport
à xj, X2...xP,
si on suppose les centres de famillesrigoureusement alignés
comme on leprécisera plus
loin.Considérons dans
l’espace
à p + 1 dimensions p + 1 axes rectan-gulaires Oxl, Ox2, Oxp,
Ot. Les familles y sontreprésentées par des
"ellipses" homothétiques
les unes des autres et situées dans des"plans"
t = constante.
La droite des centres
estimée, D,
passe par lepoint
moyengé-
néral de coordonnées
Xl, X2
...Xp, t
et a pourparamètres
directeurs :Désignons
parO1, 02 ... Ok
les centres réels desellipses, QI
,Q2
... ,Qk
lespoints
d’intersection de la droite D avec les"plans"
t = t ( 1 , t = t(2) ... t = t(k).
On a :
- coordonnées de
Oi
- coordonnées de
Qi
et on
peut
écrire :et en élevant au carré et sommant :
Degré
de liberté N - 1=(N - k) +(k - 2)
+ 1.Le
premier
terme de ladécomposition
de la somme descarrés , qui dépend
de N - kdegrés
deliberté,
n’est autre que ass, terme de ladiagonale
de la matricea.
Considérons le dernier
terme, qui
nedépend
que d’undegré
deliberté. C’est le terme dû à la
régression
deXs
parrapport
à T. Commedans le
plan
des xs, t, les valeursox(i)s
sont situées sur la droite deparamètres
directeurs03A3xs (t - t), L (t - t)2 qui
passe par lepoint ~s, t ,
on a :
et
On établit des relations
analogues
pour les termesrectangles,
etla matrice b
apparaît
ainsi comme la matrice des sommes des carrés etproduits
centrés autour de la moyennegénérale
si l’on suppose les centresparfaitement alignés
Si t =
03BB’1
x1+ 03BB’2 x2
+03BB’p x
p+
Cte
estl’équation
duplan
de ré-gression
de t parrapport
à xj,X2 ... x.
les À’peuvent
être considé- rés comme les coordonnées d’un vecteur03BB’,
et on l’obtient par :Il y a donc identité entre les coefficients 03BB et 03BB’.
Pour tester les
coefficients
on va doncdécomposer
en 2 termesla somme des carrés totale
L (t - t)2, qui
nedépend plus
que de N - 1 -(k - 2) degrés
de libertépuisqu’on
arigoureusement aligné
les centresdes familles. Cet
alignement
a été sans effet sur la valeur de1 (t _ t)2 puisque
lesdéplacements
des nuages depoints
ont été réalisés dans lesplans
t =t(1),
t = tl2... , mais
on a utilisé K - 2 relations entre lesx et t.
On a :
On établit aisément que :
Ce terme
dépend
de pdegrés
de liberté.On
peut
alors calculer le termerésiduel,
pardifférence,
et cal-culer le carré moyen résiduel. Le terme résiduel
dépend
de(N - 1) - (k-2)-p=N-k+l-p degrés
de liberté.On obtient les variances estimées des coefficients À en
multipliant
ce carré moyen résiduel par les termes
diagonaux
de la matriceb-1.
1er exemple - 2 familles
dépendant
de 4paramètres.
Discrimination entre
Ictères
médicaux et chirurgicaux à partir des ré- sultatsdel’analyse Electrophorétique
desprotéines
du sérum.Nous sommes à
l’origine
enprésence
de 3 familles(Hépatites,
Calculs, Cancers) dépendant
chacune de 4paramètres.
Lapremière
question qui
se pose est celle del’alignement
des centres. Le tableau ci-dessousindique
les valeurs moyennes observées pour chacun des pa- ramètres à l’intérieur des 3 familles.Les centres sont sensiblement
alignés
en cequi
concerne les para- mètres03B12 P’
et03B2 P’.
Ils ne le sont pas en cequi concerne =
et P. Parconséquent,
on nepeut considérer,
dansl’espace
à 4dimensions,
les 3familles comme
ayant
leurs centresalignés,
et l’on doit effectuer la dis- crimination 2 à 2.Toutefois,
comme leproblème
consiste d’abord àdistinguer
lesictères médicaux des ictères
chirurgicaux
et ensuite àséparer
les ictèreschirurgicaux
en"calculs"
et"cancers",
nous sommes conduits à calcu- ler successivement la fonction discriminante entreHépatites
d’unepart,
et calculs et cancers d’autrepart,
et ensuite la fonction discriminante entre calculs et cancers.Nous
indiquons
comment a été établie la lère de ces fonctions ap-pelée YI.
Nous avons rassemblé les 91 groupes de 4 mesures relatifs aux
"Chirurgicaux" (Calculs
+Cancers).
Nous cherchons la fonction discriminante.
Tableau I - Valeurs moyennes
Le tableau suivant
représente
la matrice des sommes des carrés etproduits
centrés à l’intérieur des familles.Cette matrice
dépend
de 195degrés
de liberté.Tableau II
Matrice des sommes des carrés et
produits
centrés 195degrés
deliberté
Le caractère
qui distingue
les deuxfamilles,
dans le casprésent,
n’est pas mesurable.
Mais,
comme dans le cas des 2 familles les centres sontrigoureusement alignés,
onpeut,
pour utiliserl’analogie
avec larégression
et tester les coefficientsB,
introduire unparamètre
t arbi-traire : choisissons t de manière que sa moyenne
générale
soit nulle : parexemple :
- pour les
Hépatites,
posons :- pour les Calculs-Cancers posons :
On a alors :
On considère alors la
régression
desparamètres A + 03B11 P’
... parrapport
à t.La droite de
régression
a pourparamètres
directeurs :(On
remarqueraqu’on
obtient facilement les nombres ci-dessus enmultipliant
les différences des valeurs moyennespar Y(t - t)2
ainsiDe
même,
les termes dus à larégression
desparamètres
parrapport
à t forment la matrice du tableau III. Le calcul des termes de cette matrice est aisé. Parexemple :
le terme à l’intersection de laligne A + 03B11 P’
et de lacolonne 03B12 P’ a
pourexpression :
soit
1 48.964 46700
209. 189 325 x(-205.931 475),
mais on connaît
déjà
lequotient
de chacun de ces deux derniers nombrespa r l (t - t) 2.
Tableau III
Matrice des termes de
régression
1degré
de libertéEn
ajoutant
les termesrespectifs
des matrices des tableaux II et III on obtient la matrice des sommes des carrés etproduits
centrésautour de la moyenne
générale, dépendent
de 196degrés
deliberté,
fai-sant
l’objet
du tableau IV.On
pourrait objecter qu’on peut
obtenir directement cette matrice àpartir
des données. Nous croyonscependant préférable d’adopter
laméthode utilisée
ci-dessus,
à cause de sagénéralité.
Elle est indis-pensable lorsqu’on
a affaire àplus
de 2familles,
et dans tous les cason a besoin de la matrice des sommes des carrés et
produits
centrésà l’intérieur des familles
(tableau II)
pour calculer la variance de la fonction discriminante à l’intérieur des familles.Tableau IV
Matrice des sommes des carrés et
produits
centrés autour de la moyennegénérale
196degrés
de libertéLa matrice inverse de cette matrice
figure
dans le tableau V.Tableau V Matrice inverse
10 4
Les coefficients s’obtiennent en
multipliant chaque ligne
de la ma-trice inverse par :
Par
exemple :
ÀI
=10-4 (1.449965730
x 209. 189 325 +0. 877318701 x(- 205.931475) +...)
On obtient :
03BB1 = -0.004 587 911 44
03BB2
= -0. 055 168 348 3703BB3
= -0.021 393 103 37B
= -0. 008 394 789 18La fonction discriminante est donc :
On
peut remplacer
les coefficients B par un groupe de valeurs pro-portionnelles (on
a intérêt à conserver ungrand
nombre de chiffres si-gnificatifs
pourchaque
coefficient 03BB tant que l’on n’a pas effectué le test designification
de cescoefficients).
Test des coefficients 03BB : Les coefficients 03BB obtenus par la méthode que
nous avons suivie sont ceux de
l’équation
derégression :
Pour un ensemble de
valeurs A + a1 OE2 p
, P observées surun
individu,
on a :En élevant au
carré,
et ensommant,
on obtient :Dans cette
équation, 03A3(y1 - y1)2 représente
la somme des carrés dey1
autour de la moyennegénérale
dey.
On établit aisément que :
= 15. 932 291 400
D’où le tableau VI
d’analyse
de la variance : Tableau VIAnalyse
de la varianceD’après
la théorie de larégression multiple,
on obtient les va-riances estimées des coefficients À en
multipliant
le carré moyen ré- siduel 0. 172 042 58 par chacun des termes de ladiagonale principale
dela matrice inverse.
Les coefficients
03BB2, 03BB3, 03BB4
sont hautementsignificatifs.
Par contre03BB1
n’est passignificativement
différent de0,
et onpourrait
ne pas re- tenir leparamètre A + 03B11 P’
dans le calcul de la fonctiondiscriminante,
et
envisager
de recommencer les calculs en ne considérant que les 3paramètres 03B12 P’ ; f"
et P.Cependant
comme le coefficientde A + 03B11 P’
serévèle le
plus significatif
dans la discrimination entre calculs et cancers, ilparaît préférable
d’avoir les mêmesparamètres
dans les deux fonc- tions discriminantes.Variance de y, à l’intérieur des familles
En
désignant
parall a12 a13 al4, a22 a23 a24 a33 , a34, a44
les termesde la matrice des sommes des carrés et
produits
centrés à l’intérieur des familles(Tableau II)
on établit que la somme des carrés centrés de y à l’intérieur des familles a pourexpression :
Tous calculs faits on trouve :
d’où estimation var
y1 =
10.
195
= 0. 055 118 795et
On
peut
obtenir la variance deYI
à l’intérieur des familles d’une manièreplus rapide,
etqui permet
dans une certaine mesure une véri- fication de l’exactitude des calculs.Désignons
par R le coefficient de corrélation entre t ety.
La dé-composition
en carrés du tableau VI s’écrit :d’où :
et
On
peut décomposer
la somme des carrés03A3(y1 - y1)2
autour de lamoyenne
générale
en deux termes : l’un dû à larégression
parrapport
à t
[= R2 03A3(y1 - y1)2],
et le résidu = somme des carrés à l’intérieur des familles[=(1 -R’) 03A3(y1 - y1)2].
La somme des carrés à l’intérieur des familles à donc pour ex-
pres s ion :
On retrouve la valeur calculée directement
plus
haut.Discrimination effectuée par y1 - Les valeurs moyennes de y1 au sein des deux familles sont :
l Hépatites
= -1.516 55037,
Calculs-Cancers = -1.841 935La différence est
égale
à 0. 325385,
soit 1. 385 95écarts-types.
On remarque que la différence des valeurs moyennes a la même valeur
numérique
queR2 (0.
325385).
Ce faitprovient
du choix des va-leurs de
tl
ett2.
2ème exemple - Plusieurs familles
dépendant
de 2paramètres.
Centresalignés.
Es t im at i on du nom bre de capes de cigares que l’on peu t t i re r d’une
feuille
de tabac, connaissant salonéueur
et salaréeur.
La confection des
cigares
estmécanique,
l’ouvrièreprésente
lafeuille de tabac sur un
gabarit
dedécoupe.
La machine coupe donc uneportion
de feuilleappelée
capequi
atoujours
la mêmeforme,
les mêmesdimensions,
et enroule cette cape autour ducigare
pour lui donner sonaspect
définitif.Pour estimer le nombre de capes que l’on
peut
tirer d’un lot detabac,
onpeut
utiliser l’essai surmachine,
ou l’essai augabarit
en Laboratoire. Ce dernier consiste à dénombrer à l’aide de morceaux de cartonayant
la forme dugabarit
dedécoupe
le nombre de capes réa- lisable.Il
paraît
bon de mettre à ladisposition
del’Ingénieur
et de laMaîtrise une
règle simple, rapide, permettant
de contrôler le travail effectué aussi bien sur machinequ’au
Laboratoire. Comme l’essai enLaboratoire donne
également
lalongueur
L et lalargeur
1 desfeuilles,
nous avons déterminé le nombre de capes que l’on peut tirer d’une
feuille
connai ssant sa longueur et sa
largeur.
Les mesures ont
porté
sur 950 feuilles. Leurrépartition
entre les différentes familles ainsi que les valeurs moyennes observées sont indi-quées
dans le tableau Ici-après :
Tableau I Valeurs
moyennes
L’examen des valeurs moyennes montre
qu’on
est en droit de con-sidérer les centres comme
alignés,
ainsiqu’en
fait foi legraphique
ci-dessous :
Somme des carrés et
produits
centrésLa matrice des sommes des carrés et
produits
centrés est donc :Tableau II
Matrice des sommes des carrés et
produits centrés
944degrés
de libertéDésignons
par c le nombre de capes que l’onpeut
tirer d’une feuille. Le caractèrequi distingue
les familles(c)
est ici mesurable.Le
paramètre
cjoue
le rôle duparamètre
t de la théoriegénérale.
D’où le tableau III.
Tableau III
Matrice des termes de
régression
1
degré
de libertéEn
ajoutant
les matrices des Tableaux II etIII,
nous obtenons la matrice du TableauIV, appelée
Matrice des sommes des carrés et pro- duits centrés autour de la moyennegénérale,
mais il convient de ne pas oublier que l’on suppose avoir ramené les centres des différentes fa- millesrigoureusement
sur la droite estimée des centres.Tableau IV
Matrice des sommes des carrés et
produits centrés
autour de la moyennegénérale
945
degrés
de libertéDésignons par A
la valeur du déterminant formé par les termes de cette matrice.La matrice inverse est :
Tableau V Matrice inverse
10-6
d’où
Test des coefficients À :
Décomposons
la somme des carrés03A3(c - c)2 =
3 417. 079qui dépend
de 945
degrés
de liberté(et
non pas949)
en deuxparties,
l’une cor-respondant
à larégression
parrapport
à L et 1(2 degrés
deliberté),
l’autre étant le résidu
dépendant
de 943degrés
de liberté.Le terme
correspondant
à larégression
s’obtient par :Le tableau
d’analyse
de la variance est donc :Tableau VI
Analyse
de la varianceLa variance de
À-1
s’obtient enmultipliant
le carré moyen du ré- sidu par le termecorrespondant
àL2 dans
la matrice inverse, soit dans le casprésent :
Les
valeurs 03BB1
etÀ2
observées sont donc trèssignificatives.
Calculons maintenant les coefficients
03BB1 03BB2
en ne tenantcompte
que des familles à2, 4,
6 et 8 capes. Il estplus logique
de ne tenircompte
que de cesfamilles, puisque
en voulant déduire le nombre de capes de la seule connaissance de lalongueur
et de lalargeur,
il estnormal de supposer la feuille
symétrique.
D’autrepart, l’alignement
des centres de ces 4 familles est meilleur que celui de tous les centres et les
produits
centrés sontpositifs
pour ces familles alorsqu’ils
sontnégatifs
pour les familles à 3 et 5 capes.Tableau des valeurs moyennes :
Somme des carrés et
produits
centrés :D’où la matrice :
La matrice inverse est
proportionnelle
à :(Il
suffit d’intervertir les termes de ladiagonale principale
et dechanger
lessignes
des termes relatifs àL,1).
Comme
Il vient :
Equation
des droites discriminantes.Pour ce 2ème cas que nous venons de
traiter,
il est tout à faitlogique
deprendre
pour droites discriminantes cellesqui passent
par les milieux dessegments
reliant 2 centresconsécutifs,
bien que l’on n’ait pas observé le même nombre de feuilles à2, 4,
6 et 8 capes, dans le lotétudié,
et que pour les calculs on n’ait pas le même nombre de feuilles danschaque
famille. Larègle
que nous établissons doit être valable pour toutlot,
et l’on doit donner la mêmeimportance
à toutesles familles.
On est ainsi conduit à tracer les droites
(graphique I).
L + 2. 808 1 = 87. 987
séparant
les feuilles à 2 et à 4 capes L + 2. 801 1 = 102. 485séparant
les feuilles à 4 et à 6 capes L + 2. 088 1 = 117.978séparant
les feuilles à 6 et à 8 capesPar
contre,
pour le 1 er cas, où l’on tientcompte
des feuilles à nombreimpair
de capes, il y a lieu de donnerplus d’importance
auxfamilles à
2, 4,
6 et 8 capes. Nous avonschoisi, compte
tenu de la pro-portion
de feuilles à 3 et 5 capes, de tracer des bandes delargeur
dixième des bandes
correspondant
à2, 4,
6 capes. Pourcela,
nous avonstracé sur le