R EVUE DE STATISTIQUE APPLIQUÉE
E. M ORICE
Confection, biométrie et statistique
Revue de statistique appliquée, tome 8, n
o3 (1960), p. 87-94
<
http://www.numdam.org/item?id=RSA_1960__8_3_87_0>
© Société française de statistique, 1960, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (
http://www.sfds.asso.fr/publicat/rsa.htm
) implique l’accord avec les conditions générales d’uti- lisation (
http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
CONFECTION, BIOMÉTRIE ET STATISTIQUE
E.
MORICE
Inspecteur
Général àl’Institut National
de laStatistique
et desÉtudes Économiques
Au cours des
vingt
dernièresannées,
diverses études ont étéfaites
(aux Etats-Unis sur unetrès
vasteéchelle,
etplus
récem-ment en Hollande) pour déterminer à
partir
de mesuresprécises ,
des"standards" de
confection
correspondant au mieux aux dimensions moy- ennes de lapopulation à laquelle
ces vêtements étaient destinés.La
réalisation,
en France, d’uneenquête analogue
avait été étu- diée dès le début de 1947 : .’ une "Commission Nationale des Mensura- ttons du corps humain",groupant
desreprésentants
du Centre d’EtudesTechniques
desIndustries
del’Habillement,
et desprincipales
mai-sons de
con fection
masculine en grandesérie, ainsi
que des biométri- ciens et des statisticiens, avait établi unprojet d’enquête
dont laréalisation avai t
dû être différée faute
de moyens matérielssuffi-
sants.
Cette étude a été
reprise
et réalisée en1959pourla confection féminine
par le Centre d’Etudes Techniques des Industries de 1 ’Habi 1- lement avec la collaboration du Centre de Formation auxApplications
Industrielles de laStatistique (voir
articleH.Férignac, ci-après).
Etude rationnelle de la confection
Etant donnée la
nécessité,
aupoint
de vueéconomique,
de limiter de ma-nière
acceptable ie
nombre de tailles confectionnées ensérie,
leproblème
es-sentiel consiste donc à déterminer
quelles sont, parmi
les différentes mesures(longueurs, périmètres, poids) auxquelles peut
donner lieu le corpshumain,
celles
(en petit nombre,
deux ou trois aumaximum) qui
décrivent le mieux tou- tes lesautres,
c’est-à-dire àpartir desquelles
onpeut espérer
estimer les au-tres avec le minimum de
dispersion résiduelle.
Ces mesures
ayant
étédéfinies,
au nombre de deux parexemple,
a etb,
Jet un certain nombre de classes
ayant
été choisi pour chacune d’elles de manière à définir des intervalles considérés commeacceptables,
on détermine ainsi uncertain nombre de cases, chacune
correspondant
à un"patron"
de confectiondont toutes les dimensions
peuvent
être estimées àpartir
de(a:, b; ) par les équations
derégression
déduites de l’ensemble des observations.Au
point
de vuestatistique,
ils’agit
donc :1 /
d’unproblème d’échantillonnage :
des considérationspratiques,
finan-cières ou
autres, limitant,
engénéral,
assezrapidement
l’effectif soumis auxmensurations
(notons
enpassant qu’aux Etats-Unis, l’enquête organisée
en 1936par le
"U.
S.Department
ofAgriculture"
et la"Works Progress Administration"
et réalisée de février 1937 à
juin
1939 dans seizeEtats,
avaitporté
sur 76 744garçons et 70 344 filles de 4 à 17 ans.
2/
d’unproblème d’observation,
c’est-à-dire ici de mensurations dont il fautsouligner
toutel’importance,
nécessitant la formation d’un corpsd’enquê- teurs, capables
de définir d’une manièreprécise
lesrepères
limitant les men-surations
prises
ou fixant uneposition
et utilisant de la même manière les mê-mes instruments de mesure.
3/ après
ledépouillement,
vient leproblème d’analyse statistique :
étudedes distributions
observées,
calculs de corrélations et enfin leproblème spéci- fique p~sé ci-dessus,
c’est-à-direl’analyse
de ces corrélations(analyse
facto-rielle),
en vue dedéterminer, parmi
lesmultiples
facteursobservés, quels
sontles
composantes principales
de cetensemble,
les facteurs de groupeexpliquant
au mieux tel ou tel groupe de mesures et dont la
simple
considérationpermet-
tra d’estimer au mieux tous les
autres,
avec uneprécision qu’il
sera utile deconnaître en calculant les variances résiduelles.
Le calcul des coefficients de corrélation est
déjà
assez lourd :(n(n - I)
coefficients à calculer si on a conservé dans l’étude n
mesures),
mais ce calculpeut
être assez facilement réalisé au moyen d’unéquipement mécanographique
de
type
usuel.Reste le
problème d’analyse factorielle proprement
ditqui représente
unemasse considérable de calculs si le nombre n des mesures est
important.
On
peut
schématiser leproblème
de la manière suivante :Supposons
que trois mesuresxl,
x 21x3
suffisent pour dessiner unpatron
(ce qui
n’est évidemment pas lecas),
et proposons-nous de construire des pa- trons entièrement déterminés par une mesure x 1= a 1, les deux autres étant esti- mées àpartir
de celle-là à l’aide deséquations
derégression
déduites de l’en- semble des mesures(Xl’ X2’ x3). Laquelle
de ces trois variables convient-il de choisir comme variablepermettant
d’estimer au mieux les deux autres.Géométriquement,
onpeut
fairecorrespondre,
à chacune des trois mesu- res faites sur un individu de l’échantillonétudié,
unpoint M(xl, x 21 x3).
L’en-semble de ces
points
détermine un nuage(N).
Se donner xi =
al,
c’est couper ce nuage par unplan
Pperpendiculaire
àOxl,
aupoint A,
d’abscisse xi. Le sous-échantillon(xi= a 1) est
alorsrepré-
senté par le nuage
plan LI.
Dans ce nuage, lepatron
estreprésenté
par lepoint
M’(xl, y2, y3 ) y2
ety3
étant les valeurs estimées de x2’x3.
La solution choisie sera d’autant meilleure que le
point
M’ sera moinséloigné
de l’ensemble despoints
M du nuage~1,
ceci étant vrai pour les diffé- rentes valeurs de xi = a ;.Schématiquement,
ceci revient à chercherquelles
sontles sections x constante (i = 1, 2
ou3) qui,
dansl’ensemble,
sont lesplus
con- centrées.Plus généralement,
siparmi
les n variables mesurées x ; ... Xn, on a choisi s variablesexplicatives
xi, x2, ... , Xs, àpartir desquelles
on estimeles t = n - s variables restantes par
ys+1,
... yn, on aura àenvisager
dans l’es-pace à n dimensions les sections du nuage
total,
obtenues enconsidérant
des va-leurs fixées
x 1 = a 1 ... Xs = as
du groupe des variablesexplicatives,
1 c’est-à-dire à étudier les variances résiduelles obtenues en associant les
points
échan-tillons
M(x~ ....
xS...xn)
aupoint M’(XI
... xsys+~ .
...y~ ) correspon-
dant aux valeurs fixées :
xl = al, x2 = a2, ... x S = aS
Il restera ensuite à choisir
parmi
les combinaisonspossibles
de s varia-bles celle pour
laquelle
cette variance résiduelle est !=:1Jffisammentpetite.
Sans entrer dans le détail des
calculs,
on se rendcompte
que ceciexigera
la
manipulation
de nombreuseséquations
derégression,
c’est-à-dire le calcul-
à partir des
corrélationsdéjà
obtenues - de très nombreux coefficients de cor-rélation
partielle
oumultiple
nécessaires pour obtenir et ensuite comparer les variances résiduellescorrespondant
aux différents groupesenvisagés
de s va-riables
descriptives.
Une étude
théorique complète
duproblème
est extrêmementlourde,
sinon matériellement irréalisable.Néanmoins,
dans lapratique
divers éléments peu- vent limiter la masse des calculs.Si on se
place
aupoint
de vue strict duconfectionneur,
il est tout d’abord évident que certaines mesuresbiométriques,
bien quecorrespondant
à des par- ties du corps couvertes par le vêtement sontpratiquement
sans intérêt.D’autre
part,
leproblème
nepeut
avoir de solutionpratiquement
utilisa-ble que si s est
petit (2
ou 3 parexemple), sinon,
on serait conduit à un nombretrop grand
depatrons différents,
satisfaisantspeut-être
dupoint
de vue del’ajus- tement,
maiséconomiquement
sans intérêt dupoint
de vue du confectionneur.Il y a lieu aussi de tenir
compte
des résultatsacquis
parl’expérience
delongues années,
du fait que certaines mesuresqui peuvent paraître théorique-
ment intéressantes à
partir
d’un échantillon de mesuressoigneusement
étudiésont,
dans lapratique courante, trop
difficiles à obtenir defaçon précise
avec lematériel couramment
employé.
Enfin,
il faut noter que le schéma utilisé aura unpouvoir
de discrimina- tion d’autantplus grand
que les variablesexplicatives
retenues auront unchamp
de variation
plus large.
Cependant,
même en tenantcompte
de ceséléments,
il restera un nombreappréciable
de variablesexplicatives auxquelles
il conviendraitthéoriquement d’appliquer
les méthodes del’analyse factorielle,
seulescapables
de donner unesolution absolument correcte du
problème.
Une méthode
graphique
fortsimple, inspirée
desprofils psychologiques
utilisés en
psychotechnique,
sembledevoir jeter quelque
lumière sur leproblème envisagé.
Considérons pour
chaque
individu un certain nombre degrandeurs A, B, ... , K, L,
caractérisées par leurs mesures a,b,... k, 1,
et soient cal- culés les coefficients de corrélation :ra b ’
>r ac’
... ,rb~ ,
... ,rki
Portons sur l’axe des
abscisses,
à intervalleségaux (en principe
dans unordre
quelconque),
lespoints A, I3, ... , K, L, représentatifs
desgrandeurs considérées,
ettraçons
pour chacune de cesgrandeurs
laligne polygonale
re-présentative
des variations du coefficient de corrélation de l’une de cesgran-’
deurs,
F parexemple,
avec toutes les autres.On a évidemment :
rff=
1mais,
pour faciliter lescomparaisons qui
vontsuivre,
iln’y
a pas intérêt à in- clure cepoint
P dans legraphique :
il vautmieux, simplement
pour faciliterl’examen de la
ligne (F), joindre
enpointillé
les deuxpoints
R et Squi
l’enca-drent.
On obtiendra ainsi un réseau
plus
ou moins entrelacé delignes polygonales (A), (B),..., (L).
Si toutes les variables étudiées
jouent chacune,
dansl’explication globale
du
phénomène étudié,
un rôle individuel sans lien avec lesautres,
legraphique
se
présentera
comme un treillis indéchiffrable. Mais ilpeut
arriver que certai-nes
grandeurs F, D, A,
parexemple, jouent
chacune des rôlescomparables
dansla
description (ou
l’estimation desautres).
Dans ce cas, lesgraphiques (F),.(D), (A) ;
seprésenteront
comme deslignes polygonales ayant
sensiblement la mêmeforme.
Si de
plus,
l’une d’entre elles(F),
parexemple,
tend à seplacer systéma- tiquement
au-dessus du réseaupartiel
ainsidéterminé,
cela voudra dire que siF, D,
A fournissent desexplications
relativementcomparables
del’ensemble , l’explication (l’estimation)
fournie par(F)
est meilleure que les autres.En un
mot,
pouremployer
lelangage
del’analyse factorielle,
on aura misen évidence un groupe de facteurs
F, D, A,
le facteur Fpouvant
être considérécomme facteur
caractéristique
du groupe.Un
exemple numérique précisera
lasignification
et laportée
duprocédé.
Soient 7
variables, A, B, C, D, E, F, G,
dont les coefficients de corré- lation deux à deux sont donnés par le tableau :PROFIL DE CORRÉLATIONS
On en déduit le
graphique
ci-dessus(fig. 2).
L’examen de ce
graphique
montre l’existence de deux groupes :1 / B, C, E,
F(numéros 6, 5, 4, 7)
2.
A, D,
G(numéros 1, 2, 3)..
Dans le
premier
groupe, lespoints
dugraphique
Fsont,
engénéral
au-dessus des
autres,
tandis que dans le deuxième groupe cesont,
engénéral,
lespoints
A.Si l’on se propose de décrire l’ensemble des 7
variables, A, B, C, D, E, F, G,
à l’aide de deux d’entreelles,
ce sont manifestement les deux variables A et Fqu’il
conviendra de choisir pour servir de base à l’estimation des autres.Les 7 variables considérées dans
l’exemple
ci-dessus sontsept
caracté-ristiques biométriques
mesurées sur 3329 jeunes
filles américaines de 16ans ( 1 ) ,
ces mesures étant classées ci-dessous dans un ordre absolument arbitraire
sans se soucier des liaisons que leur
signification physique
aurait pusuggérer
à l’avance : A : Taille
B : Périmètre vertical du tronc
(épaule, entrejambes)
C : Tour de hanches D : Hauteur des hanches
E : Tour de
poitrine (aisselles)
F : Poids
G :
Longueur
totalepostérieure
du bras.Les deux groupes mis en évidence par cette
analyse graphique
que l’onpourrait appeler profil
de corrélation sont donc : I - LE GROUPE DES LONGUEURS -1/ATaille
2 /
D Hauteur des hanches3/
GLongueur
totalepostérieure
du brasII - LE GROUPE DES PERIMETRES
AUQUEL
S’AJOUTE LA VARIABLE POIDS4/
E Tour depoitrine 5 /
C Tour de hanches6/
B Périmètre vertical du tronc7/
F Poids.En ce
qui
concerne lepartage
entrelongueurs simples
etpérimètres,
onpouvait
évidemments’y
attendre encore que certaines idéessimples
conçues apriori peuvent quelquefois
se trouver contredites par les observations.Mais de
plus
legraphique
montre :---
(1)
"Body
measurement of american boys andgirls" -
USA - Dept. ofagriculture -
N° 366 - July 1941.1 / Que
lepoids
secomporte -
en tant que variableexplicative -
tout à faitcomme les
périmètres
et pas du tout comme leslongueurs.
2/ Que
si l’on considère deux groupes defacteurs,
les deux meilleures variablesexplicatives sont,
d’unepart,
la taille et lepoids (chose
àlaquelle
onn’aurait vraisemblablement pas
pensé
apriori).
3/
Et que si l’on admet que les six mesures numérotées de 1 à 6 suffisent à définir unpatron,
la meilleure estimation des dimensions2, 3, 4, 5
et6,
c’est- à-dire(d,
g,e, c, b)
se ferait àpartir d’équations
d’estimations(ou
derégression)
de la
forme :
Pour une
jeune
fille du groupeconsidéré,
la détermination du"patron"
luiconvenant le mieux serait
simplement
basée sur la connaissance de sa taille et de sonpoids.
Il est évident que
les
dimensions nécessaires pour dessiner unpatron
- variables d’ailleurs avec le
type
de vêtement - ne sont pas cellesqui figurent dans l’exemple ci-dessus,
mais les résultatsacquis
pour des dimensions carac-téristiques
du corps humain restent valables pour celles des éléments de surfa-ces
développables
que le confectionneur veutappliquer
sur ce corps.Ce sont là les résultats - valables d’ailleurs pour tout le groupe
d’âge
de6 à 17 ans -
auxquels
a conduitl’enquête
américaine citéeci-dessus, après
delaborieux calculs
d’analyse
factorielle basés sur la méthode de recherche descomposantes principales proposée
parHotelling,
en1933 ( 1).
Seules,
les considérations d’ordrepsychologique (il
estpeut-être trop
inha-bituel de demander à
une jeune
fillequel
est sonpoids quand
on sepréoccupe
sim-plement
de lavêtir),
ont conduit les confectionneurs américains à baser leur série de confection féminine sur la taille et le tour dehanches,
cette dernière mesureétant, après
lepoids,
le meilleur facteurdescriptif
du groupe II pour l’ensem- ble de lapopulation
étudiée(6
à 17ans), après
élimination dupérimètre
verticaldu
tronc,
de mesure difficile à réaliser dans les conditions habituelles(sujet habillé).
---
(1) H. Hotelling - Analysis of a complex of Statistical variables into Principal Components - Journal Ed. Psychol. 1933.