R EVUE DE STATISTIQUE APPLIQUÉE
J. T ORRENS -I BERN
Analyse factorielle des sables de moulage
Revue de statistique appliquée, tome 6, n
o3 (1958), p. 93-114
<
http://www.numdam.org/item?id=RSA_1958__6_3_93_0>
© Société française de statistique, 1958, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (
http://www.sfds.asso.fr/publicat/rsa.htm
) implique l’accord avec les conditions générales d’uti- lisation (
http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme
ANALYSE FACTORIELLE DES SABLES DE MOULAGE
par
J. TORRENS-IBERN
Ingénieur à lEntreprise " Suner, S. A. " de Sabadell (Barcelona)
Professeur de Statistique
àl’Ecole d’Ingénieurs Industriels de Barcelone
Après
avoirfait
ses preuves dans les étudespsychologiques, l’Analyse
Factorielle est deplus
enplus employée
dans l’étude deproblèmes
très variés où interviennent de nombreusesvariabtes;c’est
lecasdans l’industrie où de nombreux
produits
sont- utilisés à cause despropriétés multiples
dont ilsjouissent; l’Analyse
Factorielle est donc trèsappropriée
à leur étude.L’étude
qui
suit est uneapplication des techniques de
l’Ana-lyse
Factorielle à unproblème
industrielparticulièrement
intéres- sant, compte tenu del’importance
de lafonderie
dans l’industriemétallurgique
etmécanique.
Les résultats en sont donnésaprès
unexposé
desprincipes
essentiels des méthodes.Cette étude a été
présentée
dans la séanceinaugurale
du Sé- minaire deStatistique Appliquée
de l’Ecoled’Ingénieurs Industriels
e t de l’Inst i tut d’Economie de
l’Entreprise de Barce lone,
sous lapré-
sidence du sous-directeur et
chef
des études del’Ecole,
M. FREIXA, devant unpublic
très intéressé.LES SABLES DE
MOULAGE;
LEURS PROPRIETES ET LEUR CONTROLE - Laqualité
etl’aspect
despièces
couléesdépendent
dans unelarge
mesuredes sables de
moulage employés.
Ceux-ci sont essentiellementcomposés
de pe- titsgrains
dequartz,
de0,2 à 0,3
mm de grosseur, etd’argile,
de0, 1
mm.Les
premiers
sont recouverts par une coucheargileuse qui
leur donnecohésion;
l’argile gonfle
par suite del’humidité,
defaçon
que lemélange
devienneplus
oumoins
plastique.
Les
propriétés
fondamentales des sables demoulage
sont très variées :plasticité, consistance, perméabilité
auxgaz,réfractibilité,
etc... Cesproprié-
tés sont le résultat de
l’opération appelée préparation
dusable, laquelle
a lieudans des machines
adéquates produisant
sonparfait mélange,
sonmalaxage
oupétrissage
et son aération parcentrifugation.
Lemélange
doit êtrespongieux
ethomogène,
libre de matièresétranges,
notamment du calcium.Pour l’achat et le
mélange
des sables destinés aumoulage
l’ons’appuyait jadis
sur lesappréciations empiriques
des contremaitres fondeurs etmouleurs, lesquels
se rendaientcompte
despropriétés
du sable en enprenant
unepoignée
et la serrant entre leurs
doigts.
Aprésent
la décision estprise
à la suite du con-trôle réalisé au laboratoire des
principales caractéristiques physiques : perméa-
bilité aux gaz, résistance à lacompression
et aucisaillement, proportion d’agglo- mérant,
résistance aufeu,
teneur en eau, grosseur dugrain, degré
de serrage, etc...Une
partie
de cespropriétés
n’a besoin d’être contrôléequ’au moment de
l’achat du
sable, pour
se rendrecompte
immédiatement de sesqualités
intrin-sèques (granulométrie)
tandisqu’il
y a intérêt à déterminer les autres caracté-ristiques journellement après
lapréparation
du sable et avant sonemploi
aumoulage.
Celles-ci sontprincipalement :
la teneur en eau, ledegré
de serrageadmis,
laperméabilité
aux gaz et la résistance à lacompression
et au cisaille-ment.
Périodiquement,
une ouplusieurs
fois parjour,
onprend
des échantillonsdu sable préparé
et on mesure cescaractéristiques
à l’aided ’appareils appropriés.
I - ETUDE
STATISTIQUE
DESCARACTERISTIQUES PHYSIQUES
DES SABLESDE MOULAGE -
En
partant
desexpériences
du contrôlejournalier
des sables demoulage
réalisées normalement dans une fonderie
mixte,
d’acier et defonte,
nous avonsrecueilli 749 résultats
parmi lesquels
364appartenaient
à des sables destinés aumoulage
de l’acier et 38 5 à des sables pour lemoulage
de la fonte. Les différences constatées entre les sables- destinés àchaque alliage
sont dues à la différence decomposition
des deuxmélanges,
defaçon qu’ils
nepourraient
pas être con- sidérés comme des échantillonsappartenant
à une mêmepopulation statistique,
même si les moyennes de certaines
caractéristiques physiques
des deux sablespouvaient
n’être passignificativement
différentes.La totalité des
expériences peut
être résumée selon le tableau I.Tableau I
Avant de calculer les corrélations entre ces
variables,
nous avons tracédes
histogrammes correspondants
afin d’avoir une idée de leurs distributionssans besoin de
longs
calculs(Fig. 1 à 5).
A la vue de ceshistogrammes
onpeut
admettre que les distributions considérées
sont,
engénéral,
unimodales etqu’ elles
appartiennent
à despopulations
sensiblement normales.Cependant,
certainescaractéristiques
sont assezéloignées
de cettepropriété,
sans doute en raisondu manque
d’homogénéité
des sablesacquis
ou bien des insuffisances dumélange ou
de lapréparation.
Cela seproduit
toutspécialement
en cequi
concerne laperméabilité
aux gaz, surtout dans les sables pour lafonte,
danslesquels
ontrouve deux
modes,
l’un pour les valeurscomprises
entre25,125
et35,125
etl’autre pour les valeurs
comprises
entre75,125
et85,125.
Ledegré
de serrage,par contre,
se trouve distribué en un nombre très réduit desclasses, lesquelles , correspondent
aux mesures directement fournies parl’appareil
nepeuvent
pas êtresous-divisées; ainsi,
cettecaractéristique
doit être considérée comme peuprécise
pour notre propos,qui
n’était autre que l’étude desrapports statistiques
entre les diverses
épreuves
de contrôle des sables demoulage.
Nous avons calculé ensuite les corrélations mutuelles
qui
lient ces carac-téristiques physiques
des sables.Certaines, parmi elles,
sont trèsélevées,
comme l’on
pouvait déjà prévoir,
les essais de résistance au cisaillement et à lacompression,
notamment. Le tableau II donne des coefficients d’intercorré- lation despropriétés physiques
contrôléespour les
sables destinés aumoulage
de l’acier.
Tableau II
Sables pour le
moulage
de l’acierIl faut remarquer que
d’après
les études faites parplusieurs expérimen-
tateurs la liaison
stochastique
entre la teneur en eau(humidité)
et la résistanceà la
compression
n’est paslinéaire;
la courbe deregression
est d’abord ascen-dante et descend
ensuite, présentant
un maximum pour un certaindegré
d’hu-midité
(Fig. 6)(1).
Les chiffresantérieurs, cependant, correspondent
à un in-tervalle des valeurs de la teneur en eau pour
lesquelles
la résistance à la com-pression
décroîtlorsque
l’humiditéaugmente,
cequi
est confirmé par lesigne
du coefficient de corrélation.
Par contre,
notre étude est en contrediction avec legraphique
de lafigure 6,
en cequi
concerne la diminution de laperméabilité lorsque
la teneur en eaucro1t, puisque
nous avons trouvé une corrélation assez élevée etpositive
entreces deux variables. Entre le
degré
de serrage et toutes les autres variables la corrélation est trèspetite ;
ellepeut
être considérée commenulle, compte
te-nu des fluctuations
d’échantillonnage.
L’étude relative aux sables de
moulage
destinés à la fonte apermis
dedresser le tableau III des coefficients de corrélation.
(1) "La préparation des sables de
moulage". Supplément
au ri 76 (Avril-Mai 1956) du "Journal d’Informationtechniques
des Industries de la Fonderie".Tableau III
Sables pour le
moulage
de la fonteLe manque
d’homogénéité
décelé au moyen del’histogramme de la figure
4 dans les sables de
moulage
pour lafonte, objet
de cetteétude,
recommande deséparer pour une analyse plus précise
de cessables,
les observations dans les-quelles les
chiffres de laperméabilité
sontsupérieurs
à65,
125. Une fois élimi- nées ces données le nombre des observations se réduit à335,
mais l’ensembleest
plus homogène.
Dans lesfigures
1 à 4(moitié gauche)
sontreprésentés
ceseffectifs
plus
réduits au moyen deslignes
à traitcontinu,
celles à trait inter- rompu étant lareprésentation
des effectifscomplets;
les tableaux I et III subis- sent alors les modifications que voici(Tableau IV) :
Tableau IV
Sables pour le
moulage
de la fonteCette fois nous n’avons pas calculé les valeurs relatives au
degré
de ser-rage à cause
de leursignification
siréduite,
cequi
est évident si l’on remarque lapetite dispersion
de leurs valeurs et les corrélations presque nullesqui
leslient avec toutes les autres
propriétés physiques.
L’ensemble des coefficients de corrélation totaux pour les sables de mou-
lage
de la fonte est donc moinsinstructif,
dupoint
de vuestatistique,
que celui des sables demoulage.pour l’acier, puisqu’ily a beaucoup
de coefficients de cor-rélation qui ne
sont passignificativement
différents de 0. L’étude factorielle quenous
entreprendrons
seralimitée,
parconséquent,
aux sables demoulage
desti-nés aux
pièces
d’acier.2 - ANALYSE FACTORIELLE : ORIGINE ET IDEES GENERALES -
En
quoi
consistel’analyse
factorielle? Pour encomprendre
mieux l’es- sence, il sera bon d’en exposerl’origine.
Si nous laissons de côté certains essais
possibles
nonsystématiques
dedescription
factorielleentrepris
parplusieurs statisticiens,
la vraiepaternité
deces méthodes doit être attribuée à
SPEARMAN, psychologue anglais
du début dece
siècle(1).
Se rendantcompte
de la corrélationpositive
élevée existante entreles résultats des tests
psychologiques
etpsychotechniques appliqués
dans lesépreuves
d’orientationprofessionnelle,
il a établi la théorie de l’existence d’un certain facteurqui
serait la cause de ces corrélations. Cefacteur, appelé
par SPEARMANfacteurgénéral,
serait variable d’un individu à un autre et caracté-ristique
de chacun.L’analyse
factorielle a commeobjet
son estimation au moyen des corrélations constatées entre les résultats des tests.Voyons
d’abord un peu comment seprésente
leproblème
dupoint
de vuedu
psychotechnicien.
D ans l’étude des individus parrapport
à leurs activités pro-fessionnelles,
il semble que le succès ou l’échec de celles-cipuissent provenir
de la
possession
ou non de certainesqualités. Lorsqu’on soumet les
candidats à unposte
à des testspsychotechniques,
cequi
nous intéresse réellement ce n’est pas de connaître lespoints
obtenus dans lestests,
mais de connaître ce que la réalisation des testssignifie
parrapport
aux individus examinés et au métier choisi. D’unepart chaque
test ne donne pas la mesurejuste
d’uneaptitude
pro- fessionnelle à son état pur; d’autrepart
nous ne connaissons pas exactement lesaptitudes
propres àchaque
métier.Un test, en outre,
s’il est bon pour détecter unecertaine
aptitude,
étendra aussi sonpouvoir
de détection sur une surfaceplus
oumoins
grande correspondant
à desaptitudes voisines;
il ne sera donc pas éton- nantqu’il
existe des corrélations élevées entre des tests s’adressant à desaptitudes
voisines. Cette doubleimprécision
de lasignification
dechaque
test et des
aptitudes
reconnues nécessaires pour exercer efficacementunmé-tier, permet
decomprendre
que l’onpuisse
attribuer à certains facteurs in- dividuels cequi produit
la coïncidence des deux schémas. Il n’est pasnéces- saire, d’ailleurs,
que ces facteurs aient un vrai caractèreobjectif; SPEARMAN,
par
exemple, essayait
de définir son facteur g d’une batterie de tests d’unefaçon purement mathématique
afin que l’on ne soit pas tenté de l’identifier à l’intelli- gence.Mais,
iln’y
a pas de doute que les cas lesplus intéressants,
aupoint
devue des
applications pratiques industrielles,
seront ceux danslesquels
les fac-teurs auront une
interprétation physique
ou, tout au moinsobjective.
3 - LES PROBLEMES DE L’ANALYSE
FACTORIELLE;
LEUR FORMULATIONMATHEMATIQUE -
Le
problème qu’il s’agit
de résoudrepeut
être formuléschématiquement
comme une tentative de
décomposition
et de transformationd’ungroupe
de varia-bles enun autre
groupe plus réduit,
dont la réalitéphysique peut
être moins bien définie maisqui,
enrevanche,
a unesignification
transcendantesupérieure.
Danssa forme la
plus générale
onpeut
proposer lesystème d’équations
suivant :dans
lequelxj
est une des variables mesuréesexpérimentalement
etfl , f2 , ....
fm, Uj’
les facteurs que l’on considère commeagissant
dans la réalisation duphénomène étudié, bienque, engénéral,
ils nepuissent
être calculés ni mesurésdirectement. La forme la
plus simple
que l’onpeut
attribuer auxéquations
dusystème précédent
est la formelinéaire,
c’est-à-dire que :(1) SPEARMAN
(C.) "GeneralIntelligence objectively
determined and measured". "Amer.Journ. of
Psychology",
1904, v. 15,p.201-293.
Du
point
de vue de la théoriemathématique,
cette limitation à la linéaritépeut paraître
trèsrestrictive,
mais dans lapratique
elle ne l’est vraiment pas,puisque
lamajorité
desphénomènes peuvent
êtreétudiés,
au moins enpremière approximation,
comme résultant d’ une liaison linéaire de facteurshypothétiques,
ce
qui
facilite considérablement lescalculs,
sans rien ôter àl’analyse
de sonintérêt
pratique.
Si les variables xj et les facteurs
fi
sont centrés et réduits(c’est-à-dire
ont une moyenne nulle et un écart
type unité),
la valeur moyenne du carré des variables x sera :Dans le cas où tous les facteurs seraient
orthogonaux (sans
corrélation entreeux)
laparenthèse
s’annule et il reste seule la somme des carrés des coefficientsaj i
,aj.
Le derniercarré, a2j’ constitue
l’unicité et la somme de tous les au- tres la communauté de chacune des variablesexpérimentales :
Le
produit
de chacune deséquations
antérieures par les facteurshypothé- tiques
considérés donne un autresystème d’équations, duquel
on calcule aussiles valeurs moyennes :
Cette
équation
se réduit à :lorsque
les facteurs sontorthogonaux.
Si maintenant nous calculons les valeurs moyennes des
produits
deséqua-
tions du
système, prises
deux pardeux,
nous aurons :Dans chacune de ces
équations
les termes affectés par un coefficient de corrélationpeuvent
aussi êtrenuls,
si les facteurscorrespondants
sont consi-dérés comme sans corrélation. Alors :
L’on
peut
comparer les coefficients de corrélationthéoriques r’jk
obtenusau moyen de ces
équations
et les coefficientsexpérimentaux rjk
déterminés an-térieurement. Par différence on trouve les corrélations résiduelles :
L’analyse
factorielle d’un ensemble de variablespeut
êtreenvisagée
aussicomme une
décomposition
et transformation vectorielle dans un espace multi- dimensionnel. Lareprésentation
des variablesexpérimentales
étant faite danscet espace, avec autant de dimensions que de
variables,
l’on passe à un autre espace,d’unplus petit
nombre dedimensions,
enprojetant
lespoints
dupremier
dans le second. Lepremier
espace est celui des variables outests,
tandis que le second estl’espace
factoriel. Pour faciliter lacompréhension
de cettefaçon de procéder nous
supposerons que l’ensemble des variables considéréespeut
êtrerésumé enun seulfacteur commun et un facteur
spécifique
pourchaque variable ,
tous sans corrélation mutuelle. A
chaque
variablecorrespondra
unplan,
déter-miné par l’axe du facteur
commune (Fig.7)
et l’axe du facteurspécifique uj .
L’ensemble des variables sera constitué par tous cesplans, qui
ont un axe com-mun, mais
qui
sontorthogonaux
parce que les axes des facteursspécifiques
sontperpendiculaires
entre eux. Lafigure
7représente
deux variablesqui
ont un fac-teur commun; elles se
décomposent
en deuxfacteurs, f 0
etuj , perpendiculaires
entre eux et avec tous les autres.
Onpourra
encorereprésenter
dans notre espace normal à troisdimensions,
le cas d’une variable
qui
sedécompose
en deux facteurs communs et un facteurspécifique (Fig. 8),
maischaque
variableoccuperait
toutl’espace.
Leplan fl f2
serait commun à toutes les variables et les troisièmes axes,
correspondants
auxfacteurs
spécifiques,
seraientorthogonaux
entre eux et sortiraient del’espace représenté
dans lafigure
pour toutes les variables autres que xj .Le même
problème
del’analyse
factoriellepeut
être considéré d’un autrepoint de vue mathématique,
tout aussi intéressant: celui del’algèbre
matricielle.Au moyen de cette notation le
système d’équations (3.7) s’exprime : (3,9)
Considérons,
d’autrepart,
la matrice de l’ensemble de toutes les variables :Multiplions
ces deux matrices entre elles et divisons leproduit
par N :On démontre que les coordonnées de n
points
contenus dans un espace li- néaire à m dimensions(autrement dit, lorsque
les vecteurs de ces npoints
peu- vent être décritsanalytiquement
en fonction linéaire de m vecteursparallèles
aux axes de
l’espace considéré)
constituent une matrice de rangm( 1)
et que son rang reste le mêmequand
elle estmultipliée
par sa matricetransposée.
Si l’on compare les matrices des corrélations
expérimentales rjk
avec celles des corrélations que nous avonsappelées théoriques r’ jk
, on voit que les valeursexpérimentales x.k peuvent s’exprimer
en fonction linéaire de m + nfacteurs,
tandis que lesvaleurs théoriques x’ij
que l’on obtiendrait àpartir
descorrélations r’jk s’expriment
en fonction linéaire de m facteurs seulement.Ainsi ,
(1) Une matrice est
appelée de rang
m lorsque tous les mineurs d’ordre m + 1 sont nuls, mais pas ceux d’ordre m.les
matrices ~xij~ et Il r. 111
sont nonsingulières
c’est-à-dire différentes de0,
et lesmatrices IIx: j 1 I
et~r’ij~
sont de rang m, c’est-à-dire que dans celles-ci tous lesmineurs
d’ordrem
+ 1 sont nuls.Ces considérations
permettent
decomprendre
comment l’onpeut
déterminerle nombre des facteurs communs d’un groupe
quelconque
de variables données.Il
suffit,
tout au moins enthéorie,
de construire la matrice des corrélationsthéoriques,
sans oublier les communautéscorrespondantes
dans ladiagonale principale,
et d’étudierquel
est son rang; le nombre des facteurs communsest,
en
effet, égal
au chiffre de ce rang.Pratiquement,
à laplace
de la matrice descorrélations
théoriques
onprend
la matrice des corrélationsexpérimentales
etl’on détermine les communautés de
façon
que le rang de la matrice résultante soit minimum.4 - DIVERSES METHODES D’ANALYSE FACTORIELLE : THEORIE DES DEUX
FACTEURS;
ANALYSEBIFACTORIELLE;
ANALYSEMULTIFACTORIELLE;
COMPOSANTES PRINCIPALES -
Le nombre de facteurs communs nécessaires et suffisants pour décrire un
ensemble de variables donné est donc
égal
au rang de la matrice des coefficients de corrélationexpérimentaux, complétée
avec les communautés dans ladiagona-
le
principale.
SPEARMAN dans
l’application
del’analyse
factorielle àl’expérimentation psychotechnique
suppose que tous les tests que l’onpeut
faire subir à un groupe d’individus définissent un seul facteurgénéral
g, commun à tous lestests,
et un facteurspécifique
propre àchaque
test. Dans ces conditions la matrice des cor-rélations serait de rang
1,
c’est-à-dire que si les tests sontplacés
dans un cer-tain ordre
(ordre hiérarchique)
leslignes
et les colonnes de la matricesuivent,
à peu
près,
une loi deproportionnalité.
En choisissant tous les mineurspossi-
bles d’ordre 2 et en les
annulant,
nous aurons :SPEARMAN
exprime
cettepropriété
de ces matricesen disant que
les dif-férences tétrades s’annulent. Le même théorème
permet
d’écrire la suite sui- vanted’égalités
oùchaque
membre est uneexpression
différente etéquivalente
de la même communauté.
Il y a donc
plusieurs
méthodes pour vérifier si dans la réalisation d’unphénomène agit
un seul facteur commun :- Etudier la matrice des corrélations pour constater si les coefficients sont ordonnés
hiérarchiquement;
- Déterminer toutes les différences tétrades et étudier leur
distribution,
notamment au
point
de vue de sanormalité;
- Estimer les communautés au moyen de toutes les
expressions possibles
et tester leur
égalité.
Dans tous les cas si l’existence d’un seul facteur commun est
démontrée,
les coefficients de
regression
des facteurs ou saturations sontégaux aux
com-munautés
correspondantes.
Bientôt il est apparu
que l’application simple
de la théorie et la méthoded’analyse développée
par SPEARMAN nepermettait
pasd’expliquer complète-
ment
beaucoup
dephénomènes.
Enpsychotechnique, spécialement,
il y a des tests assezproches,
parexemple
ceuxqui
sont basés sur les diverses mani- festations de lamémoire,
dont laparenté
est trèsgrande;
dans le groupe for- mé par ces tests ilapparait
unfacteur, appelé
facteurde groupe qui
ne se ma--nifeste pas avec les autres
tests,
etqu’il
ne faut pas confondre avec le facteurgénéral,
commun à tous.Si dans l’étude d’un
phénomène
il ressortqu’un
seul facteur commun estsuffisant pour
l’expliquer,
les coefficients de corrélationexpérimentaux peuvent
être reconstitués avec une
approximation plus
ou moinsgrande
au moyen des for- mulessuivantes :
Par contre s’il existe des facteurs de groupe cette
égalité
ne sera valableque pour les
couples
des tests ou variablesn’appartenant
pas au même groupe . Si l’on calcule alorsles différences ne seront pas toutes nulles
(Fig.9).
Test
FacteursFig.
9Pour résoudre le
problème qui
seprésente
dans ces cas, on élimine d’abord le facteur commun, et on étudie ensuiteséparément chaque
groupe pour détermi-ner les facteurs de groupe existants.
La vraie
généralisation
des méthodesd’analyse
factorielle a étéentreprise
par THURSTONE sous le nom
d’analyse
multifactorielle. Dans cette méthode on ne limite pasà priori
le nombre des facteurs mais cette limitation découle des calculs. Ilnt est plus possible, naturellement,
deprocéder
de lafaçon exposée jusqu’ici;
la méthodequ’il
faut suivre esttout-à-fait différente
et basée sur les considérationsgéométriques
suivantes.La
représentationde
toutes les variables dansl’espace
des facteurs com-muns,
àmdimensions,
donnera une nébuleuse depoints plus
ou moins concentrés autour de leur centre degravité
ou centrolde. Il estlogique
de choisir commeaxe du
plus importantdesfacteursceluiquipasse
par ce centroide. Dansl’espace
des facteurs
communs les coordonnées du centre degravité
de tous lespoints
s’exprimeront :
et seront toutes
nulles, excepté
pour lepremier
axe; lapremière
coor-donnée
exprime,
enplus,
la distance du centre degravité à l’origine.
On démon-tre
qu’elle
vaut :En retranchant des corrélations
expérimentales,
les corrélations théori- ques dues à cepremier facteur,
il restera :ou corrélations résiduelles dans un espace à m - 1 dimensions ou facteurs com- muns. Le centre de
gravité
despoints représentatifs
des variables se trouve maintenantà l’origine
descoordonnées;
pourpouvoir appliquer
à nouveau la mê-me méthode il faut
séparer
le centre degravité
del’origine
des coordonnées . Cela est obtenu au moyen d’une rotation de180°
d’unepartie
desvariables,
enles
changeant
designe (de préférence
on choisit cellesqui
donnent des coeffi- cientsnégatifs
dans la matrice des corrélationsrésiduelles)
et enprenant
notedes
changements
pourpouvoir
lescorriger
à la fin. Au moyen d’une méthode et de formulespareilles
à cellesemployées
pour la détermination dupremier
fac-teur,
on calcule les coefficients aj2 et on
sépare
despremières
corrélationsrésiduelles,
lesproduits (aj2 ak2) équivalents
aux corrélationsthéoriques
duesau deuxième facteur.
Alors,
il reste :Cette méthode est continuée
jusqu’à
ce que l’on trouve des coefficients de corrélations résiduellesqui
ne soient passignificativement
différents de 0.Il faut remarquer que les matrices des corrélations doivent être
complètes, c’est-à-dire,
telles que dans ladiagonale principale
toutes les valeurs 1 aient étéremplacées
par des estimations des communautés. Larépétition
du calculavec les valeurs trouvées pour les communautés
permet
detrouver,
deproche
en
proche,
des solutions deplus
enplus précises
et exactes.HOTELLING a cherché la solution du
problème
del’analyse
factorielle suivant uneconception géométrique aussi,
mais très différente de laprécédente.
Il
part
de l’idée que lareprésentation
des variables dans unsystème
d’axes coor-donnés multidimensionnaux donne des nébuleuses
de points
dont la forme est celled’ellipsoi’des.
Les axes de cesellipsofdes
sont donc choisis comme axes desfacteurs,
sous la dénomination decomposantes principales,
encommençant
par lesplus importants
et considérant comme nuls les derniers. Les unités de ladiagonale principale de la
matrice des corrélationspeuvent
êtreremplacées
par des estimations descommunautés,
cequi
réduit le nombre des axes del’ellip-
soi’de
ayant
uneimportance géométrique
réelle.La méthode
géométrique
de détermination des axes d’unellipsotde,
pos- siblelorsque
celui-ci a troisdimensions,
devient bientôt trèscompliquée quand
le nombre des dimensions
augmente.
Dans la résolutionpratique
de ceproblème
l’on
emploie
une méthode itérative due àHOTELLING, laquelle
al’avantage
d’êtred’une routine
simple,
encore que la théorie ne le soit pas.Dans notre
exposé
nous nous limiterons àexpliquer
la méthode dupoint
devue pratique,
parce que ledéveloppement
des considérationsthéoriques
sur les-quelles
la méthode estbasée,
nous entra3neraienttrop
loin. Commetoujours ,
nous
partons
dusystème
deséquations (3.2)
dedécomposition
de la variable enfacteurs
communs,
mais sans facteursspécifiques :
La communauté concernant la variable x sera :
et la contribution totale du facteur
f
i aux communautés de toutes les variables :restant valables les conditions fondamentales :
L’emploi
de la méthode desmultiplicateurs
de LAGRANGEpermet
d’éta-blir le
système d’équations
suivant :La méthode
développée
par HOTELLING consiste en l’obtention simultanée de la racinecaractéristique 03BB1
et des coefficientsa j1.
Pour cela il faut chercherune série de valeurs
03B1j1 qui
soientproportionnels
aux coefficients vrais. L’onpart
de la matrice R des corrélationscomplètes,
c’est-à-dire danslaquelle
lesunités de la
diagonale principale
ont étéremplacées
par des estimations des communautés.Multipliant chaque
fois les matrices par elles-mêmes on calcule le carré deR, après
laquatrième puissance
deR,
lahuitième,
laseizième, etc... ,
et pourchaque
matrice résultante on additionne les valeurs dechaque ligne
et on divise la somme par laplus grande
d’entreelles :
Lorsque
deux matrices successives Reet R2e
donnent des valeurs a assezvoisines,
avecl’approximation désirée,
on arrête lesmultiplications
et on calcu-le les coefficients
ajl moyennant
les formulesci-après :
On
peut
alorsséparer
lepremier
facteur oucomposante principale
de lamatrice des corrélations
expérimentales,
cequi
donne :A la matrice des corrélations
résiduelles,
ainsiconstruite, l’onapplique
le même
procédé
de calculqu’ à
la matriceprimitive
et l’on obtient les coefficientsaj2 correspondants
au deuxième facteur oucomposante principale.
Et les calculs sont continués de la mêmefaçon jusqu’à
ce que la matrice des corrélations ré- siduelles soit constituée par des éléments virtuellement nuls.5 - DETERMINATION DES CORRELATIONS DES VARIABLES AVEC LES FACTEURS -
Les coefficients
ajk
calculésjusqu’ici
sont les coefficients deregression
des variables
Xj
en fonction des facteursfk .
Lareprésentation
des variables dansl’espace
des facteurs communs est telle que les coefficientsajk
deviennentles
projections
des vecteurs ou variables sur les axes ou facteurs. Lalongueur
des vecteurs est
proportionnelle
aux communautés.Il est
possible
aussi dereprésenter graphiquement
les corrélations entre variables sur le même schéma : la corrélation entre les variables iet j
s’ex-prime
par leproduit
scalaire des deux vecteurscorrespondants (Fig. 10) :
Cette
expression
étantindépendante
des axes ou facteurs deréférence,
ilest
possible
de faire tourner le faisceau des communautés dansl’espace
desfacteurs communs,
jusqu’à placer
cetteconfiguration
des vecteurs en une situa-tion telle que la plupart
d’entre eux soient presqueparallèles
aux axes d’un autresystème
deréférence,
du même nombre defacteurs;
ce nouveausystème
d’axesde référence n’est pas
obligatoirement orthogonal. THURSTONE,
dans son ana-lyse multifactorielle,admet parfaitement
ces solutionsobliques
et même se basesur elles pour définir des facteurs du second ordre.
Dans le cas le
plus général
des facteursobliques,
la détermination des coefficients de corrélationthéoriques
des variables parrapport
aux facteurspeut
se faire au moyen dusystème d’équations (3. 5) déjà
antérieurement expo- sé :Si les facteurs communs sont
orthogonaux
cetteexpression
se réduit àcelle-ci :
6 - ESTIMATION DES FACTEURS COMMUNS -
Une fois déterminés les modèles et structures factoriels du
phénomène
enquestion,
pour que les facteursreprésentatifs
des variablesanalysées
soientmis en
évidence,
et une fois calculés les coefficients deregression
des varia-bles enfonctiondes
facteurs,
il est intéressant de résoudre leproblème inverse, c’est-à-dire, procéder
à la détermination deséquations
deregression qui
doi-vent permettre de
calculer les valeurs individuelles des facteurs en fonction desmesures
expérimentales
des variables. Ceséquations
seront :Ces
équations
deregression
sedistinguent
deséquations
deregression
normalement rencontrées dans l’étude
statistique
des corrélations en ce que,ici,
seules les variables
xji
sont connues directement par desexpériences.
Dansce
système d’équations, donc,
il y aplus
d’inconnues qued’égalités;
pour le ré- soudreil faut multiplier
successivement chacune deséquations
parchaque
varia-ble x.. et calculer
les valeurs moyennes; nous obtenons ainsi lesystème d’équa-
tions suivant,
où les variablesaussi bien que
les facteurs sont centrés et réduits :Dans ce
système d’équations
les seules inconnues sont lescoefficients 03B2
et il y a autant
d’équations
que d’inconnues. Il est doncpossible
de le résoudre suivant les méthodesclassiques,
parexemple
celle deCRAMER,
ou mieux celle de GAUSSadaptée
par DOOLITTLE et parMINEUR,
ou celle d’AITKEN. Toutesces méthodes ont
l’avantage
depermettre
un contrôle constant desopérations
successives
jusqu’à
la déterminationcomplète
des coefficientscherchés;
ellespermettent
de faire les calculs de tous les facteurs à lafois,
cequi
est aussi unavantage
certain dupoint
de vuepratique.
En utilisant des
opérations d’algèbre matricielle,
LEDERMAN aprésenté
une autre méthode
(généralisée après
par HARMAN pour des facteursobliques)
dans
laquelle
le nombre d’inconnues dechaque équation
devientégal
au nombredes
facteurs,
au lieu de l’être au nombre destests,
cequi
facilitebeaucoup
lesopérations
parce que celui-ci esttoujours plus grand (et parfois beaucoup plus grand)
que celui-là.7 -
APPLICATION
A L’ETUDE DES SABLES DE MOULAGE -Prenons la matrice des coefficients de corrélation des
propriétés physi-
ques des sables destinés au
moulage
despièces d’acier,
sans considérer la va-riable
"Degré
deserrage"
pour les raisons données antérieurement :Nous avons
changé,
enplus,
lessignes
des variables"Teneur
eneau"
et"Perméabilité
auxgaz"
afin d’avoir seulement des corrélationspositives
dansla matrice.
L’application systématique
des différentes méthodesd’analyse
factorielleexposées antérieurement,
àl’objet
de déterminer les communautésh2
et les coefficients deregression
a des variables en fonction desfacteurs, permet
deconstater que la matrice A n’est pas de rang
1, quelles
que soient les valeurs choisies pour les communautés. La théorie des deux facteurs de SPEARMAN n’est pas doncapplicable
aux sables demoulage.
Nous avons trouvé des
possibilités
meilleures avecl’application
des mé-thodes de
l’analyse
bi-factorielle. Dans ce casapparaissent
un facteur communet deux facteurs de groupe,
lesquels épuisent
presquecomplètement la signifi-
cation des corrélations. La
représentation graphique des quatre caractéristiques étudiées,
dansl’espace
des facteurs communs se trouve dans lafigure
11. Lesvaleurs des saturations des variables dans chacun des facteur sont :
Du point
de vuephysique
ces facteurspeuvent
être conçus de lafaçon
sui-vante : Un facteur commun
qui correspondrait
au"corps"
dusable,
c’est-à-dire à cettepropriété
que l’on détectelorsqu’on
presse unepoignée
desable;
un fac-teur de groupe concernant sa
capacité
de résistancemécanique,
et un autre fac"teur de groupe se
rapportant
à lacompacité.
L’analyse multifactorielle,
suivant la méthode deTHURSTONE,
fait ap-paraître
deuxfacteurs communsorthogonaux,
lepremier ayant
caractèrepositif
pour toutes les
caractéristiques contrôlées,
le second avec dessignes opposés
pour les deux
premières par rapport
aux deux dernières.Leur
représentation graphique
est celle de lafigure
12. A la vue de celleci il
apparaitqu’il est possible
dechanger
les axesorthogonaux
dessinés par desaxes
obliques, passant
lepremier
entre les vecteurs concernant les résistances à lacompression
et au cisaillement et le deuxième entre ceux concernant l’humi- dité et laperméabilité.
La méthode d’HOTELLING ou des
composantes principales permet
une re-présentation
trèsproche
de laprécédente.
Eneffet,
suivant cetteméthode,
ontrouve une
première composante positive
pour tous les résultats des essais et une secondecomposante
affectée designes différents,
selon lavariable,
commepour les vecteurs de THURSTONE.
La
représentation graphique (Fig. 13)
est très semblable à celle de l’a-nalyse multifactorielle,
au moins en cequi
concerne la structuregénérale.
Ici aussi les axes
orthogonaux peuvent
êtreremplacés
par des axesobliques plus représentatifs
despropriétés
des sables demoulage,
choisissant pour cela les bissectrices dechaque paire
de vecteurs de lafigure
13.Les différentes méthodes
d’analyse
factorielle donnent donc desreprésen-
tations différentes du mêmephénomène,
toutes néanmoinspareillement accepta-
bles du
point
de vuemathématique.
Cettemultiplicité
de solutions n’est pas, ensoi,
un inconvénientpuisqu’elle permet
de choisir la solutionqui s’adapte
da-vantage
aux conditionsphysiques
duphénomène analysé.
Dans ce cas la meilleure solution semble être celle donnée parl’analyse bifactorielle, laquelle permet,
comme nous l’avons
indiqué,
uneinterprétation physique simple
etobjective
desfacteurs. Nous nous baserons donc sur cette solution pour estimer les facteurs concernant chacun des sables que l’on contrôle.
La détermination des coefficients de
regression
des facteurs en fonction despropriétés physiques
des sables contrôléesjournellement
apermis
d’établirles
équations ci-après :
Les estimations de ces facteurs sont centrées et
réduites,
c’est-à-direqu’elles
ont une moyenne nulle(dans
le domaine d’utilisation des sablesaptes
pour le
moulage
despièces d’acier)
et unécart-type
unitaire. Etant donné que l’onpeut admettre
que ces facteurs se distribuentnormalement,
les valeurs ab-solues
supérieures
à 3 serontexceptionnelles et,
en cequi
concerne le facteurcommunfo
un sable coté -3 devrait être refusé. Les variablesXi , X2 , X3, X4 ,
correspondant
auxquatre caractéristiques
des sables contrôlés(c’est-à-dire respectivement Xl =
résistance aucisaillement; X 2 =
résistance à la compres-sion ; X3
= teneur en eau ouhumidité; X4 = perméabilité
auxgaz),
sont mesurées directement à l’échelle desexpériences.
Pour faciliter la
compréhension
de lafaçon
dontpeut
être utilisée l’infor- mation donnée par les résultats du contrôle dessables,
nousappliquerons
leséquations
antérieures àquelques
caspratiques, prélevés parmi
ceux desexpé-
riences
qui
ontprécédé
cette étude :Tableau V
Estimation des facteurs en fonction des
propriétés physiques
des sablesLa
comparaison des propriétés physiques
de ces sables est facilitée d’unefaçon remarquable
par les facteurs. Lasimple
lecture de ce tableau nous ren-seigne
tellement sur les sables échantillonnésqu’il
neparait
pas nécessaired’y ajouter
des observations ou desexplications quelles qu’elles
soient.8 - CONCLUSION ET RESUME -
Les méthodes
d’analyse
factorielle ont un domained’application beaucoup plus
vaste que la seule étudepsychotechnique
desaptitudes
humainesqui
a étéleur
origine.
Dans leColloque International
célébré à Paris en1955,
sous l’é-gide
du Centre National de la RechercheScientifique,
sur"l’Analyse
factorielle et sesapplications"
on a vu que nombre deproblèmes
très diverspouvaient
serésoudre par
l’emploi
de ces méthodes. Nous avonscherché,
dans notreétude,
à
appliquer l’analyse
factorielle à unproblème
industrielparticulièrement
in-téressant, bienqu’assez simple, ce qui lui donne
son doubleaspect d’exemple et, pourrait-on dire,
d’exerciced’analyse factorielle,
de facile exécution.Envisagée
dupoint
de vueindustriel, l’analyse
réaliséepermet
d’établirdes bases pour une classification des sables de fonderie destinés au
moulage
despièces d’acier, d’après
leurs conditionsessentielles,
c’est-à-dire les facteursphysiques
que nous avonsdécelé,
au lieu de se baser sur les résultats bruts desessais, qui
nesont,
enréalité,
que le reflet de ceux-là.BIBLIOGRAPHIE
C.
N. R. S. -"L’Analyse
Factorielle et sesApplications".
45eColloque
Interna- tional du Centre National de la RechercheScientifique Paris,
1956.HOLZINGER (K.J.) et HARMAN (H.H.) - "Factor Analysis.
Asynthesis
of fac-torial
methods".
TheUniversity
ofChicago Press, 3e.
ed. 1951.THOMSON
(G.H.) - "L’Analyse
Factorielle desAptitudes Humaines" -
Trad.par P. Naville. Presses Universitaires de France. 1e ed. 1950.
THURSTONE
(L.L.) - "Multiple-Factor Analysis".
TheUniversity
of Chica-go
Press, 3e
ed. 1950.VILLE
(M.J.) - "Principes d’Analyse Matricielle" -
Institut deStatistique
del’Université de