R EVUE DE STATISTIQUE APPLIQUÉE
F. F ACY
Y. L ECHEVALLIER
Traitement des non réponses et des données manquantes pour des variables qualitatives après classification automatique
Revue de statistique appliquée, tome 26, n
o4 (1978), p. 39-53
<http://www.numdam.org/item?id=RSA_1978__26_4_39_0>
© Société française de statistique, 1978, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.
sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les conditions générales d’uti- lisation (http://www.numdam.org/conditions). Toute utilisation commerciale ou im- pression systématique est constitutive d’une infraction pénale. Toute copie ou im- pression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
39
TRAITEMENT DES NON RÉPONSES
ET DES DONNÉES MANQUANTES
POUR DES VARIABLES QUALITATIVES APRÈS CLASSIFICATION AUTOMATIQUE
F.
FACY
INSERM - 44, Chemin de ronde - 78110 LE VÉSINET
Y.
LECHEVALLIER
IRIA-LABORIA - Domaine de Voluceau - 78150 LE CHESNAY
RESUME
La pratique des enquêtes par questionnaire révèle une
fréquence
importante des nonréponses.
La méthodeproposée
ici traite lanon-réponse
dans le cas des variables qualitatives.La population étudiée est
supposée
divisée en k groupeshomogènes.
Le but poursuivi est de décider pour chaque groupehomogène
et pour chaque variable entre les deux éventualités suivantes :- Soit la non-réponse doit être conservée comme une modalité à part entière ;
- soit elle doit être estimée par une autre modalité de
réponse
à la question.Cette décision est fondée sur des calculs de chi-deux de liaison entre chaque variable comportant des
non-réponses
et la variableprésence-
absence associée à chaque groupe.Un exemple d’utilisation est ensuite fourni, extrait d’une enquête de Santé Publique,
abordant le
problème
des tentatives de suicide chez les adolescents.INTRODUCTION
Par
expérience
desenquêtes
conduites à travers desquestionnaires,
on a pu remarquer une relativefréquence
desnon-réponses,
dûes à différentes causes :- soit par faute de
l’enquêteur
ou absence dusujet ;
- soit par la nature,
trop
vague parexemple,
de laquestion ;
- soit par la volonté délibérée du
sujet
de ne pasrépondre
à laquestion.
Pour recouvrir ces diverses
situations,
le terme denon-réponse
est entenduici dans un sens très étendu. Il
englobe l’erreur,
l’oubli et la volonté dusujet interrogé
pourchaque question.
La
multiplicité
desnon-réponses,
observée dans certainesenquêtes
et lavariété de leurs motifs
indiquent qu’il
faut leur donner unesignification
différenteRevue de Statistique Appliquée, 1978, vol. XXVI, n° 4
Mots clés :
Non-Réponse, Chi-deux,
variablequalitative,
classification auto-matique.
40
suivant les maiviaus et suivant ies questions. rour atteindre cet objectit, on est amené à faire une
approche globale
duproblème
pour proposer une solutionqui
suivant les cas, conserve la non
réponse,
en lui donnant un sens propre, ou laremplace
par d’autres modalités deréponse présentes
dans lequestionnaire.
Pour illustrer le
problème,
unexemple
est choisi dans uneenquête
de SantéPublique,
concernant des adolescentsayant accompli
une tentative de suicidecf.
[Da 76a], [Da 76b]- [Fa 78]. L’enquête
est constituée par un ensemble dequestions caractérisant,
pourchaque sujet,
sa situationsocio-familiale,
son compor- tement, ses antécédentscliniques,
son acte.Chaque question
formeainsi,
pour l’échantillon dessujets interrogés,
une variablequalitative,
àplusieurs
modalitésde
réponse,
lanon-réponse
étant l’une d’entre elles. Cetexemple
sertd’application
de la méthode
proposée,
par la suite.De nombreuses méthodes ont été
développées
dans le but de réduire le moinspossible
l’ensemble desobservations,
cequi permet
une certaine robustesse dans les résultats.On
peut distinguer
3 voies :- la
plus
ancienne revient à estimer lesparamètres
d’unmodèle, (souvent
laloi
normale)
et àremplacer
lanon-réponse
par une donnée simuléecf.
[Wi 32], [Af 66], [Ho 68] ;
- d’autres études ont été faites dans le cas multivarié sans
hypothèse préalable
sur les lois des variables. Leur butprincipal
est depouvoir
utiliser simultanément ou par la suite des méthodes factorielles sur l’ensemble des
objets analysés.
Onpeut
citer Christofferson[Ch 70]
pourl’analyse
encomposantes principales,
et pour le traitement des variablesqualitatives,
en vue d’uneanalyse
descorrespondances,
J.P. Benzecri[Be 73]
et Nora[No 75].
Onpeut
utiliser indirectement aussi les travaux de B. Escofier[Es 76] ;
-
enfin,
si on observe unehétérogénéité
de l’ensembleanalysé,
un traitementpar une classification
automatique s’impose,
d’où la nécessitéd’adapter
des méthodes de classification à des données
manquantes
cf.[Ok 75], [Ha 75], [Di 76].
Ces méthodes
s’appliquent
à des donnéesquantitatives,
carschématiquement,
elles
remplacent
la donnéemanquante
par une valeurnumérique
assimilée sansproblème
à une observationpossible
sur cette variable(par exemple
centre degravité).
Par contre, avec des donnéesqualitatives,
il faut absolumentremplacer
la
non-réponse
par une autremodalité,
d’oùl’impossibilité
d’utiliser les méthodesprécédentes.
Ainsi dans le traitement d’un tableaudisjonctif complet,
lasuppression
de la
non-réponse
entraîne la redistribution des individus ànon-réponse
sur lesautres modalités cf.
[Le 77].
Dans cette
optique,
nous proposons ici un traitementqui permet d’appliquer
les méthodes de classification à des données dans le cas de variables
qualitatives,
avec le souci
important
de ne passupprimer
à toutprix
la modalité de "non-réponse"
cf.[Fa 78].
Revue de Statistique Appliquée, 1978, vol. XXVI, n° 4
41
1. PRINCIPE DE LA METHODE
Hypothèse préliminaire
Afin de considérer les
non-réponses
parrapport
à l’ensemble des informations dufichier,
on faitl’hypothèse
suivante :- la
population
étudiée sedécompose
en groupeshomogènes
auregard
desvariables
analysées
et la modalité denon-réponse peut
se différencier suivant ces groupes. On suppose que lanon-réponse
n’a pas unesigni-
fication
unique
pour l’ensemble dessujets qui
esthétérogène
apriori.
1.1. Position du
problème
Le
problème
estd’analyser
lanon-réponse
dans le cadre des variablesquali-
tatives. Cette
analyse
doit nouspermettre
pourchaque
groupehomogène
de déciderentre les deux éventualités suivantes :
- soit la
non-réponse
doit être conservée comme une modalité àpart entière ;
- soit elle doit être estimée par une autre modalité de
réponse
à cettequestion.
Pour
analyser
la nonréponse
d’une variable, dans unepopulation
parrapport
aux autres
modalités,
on cherchequelle
est lapart d’explication
dechaque
modalitéde
réponse
dansl’organisation
de lapopulation
en K groupeshomogènes ;
la mesurede
l’explication
estfaite, ici,
par leX2.
Ces K groupeshomogènes peuvent
être fournis soit par l’utilisateur soit par une méthode de classificationautomatique,par exemple
la Méthode des NuéesDynamiques [Di 72], [Le 74], [Di 75]. L’objectif
est
d’approcher
lapopulation
dans uneperspective
trèsorientée,
celled’expliquer
successivement K variables
dichotomiques.
Ces K variables sont les fonctions indicatrices des K groupes déterminés audépart.
Dans le cas où les résultats sont obtenus àpartir
d’une classificationautomatique qui
regroupe lessujets
entypes :
- la variable à
expliquer 8i
estl’appartenance
à un groupeEi
de latypo- logie :
- les variables
explicatives
sont les différentesmodalités jq
d’unevariable j
parmi lesquelles
se trouve lanon-réponse jo. (La
même étude estrépétée
pour toutes les variables
comportant
une modalité denon-réponse).
1.2.
Méthodologie
Pour
chaque
groupeEi
de lapopulation
on considère unepartition
en sclasses de l’ensemble des modalités de la variable
j.
Le but de l’étude est de rechercher ledécoupage
desmodalités jq
en un certain nombre de classesqui
caractérise le mieux le groupe
Ei.
Pourinterprêter
lanon-réponse
d’une variable dans un groupehomogène
desujets,
il faut déterminer sa meilleureposition relative,
par
rapport
aux autres modalités. Celle-ci est donnéelorsque
lacorrespondance
entre les 2
variables S;
etj,
dont certaines modalitéspeuvent
êtreregroupées,
assure un
X2
maximum.Revue de Statistique Appliquée, 1978, vol. XXVI, n° 4
42
définitions
On considère le tableau de données
To
=(ExJ) qui
est le tableaudisjonctif complet
des deux ensembles :E =
{sujets}
et J ={variables}
tQjq
= 1 si lesujet
Q est caractérisé par lamodalité jq de j,
0 sinon.Après
classification P dessujets
sur l’ensemble desvariables,
il existe pourchaque variable j
le tableauTl
=(Pxj)
L. Ei t~Jq est le nombre de sujets
du groupe Ei ayant
la modalité jq
pour la
variable j.
Revue de Statistique Appliquée, 1978, vol. XXVI, n° 4
43
Propriétés
Le tableau
(S i , j)
=Tj2
se fait àpartir
deT0.Tj2 est
la concatenation deTI,
si on ne considère
qu’un
groupeEi
et soncomplément Ei.
nijq
est le nombre desujets
de la classeEi ayant
lamodalité jq pour j :
Le tableau
Ti 3
se fait àpartir
deT2
par larépartition
des r modalités ens classes :
La variable à
expliquer Si
estdichotomique, présentant
deux états :l’appar-
tenance à
Ei
etl’appartenance
au reste.Un
X2
est calculé surchaque
tableauTi 3 correspondant
à une distribution desjq
en s classes.Revue de Statistique Appliquée, 1978, vol. XXVI, n° 4
44
D’après
lespropriétés
du~2,
en retenant ledécoupage qui
donne leX2
maximum,
on a, auregard
desmodalités,
un regroupementqui
assure la meilleurehomogénéité
de ces classes vis-à-vis de03B4i.
Ainsi : un
pronostic
estpossible
àpartir
de la connaissancedes j
d’unindividu de la
population
pour caractériserQi
etréciproquement
àpartir
deSi, prévoir les j
ce dernierpoint
est très utile ici.Dans le tableau
(03B4i,S’)
dont leX2
est maximum pour une certaine distri- butiondes jq,
larépartition
des modalités est telle que lanon-réponse jo
se trouveseule ou avec d’autres modalités de
façon
"trèshomogène".
L’interprétation
de lanon-réponse
en découle : suivant laprésence
demodalités dans la même classe que
jo’
onpeut
dire quejo
et celles-ci sontproches
pour les
sujets
deEi
paropposition
aux modalités restantes.Cette
proximité
éventuelle dejo
avec d’autres modalités donne le sens de lanon-réponse
d’unevariable j
pour un groupe donné desujets.
Par lasuite,
lerempla-
cement de
jo peut
être effectué en fonction des modalitésprésentes
dans la mêmeclasse. En
pratique,
ilpeut
se faire à laproportionnelle,
suivant lafréquence
de cesdernières. Ceci ne
change
pasglobalement
laprobabilité
pour unsujet
du groupeEi
d’avoir untype
deréponse, chaque type correspondant
à une classe.A la
fin,
onpeut
obtenir pourchaque
groupe desujets
et pourchaque variable,
unesignification particulière
de lanon-réponse
et éventuellement uneproposition
deremplacement
en fonction des autres modalités.Remarque :
La
part d’explication
dechaque modalité jp de j
pour le groupeEi
dans laclasse SI telle
que jo E
SI est donnée par lerapport :
et pour la
non-réponse :
La
configuration
desnijo
est donnée par l’ensemble des autresnijp.
Si untirage
au sortpeut
êtreeffectué,
pourremplacer
lesnij
par des différentsnif
dansun
rapport : nijp nis1 - nij0 (cf. [Le 77]).
Revue de Statistique Appliquée, 1978, vol. XXVI, n° 4
45
la
part
quereprésente nij0
pour le groupeEi
aura la mêmeconfiguration
que le reste desnijp.
Ainsi :
La
probabilité d’interprétation de jo par j p
est :2. CONDITIONS DE VALIDITE DE LA METHODE
Dans le déroulement des
calculs,
on est amené à :- considérer un tableau initial à
2 lignes
et r colonnes :- construire la suite des tableaux à 2
lignes
et s colonnescorrespondant
chacun à une
répartition des j
modalitésde j
en s classes. s est fixé par l’utilisateur en fonction de la nature des variables initiales et du nombre de leurs modalités. Comme on cherche unremplacement
éventuel de lanon-réponse,
le nombre de classes estobligatoirement
inférieur au nombreinitial de
modalités ;
d’oùEn
pratique
pour une variable initialement en OUI - NON etnon-réponse,
le nombre de classes
peut
être 2.Revue de Statistique Appliquée, 1978, vol. XXVI, n° 4
46
Pour une variable
comportant plus
de 3modalités,
3 classes ou moinspeuvent
être retenues.
Tableau
(2, s)
Avec
Sk
étant lakième
classe- effectuer sur
chaque
tableau(2,s)
le test duX.
Tout
d’abord,
pour un tableau enmodalités,
la condition habituelle d’utili- sation duxi
est quechaque
effectif observé soitsupérieur
ouégal
à 5 :D’autre
part,
dans la recherche dutableau, parmi
ceux de dimensions(2, s), ayant
lex2 maximum,
l’utilisateurpeut
se fixer un seuil designification
du test :par
exemple,
ilpeut
admettrequ’il
y a liaison entre la variableSi et
lavariable j
àla seule condition que a soit inférieur ou
égal
à 5%.
Dans le cas où a estsupérieur
à 5
%,
la méthode n’est pasapplicable
et un autre traitementpeut
êtreenvisagé.
Au
total,
les conditions à vérifier sont trois :3. SIGNIFICATION DU CRITERE OPTIMISE
Le test du
X2
est un testd’indépendance
entre deux variablesqualitatives
1 et J. Il est donné
pratiquement, après
détermination des effectifs calculés :cij = nj. ni. n, par la
formulePour la
signification
de ce test, on cherche lerisque
a associé par lecture de la table de~2,
pour le nombre dedegrés
de liberté : :d.d.1. 1=(k - 1) ) (s - 1)
Revue de Statistique Appliquée, 1978, vol. XXVI, n° 4
47
Dans le cas
présent
où k = 2 et où s sera souvent fixéégal
à2,
on a le tableau :Et par
rapport
au tableau initialTo
des individus avecthj
= 0 ou 1 pour laligne
h et lacolonne jq ,
on a :Si on pose p
f et f2 = n2,
la méthode revient à maximiser les expres-ni n2
sions
suivantes,
pourlesquelles
onpeut
se référer à[Fa 78,]
pour le détail des calculs.très
classiques
par ailleurs.Comme
bi, biet
n sontindépendants
de la subdivisioneffectuée,
maximiserS revient à maximiser E =
n1f21 + n2 f22.
La somme des variances inter-classes est
égale
à :Elle est maximale
quand
E est maximumRevue de Statistique Appliquée, 1978, vol. XXVI, n° 4
48
Et la somme des variances intra-classes est
égale
à :Elle est minimale
quand
E est maximum.Dans le cas où s = k : le détail des calculs se trouve en annexe.
L’expression
à maximiser est :Remarque
1On
pourrait
aussi considérer le cas où le nombre de classes s n’est pas fixé.Quand
s estfixé,
on compare les valeursprises
parX2 (s - 1)
pour les différentes subdivisions des modalités de lavariable j
alors que dans l’autre cas, on compare lesX2 (s - 1)
avec svariable,
enpassant
par l’intermédiaire de laprobabilité
corres-pondante,
fournie par les tables de distribution de la loi duX2 .
C’est unepossibilité
intéressante de la méthode du
X2
que d’effectuer des subdivisions en nombres différents d’états.Remarque
2Ainsi dans la méthode de classification
appliquée
pour la détermination des K groupes, on a définil’homogénéité
des groupespar la
somme des variances intra- classes.L’algorithme
de classification fait décroître ce critère et notre méthode deregroupement
des modalitésaugmente
cette décroissance. Onpeut
remarquer queces deux méthodes font décroître le même
critère,
onpeut
ainsi les utiliser alter- nativement. Parexemple,
avec les nuéesdynamiques
on obtient unoptimum local ;
le
regroupement
de certaines modalitéspermet
dedégager
un autreoptimum
ensimplifiant
l’ensemble des modalités duquestionnaire,
cequi apporte
deplus
unintérêt, lorsque
celui-ci est lourd audépart.
4. DEROULEMENT DES CALCULS Commentaire de
l’organigramme
suivant.3
étapes peuvent
être schématisées :4.1 - En considérant tous les
sujets,
on effectue uneclassification,
dutype
"nuéesdynamiques"
parexemple.
On obtient ainsi unepartition
dessujets
en K groupesEi,
lesnon-réponses
sont considérées comme des modalités àpart
entière pourchaque
variable.On
part
d’unejuxtaposition
de tableauxTô, j = 1,
v et d’unejuxtaposition
detableaux
rJI ’ j
=1,
v.Pour
plus
decommodité,
on a enprincipe
réservé la modalitéjo
pour lesnon-réponses, quand
elles sontprésentes
dans l’ensemble E pour la variablej.
Revue de Statistique Appliquée, 1978, vol. XXVI, n° 4
49
ORGANIGRAMME
Revue de Statistique Appliquée, 1978, vol. XXVI, n° 4
50
4.2 - En étudiant
chaque
groupeEi séparément,
on recherche pourchaque
variablej
ledécoupage optimal
de l’ensemble de sesmodalités jq
au sens de la distance duX2.
Pour un nombre de classes fixé à2,
le testeffectué
consiste à maximiser lex2
decontingence
du tableauTJ 3
avec s = 2.Pour
appliquer
cetteméthode,
la seule condition à vérifier est queni~
5donc en
particulier
pour le nombre denon-réponses,
il fautqu’il
soitsupérieur
à 5pour une variable et pour un groupe.
4.3 -
L’analyse
des résultats de la méthodeexposée
conduit àl’interprétation
dejo
Premier cas
Le test du
X2 correspondant
au tableau initial n’est passignificatif
au seuilfixé+.
La variable nereprésente
pasEi
mais s’il estindispensable
desupprimer
lamodalité
jo
pour cette variablequalitative,
onpeut
proposer unereprésentation
dejo proportionnelle
à larépartition
des autres modalités danschaque groupe,réalisée
par un
tirage
au hasard dessujets.
Ceci est àrapprocher
d’unepratique
assezrépandue,
consistant àremplacer
les donnéesmanquantes
par le "centre degravité"
du nuage de
points.
Exemple
1 : Apartir
du fichier initial dessuicidants,
unrecodage
s’est révélénécessaire, après
unepremière
classification. Lafréquence
desnon-réponses
étanttrop
faible pour certaines variables pour obtenir unX 2significatif,
lesnon-réponses
ont été
réparties
sur les autres modalités. Par contre, pour d’autresvariables,
lafréquence
était telle que la modalité denon-réponse
a été conservée.Deuxième cas
Le test du
X 2
estsignificatif
au seuil fixé apriori (la variable j
est liée à laclasse
Ei).
Le
découpage dichotomique de j peut
seprésenter
sous différentes formes :A) jo
est seul contre toutes les autres modalités. On nepeut
donc quegarder jo qui
a une valeur
intrinsèque
pour le groupeEi.
Exemple
2 :D’après
une classification sur les variables socio-familiales desjeunes suicidants,
un groupe desujets apparaît
comme étantplutôt
constitué par des filles de 15 à 16 ans, habitant à la campagne, dont lepère
est ouvrier ouagriculteur,
et
ayant
de nombreux frères et soeurs ; elles vivent aufoyer
familial et ont subi uneréaction
d’agressivité
de leurentourage après
leur tentative. Les familles n’ont pasrépondu
auxquestions
concernant l’éducation et les difficultés scolaires éventuelles des adolescentes.Or, d’après
les tests duX2
effectuées sur ces variables pour ce groupe, aucune autre modalité ne s’est réveléeproche
de lanon-réponse.
Elle doitêtre conservée et montre un refus de
répondre
de lapart
de la famille dans ce cas.+ Le seuil est souvent pris dans la pratique
égal
à 5 %.Revue de Statistique Appliquée, 1978, vol. XXVI, n° 4
51
Exemple
2 bis : Dans une classification dessujets d’après
les variablespsycho- logiques
etrelationnelles,
un groupe sedistingue,
caractérisé essentiellement par desnon-réponses.
Aucuneproximité
avec d’autres modalitésn’apparait.
La non-réponse
nepeut
êtreremplacée
pour ces variables.B) jo
estaccompagné
d’autresmodalités jp contre j,,.
Donc lesujets
du groupeEi
qui
ontjo
pour lavariable j
ont uncomportement proche
de ceuxqui
ont lesmodalités
jp, s’opposant à jq.
Onpeut
doncestimer,
pourEi, jo
parles j
estimation
qui
estproportionnelle
à larépartition
dessujets
du groupeEi
sur lesmodalités
jp,
cequi
donne uneprobabilité d’interprétation
et d’affectation dejo par les autres j.
Exemple 3 :
Unepartition
des suicidants sur la situation socio-familiale montre unpetit
groupe où il y a certainesnon-réponses
etquelques caractéristiques signi-
ficativesprécisées, qui
sont retrouvées pour un autre groupe. Les tests duX 2
montrent une
proximité
desnon-réponses
avec les modalités significatives de l’autre groupe. Ainsi l’absence deréponse
pour la situation familialeindique
en fait laséparation
du milieu familial pour ce groupe desujets.
Il en a été de même pour un deuxième groupe de
sujets
dont lesnon-réponses
ont pu être estimées
"proches"
desréponses
d’un autre groupe.Contrôle de la méthode
Après
leremplacement
des modalitésjo
des variables suivant les différents groupes, onpeut
refaire une classification de tous les individus avec leurs nouvelles modalités et voir si la nouvellepartition
obtenue diffèrebeaucoup
de lapremière.
5. CONCLUSION
La
fréquence importante
desnon-réponses
dans ce fichier de SantéPublique, atteignant
10%
des effectifs pour certainesvariables, justifiait
un traitementparticulier,
dont lesrésultats,
deplus,
se révèlent intéressants.En effet
l’analyse
des données montre que lesnon-réponses
sontplutôt spécifiques
destypes
de suicidants lesplus
graves. Si on avait écarté lessujets
dontcertains
renseignements manquaient
etqui
étaient asseznombreux,
on auraitprobablement
sous-évaluél’importance
des tendances suicidaires.On voit donc par cet
exemple
l’intérêt du nonregroupement systématique
des
non-réponses
et la cohérence entre la méthodeproposée
departition
demodalités et la méthode de classification des individus.
Elle
peut
êtregénéralisée
au traitement de modalités autres que la non-réponse
dans un but de regrouper des modalités voisines.Revue de Statistique Appliquée, 1978, vol. XXVI, n° 4
52 ANNEXE
cas où s = k : calcul du
~2
Le
X 2
total a pourexpression :
soit,
en tenantcompte
de ce quebi
+bi =
n :Revue de Statistique Appliquée, 1978, vol. XXVI, n° 4
soit
puisque
53 BIBLIOGRAPHIE
[Af 66]
AFIFI A. et ELASHOFF R.M. -"Missing
observations in Multivariate Statistics I review of the litterature".J.A.S.A., 1966, 61,
pp. 595-604.[Be 73]
BENZECRI J.P. -"L’analyse
desdonnées",
Tome2, DUNOD,
1973.[Ch 70]
CHRISTOFFERSON A. - "TheOne-Component
Model withIncomplete
Data" Dissertation for the
Degree
of Doctor ofPhilosophy, Faculty
of SocialSciences of the
University of Uppsala,
1970.[Da 76a]
DAVIDSONF., CHOQUET M.,
et FACY F. - "La notion derisque
dansle domaine du suicide chez l’adolescent". Revue
épidémiologique
et SantéPublique, 1976, 24,
pp. 283-300.[Da 76b]
DAVIDSONF.,
etCHOQUET
M . - "Etudeépidémiologique
du suicidede l’adolescent :
comparaison
entre suicidantsprimaires
et suicidants récidi- vistes". Revueépidémiologique
et santépublique, 1976, 24,
PP 11-26[Di 72]
DIDAY E. - "Nouvelles méthodes et nouveauxconcepts
en classificationautomatique
et reconnaissance des formes". Thèsed’Etat,
ParisVI,
1972.[Di 75]
DIDAY E. - "Classificationautomatique séquentielle
surgrands
tableaux".
RAIRO-B1,
pp. 29-61.[Di 76]
DIDAYE.,
OKY., JACOTTET,
TOMASSONNE. -"Lissage typo- logique". Rapport
IRIA-LABORIAn°
164.[Es 76]
ESCOFIERB.,
et LEROUX B. - "Influence d’un élément sur les facteurs enanalyse
descorrespondances".
Les cahiers del’analyse
desdonnées, n° 3, 1976,
pp. 297-318.[Fa 78]
FACY-MARCHAL F. - "Classification sur tableauxjuxtaposés. Appli-
cation à l’étude
psychosociologique
des adolescents suicidants". Thèse 3ecycle,
Paris VI. 1978.[Ha 75]
HARTIGAN J.A. -"Clustering Algorithms".
N.Y.Wiley
75.[Ho 68]
HOCKING R.R. et SMITH W.B. - "Estimation of Parameters in the Multivariate Normal Distribution withMissing
observations".J.A.S.A., 1968, 63,
pp. 159-173.[Le 74]
LECHEVALLIER Y. -"Optimisation
dequelques
critères en classi-fication
automatique
etapplication
à l’étude des modifications desprotéines sériques
enpathologie clinique".
Thèse3e cycle,
ParisVI,
1974.[Le 77]
LEBARTL.,
MORINEAUA.,
TABARD N. -"Techniques
de laDescription Statistique,
Méthodes etlogiciels
pourl’analyse
desgrands
tableaux". Dunod 1977.
[No 75]
NORA-CHOUTEAU C. - "Une méthode de reconstitution etd’analyse
de données
incomplètes".
Thèsed’Etat, Paris, VI,
1975.[Ok 75]
OK-SAKUN Y.-"Analyse
factorielletypologique
etlissage typolo- gique".
Thèse3e cycle,
ParisVI,
1975.[Wi 32]
WILKS. - "Moments and distributions of estimates ofpopulation parameters
fromframentary samples".
Annalsof
MathematicalStatistics,
1932,
Vol. 3.Revue de Statistique Appliquée, 1978, vol. XXVI, n° 4