R EVUE DE STATISTIQUE APPLIQUÉE
H. E L M AY G. A NTILLE
R. T RÉMOLIÈRES
La méthode des tranches de densité : une réponse aux problèmes de multirégression
Revue de statistique appliquée, tome 44, n
o3 (1996), p. 83-94
<http://www.numdam.org/item?id=RSA_1996__44_3_83_0>
© Société française de statistique, 1996, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les condi- tions générales d’utilisation (http://www.numdam.org/conditions). Toute uti- lisation commerciale ou impression systématique est constitutive d’une in- fraction pénale. Toute copie ou impression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
LA MÉTHODE DES TRANCHES DE DENSITÉ :
UNE RÉPONSE AUX PROBLÈMES DE MULTIRÉGRESSION
H. El
May (1),
G. Antille(1),
R. Trémolières(2)
(1) Université de Genève,Dpt
d’économétrieUni Mail, Bd
Carl-Vogt
102,1211 Genève 4 (2) Université Panthéon-Assas, Paris II,92 Rue d’Assas, 75006 Paris, France
RÉSUMÉ
Le
problème
que nous abordons ici est celui de lagénéralisation
du concept derégression
ayant pour but laprise
en compte des aspects structurels de l’ensemble des données. Nousprésentons
dans cet article une méthode de résolution basée sur lapercolation :
la méthode des tranches de densité, uneapproche
permettant de rechercherautomatiquement,
sur un mêmeensemble de données, l’existence d’un modèle ou de
plusieurs
modèlessous-jacents.
Mots-clés :
régression, multirégression, régression typologique.
ABSTRACT
This paper presents a mixed method
assigning
agiven
set ofpoints
of a multidimen- sionnal space into several subsetshaving
their ownregression hyperplanes
or factorial decom-position.
The method is based ondensity
conceptsadapted
from the Percolation Method.Keywords : Regression, multiregression, typological regression.
1. Introduction
Dans les
problèmes d’ajustement
de données par des méthodes derégression,
la
présence
de valeurs aberrantes et de certaines structuressous-jacentes peut
affecter laqualité
del’ajustement.
L’identification de cesparticularités
peut êtrerapprochée
d’un
problème
de reconnaissance de formes. Dans cet article nousprésentons
unalgorithme permettant
de résoudre cetype
deproblèmes
pour des structures linéaires.Face à
l’hétérogénéité
apriori possible
de l’ensemble des données nous proposons dechercher,
sur un même nuage depoints plusieurs ajustements
et nonun
seul,
pourpermettre
unedescription beaucoup plus précise
et une meilleurecompréhension
duphénomène
étudié.84 H. EL MAY, G. ANTILLE. R. TRÉMOLIÈRES
La
figure
1 montre une situation où l’évolution de ychange
en fonction du niveau de x. La détection dupoint
aberrant ainsi que la détection des 4droites,
depentes différentes,
sontimpératives
pour une bonnedescription
de l’ensemble des observations.La
figure
2 montre une situation encoreplus complexe
où le nuage despoints présente
deux tendances différentesqui
se croisent.FIGURE 1 FIGURE 2
La détection de ces multitendances
prend
toute sonimportance
dans un espace multidimensionnel où unereprésentation
despoints
n’estplus
réalisable.Des
approches multivariées,
cherchant àdécomposer
l’ensemble des observa- tions en groupes, traduisant chacun une relationspécifique,
ont étéprésentées
dansla littérature notamment par Mac Gee et Carleton
[7],
OK Sakun[6]
et Charles[3].
Dans cet article nous
présentons
une méthode multivariéequi adapte
leprincipe
de la Percolation
[9], [10],
méthode de classification nonhiérarchique
faisantappel
àla notion de
densité,
au cas de larégression
linéaire.Cette méthode
appelée
méthode des tranches de densité([ 1 ], [2], [4], [5], [6])
permet de découvrir k tendancessous-jacentes
à un même ensemble dedonnées, k
est déterminé par la méthode elle-même en fonction de la structure des observations et du
degré
d’affinement souhaité.Dans la section
II,
unedescription
de la méthode ainsi quel’algorithme correspondant
sontprésentés.
Des
applications
à la reconnaissance desformes,
à lamultirégression,
ainsiqu’à
la
régression multiple
sontprésentées
dans la sectionIII;
l’étude deconfigurations particulières
y est aussi abordée.2. La méthode des tranches de densité
Notre
objectif
étant de structurer un ensemble depoints
en fonction de leurdegré d’explicativité
parrapport
à diversespossibilités
derégression
dans l’ensembledes
données,
nous allons introduire diverses notions comme celle de sous-groupes depoints générateurs
d’un mêmehyperplan. Puis,
pourdistinguer
entre les différents«hyperplans
directeurs» ainsi constitués nous introduirons des notions de distancesentre
hyperplans
dont la distinction se fera en fonction de seuils deperception
commedans la méthode de
percolation. Formellement,
considérons les notations et définitions suivantes afin de mieuxpréciser l’approche
et la méthode des tranches de densité.Soient :
E = un ensemble de
points
del’espace
EuclidienRp+1, p 1,
muni d’unedistance
d( , ),
où l’on affectechaque point
i E E d’unpoids
pi avec pi E[0; 1]
et tel que03A3pi
= 1 :G = sous-ensemble arbitraire de
points
deE, qu’on appellera
« groupe » depoints
pour
simplifier.
H(G)
=hyperplan
obtenu parrégression
sur un groupe, dans ce cas G estappelé
«ensemble» ou « groupe
générateur»
del’hyperplan.
On définit une tranche de mesure, - ou
d’épaisseur
-, rJ autour deH(G)
paret l’on
appelle
encoreH(G) l’hyperplan
directeur de la tranche. Le sous-ensemble depoints
de E associés à une trancheT(H(G), 7;)
est notéOn définit la densité d’une tranche
T(H(G), ~)
parc’est-à-dire par le nombre de
points
de E dans la trancheT(H(G), ~]).
On utilisera indifféremment le terme de tendance pourparler
deH(G),
deT(H(G),~)
ou deE(H(G), ~).
On définit la distance entre un groupe
G, (non
forcément groupegénérateur)
etun
hyperplan H
paroù
x*,
laprojection
de x surH,
est l’élément leplus proche
de x au sens ded(x, x*)
et où px est un
poids
à donner àchaque point
x de G.Pour caractériser la notion de distance entre deux groupes
G1, G2,
ou deux tendancesTl, T2,
au senslinéaire,
on définit le concept de distance linéaireréciproque
86 H. EL MAY, G. ANTILLE, R. TRÉMOLIÈRES par
Deux groupes
GI, G2,
ou deux tendancesTi, T2
seront alorsproches,
au seuil03B5 et au sens de la distance linéaire
réciproque
siOn
peut
aussi tenircompte
du nombre depoints
dans les groupesGl
etG2,
en
remplaçant
la moyennearithmétique simple
des 2 distances par une moyennearithmétique pondérée
par ces nombres depoints.
Onpeut
aussi convenir d’autres définitions similaires.Cette distance tient
compte
essentiellement de la notion d’orientation si les groupesG1
etG2
sontéloignés
dansl’espace
maisapproximativement
dans leprolongement
l’un del’autre,
et, de la notiond’épaisseur
si les groupes sontproches.
Dans la méthode des tranches de
densité,
nous cherchons àexpliquer
uncaractère y relativement aux caractères
xj, j = 1,..., p
par une ouplusieurs régressions. Ainsi,
chacun despoints
de E pourra se retrouver dans l’une ou l’autre descatégories
suivantes :2022
points appartenant
à une même tendance(points
relatifs à un mêmehyperplan
derégression),
2022
« points-frontières » appartenant
àplusieurs
tendancessimultanément,
2022
points
isolés non rattachés à une tendance.Dans
l’application
del’algorithme,
on se fixe lesparamètres
suivants :2022 7/ indice
d’épaisseur
des tranches dedépart;
2022 03B5 seuil de
proximité permettant
de considérer que deux tendances différentes sont suffisammentproches
pour être confondues en uneseule;
2022 gmin, gmax nombres
ayant
pour but de fixer la taille retenue des ensemblesgénérateurs
des différentshyperplans.
On note alors :
G
= ensemble des groupesgénérateurs
retenus apriori
dansl’algorithme.
La taille de cet ensemble
peut
être trèsgrande puisqu’il peut
contenir à l’extrême tous les sous-ensembles à au moins p + 1 éléments de E. Poursimplifier,
on pourrane s’intéresser
qu’aux
groupesayant
exactement p + 1éléments,
donc tels que gmin = gmax =P +
1.On
peut
alors écrireoù
P(E)
est l’ensemble desparties
de E.Lorsque
la combinatoire liéeà G peut
être considérée commetrop importante,
on pourra aussi supposer
que g
est constitué d’un sous-ensemble tiré au hasard dans l’ensemble desparties
de E. Parexemple g peut
êtresupposé
défini par un sous- ensemble tiré au hasard de l’ensemble des sous-ensembles à p + 1 éléments de E.Mais il faut bien reconnaître que la
procédure
aléatoire est hautementconjoncturale
etqu’il
convient certainement deprendre
un nombre assezimportant
de sous-ensembles pouraugmenter
les chances de tirer deshyperplans
avec des directionsproches
dechaque
tendanceimportante
existante.En effet pour
qu’elle
soitconstituée,
une sous-structure doit êtrereprésentée
par au moins un groupe
générateur
contenu dans sa tranche etayant
une directionproche
de sonhyperplan
directeur.Pour des
généralisations
ultérieures nous introduisons en outre :sG = nombre minimum de
points
devant êtrespécifiques
à une tendance etn’appar-
tenant à aucune autre.
ST = nombre minimum de
points
devantappartenir
à la tranche associée à unetendance pour que cette tranche
puisse
être retenue.Pour
simplifier,
on limitera l’ensemble desparamètres
à des valeurs telles queLe seuil de
proximité 03B5
sera fixé à zéro audépart puis
on lui feraparcourir
les valeurs de la matrice de distances entre les
points
de l’ensemble dedépart.
Onpourra aussi laisser le libre choix à l’utilisateur. Pour
chaque
valeur de 03B5 deplus
enplus
élevée une nouvellepartition
enk(03B5)
groupes avec leurrégime
derégression
associé sera donnée
(pour
unedescription plus
détaillée de la méthodecf.
ElMay,
Trémolières
[3], [4]).
Cet 6’joue
l’effet de zoom etpermet
de déceler les structuressecondaires ou
principales.
Les orientations internes sont deplus
enplus négligées
aufur et à mesure que croît le seuil de
perception
03B5. Des mesurespermettant d’apprécier
la
qualité
deshyperplans
derégression
obtenus et leurpouvoir
dereprésentation
despoints
du groupeauquel
ils sont associés sont aussi calculées.Quant
à l’indiced’épaisseur ~
des tranches dedépart,
il devrait être lié au bruit que l’onpeut
admettre dans la définition des groupes dedépart.
La distribution deprobabilité
despoints
autour dechaque hyperplan permettra
de fixer ceparamètre.
Cependant,
par souci desimplification,
nous nous contenterons deprendre 7y = 0,
dans
l’application
del’algorithme
afin de limiter letemps
de calcul.L’algorithme
destranches de densité
peut
alors être établi comme suit :1. En fonction de la dimension ii -
(p
+1)
desdonnées, choisir 9
comme étantl’ensemble de tous les groupes à p + 1 éléments ou
uniquement
unepartie
constituée de r
(à
fixer parl’utilisateur)
groupes à p + 1 éléments tirés auhasard.
2. Pour tout G
E 9
. déterminer :
H(G), l’hyperplan
derégression,
T
(H(G), 1])
la trancheà ~ près,
b
(T(H(G), ~))
= card(E(H(G), 1]»),
la densité de la tranche.88 H. EL MAY, G. ANTILLE, R. TRÉMOLIÈRES
2022 classer toutes les tranches T
(H ( G), 1])
en ordre décroissant de leur den-sité.
(Considérer
à ce stadequ’aucune
tendance n’a encore été «examinée»ou «retenue» comme constitutive de la structuration linéaire
recherchée).
3. On considère alors la tendance T la
plus
dense non encore examinée etpossèdant
au moins s
points spécifiques,
autrementdit,
despoints appartenant
à la tendance T considérée et à aucune des tendancesdéjà
retenues comme constitutives de la structuration linéaire recherchée.On détermine si la tendance trouvée est
proche
auseuil 6’,
d’une tendancedéjà
constituée.
Si la tendance trouvée est
proche
d’une et une seule tendancedéjà constituée,
les
points
de la tendance sont annexés à la tendancedéjà
constituée.Si la tendance se trouve voisine à un seuil inférieur ou
égal
à 03B5 de deux tendancesdifférentes,
elle constitue une tendance frontière et lespoints spécifiques qui
laconstituent sont des
points-frontières.
Dans le cas où la tendance trouvée ne
possède
pas de tendance voisinedéjà constituée,
elle est définie comme une nouvelle tendance «constitutive» et sespoints
forment un nouveau groupe.Si l’on ne trouve pas de tendance suffisamment dense
(avec
au moins spoints),
les
points
enquestion qui
nepeuvent appartenir
à aucune autretendance,
sontlaissés de côté comme
points
isolés.On revient en 3. pour considérer les tendances suivantes.
4.
Augmenter 03B5
si un groupage moins fin est souhaité et retourner en 2..Les résultats en fonction de
plusieurs
valeurs de êpermettent
unedescription qui
va dans le sens de laperception
visuelle des données. C’est ainsi que pour les données de lafigure 1,
à un niveau de 03B5 =0,
la méthode détecte outre lepoint
aberrantI,
les 4 tendances suivantes :A un niveau E =
2,
tous lespoints
de lafigure
àl’exception
dupoint
aberrant 1sont regroupés
autour de la même droite : y = 3.18+0.5x. Aux niveaux intermédiaires 0 03B52, Hl
etH2
d’un côté ainsi queH3
etH4
de l’autre sontregroupés.
Par
ailleurs,
pour l’ensemble des données décrit dans lafigure 2,
la méthodedes tranches de densité identifie les 2 tendances suivantes au niveau E = 0 :
Au niveau E =
1, Hl
etH2
sontregroupés
autour de la droite derégression
classique :
y = -2 + 1.5x.3.
Applications
Nous avons testé la méthode des tranches de densité sur
plusieurs types
deconfigurations,
surplusieurs
lettres del’alphabet,
sur desfigures parfaites
et sur desfigures
où des bruits ont été introduits autour des tendances.Les résultats sont donnés pour différents seuils de
perception
6;. On initialise d’abord 6 à zéropuis
on lui faitparcourir
la matrice des distances euclidiennes entre lespoints
de l’ensemble de toutes les données. Onpeut
aussi limiterl’analyse
àseulement
quelques
niveaux de e choisis par l’utilisateur.Cette
analyse
à différents seuilspermet
d’avoir une masse d’information trèsgrande qui
est en même temps une source de découvertes intéressantesquant
aux orientations internes et àl’emplacement
despoints
les uns vis-à-vis des autres, mais aussiquelquefois
unepanoplie trop grande
de résultats : l’utilisateur devra faire unarbitrage
réfléchi entre, d’unepart,
les différents seuils deperception,
le nombre de groupes, les différentes mesures dequalité
deshyperplans obtenus,
et, d’autre part, la structure en groupes linéaires à choisir et les résultats à retenir.Les deux
premiers exemples présentés
ici sont relatifs à deux cas de reconnais-sance des formes :
2022
l’exemple
du «Aparfait»
où nous avons écarté tous les bruits defaçon
à avoirdes structures
parfaites (cf. Fig. 3),
et,2022
l’exemple
du « A diffus» où nous avons introduit des bruits(cf. Fig. 4).
FIGURE 3 Résultats obtenus pour
03B5 = 0, p = 1 et s = 2
FIGURE 4 Résultats obtenus pour
03B5 = 1.118, p = 1 et s = 3
La méthode est stable face aux bruits
qui
peuvent être introduits autour des tendances. Elle permet dans les deux cas de retrouver les trois barresprincipales
du« A » : deux barres
obliques
et une barre horizontale.Le troisième
exemple
est un nuage depoints allongé
où nous avons introduitun
point
aberrant(cf. Fig. 5) :
cepoint
est reconnu comme tel par laméthode,
il estqualifié
d’isolé et écarté lors du calcul del’hyperplan.
90 H. EL MAY, G. ANTILLE. R. TRÉMOLIÈRES
FIGURE 5a Résultats obtenus pour
03B5 = 0 et s = 2
FIGURE 5b Résultats obtenus pour
03B5 = 1 et s = 2
Le
quatrième exemple (cf. Fig. 6)
se rapporte à un cas multidimensionnel avec2 variables
explicatives
x, et X2 et une variable àexpliquer
y. Lafigure
est constituéede ii = 26
points
que pour la commodité nousdistinguons
en :11
points
«+»appartenant
auplan
7rl : y = -Xl - X2 +5,
6points
«o»appartenant
auplan
7r2 : y =2X1 - 2X2
+ 7.5, 3points
« * »appartenant
auplan
7r3 : y =2.5,
5
points
«2022»appartenant
aux 3plans
7ri, 7r2 et 03C03, et,1
point
« o »n’appartenant
ni à 7rl, ni à 7r2, ni à 03C03.FIGURE 6 Cas niultidinientionnel
Si on ne s’intéresse
qu’aux
groupesayant
3(=
p+ 1)
éléments. Lapremière
itération devrait consister en une énumération de
26
soit 2600 sous-ensembles.Pour limiter ce
départ fastidieux,
nous avons choisi de ne considérer que 200 sous- ensembles à 3 éléments tirés d’une manière aléatoire àpartir
de l’ensemble des données.A ê =
0,
unepremière tranche,
laplus dense,
est retenue; elle définitl’hyperplan
7r1 formé des 16points
«+» et «2022». Le groupegénérateur
de cette trancheest un des
16
groupescomposés
de 3points
«+» ou « a ».Dans la constitution du second groupe
générateur
tous les sous-ensemblesgénérant
lapremière
tranche ou d’autres tranches formées par moins de 3points spécifiques
sont laissés de côté parl’algorithme.
On cherche alors un groupegénérateur
depoints
autres que «+» et «2022» et de densité maximale. On trouve ungroupe formé de trois
points
«o».C’est ainsi que la deuxième tranche est constituée des 11
points
« o » et «8» de7r2.
A ce
stade,
il ne reste que lespoints
« * » et lepoint
«A»qui n’appartiennent
pas
déjà
à une tranche constituée.En écartant les
points déjà
inclus dans les 2 tranchesprécédentes,
on chercheun groupe
générateur
de densité maximale : celui-ci est trouvéparmi
lespoints
« * ».L’algorithme
retient leplan
7r3 formé par tous les 8points
« * » et « 0 ».Il reste alors un seul
élément,
lepoint
« A» qui
est considéré commepoint
isolé.Ainsi au seuil 03B5 = o,
l’algorithme
retrouve exactement la structure existante.Pour des valeurs de 03B5
plus grandes,
c0.3,
leséquations
des 3plans
sontlégèrement
modifiées par l’affectation d’autres
points
de l’ensemble des donnéesqui
leur sontproches
à une distance 03B5 defaçon
à constituer des tranchesd’épaisseur
c.Une nouvelle tendance ressort aussi dans les résultats : c’est une tranche constituée autour d’un
plan
médian entre lesplans
03C01 et 7r2 et incluant lepoint
Aqualifié
d’isoléauparavant.
A 03B5 >
0.3,
leplan
horizontaldisparaît
desrésultats,
sespoints, excepté
lepoint (0, 0, 2.5),
sont tous affectés aux autres tranches.A ê = 0.8 tous les
points
sauf lepoint (0, 0, 2.5)
sontregroupés
autour d’uneseule et même tendance.
Dans une deuxième
étape,
la variable àexpliquer
y, de l’ensemble desdonnées,
a été
perturbée
par une erreur normale de moyenne 0 et d’écart type 0.3.Cet écart
type
est arbitraire mais choisi defaçon
à ne pas trop compromettre laconfiguration
dedépart.
Pour des 03B5
petits
inférieurs ouégaux
à0.4,
lespoints
sontregroupés
par la méthode autour deplans
trèsproches
de 7rl, 7r2 et duplan
médian. Leplan
y = 2.5ne ressort
plus
dans les résultatspuisque
tous sespoints
àl’exception
d’un seul sontaffectés aux autres
plans.
92 H. EL MAY, G. ANTILLE, R. TRÉMOLIÈRES
Pour des valeurs de 03B5
plus grandes,
la méthode des tranches de densité forme ungroupe et détecte un
point isolé,
lepoint (0,0,2.5).
Enfin la méthode destranches
dedensité regroupe tous les
points
dans une même tranche autour duplan de régression
des moindres carrés : y = 5.52 - 1.2 x1 - 1.2 X2.
La méthode permet une bonne
description
de l’ensemble des données surtout si l’on tientcompte
des différents résultats liés àchaque
niveau de 6’.Dans les
exemples suivants,
nousprésentons
le comportement de la méthode face à certainesconfigurations particulières.
Pour la
représentation
illustrée à lafigure 7,
la méthode identifie des tendances horizontales et non verticalespuisqu’elle
tientcompte
non seulement de la notion d’orientation mais aussi de la densité en nombre depoints qui
est utilisée pour choisir les candidats aux groupes.Pour l’illustration
8, plusieurs
sous-groupes depoints
deplusieurs
tranches sontregroupés
par la méthode autour de la même tendance. La tendanceTl
est formée enpremier
parcequ’elle
estplus
dense queT2
etT3.
Par contre, si cette tendance était formée au total par un certain nombre depoints plus petit
que le nombre depoints
deT2
et celui deT3,
ces deux tendances seraient formées enpremier,
et les différentesmasses n’auraient pas pu former un nouveau groupe par manque de
points
propres, lespoints
enquestion
étantdéjà
classés dans des groupes.FIGURE 7 FIGURE 8
4. Conclusion
Les domaines
d’applications
de la méthode des tranches de densité sontnombreux en reconnaissance de formes à structures linéaires ou en
régression multiple
et
multirégression
linéaires.La méthode nous
paraît
fiable face auxreprésentations
où les tendances sont assez nettes et nonambigües.
A différents seuils deperception
la méthode décrit le nuage depoints initial,
en définissant des tendances «naturelles» linéaires en harmonieavec la
perception
visuelle.Cependant,
les groupes formés n’obéissent pas forcément au concept decontinuum,
un concept nonpris
en compte par la méthode. Plusieurs sous-ensemblesde
points appartenant
à différentes tranchespeuvent
êtreregroupés
par la méthode autour de la même tendance s’ils ontplus
ou moins la même orientation. Ainsion
risque
de mettre dans la même tranche des groupes depoints
assez distants mais formant le mêmehyperplan
derégression.
Les tranches obtenuespeuvent
êtrerepérées
en calculant un indice mesurant la cohésion et
l’homogénéité
des groupes trouvés. Onpourrait
se faire une idée de la distribution despoints
et des éventuelles concentrations depoints
dans lestranches,
enprojetant
parexemple
lespoints
de la tranche surl’hyperplan
directeur de celle-ci et enreprésentant
sipossible
la distribution despoints
obtenue ou en calculant un indice. C’est à l’utilisateur par la suite dedécider,
en fonction du
problème traité,
s’il estopportun
de tenircompte
des groupes différentsqui peuvent
être ainsi obtenus.Les
problèmes
à traiterpouvant
être trèsdisparates,
il faudrait essayer de donner uneplus large place
àl’heuristique
et àl’interactif,
en utilisant le bon sens de l’utilisateurqui
devra intervenir même au niveau de la résolution duproblème
afin deguider
le déroulement del’algorithme.
Ainsi onpourrait prévoir d’intégrer
différentes définitions deproximité
des tranchesqui
seraient choisies en fonction duproblème traité,
enprivilégiant
tantôt la notiond’orientation,
tantôt la notion decohésion,
tantôt la notiond’épaisseur.
Dans le cas où le
concept
de continuumpeut
êtreprivilégié,
on peut se contenter de déterminer des «groupes»homogènes,
parexemple
au sens de lapercolation
etdéfinir des tendances propres à chacun
d’eux,
pourvu évidemment que ces groupes forment des tendances suffisamment denses.Dans le cas où le
concept
de tendance doit êtreprivilégié,
la méthode des tranches de densitépermet
par contre d’aborder leproblème
defaçon plus générale
en offrant la
possibilité
d’obtenir deshyperplans
derégression
constitués de groupes différents mais relatifs à des tendancesidentiques.
Références
[1] Antille G.,
ElMay
H.(1992).
The Use of Slices in the LMS and the Method ofDensity
Slices : Foundation andComparison,
inDodge
Whittaker(Ed.), Computational Statistics,
Vol. 1(Physica-Verlag)
441-445.[2]
AntilleG.,
ElMay
H.(1994).
MéthodesDescriptives
enRégression Linéaire,
XXVI° Journées de
Statistique
del’ASU,
Neuchâtel 1994.[3]
Charles C.(1977).
LaRégression Typologique
et la Reconnaissance desFormes,
Thèse de 3èmecycle,
Paris IX.[4]
ElMay
H.(1991).
Extension de laRégression Classique
à des ProblèmesTypologiques
et Présentation de la Méthode des Tranches de Densité : uneApproche
Basée sur laPercolation,
thèse dedoctorat,
IAE. Université d’Aix- Marseille III.[5]
ElMay
H.(1992).
La Méthode des Tranches de Densité : uneRéponse
auxProblèmes de
Multirégression,
cahier 92.05 dudépartement
d’économétrie de l’Université de Genève.94 H. EL MAY, G. ANTILLE, R. TRÉMOLIÈRES
[6]
ElMay
H. and Trémolières R.(1992).
Presentation of the Method ofDensity
Slices : An Answer to the Multitendencies
Problems,
inDodge
Whittaker(Ed.), Computational Statistics, Vol.
1(Physica-Verlag)
pp. 171-178.[7]
OK Sakun Y.(1975). Analyse
FactorielleTypologique
etLissage Typologique.
thèse de 3e
cycle,
Université de Paris VI.[8]
Mac GeeU.E.,
Carleton W.T.(1970).
PiecewiseRegression. JASA, September
70,
Vol.65,
No331, Applied Section,
pp. 1109-1124.[9]
TrémolièresR., ( 1983)
The Generalized Percolation for DataAnalysis
and PatternRecognition.
In «New Trends in DataAnalysis
andApplications»,
J.Jansen,
J.F.