• Aucun résultat trouvé

État des recherches sur la classification ascendante hiérarchique exposées dans ce cahier

N/A
N/A
Protected

Academic year: 2022

Partager "État des recherches sur la classification ascendante hiérarchique exposées dans ce cahier"

Copied!
2
0
0

Texte intégral

(1)

L ES CAHIERS DE L ’ ANALYSE DES DONNÉES

État des recherches sur la classification ascendante hiérarchique exposées dans ce cahier

Les cahiers de l’analyse des données, tome 7, n

o

2 (1982), p. 162

<http://www.numdam.org/item?id=CAD_1982__7_2_162_0>

© Les cahiers de l’analyse des données, Dunod, 1982, tous droits réservés.

L’accès aux archives de la revue « Les cahiers de l’analyse des don- nées » implique l’accord avec les conditions générales d’utilisation (http:

//www.numdam.org/conditions). Toute utilisation commerciale ou impres- sion systématique est constitutive d’une infraction pénale. Toute copie ou impression de ce fichier doit contenir la présente mention de copyright.

Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques

http://www.numdam.org/

(2)

1 6 2 J.P. BENZECRI

Etat des recherches sur la classification ascendante hiérarchique exposées dans ce cahier

{ETAT C.A.H.]

L'article {BORNES NIV. C.A.H.] ainsi que les sept articles qui le suivent sont consacrés à la classification ascendante hiérarchi- que. Il nous paraît bon de profiter d'une page blanche pour préci- ser les rapports entre ces huit articles.

{BORNES NIV. C.A.H.l concerne le choix d'un seuil dans l'algo- rithme des voisinages réductibles (cf. M. Bruynooghe) ; algorithme éventuellement susceptible de perfectionnements, mais qui,dans son état actuel est nettement plus lent que les algorithmes programmés par J. Juan dans {PROG. C.A.H. RECIP.] et {PROG. C.A.H. CHAINE RE CIP.1.

LC. A. H. DIST. TRI] suggère une idée nouvelle qui paraît pouvoir accélérer grandement la C.A.H. ; et donne sans programme de calcul les premiers résultats expérimentaux.

{C.A.H. FLUX] offre un nouveau critère d'agrégation : ce cri- tère peut servir 3ans l'algorithme de base de la C.A.H., mais aussi dans les algorithmes accélérés d'agrégation des voisins récipro- ques, éventuellement en chaîne : il est en particulier immédiate- ment utilisable avec le programme ALGOL donné dans {C.A.H. CHAINE RECIP.]

IPROG. C.A.H. RECIP.] en utilisant le principe des voisins réciproques (dont C. de Rham nous a montré l'intérêt) ce programme est actuellement, à notre connaissance, celui qui réalise les meil-

leures performances moyennes en agrégation suivant la variance.

{PROP. RECIP.] on voit que sur un cas modèle (qui semble typi- que) {PROG. C.A.H. RECIP.] a un temps d'exécution de l'ordre de n ( n étant le nombre d'individus). 2

{CHAINE COUP. C.A.H.l mais on peut construire des exemples où {PROG. C.A.H. RECIP.] a, comme l'algorithme de BASE, un temps de l'ordre de n ; d'où l'intérêt des algorithmes en "CHAINE".

{C.A.H. CHAINE RECIP.] en recherchant individuellement les pai- res de voisins réciproques, on a un temps de calcul toujours en

2

n , quelles que soient les données. L'algorithme donné ici, opérant sur un tableau de distances, est apte à traiter tous les critères usuels, notamment [C.A.H. FLUX].

{PROG. C.A.H. CHAINE RECIP.] applique le principe de la recher- che en CHAINE avec le critère d'agrégation suivant la variance ; et opère sur un tableau de coordonnées factorielles (ou de mesures), ou un tableau de correspondance. Il est en moyenne un peu moins rapide que {PROG. C.A.H. RECIP.], mais est toujours en n2 (cf. {CHAINE COUP.

C.A.H.]).

Références

Documents relatifs

[TxAr]), est traité, suivant la même méthode, un corpus étendu, où, aux 13 premiers fragments sont ajoutés 78 autres, longs également de quelque 3k, mais d'une plus grande

Partant d'un sommet s on cherche le sommet v(s) qui en est le plus proche en calculant les n distances de s à tous les sommets non rangés dans la chaîne; en cherche ensuite v(v(s))

1°) Choix du nombre k: selon nos hypothèses, e est estimé d'après la dimension de l'espace ambiant; k est choisi tel que (l-e) k &lt; 1/2. 2°) Tirage d'un échantillon E de

Commentaire : le tableau Ncl contient les numéros des classes qu'on désire retenir pour elles-mêmes ; le tableau Ret sera l'indicatrice de la sous-hiérarchie retenue avec

Commentaire ; KI est le nombre des points POSIJ parmi lesquels on recherche des voisins au point PJ ; KJ est la dimension de l'es- pace ambiant (ici on ne détaillera pas les

La réalisation de cette idée exige le tri des distances entre observations et une nouvelle organisation des données mais permet d'obtenir des performances très supérieures à celles

Bien que dans de nombreux cas les ensembles I et J puissent être distincts, et que la description complète des flux requiert éventuel- lement un tableau ternaire (e.g. tableau

SI ON UTILISE CE SOUS PROGRAMME .L'ALLOCATION N'EST PAS DYNAMIQUE. PROGRAMME HIVOR.CLASSIFICATION ASCENDANTE BINAIRE,ALGORITHME DES VOISINS RECIPROQUES PAR LA METHODE DES