M ATHÉMATIQUES ET SCIENCES HUMAINES
M. T REHEL
Catalogues, treillis de catalogues, génération et décomposition
Mathématiques et sciences humaines, tome 40 (1972), p. 5-18
<http://www.numdam.org/item?id=MSH_1972__40__5_0>
© Centre d’analyse et de mathématiques sociales de l’EHESS, 1972, tous droits réservés.
L’accès aux archives de la revue « Mathématiques et sciences humaines » (http://
msh.revues.org/) implique l’accord avec les conditions générales d’utilisation (http://www.
numdam.org/conditions). Toute utilisation commerciale ou impression systématique est consti- tutive d’une infraction pénale. Toute copie ou impression de ce fichier doit conte- nir la présente mention de copyright.
Article numérisé dans le cadre du programme
CATALOGUES, TREILLIS DE CATALOGUES, GÉNÉRATION ET DÉCOMPOSITION
par M. TREHEL1
Les
catalogues forment
un typeparticulier
defichiers
arborescents. Lesopérations qui
consistent à réunir les in-formations
ou à capter cequi
est commun à deuxcatalogues correspondent
à l’union et l’intersection de la théorie des treillis. Cette étude donne un moyen degénérer
cette classe de treillisindépendamment
descatalogues
etde retrouver la
forme
descatalogues
àpartir
de laforme
du treillis.INTRODUCTION
Le
problème
del’échange
d’informations sur bandemagnétique
entre laboratoires s’estposé
dèsl’appa-
rition de ces bandes dans les centres de calcul : pour que le centre
récepteur puisse
décoderl’information,
il est nécessaire que le format soit
parfaitement
défini. Le Centred’Études
pour la Traduction Automa-tique
de Grenoble et le Laboratoire deLinguistique
de la RandCorporation
à Santa Monica en Californieont coordonné leurs efforts pour arriver à un format commun en 1963. Le résultat fut
appelé
formatde
catalogue [5].
Lafaçon
de relier entre eux les différents types d’information étaitexpliquée
dansun cas
particulier.
C’est seulementplus
tard que la structure decatalogue
fut définie de manièregénérale,
à l’aide de la théorie des ensembles
ordonnés,
et que diversespropriétés mathématiques
apparurent[8].
Bien que les
catalogues
soient issus depréoccupations linguistiques,
ce n’est pas dans cettediscipline qu’on
en trouve lesexemples
lesplus intéressants,
maisplutôt
à propos depréoccupations
administratives. Nous allons donc
présenter
la notion decatalogue
àpartir d’exemples
decomplexité
croissante, puis
donner des schémas de fichiersqui
ont été réellement construits sur ce format.De nombreux fichiers administratifs ont une structure de
catalogue
à carte linéaire : ils sontconstitués d’un certain nombre de fiches
qui
ont toutes le même nombre de niveaux[1].
Les informationsqu’on
trouve à un niveau donné sont dites être les différentesétiquettes
d’une mêmecaractéristique.
Supposons qu’on
ait troiscaractéristiques :
un nomd’individu,
sonprénom, puis
un code d’iden-tification.
Chaque
fiche sera constituée de ces trois éléments.Figure
11. Ce travail a été réalisé à :
IUT, route de Perros-Guirec, 22302 Lannion.
UER, IRMA, Mathématiques Appliquées, Université scientifique et médicale de Grenoble.
L’information est de type « un pour un»
puisque chaque
individu n’aqu’un prénom principal
et
qu’un
code.Toutefois,
il peut y avoirplusieurs
individus portant le même nom, et éventuellement le mêmeprénom.
On peut alors
imaginer
de regrouper les informations deplus
haut niveau.figure 2
La mise sous forme arborescente n’a pas tellement de raison d’être dans ce cas. Présentons
l’exemple
del’emploi
du temps dans uneuniversité,
où il en va différemment. Au nom de la personne,on attache les cours
qu’il fait, puis
lelieu,
lejour,
l’heure où il les fait.Figure
3Un tel
catalogue
acinq
fiches.La
description
descaractéristiques
est faite au moyen d’une chaîneappelée
carte etqui,
dans cetexemple,
seprésente
ainsi :Figure
4Une telle carte est dite linéaire. On
peut imaginer
une carte arborescente danslaquelle,
si deuxcaractéristiques
ne sont pas irrémédiablement liées l’une àl’autre,
elles ne sontplus
l’une sous l’autre.Ainsi,
onpeut
avoir la carte :Figure
5.Afin que le
catalogue
soit unearborescence,
nousadjoignons
une racine w.Figure
6La fiche n’est
plus
une chaîne commeprécédemment,
mais une arborescence.C’est une
partie
ducatalogue, composée
d’une et une seuleétiquette
dechaque caractéristique.
Il y a quatre fiches dans
l’exemple ci-dessus,
chacune étantcomposée
du nom d’unindividu,
d’uncycle
d’études
qu’il
asuivi,
d’unenseignement qu’il dispense.
On a
déj à
dit que c’est à propos delinguistique
que lescatalogues
ont été introduits. D’abord le corpus, ensemble de textes servant à tester les programmes de traductionautomatique,
a été mis surbandes sous le format de
catalogues.
Pourplus
dedétails,
le lecteur pourra consulter les notices de la RandCorporation ([4]
et[5]).
Des dictionnaires
techniques
del’anglais
au russe ont aussi été mis sous format decatalogue : chaque
dictionnaire(D)
donne une liste de numéros(NR)
de noms.A
chaque
numéro est attaché ses formes en russe(FR)
et seséquivalents anglais (EE).
Sous
chaque
FR on trouve des codesgrammaticaux (CG)
et des codesidiomatiques (CI).
La carte est la suivante :
Figure
7Tous ces
exemples
ne suffisent pas pour définir formellement uncatalogue.
La difficulté rencontrée pour aborder cette définition est due au faitqu’un catalogue
n’est pas unensemble,
carplusieurs
de seséléments
peuvent porter
le même nom, c’est-à-dire la mêmeétiquette, donc,
afortiori,
ce n’est pas un ensemble ordonné.Ainsi,
pour lafigure
5plusieurs enseignants
peuvent avoir suivi des études communes et dès lors le nom de ces études se retrouvera àplusieurs
endroits dans lecatalogue.
Nous passerons donc par la notion intermédiaire deprécatalogue, qui, lui,
est un ensembleordonné,
dont on peut ensuiteétiqueter
des éléments distincts avec la même
étiquette,
sous certaines conditions.L’ensemble des
étiquettes
d’une mêmecaractéristique
.A seraappelé
la collection liée à A.Nous serons aussi amenés à
imposer
àchaque
fiche d’êtrecomplète,
c’est-à-dire d’avoir une et une seuleétiquette
pourchaque caractéristique.
Nous utiliserons pour cela la notiond’homomorphisme
depremière catégorie
que nous verrons dans lesrappels.
Après
avoir défini formellement lescatalogues,
nous remarquerons dans unepremière partie
que leurunion et intersection
permettent
de définir des treillis. Dans une secondepartie,
nous montrerons que ces treillis peuvents’engendrer
à l’aide duproduit
direct et d’une autreopération appelée produit
contracté.Dans une troisième
partie,
nous constateronsqu’étant
donné un de cestreillis,
il ne peut avoir étéengendré
que d’une seule manière et nous donnerons unalgorithme
dedécomposition. En£~n,
nousverrons dans la dernière
partie quelles
sont les cartesqui peuvent
donner lieu à un certain treillis decatalogues.
RAPPELS
Dans un ensemble ordonné on dit que y couvre x si x y et si x z y
implique
z = x ou z = y.On
notez
y.Une chaîne est une suite d’éléments xl, x2, ... xp telle que xl x2 ... xp. Une chaîne maximale
est une suite d’élément xl, x2, ... xp telle que xi
- X2 ... ~!
xp et xi est un élémentminimal,
xp est un élément maximal. Dans lasuite, quand
onparlera
dechaînes,
ils’agira toujours
de chaînes maximales.On dit que x et y sont
comparables
si x y ouy
x.Dans un ensemble ordonné ayant un élément nul 0 et un élément universel
1,
y est dit uncomplé-
ment de x si :
- , . ’1....,
Un ensemble ordonné
compléments
est tel que tout élément admette uncomplément.
Une arbo-rescence est un ensembles ordonné fini tel que deux éléments
quelconques
ont un minorant communmais pas de
majorant
commun. L’élément nul estappelé
racine.On
distinguera
l’ensemble X des éléments d’une arborescenceY,
de l’arborescenceelle-même, qui
est la donnée de X et d’une relation d’ordre 3fqui
en fait une arborescence. On notera Y =(X, 2f) .
Une
forêt
est une union d’arborescencesdisjointes.
Une
pseudo-arborescence [7]
est une arborescenceétiquetée,
deux éléments distincts peuventporter
la mêmeétiquette.
Dans lespseudo-arborescences
dont il seraquestion,
les éléments distinctscomparables
porteront desétiquettes
distinctes. La notion de chaîne maximalepeut
doncs’appliquer
à des
pseudo-arborescences.
Les racines d’une forêt seront dites de niveau
0 ;
si x est de niveau i et y couvre x, alors x sera dit de niveau i -~- 1.Un
homomorphisme
d’ordre strict depremière catégorie
parrapport
à lapremière
variable[6]
estune
application
tp d’un ensemble ordonné E dans un ensemble ordonné F telle que :i)
a bimplique y (a)
~(b) ii) cp (a)
tp( b) implique
Pour un
homomorphisme
par rapport à la deuxièmevariable, ii)
est àremplacer
parii’).
ii’) cp (a)
y(b) implique
db~
~(p-1
(p(b), 3 il¡ E rp-1 tp (a)
a,bi .
Le
produit
cartésienTl
XT2
est l’ensemble descouples (x, y)
où x ETl,
y eT2.
Leproduit
direct
Tl. T2
des ensembles ordonnésTl
etT2
est l’ensemble descouples,
ordonné par la relation :Le treillis de Boole à 2P éléments sera noté 2P.
On écrira
Tl N T.
pourexprimer l’isomorphisme
des ensembles ordonnésTl
etT2.
Les autresnotations utilisées sont évidentes.
Soient des ensembles ordonnés ayant un 0.
On considère dans
Tl
XT2
l’ensemble H descouples (0, x)
et(x, 0)
et lapartition
deTl
XTZ
en sous-ensembles pour
lesquels
H est le seulnon-singleton.
Leproduit
contractéTl
*T2
est l’ensembledes
classes,
muni de la relation d’ordre induite àpartir
duproduit
direct.On a:
1 sont des
treillis,
alorsTl
*T2
en est un aussi.On dit que T est irréductible pour * si T a
plus
de 2 éléments et si T c-t~Tl
*T2 implique Tl c-~e
21ou
T2 ~
21. On dit que T est irréductible pour. si T aplus
d’un élément et si T ~Tl . T2 implique
que
Tl
ouT2 a
un seul élément.Les ensembles ordonnés connexes
possèdent
lafactorisation unique [3]
pour leproduit
directce
qui signifie
que siS1 . S2 .... S~ N T~ . T2
....Tn
et que lesSi
etTi
soient connexes et irréductibles pour ., alors m = n etTl, T2
...Tn
sontrespectivement isomorphes
à S Yll S 2, ... S cpn pour une per-mutation (p == (çi,
...CPn)
de(1,
...n).
On en déduit aisément la factorisation
unique
pour leproduit
contracté des ensembles ordonnéeavec 0.
I.
DÉFINITION
DESCATALOGUES,
UNION ET INTERSECTIONSoit un ensemble X et une relation d’ordre Ye
qui
en fait une arborescence Y =(X, Xe).
Une forêt Fiest dite un
précatalogue
sur Y s’il existe uneapplication surjective
de F sur Yqui
soit unhomomorphisme
d’ordre strict de
première catégorie
successivement par rapport aux deux variables.Il est clair que tous les éléments de
tp-1 (x)
sont au même niveau pourchaque x e
X.Ajoutons
à .F une racine co pour en faire une arborescence.Étiquetons
les éléments duprécatalogue
de sorte que deux éléments n’ont mêmeétiquette
que s’ilsappartiennent
au mêmetp-1 (x)
et s’ils ne couvrent pas un même élément. Lapseudo-arborescence
obtenue alors est un
catalogue.
Les éléments de X sont notés
A, B, C,
... D. L’ensemble desétiquettes
decp-1 (A)
est notécoll
(A) _ {
a,, a2, ... a(X } etappelé
collection liée à A. Son nombre d’éléments est card(coll. (A)).
De même coll
(B) = {bH b2,
...b~ }
et ainsi de suite.. r , , ,
est dit ensemble
d’étiquetage.
On trouvera des
exemples
decatalogues
à lafigure
8.On
appellera
carte Z la donnée de l’ensemble X ordonné par la relation d’ordre ,~’ et de V.On écrit Z =
(X, Jf, V)
et arb(Z) = (X, 5r) .
Lescatalogues
ainsi définisauxquels
onadjoint
l’ensemblevide noté
0,
sont lescatalogues
de carte Z.Enfin,
uncatalogue
contenant un et un seul a~, un et un seulbi,
... un et unseul di
estappelé
unefiche.
R est dit une fiche extraite de K si R est une fiche et si toute chaîne maximale de R est une chaîne maximale de K.
Conditions pour
qu’un
ensemble E de chaînesdéfinisse
uncatalogue
de carte donnée :1)
Ces chaînes doivent être toutes distinctes.2)
Chacune doit fairepartie
d’une fiche forméeuniquement
de chaînes de E.Ces conditions sont visiblement nécessaires et suffisantes.
Union et intersection de
catalogues
Soient les
catalogues Kt
etK2
de même carteCi.
Ordre
Ki K2,
sichaque
fiche extraite deKt
est une fiche extraite deK~.
On vérifie quechaque
chaînemaximale de
Kt
est une chaîne maximale deK$.
Union de
Kt
et.I~Z
Il s’ensuit que
Kt
VK2
est lecatalogue
dontchaque
chaîne maximale est, soit une chaîne deKi,
soitune chaîne de
K2.
Exemple
Figure 8
C’est un
exemple
oùKl
VK2
contient des fichesqui n’appartiennent
ni àKl
ni àK2.
Intersection de
KI
etK2
KI
/1KZ
est l’union des fiches extraites deKI
etK~.
Exemple
On
reprend K,
etK2
de lafigure
8.Figure
9Ayant
une union et uneintersection,
lescatalogues
de carteCl
forment un treillisqui
sera notéT
(Cl) . V
étantfini,
ils’agit
d’un treillis fini. Son élément nul sera noté0,
son élément universel 1.Les atomes sont les
catalogues
formés d’une seule fiche.II.
GÉNÉRATION
DES TREILLIS DE CATALOGUESComposition
de cartesSoit A
n’appartenant
à aucunXi
et coll(~4) === {~i~
... an )disjoint
avecchaque n.
La carte
(X,
5r,V)
ainsi définie :sera notée
Catalogues
de 1Soit un
catalogue
non nul de T(A1 Ci C2
...Cn).
Par la définitionprécédente
les éléments d’une chaîne nepeuvent appartenir
à des collections liées àplus
d’unCi.
On noteKt
lecatalogue
formé des chaînes dont les élémentsappartiennent
à des collections liées aux éléments deCi.
K sera noté al
Kl K2
...Kn.
Propriété
1Démonstration
On a vu que les
catalogues
non nuls de T(Al Ci C2
...Cn)
s’écrivent a,K, K2
...Kn
où T(Ci)
et 0. On retrouve donc bien le
produit
contracté.Exemple
Figure
10Propriété
2Démonstration
Les
catalogues
de TCI C2
...Cn)
peuvent s’écrire(ocl,
a2, ...am)
oùchaque
ce, est uncatalogue
ai
Ki
d’un treillis TCi ... Cn)
ou 0. On retrouve donc leproduit
direct.Propriété
3Les treillis de
catalogues
sontisomorphes
aux treillis obtenus par un nombre finid’applications
des deuxopérations
suivantes : élévation à lapuissance,
etproduit contracté,
àpartir
de 21.C’est une
conséquence
immédiate despropriétés précédentes.
Les treillis de
catalogues
sont des casparticuliers
des treillis CD ainsi définis :Les treillis CD sont les treillis obtenus par un nombre fini
d’applications
desopérations
deproduit
direct et de
produit
contracté àpartir
de 21.Le lecteur vérifiera aisément les
propriétés suivantes, qui
nous serviront dans la suite etqui
sedéduisent de la manière dont on a
engendré
ces treillis.Propriété 4
Les treillis CD sont
complémentés.
Propriété
5Les treillis CD sont
coatomiques (ce qui signifie
que tout élément est intersection decoatomes).
Propriété
6Dans un treillis
CD,
l’union descompléments
d’un coatome x estcomplément
de x.III.
DÉCOMPOSITION UNIQUE
D’UN TREILLIS CD. ALGORITHME DEDÉCOMPOSITION
Il y a
plusieurs façons
de montrerqu’un
treilus CD résultant d’unproduit
contracté ne peut être iso-morphe
à un treillis CD résultant d’unproduit
direct. Nous en choisissons unequi
débouche sur unalgorithme simple.
Graphe
descompléments
Supposons
que l’ensemble ordonné T soitcomplémenté :
on dit que legraphe
non orienté(X, U)
où Xest l’ensemble des sommets,
U,
l’ensemble desarêtes,
estgraphe
descompléments
de T si :-- X -
T -- { 0,13
- l’arête
[a, b]
E U si et seulement si b estcomplément
de a dans T.Propriété
7Si les ensembles ordonnés
Tl
etT2
sontcomplémentés
et distincts de21,
alors legraphe
descompléments
de
Tl * T2
est connexe.Démonstration Soient
On peut écrire
Montrons
qu’il
existe une chaîne entre x et y.Soit x E
T2, Z =1= 0, 1.
Soient a’ et c’ descompléments respectifs
de a et c dansTl,
z’ et d’ descompléments respectifs
de z et d dansT2.
- - Si a et c sont distincts de 1
x =
(a, b)
estcomplément
de(a’, 1)
- --~ Si c = 1 alors
d ~
1puisque y 5~
1.Soit en
plus
parexemple a ~ 1
x =
(a, b)
estcomplément
de(a’, 1)
Les autres cas sont
symétriques.
Ainsi x, y
quelconques
sont reliés par une chaîne : legraphe
est connexe.Propriété
8Le
graphe
descompléments
deTl . T2
n’est pas connexe.Il est en effet clair que
(1, 0)
a pourcomplément unique (0, 1).
Ces deux
propriétés permettent
de voirqu’un
treillis CD provenant d’unproduit
contracté nepeut
êtreisomorphe
à un autre venant d’unproduit
direct. Deplus
un treillis a lapropriété
de factorisa- tionunique
pour leproduit
direct et pour leproduit
contracté. Ainsi un treillis CD n’aqu’une génération,
ou une
décomposition, possible.
Algorithme
dedécomposition
d’un treillis CDNotons
x]
l’ensemble des élémentsqui
sont inférieurs ouégaux
à x. Si le treillis n’est pas àgraphe
descompléments
connexe, il estisomorphe
auproduit
desx]
où x est minimal(distinct
de0) parmi
leséléments ayant un seul
complément. x
s’écrit en effet :(0, 0,
...0,1, 0,
...0).
Si le treillis est à
graphe
descompléments
connexe il est résultat d’unproduit
contracté dont il fautpouvoir
trouver les facteurs.Notons C
(x)
l’ensemble des coatomessupérieurs
ouégaux
à tous lescompléments
de x.Propriété
9Dans un treillis CD résultant d’un
produit direct,
si x et y sont deux coatomesdistincts,
alors y E C(x)
ou y E C2
(x).
Démonstration
1 l’union z des
compléments
de x estSi par contre y s’écrit
(d, 1, 1, ... 1)
alors l’union z descompléments
de y est t =(d’, 0, 0,
...0).
On peut trouver un coatome u =
(1, b,1, ... 1) supérieur
ouégal
à t et y E C(u).
Corollaire 10
Dans un treillis CD résultant d’un
produit
contracté d’ordonnés irréductibles pour*, Sl, S2,
...Sn,
tousles éléments de la forme
(x, 1, 1, ... 1)
et eux seuls sontengendrés
àpartir
d’un coatome de cette formepar les
opérations C, C2,
etd’intersection,
effectuées sur deséléments =A
0.Démonstration
Soit un coatome p =
(x, 1, ... 1)
où x est un coatome deSl.
Par lapropriété precéden1:e
onpeut
obtenir le coatome y dansS,
àpartir
de x par C et C2. Donc dansSi * S2
... *Sn,
on obtient(y, 1, 1, ... 1)
àpartir
de p.Puisque
le treillisS,
estcoatomique,
on obtient tous les éléments de cette forme par inter- section de coatomes. Il est clair enfin que lesopérations C,
C2 sur desélé*ments 0 0,
et l’intersection nedonnent que des éléments de cette forme.
L’ensemble des éléments
obtenus, auxquels
onadjoint
0 est 1ù1 facteur duproduit
contracté.On obtient les autres facteurs à
partir
d’un coatome non encore investi, IV.DÉCOMPOSITION UNIQUE
ET CARTESÉQUIVALENTES
Deux cartes
Cl
etCp
sont diteséquivalentes
s’il existe une suiteCl, Ci,,
...,Cp-,
telle queCi
etCi+,
pouri = 1, 2,..., p -
1 soient dans l’une des situations suivantes :1)
Les arborescences sontisomorphes
et les collections liées aux sommetsqui
secorrespondent
parl’isomorphisme
ont même cardinal.2)
L’une des arborescences est(X,
l’àutre(~
induit sur
X - { A ~
àpartir
de3)
L’une des arborescences est5r),
l’autre(X
U {E ~ - { A,
B}, Jr’)
où:/Í est tel que tout élémentcomparable
à A estcomparable
àB,
et réci-proquement,
card(coll (E))
= card(coll (A))
X card(coll (B»,
et .~’’ est l’ordre induit àpartir
de X’en enlevant
A,
etremplaçant
B par E.Exemple
n’avons
aux ntauds des arborescences deCl
etC2
les tardinaux des collectionscorrespondantes :
Figure
112) Supprime
A où card(coll (A))
= 13) Regroupe
B et C avec card(coll (B))
=2,
card(coll (C))
= 8.Propriété
11T T
(C2)
si et seulement siCl
etC.
sontéquivalentes.
Démonstration
Il est clair que si
Cl
etC2
sontéquivalentes,
T T(C2).
Démontrons laréciproque :
soit TT
(C2).
La
propriété
est vraie si T 21.Supposons-la
vraie si T(Cl)
n’a pasplus
de n éléments et montrons-la pour n-~-
1. Tout d’abord ilpeut
ne pas exister de treillis decatalogues
de n -!- 1 éléments. Leproblème
est alors résolu.Sinon,
deux cas seprésentent :
- T
(Cl)
est le résultat d’unproduit
contracté.T
(Cl)
nepeut provenir
d’unproduit
direct. On peut doncdécomposer
T(Cl)
de manièreunique
enensembles ordonnés irréductibles pour * et .
qui
sont des treillis decatalogues.
Par
hypothèse
de récurrence les cartesDl, D2,
...Dm
sontéquivalentes
aux cartesEl
...E~
pourune
permutation
convenable.Donc
Ci
etC2
sontéquivalentes.
- T
(Ci)
est le résultat d’unproduit
direct.Puisque
c’est un treillis decatalogues,
onpeut
l’écrire T( T (D)) m
où T(D)
est irréductible pour leproduit
direct.~ sont
équivalentes.
DoncCi
etC2
sontéquivalentes.
BIBLIOGRAPHIE
[1] ABRIAL, BAS, BEAUME, HENNERON, MORIN, VIGLIANO, Projet Socrate,
Doc.interne,
Institut deMathématiques Appliquées,
Université deGrenoble,
août 1970.[2]
BARBUTM.,
MONJARDETB.,
Ordre etclassification : Algèbre
et combinatoire 1.Paris, Hachette,
1970.[3]
CHANG C.C.,
JONSSONB.,
TARSKIA.,
"Refinementproperties
for relationalstructures",
Fund.Math., 55, 1964,
pp. 249-281.[4]
HAYS D.G.,
KAYM.,
KOZAK A.S.,
TAFT T.D.,
Afile of
Russian text onmagnetic
tape, Memorandum RM5509-RADC,
octobre1967,
RandCorporation,
SantaMonica,
Calif.[5]
KAYM.,
ZIEHET.,
Thecatalog :
Aflexible
datastructure for magnetic
tape, Memorandum RM 4645PR,
octobre
1965,
RandCorporation,
SantaMonica,
Calif.[6]
KUNTZMANNJ.,
"Extension aux relations de certaines notionsalgébriques",
C.R. Acad.Sci., Fr.,
267