• Aucun résultat trouvé

0 Editions du CNRS, Paris, 1978 ISBN - 2-222-02312-2

N/A
N/A
Protected

Academic year: 2023

Partager "0 Editions du CNRS, Paris, 1978 ISBN - 2-222-02312-2"

Copied!
24
0
0

Texte intégral

(1)
(2)

0 Editions du CNRS, Paris, 1978 ISBN - 2-222-02312-2

(3)
(4)
(5)

Jacques LE MAITRE : la rationalisation des systèmes de traitement de l'information documentaire en archéologie

ERRATA

Pour diverses raisons, ce livre comporte un grand nombre d'erreurs dont la liste est donnée ci-dessous. L'auteur est conscient de la contrainte qu'imposera au lecteur la consultation fréquente de cette liste, il lui demande donc de bien vou- loir l'en excuser.

Chapitre 1

p. 2 lig. 4 informaticien

Chapitre 2

p. 17 lig. 3 page 16

lig. 5 page 15

p. 18 lig. 16 = tenon perforé =

p. 19 lig. 36 colonne 3

lig. 38 colonne 2 Chapitre 3

p. 43 lig. 29 DR au lieu de DAT

p. 44 lig. 1 idem

p. 47 lig. 7 trois niveaux

p. 48 lig. 10 i > 1

p. 50 le fig. PARTITION

p. 51 lig. 11 S m

p. 52 lig. 18 à une entité e de type E prendra pour la clé extérieure la valeur de la clé primaire de e

Chapitre 4

p. 61 lig. 17 SGD

entre lig. 22 et 23 Il manque la phrase suivante :

« Les deux premières études, bien que très complètes ne concernent que les SGBD, la troisième concerne les SGC (voir leur définition au paragraphe 3.3) et uniquement le cas des structures hiérarchiques »

p. 66 lig. 3 M =

lig. 7 et 8 p au lieu de m et q au lieu de n

p. 69 lig. 5 COULEUR

lig. 27 à 29 TABLEAU au lieu de ARTISTE

p. 70 lig. 4 LOC

p. 76 tab., lig. 2 < p

p. 79 lig. 4 et 5 m : m et n : n A

lig. 12 m- 1 o o 1

p. 80 lig. 5 n : n

lig. 11 m= 1 et 1, n : ii lig. 12 RRII = 0

p. 85 lig. 1 n = 1

(6)

4eme fig. supprimer la relation AIFG

p. 89 lig. 7 TR 13

p. 94 lig. 10 l'instruction 5 est effectivement absente p. 96 lig. 10 à 15 fi au lieu de f

p. 99 lig. 13 n =

p. 100 lig. 13 langage d'échange p. 102 lig. 10 * P

p. 105 ler tab., lig. 2 P lig. 17 R 13 p. 107 lig. 9 n > 1

lig. 13 j < n

p. 109 lig. 6 TA 12 sur ARTISTE , exemple A 12 Chapitre 5

p. 117 lig. 2 et à chaque relation r de type R un code «cr», puis l'on place le terme descriptif « AR1 : cr» dans la des- cription de chaque entité origine de r et le terme des- criptif « AR2 : cr » dans la description de chaque enti- té extrémité

lig. 8 AR1

p. 118 lig. 1 n + 1 lig. 2 n + 2

p. 126 lig. 24 T (i, 3) - T (i, 2) < 5 0 lig. 28 (1, LA, T, 1)

p. 128 lig. 26 (2, T, TC, LPD, 1) p. 129 lig. 3 (1, T, TC, LD, 0) Chapitre 6

p. 132 lig. 9 .> 1880 < 1974

p. 133 lig. 6 COU : Noir + COU : Blanc lig. 10 « + »

p. 137 fig. CDSH

p. 140 lig. 12 longueur

p. 141 lig. 10 + DESSIN = p. 144 lig. 17 6. 2. 2.

Chapitre 7

Lire les pages dans l'ordre suivant : 147, 150, 148, 149, 151 p. 148 lig. 26 Collectif

Annexe 2

p. 166 lig. 27 SOCRATE :SGBD

Annexe 3

p. 167 lig. 29 - 2 31 à 2 31 - 1

(7)

p. 168 lig. 5 <Ak > <vk >

fig. Attribut n

p. 169 lig- 27 premier nombre premier

p. 170 lig. 6 (mod. CMX)

lig. 32 DIMENSION ZT1 (LP), ZT2 (LSPS), ZT3 (LSPC) p. 172 lig. 14 15 x (NA + 1)

lig. 25 SFV =1= SFE =1= SFL

p. 173 lig. 5 LSPS =1=0

lig. 6 cet

lig. 13 LSPC 9^0

lig. 35 LMV < LSPS - LAR - 2 p. 177 lig. 12 ZT2 au lieu de ZT4

p. 178 lig. 9 le terme descriptif < A i >SFV p. 179 lig. 12 réutilisés

lig. 15 ZT3

p. 186 lig. 9 contrairement à l'opération procédurale p. 188 lig. 14 D + N < LL + 1

p. 189 lig. 15 PNI = 1

p. 191 lig. 5 le nombre

lig. 8 NVI - 2 p. 192 lig. 3 PNI = 1 p. 193 lig. 5 PNI = 1

lig. 8 LL = LV + LIA + 2 lig. 9 LV = longueur lig. 13 = A'

lig. 15 et 17 LV + LIA + 2 lig. 23 = A

lig. 24 = A' Annexe 4

p. 194 lig. 14 9 niveaux

p. 196 lig. 11 a, ndp, ln, nc, lmc p. 197 lig. 11 0 < n i <109

lig. 15 =, >, <

p. 200 lig. 13 , + »

lig. 25 $Q11

p. 203 lig. 30 0, COU, 20

p. 210 lig. 39 partie OBJ du lexique de l'exemple du paragraphe 1.1

p. 211 lig. 6 type = 3

lig. 7 uq = 0

(8)

R - - - GAGNES MEn

(9)

CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE

C E N T R E D E R E C H E R C H E S A R C H É O L O G I Q U E S Centre régional de frappe de Sophia-Antipolis

Publications du C.R.A.

Mémoires no 1

Jacques LE MAITRE !

Centre de Recherches archéologiques ��

LA RATIONALISATION

DES SYSTÈMES DE TRAITEMENT DE L'INFORMATION DOCUMENTAIRE

EN ARCHÉOLOGIE

Editions du Centre National de la Recherche Scientifique 15, quai Anatole-France, 75700 Paris

1978

(10)

Ce travail est le résultat d'un contrat de la D.G.R.S.T. (n. de la décision d'aide : 75 7 0228 ; objet de la décision : Rationalisation des systè- tries et réseaux de données relatives aux objets matériels dans diverses disci- plines des sciences humaines (archéologie, préhistoire, ethnologie, histoire de l'art. technologie). Il est dû, pour l'essentiel, à Jacques Le Maitre, ingénieur informaticien. Le chapitre 2 a été rédigé par Marie-Salomé Lagrange, assistan- te de recherche au Centre de Recherches Archéologiques, les chapitres 1 et 7 par Jean-Claude Cardin.

@ Editions du CNRS, Paris, 1978 ISBN - 2-222-02312-2

(11)

CHAPITRE I

OBJECTIFS DE L 'ETUDE

Dans l'éventail des disciplines qui constituent les sciences humaines, il en est plusieurs dont les «données» se rapportent à des objets matériels étudiés en grand nombre, à des fins historiques, technologiques ou anthropologiques. Tel est par exemple le cas de l'archéologie et de la préhistoire, de l'ethnonologie (étude des «cultures matérielles»), de l'histoire de l'art, etc. Le caractère concret de ces objets, a priori plus faciles à réduire en «données» que des faits abstraits, en même temps que leur abondance et leur dispersion extrêmes, ont conduit très tôt à reconnaître l'intérêt potentiel des procédés mécanographiques (GARDIN 1955), puis informatiques, pour faciliter l'étude de tel ou tel corpus : outillage antique (CHRISTOPHE et DESHAYES 1964), iconographie orientale (DIGARD 1975), «monuments et richesses artistiques de la France» (MINISTERE DES AFFAIRES CULTU- RELLES 1972), collections de musées (METROPOLITAN MUSEUM 1968).

Plusieurs systèmes de traitement ad hoc ont vu ainsi le jour, au cours des dix dernières années, pour l'enregistrement et l'exploitation de tels corpus sur ordinateurs. Si les objets auxquels ils s'adressent diffèrent évidemment beaucoup, il reste que ces systèmes présentent de nombreux traits communs, à la fois quant à l'expresssion formelle des «données», à l'entrée, et quant au gen- re de «produits» issus du traitement informatique, à la sortie.

Les données, tout d'abord, sont dans tous les cas les attributs (ou caractéristiques, pro- priétés, traits distinctifs, etc.) des objets matériels, considérés sur plusieurs plans : (a) dans l'ordre intrinsèque, ce sont les attributs morphologiques (formes), technologiques (procédés de fabrica- tion), physico-chimiques (matériaux), etc. ; (b) dans l'ordre extrinsèque, ce sont les localisations (origine, trouvaille, conservation), les dates (fabrication, abandon, etc.). La recherche préalable des systèmes d'attributs jugés convenables pour décrire et exploiter un corpus d'objets donné conduit à définir des «langages documentaires» ad hoc, dont on devine qu'ils ne peuvent man- quer de présenter, par construction, nombre de propriétés structurelles communes.

De même, les produits attendus de l'exploitation sur machine tendent à se ressembler d'un corpus à l'autre: l e «noyau» commun comprend tous ceux qu'il est d'usage de trouver dans un système documentaire quelconque - fabrication de tables, index, «s.v.p», dissémination sélective, etc. - les variantes, d'un système à l'autre, concernant davantage les modalités de fabrica- tion ou de présentation de ces produits que leur conception proprement dite.

Aussi n'est-il pas surprenant que le problème de la rationalisation de tels systèmes ait été posé à plusieurs reprises, sinon traité, dans plusieurs contextes différents : (a) aux Etats-Unis, tout d'abord, où deux conférences ont déjà eu lieu, l'une en 1971 (Université d'Arkansas), l'autre en 1972 (Hershey, Pennsylvania), sur le thème de l'harmonisation éventuelle des systè- mes de données élaborées par différentes institutions scientifiques, pour la gestion de leurs collec- tions matérielles (voir RABEN et WIDMANN 1972) ; (b) en France, où le Colloque national du CNRS sur les Banques de données archéologiques, en 1972, a mis en relief l'actualité de ce même thème (GARDIN 1974), tandis que se développaient des systèmes à vocation plus ou moins gé- nérale pour le traitement de l'information en archéologie et en histoire de l'art ; (c) en Allemagne, où un groupe de travail se réunit de temps à autre depuis 1970 pour tenter de coordonner les pro- jets d'informatique documentaire éclos dans plusieurs musées ou instituts de recherche de la Répu- blique fédérale (GROUPE DE TRAVAIL POUR LA DOCUMENTATION MUSEOGRAPHIQUE 1972) ; (d) en Angleterre enfin, où le développement de systèmes généraux pour le traitement des données archéologiques et muséographiques a également fait l'objet de quelques travaux (IRGMA 1969 et 1975, MDA Information 1977).

C'est dans cette même perspective de rationalisation que nous avons voulu nous placer, mais en nous assignant des objectifs précis qu'il nous faut énoncer.

1. On notera tout d'abord que la rationalisation dont il s'agit ne porte pas sur les systèmes de représentation utilisés pour décrire les objets matériels, dans les disciplines évoquées plus haut.

Ces systèmes - aussi appelés «langages» (langages documentaires, langages d'information), ou parfois «codes» - ont pour but de condenser et de normaliser l'expression des attributs associés

(12)

aux objets, c'est-à-dire les «données», telles que nous les avons définies plus haut. L'harmonisation éventuelle de tels systèmes est une entreprise qui peut intéresser les spécialistes de chacun des do- maines scientifiques concernés, en archéologie, en préhistoire, en histoire de l'art, etc., mais qui échappe de toute évidence à la compétence de l'information. Il reste que ce dernier est obligé d'étudier au moins la structure générale de ces systèmes, dans la mesure où elle affecte l'organisation des données et la manière optimale de les exploiter en machine.

Une des raisons de considérer les bases de données matérielles (1) comme un tout est justement que les systèmes de représentation présentent dans ce cas des parentés structurelles ou formelles assez fortes pour que l'on puisse en tenir compte dans la définition d'un système de gestion commun.

C'est la position que nous adopterons plus loin (chapitre 2 et 3).

2. Les «systèmes» visés par l'étude sont donc essentiellement les systèmes de traitement des don- nées, au sens de l'informatique. La recherche d'une rationalisation de ces systèmes répond à un souci pratique : l'élaboration des programmes destinés à permettre l'enregistrement et l'interroga- tion de fichiers documentaires étendus est une entreprise relativement coûteuse, dont la répétition se justifie d'autant moins que la structure de ces fichiers et la manière de les exploiter présentent des fortes parentés d'une application à l'autre. Il est donc naturel de chercher si certains systèmes déjà constitués ne pourraient être utilisés dans des contextes plus larges, au prix de quelques aménage- ments, plutôt que de rester cantonnés dans les limites où ils ont été initialement conçus. De la même manière, et pour les mêmes raisons pratiques, on se demandera si les structures et les formats d'enre- gistrement liés à un système d'exploitation Si ne pourraient pas être applicables à des fichiers jusqu'alors exploités par un autre système Sj, ou alternativement faire l'objet de conversions plus ou moins mécanistes dans un sens ou dans l'autre (Si^>Sj, Sj —>Si), de telle sorte que l'utilisateur puisse interroger plus commodément des fichiers constitués de façons indépendante, mais qui l'intéressent tous au même titre, etc.

Ces perspectives sont connues, sous des noms variés (interconnection de systèmes, intégra- tion ou articulation en réseaux, etc.), et il n'est pas utile de les redéfinir une nouvelle fois. Précisons cependant que «rationalisation» ne veut pas dire en l'espèce «unification», ni «normalisation», pour des raisons maintes fois débattues dans le contexte de l'information scientifique en général, mais plutôt «harmonisation», dans l'un ou l'autre des sens que l'on vient de rappeler. La démarche consis- tera à déterminer, dans la relative diversité des «données» et des «produits» considérés dans les prin- cipaux systèmes en usage, à la fois les analogies et les différences de nature à fonder une certaine intégration de ceux-ci, par l'une ou l'autre des voies suivantes : définition d'un ou plusieurs formats d'enregistrements spécialisés pour des catégories d'applications particulières ; établissement de règles de conversion entre formats différents lorsque l'interconnection des fichiers visés est souhai- table (2) ; propositions d'aménagements locaux destinés à faciliter de telles interconnections (3), voire une intégration plus poussée si l'utilité s'en fait sentir (4), etc. (chapitres 4 et 5).

3. De quelques façons que l'on aborde la rationalisation, dans les domaines qui nous occupent, le ris- que est grand de s'arrêter à des positions théoriques dont nul ne mesure les avantages et les inconvé- nients réels. Nous avons donc tenu à soumettre les nôtres à des épreuves pratiques, qui consistaient à utiliser les procédures suggérées pour traiter des bases de données différentes, mais dont les auteurs ou les utilisateurs souhaitaient qu'elles fussent mises en œuvre de façon concertée, sans qu'il en coûtat chaque fois la création d'un système de traitement ou de conversion particulier. Ces expériences - qui ont souvent coïncidé avec des applications «en vraie grandeur», à des fins prati-

(1) Nous appelerons «bases de données matérielles» (BDM) celles qui se rapportent à des objets concrets (monu- ments, outils, œuvres d'art, éléments du milieu naturel associés à ces objets, etc.), par opposition aux bases de don- nées bibliographiques (BDB) ou textuelles (BDT), qui se rapportent à des documents écrits.

(2) Politique adoptée par exemple par le Museum Data Bank Coordinating Committee aux Etats- Unis (CHENHALL 1975 b).

(3) Politique suivie au Ministère des Affaires Culturelles, en France, pour harmoniser, au moins à un certain niveau, les systèmes établis d'une part pour le traitement des «monuments et des richesses artistiques» in situ, et d'autre part pour le traitement des collections de musées.

(4) Objectif, par exemple, de l'organisation MESH créée par la Smithsonian Institution, à Washington pour pro- mouvoir l'emploi du système SELGEM dans un certain nombre d'institutions comparables aux Etats-Unis (voir Annexe 2).

(13)

ques - sont présentées au chapitre 6, avec les bilans économiques appropriés.

4. Les objets concrets auxquels se rapportent les bases de données matérielles sont par définition des objets d'étude qui donnent lieu à des publications dans la littérature des disciplines concernées.

Ils peuvent donc être mentionnées ou décrits dans des bases de données bibliographiques, en même temps que dans les bases de données matérielles qui nous intéressent plus directement. Cette dualité n'est pas nécessairement illégitime ; elle n'en soulève pas moins un problème particulier du point de vue de la rationalisation que l'on retrouve d'ailleurs sous une forme voisine dans les sciences de la nature (5). Les solutions, en l'espèce peu nombreuses, seront exposées dans un chapitre distinct (chapitre 7).

(5) Recommandation n. 10 du Programme UNISIST, approuvé en 1971 par le Conseil International des Unions Scientifiques et par l'UNESCO : «une attention particulière devrait être accordée... à la relation fonctionnelle entre les réseaux de données factuelles et le réseau de traitement bibliographique» (GARDIN 1971, pp. 120-1).

(14)
(15)

C H A P I T R E 2

LES B A N Q U E S D E D O N N E E S S E R A P P O R T A N T A D E S OBJETS MA T E R I E L S D A N S L E S SCIENCES H U M A I N E S

Le chapitre qui suit présente différents exemples de banques de données matérielles (BDM) exploitées sur ordinateur, utilisées dans les sciences humaines. Ces exemples o n t été choisis de ma- nière à illustrer la diversité des situations et des besoins dans ce domaine, ainsi que la manière d o n t l ' i n f o r m a t i o n à traiter est organisée suivant les cas. De cette é t u d e o n t été exclues p a r définition les banques de données se r a p p o r t a n t à des t e x t e s anciens, malgré la richesse des réalisations actuel- les (1) : voir à ce sujet le chapitre 7.

2.1 Organisation logique d ' u n e B D M

La décision de créer u n e banque de d o n n é e s sur o r d i n a t e u r c o n d u i t souvent les spécialistes - archéologues, ethnologues, historiens de l'art... - à expliciter, normaliser, voire modifier le «découpa- ge du réel» qu'ils o p è r e n t habituellement de façon plus ou m o i n s libre lorsqu'ils é t u d i e n t et m a n i p u - lent les matériaux par des m o y e n s traditionnels. Ce découpage du réel présente les m ê m e s articula- tions logiques dans les différentes disciplines des Sciences Humaines où l'on traite d'objets maté- riels ; nous en résumerons t o u t d ' a b o r d les éléments constitutifs habituels sous trois titres : les entités, les attributs, les relations (2).

A. Les entités (Anglais «entity», parfois «item») sont les objets, m o n u m e n t s , structures bâties, représentations figurées, lieux, etc..., d o n t c h a c u n fait l'objet d ' u n e description particulière et d ' u n enregistrement distinct (Anglais «record» ; A l l e m a n d «Zielinformation» ou information-cible), dans u n e BDM déterminée (3). Les entités sont parfois divisées en sous-entités.

B. Les attributs sont les traits descriptifs retenus p o u r la description des entités. Ces attri- buts sont parfois exprimés librement (en langue naturelle), parfois inventoriés à l'avance et présentés sous f o r m e de liste de n o t i o n s (descripteurs ; Anglais «indexing descriptors» o u «tags», s'ils sont codés n u m é r i q u e m e n t ; Allemand «Deskriptoren»), d o n t l'emploi est plus ou m o i n s contrôlé. Ces listes de descripteurs, parfois accompagnés de définitions, règles d'utilisation, conventions syntaxi- ques, etc... sont c o u r a m m e n t appelés langàges documentaires (LD) ou codes (cette désignation recouvre a p p r o x i m a t i v e m e n t ce q u e les informaticiens appellent «thesaurus», dans la littérature anglo-saxonne).

(1) Voir par exemple : CREHANGE et FOSSIER 1970, LECLANT 1974, FOSSIER et ZARRI 1975, INSTITUT D'ARCHEOLOGIE MEDITERRANEENNE 1976, DOUGLAS et FOURCADE 1976, etc. Voir aussi les revues Calculi, Computers and Médiéval Data Processing, etc...

(2) La terminologie employée dans ce chapitre concerne exclusivement la description des BDM du point de vue de l 'utilisateur : l'objectif est ici de proposer une systématisation des concepts sous-jacents à l'organisation des BDM telle que la proposent les spécialistes des domaines concernés (archéologie, ethnologie, etc...). On verra plus loin (chapi- tre 3) que la systématisation de l'informaticien est tout à fait différente, même si elle fait parfois appel à la même terminologie.

(3) Nous adoptons donc ici une définition «étroite» de l'entité, à savoir non pas seulement un élément matériel doué d'une autonomie physique évidente, ou encore un ensemble d'informations qui forment un tout logique, mais bien ce qui constitue une «unité de référence» unique dans une BD. Ainsi, nous appellerons «entité» tout ensemble d'informations, qui, pour des raisons variées - d'ordre physique, logique, pratique - sont consignées sur le même «bordereau d'entrée» (ou bordereau d ànalyse ; Anglais «data sheet» ou «coding form» ; Allemand

«Erfassungsbogen» ).

(16)

C. Les relations permettant d'articuler et d'ordonner les descriptions des entités (4). Du point de vue de l'archéologue ou de l'historien de l'art, elles correspondent à des modalités d'asso-

ciation ou situations relationnelles très variées : Exemples :

Relation d'inclusion physique : tombe dans un site archéologique, chapelle dans un château, motif géométrique dans un panneau de mosaïque, etc...

Relation d'inclusion sémantique : les matériaux de construction des tombes incluent le calcaire, les structures incluent les trous de poteaux, etc...

Relation d'association physique : foyer associé à une habitation, portes (d'un meuble) associées au corps, vêtements portés par un personnage, etc...

Du point de vue de l'informaticien, ces relations se résument à quatre types de «chaînage» dans les BDM : relations entre entités, relations entités-sous entités, relations entités-attributs, relations entre attributs.

C.l Relations entre entités.

Il s'agit en général de relations d'inclusion (une entité incluse dans une autre entité), ou d'association logique ou spatiale (deux ou plusieurs entités appartenant au même ensemble).

Exemple : Soit une BD relative à une prospection archéologique, où l'on désire inventorier d'une part les sites avec leurs caractéristiques (relief, sédiments, datation...), d'autre part les objets et structures avec leur description (matériau, fonction, forme...). La relation entre les deux types d'entités (sites et vestiges matériels) est une relation d'inclusion stable, laquelle peut être prise en compte par le système informatique, de telle sorte que l'on puisse interroger la BD sur des questions du type suivant : «dans quel type de relief trouve-t-on des tombes en calcaire h .

C.2 Relations (d'inclusion) entre une entité et ses parties constituantes (ou sous-.entités).

Ces relatibns peuvent être reconnues a priori comme invariantes dans un corpus constitué d'entités auxquelles on attribue une organisation ou une structure stable.

Exemples : (a) Dans un corpus de mosaïques, l'entité «mosaïque» pourrait être divisée invaria- blement en motif central et bordure (sous-entités), (b) Le corps et les portes (sous-entités) peuvent être considérées comme les parties constituantes de certains meubles (entités). (c) Les «scènes»

(sous-entités) peuvent constituer les articulations principales de représentations figurées (entités) etc...

La prise en compte de sous-entités permet d'une part une description plus détaillée d'enti- tés complexes, en ce sens que les informations relatives aux sous-entités sont alors distinctes des informations relatives à l'entité entière. Par exemple, il peut paraître utile au spécialiste de différen- cier les mosaïques (entités) dont le motif central (sous-entité) comporte des représentations anima- les de celles où seule la bordure (sous-entité) comporte ces représentations. En second lieu, le recours aux sous-entités permet de ne pas confondre des parties de l'entité qui sont distinctes physi- quement, mais dont la description est répétitive. Par exemple, un site archéologique (entité) peut comporter un nombre a priori non limité de tombes (sous-entités) dont la description est compara- ble. En troisième lieu, l'identification de sous-entités permet l'utilisation d'un système informatique

(4) II s'agit ici des relations établies a priori au moment où l'on décide de la définition, du contenu et de l'organisa- tion des entités et des attributs. Nous ne parlerons guère ici des relations a posteriori ou éfcontingentes» que l'in- terrogation d'une BD peut faire apparaître (recherche rétrospective). Celles-ci se résument en effet à une seule et même relation de co-occurence au sens large.

Exemples : (a) Relations entre entités : Outils (entités) et tessons (entités) ayant la même origine stratigraphique (attributs), bouches de ceinture (entités) et outils (entités) en cuivre (attributs). (b) Relations entre attributs : Motifs géométriques (attributs) apparaissant sur la bordure (sous-entité) de mosaïques (entités) et thème figuré (attributs) apparaissant comme motif central (sous-entités) de mêmes mosaïques.

(17)

n'autorisant pas la prise en compte de relations entre entités. Soit par exemple un corpus d'édifices d'Architecture dont certains constituent des entités «complexes» : châteaux comportant une chapel- le, des écuries des maisons de gardiens, etc... Si le système informatique n'admet pas l'expression de la relation (d'association spatiale ou fonctionnelle) entre les entités «chapelles», «écurie», «maison de gardien», lesquelles appartiennent à un même ensemble architectural, ces édifices peuvent au moins être décrits comme des sous-entités d'une même entité «château», de manière que la trace de cette relation soit conservée.

On notera enfin que les relations entités/sous-entités s'expriment suivant deux procédés, qui peuvent être utilisés simultanément pour une même entité :

(a) L'entité comporte autant dégroupés de catégories descriptives répétitives qu'il existe de sous-entités.

Exemple :

(Entité «château» comportant plusieurs sous-entités «bâtiments secondaires») TYPE D'EDIFICE (château)

DENOMINATION CHAPELLE :

MATERIAU PLAN DATATION ECURIES :

MATERIAU PLAN DATATION

etc...

(b) L'entité comporte des catégories d'information permettant de décrire n'importe quelle subdivi- sion de l'entité. Le regroupement des termes se rapportant à une sous-entité particulière est obtenu à l'aide d'indicateurs syntaxiques que l'on associe à chaque terme descriptif (indices numériques, affixes de position, de fonction, etc... voir plus loin C. 4,2).

Exemple :

TYPE D'EDIFICE (château) DENOMINATION

BATIMENTS SECONDAIRES : MATERIAU

PLAN DATATION

les termes descriptifs utilisés

sont affectés d'un indice «chapelle», «écurie», etc...

C. 3 Relations entre entités (ou sous-entités) et attributs.

Il s'agit de relations prédicatives au sens le plus large, dont le contenu sémantique est très varié. Exemple : relations entre un objet et le matériau dont il se compose, entre un tableau et sa date d'exécution, son auteur, son origine géographique (5), etc...

(5) A propos de ce dernier exemple, on rappellera que ce qui est attribut dans une BD peut être entité dans une autre, suivant l'organisation jugée la plus efficace. Ainsi les noms propres (artistes par exemple), dans une BD rela- tive à des œuvres peintes, pourraient être considérés comme des entités, donnant lieu à une description distincte (lieu de naissance, atelier, etc...).

(18)

E n principe cette relation est contingente, n o n prévisible. E n pratique, p o u r u n t y p e d'enti- té d o n n é et p o u r certains aspects de sa description, les spécialistes connaissent souvent à l'avance au moins les catégories d ' i n f o r m a t i o n pertinentes.

C'est le cas e n particulier des indications de repérage spatial et temporel des entités, lesquel- les sont fixées a priori - p a r exemple, dans u n e BD relative à u n e fouille archéologique, la localisa- tion des vestiges dans le site, le chantier, le carré de fouille, le niveau, etc... Cette connaissance du corpus autorise en bien des cas les spécialistes à utiliser u n cadre descriptif plus ou moins rigide, qui p e u t prendre la forme d ' u n véritable langage d o c u m e n t a i r e (voir plus loin C. 4).

Il n e p a r a î t pas inutile de rappeler à p r o p o s de la relation entité-attribut, que si son conte- nu sémantique est varié, son expression symbolique est en revanche relativement m o n o t o n e d ' u n e BDM à l'autre :

1. Sauf dans les cas assez rares o ù la description de l'entité est e n t i è r e m e n t libre, cette relation s'exprime au m o y e n d ' u n couple catégorie ( d ' i n f o r m a t i o n ) / valeur (ou variable / valeur, ou caté- gorie / descripteur, etc... ; e n Anglais «unit o f i n f o r m a t i o n / descriptor», «attribute code / a t t r i b u t e value», «attribute / state», etc... ; Allemand, «Aspeckt / Deskriptor»).

E x e m p l e s :

(a) p o u r u n e entité «outil», Catégorie : M A T E R I A U , valeur : métal ;

(b) p o u r u n e entité «site», Catégorie : T R O U V A I L L E S ASSOCIEES, valeur : céramique.

Le terme «valeur» désigne ainsi u n «prédicat» particulier, choisi p a r m i d'autres possibles, et affecté à la description d ' u n e entité donnée. Certaines catégories sont susceptibles de recevoir plusieurs valeurs à la fois p o u r u n e entité : «église», Catégorie : DATATION, valeur : 15e et 19e s.

2. O n distingue c o u r a m m e n t différentes sortes de «valeurs», suivant la nature de l ' i n f o r m a t i o n qu'elles a p p o r t e n t e t / o u le t r a i t e m e n t i n f o r m a t i q u e qui s'y applique :

- les descripteurs d o n t la liste est a p p r o x i m a t i v e m e n t finie et parfois organisée c o n c e p t u e l l e m e n t : indications relatives à la f o r m e , à la structure, au matériau etc... (voir plus loin C. 4).

- les descripteurs d o n t la liste est n o n finie : n o m s de personnages, de lieux, d'évènements, titres d'oeuvres peintes etc...

I n d é p e n d a m m e n t de cette dichotomie, certains systèmes informatiques distinguent à l'usage ce q u e l'on p o u r r a i t appeler des «descripteurs libres» (parfois dits «aftixes») : il s'agit de ceux qui se r é p è t e n t f r é q u e m m e n t dans la description de l'entité et que l ' o n associe aux descripteurs p r o p r e m e n t dits - p a r exemple, dans u n corpus de peintures, les indications de couleur, utilisées p o u r décrire successivement le f o n d , les costumes, les objets représentés etc... ; de m ê m e , e n Archi- tecture, les indications d e dates, de matériau, de dimensions, d o n t o n p e u t avoir besoin p o u r quali- fier successivement les fondations, les supports, les ouvertures (voir aussi plus loin C. 4.2).

Par ailleurs les valeurs n u m é r i q u e s q u i f o r m e n t généralement u n e classe à p a r t en raison de la simplicité de leur t r a i t e m e n t e n ordinateur. Enfin, dans certaines BD, t o u t o u partie des caté- gories i n t r o d u i s e n t du texte libre, en langue naturelle ( c o u r a m m e n t appelé «commentaire» ; Anglais

«free t e x t » , « c o m m e n t » , Allemand, «Text»).

3. Les catégories s o n t souvent hiérarchisées. O n distinguera trois cas, q u i p e u v e n t d'ailleurs se pré- senter s i m u l t a n é m e n t dans la m ê m e entité :

(a) La f o r m e hiérarchisée des catégories, sur le bordereau d'analyse, reflète la hiérarchisation des

«valeurs» (voir plus loin C. 4).

(b) Cette f o r m e hiérarchisée est u n p r o c é d é d'écriture destiné à faciliter l'indexation. Ces deux cas s o n t les plus fréquents.

(19)

Exemple :

(c) La hiérarchie des catégories même si elle n'est pas visible sur le bordereau d'analyse, correspond à une réalité physique : imbrication des éléments de l'entité désignés par les catégories.

Exemple :

NUMERO DE SITE

NUMERO DE CHANTIER (dans le site)

NUMERO DE CARRE DE FOUILLE (dans le chantier) C. 4 Relations entre attributs

1. Exprimées par une organisation lexicale

Si les catégories d'information relatives à un corpus donné d'entités sont souvent connues et fixées préalablement à la description, tel peut être aussi le cas pour les descripteurs eux-mêmes, lorsqu'ils sont inventoriés à 1 avance et soumis à certaines règles d'utilisation (voir plus haut B et C, 1 et 2).

Pour faciliter l'indexation et la recherche rétrospective, certaines relations entre descrip- teurs sont parfois explicitées dans ces langages : il s'agit de relations sémantiques dont la plus fré- quente est la relation d'inclusion.

Exemples :

Pierre / pierre volcanique, Meuble / armoire, etc... Il peut s'agir aussi de relations de «proximité» au sens large : recouvrement sémantique partiel (décor gravé / décor incisé), synonymie ou quasi- synonymie entre certains descripteurs fréquemment utilisés l'un pour l'autre, à tort ou à raison (ébauche / esquisse), etc...

2. Exprimées par des procédés syntaxiques

Ce que l'on appelle couramment «syntaxe», dans les LD, recouvre un ensemble de procé- dés, différents des précédents, destinés à exprimer certaines liaisons d'ordre logique ou spatial entre descripteurs, de manière à donner une plus grande précision à la description ou à éviter certaines ambiguités. Soit par exemple une entité «Représentation figurée» et sa description, composée des catégories «Désignation des Personnages» et «Désignation des Actions». L'utilisation complémen- taire d une syntaxe permettra de préciser, lorsque plusieurs personnages et plusieurs actions sont mis en scène, quelles sont les actions accomplies respectivement par tel ou tel personnage. De même, soit un monument d'Architecture décrit au moyen des catégories Datation, Fonction, Murs, Ouvertures, Toiture. Dans le cas de remaniements répétés de l'édifice, on peut exprimer, outre la datation globa- le indiquée par la catégorie «Datation», la date de tous les éléments de l'édifice, cela au moyen d'indicateurs de dates associés librement aux descripteurs relatifs aux éléments remaniés.

La manière d'exprimer les relations syntaxiques n'est guère variée. Les deux procédés les plus courants sont les suivants :

(a) Soit que l'on créé une ou plusieurs classes d'indicateurs particuliers (indicateurs de fonction, de position, de couleur, de date...), lesquels sont affixés aux descripteurs au cours de l'indexation.

(20)

(b) Soit que l'on affecte aux descripteurs des indices numériques identiques pour tous les descripteurs que l'on désire mettre en relation. Ainsi dans l'exemple précédent d'une représentation figurée, si l'on veut exprimer qu'«un dieu menace avec un glaive des hommes armés d'épées», on pourra restituer ces relations, de l'une ou l'autre des deux manières suivantes :

(a) PERSONNAGES : dieu (sujet), hommes (objets)

ACTIONS : menace

OBJETS : glaive (instrument de l'action), épées (attributs) (b) PERSONNAGES : dieu (1), hommes (2)

ACTIONS : menace

OBJETS : glaive (1), épées (2)

2.2 Fontion des BDM : essai de classification

Les résultats de notre enquête conduisent à distinguer entre quatre catégories de BD : Catégorie 1. Traitement des données de fouilles ou de prospections archéologiques.

a. Elles se rapportent exclusivement aux monuments ou objets livrés par un lieu particulier, plus ou moins étendu (site, commune, canton, région...).

b. Une de leurs destinations principales est l'archivage des objets ou monuments en question considérés comme un groupe organique, en quelque sens que ce soit : vestiges d'une «culture»

particulière, produits d'une population homogène, traces d'évènements historiques locaux etc...

c. Les langages documentaires utilisés, lorsqu'il s'en présente, comportent tous des indica- tions de localisation spatiale très développées.

Catégorie 2. Musée, Collections, Inventaires.

a. Les entités matérielles décrites peuvent être aussi diverses que celles des BD de catégorie 1, mais elles n'ont souvent d'autre lien les unes avec les autres que leur co-occurrence dans un même lieu de conservation.

b. La destination de ces BD est presque exclusivement d'ordre pratique : gestion des collec- tions, repérage rapide des objets, ou, dans le cas des Inventaires, repérage des dossiers décrivant les objets.

c. Les LD utilisés sont souvent rudimentaires : développement des informations administra- tives aux dépens de la description proprement dite.

d. C'est la seule catégorie de BD où il existe une amorce sérieuse de recherche sur la compa- tibilité entre des BD séparées.

Catégorie 3. Traitement de corpus «sériels».

Ces fichiers se rapportent à un seul type d'objet ou de monuments (céramique, sceaux- cylindres, mosaïques...).

Leur raison d'être est de fournir un moyen de combattre la dispersion des objets et/ou de la documentation écrite qui s'y rapporte, sur le plan de la recherche rétrospective d'information. Les LD correspondants sont souvent extrêmement complexes et détaillés. On ne peut que constater la rareté de ce type de BD, alors que les corpus sériels imprimés continuent à être édités à un rythme soutenu.

Catégorie 4. Banques de données à visées scientifiques.

Il s'agit de fichiers électroniques conçus à seule fin de permettre l'application de traitements de calcul (statistique, classification automatique (6». Nous n'avons pas fait d'enquête sur cette caté- gorie de BD, pour plusieurs raisons :

(6) Voir par exemple DORAN et HODSON 1975, BORILLO et al. 1977.

(21)

a. Ces fichiers ne sont pas des banques de données à p r o p r e m e n t parler, en ce sens qu'elles ne sont accessibles le plus souvent q u ' à leur créateur.

b. Ce sont des entreprises ponctuelles, souvent éphémères, qui ne d u r e n t que le t e m p s nécessaire à la résolution d ' u n p r o b l è m e particulier.

c. D e nombreuses BD de catégorie 1 (Fouilles et prospections archéologiques) ou de caté- gorie 3 (Corpus «sériels») sont conçues p o u r offrir à l'utilisateur des possibilités de calcul sophisti- qué, et certains des auteurs de BD de ces deux catégories ne s o n t pas loin de penser que leurs fichiers p e u v e n t assumer aussi des fonctions «scientifiques» (7).

2.3. Données de fouilles et prospections archéologiques.

2.3.1 Nature des données.

Le tableau ci-après (Tableau 1) présente quatorze exemples de BD de fouilles ou de prospec- tion. En colonne 1 sont indiquées les principales références bibliographiques ; en colonne 2 figure un bref résumé caractérisant les types d'objets enregistrés, ainsi que quelques indications numériques citées dans la littérature (nombre de sites, nombres d'objets...) (8).

(7) Il n'existe pourtant, à notre connaissance, aucun exemple convaincant d'études de type scientifique menées di- rectement à partir de BD des catégories 1 ou 3. Des modifications importantes, liées à la spécificité de chaque straté- gie de recherche, sont nécessaires chaque fois qu'une étude interprétative nouvelle est entreprise suppression de classes entières d'attributs, ajouts, affinement de certains aspects de la description, voire modification de la défini- tion des entités. Cette remarque ne concerne que les données matérielles de Sciences Humaines. On évaluera avec intérêt pn- exemple l'utilisation du système SYCIL, destiné à l'exploitation documentaire d'un corpus d'inscriptions latines, dans le cadre d'une recherche historique : détermination de l'origine d'un sous-ensemble d'inscriptions au moyen de programmes de sériation automatique de la chaîne STRADES (BORILLO et al. 1975).

(8) Nous nous réfèrerons désormais à ces exemples en citant le premier nom d'auteur indiqué en colonne 1 du tableau 1.

(22)

TABLEAU 1 - Exemples de BD de fouille et de prospection archéologiques.

Références bibliographiques Nature des données

(ETATS-UNIS)

CHENHALL 1971 Arkansas Archaeological Survey : ensemble de fichiers relatifs à toute l'archéologie de l'Arkansas, USA : 5000 sites, 1 000 000 d'objets.

FISHER 1974 Fichier relatif aux objets de fouille (céramique, objets fabriqués) de Caesarea (Israël).

GAINES 1974 Fichier relatif aux objets (céramique, objets fabriqués) de plu- sieurs sites dans une réserve indienne Navajo au Nord-Est de l'Arizona, USA.

LUKESH 1975 Fichier principalement destiné à l'archivage de la céramique de l'Age du Bronze, à Buccino (Italie du Sud).

(FRANCE)

BAYLE et al. 1975 Fouilles protohistoriques de la vallée de l'Aisne, France. Plusieurs CLEUZIOU et DEMOULE 1975 dizaines de sites, constitués par les vestiges d'habitations avec leurs palissades (trous de poteaux), et par des fosses. Ces vestiges incluent des objets (céramique, vestiges osseux et lithiques, co- quillages, pollens...). Le nombre des objets découverts en trois ans est de plus de 30.000.

BUCHSENSCHUTZ et al. 1975 Carte archéologique de la France, concernant 200.000 à 300.000 sites prévisibles, leur contenu mobilier (tuiles...) et immobilier (structures), les caractéristiques de leur environnement naturel, et les sources (écrites ou graphiques) associées : toponymes, textes anciens, cadastre, cartes...

GARDIN 1973 Céramique issue du site urbain d'Aïkhanoum (Afghanistan) : GARDIN, LYONNET, 300.000 tessons d'époque hellénistique.

LE MAITRE 1977

LUMLEY-WOODYEAR et al. Fouilles préhistoriques du bassin méditerranéen français. Une 1974 demi-douzaine de sites (Habitat de Lazaret, Grotte de l'Hortus, Terra-Amata...), comprenant de 3.000 à 300.000 objets chacun : outillage, céramique, vestiges animaux, pollens...

YON 1974 Archivage des objets de fouille de Salamine (Chypre) : éléments architecturaux, céramique, monnaies, objets domestiques, inscrip- tions, représentations figurées etc...

(23)

C. Suppression.

Cette opération permet de supprimer certains documents ; elle est commandée par l'instruction :

SUPPRESSION [(liste)]

a. La liste doit contenir les numéros des documents que l'on désire supprimer.

b. Le système supprime tous les documents dont les numéros appartiennent à la liste.

c. Il n'est pas possible de supprimer par cette opération une partie seulement des sous-documents d'un document. Il faut pour cela créer un nouveau document composé par les sous-documents à con- server, puis supprimer l'ancien document.

D. Edition.

Cette opération permet d'éditer les descriptions de certains documents suivant un format standard ; elle est commandée par l'instruction :

EDITION [ (liste) ]

1. La liste doit suivre les mêmes règles que pour l'opération de suppression. Si la liste est omise elle est considérée comme étant implicitement composée par les numéros de tous les sous- documents du fichier.

2. Le système édite les descriptions de tous les documents ayant au moins un sous-docu- ment appartenant à la liste.

2.3. Gestion d'un fichier «questionnaire».

A. Création d'un fichier «questionnaire».

Elle est commandée par l'instruction :

a. Les options ESSAI et CREATION ont la même signification que pour un fichier «lexique» (cf. ci- dessus, paragraphe 2.1., A.).

b. nq et lme ont déjà été définis (cf. ci-dessus, paragraphe 1.3.).

c. Le système imprime les paramètres et la taille du fichier (mesurée en nombre d'octets).

Il n'y a pas d'opérations de réorganisation. Lorsqu'un fichier «questionnaire» est saturé, il faut en créer un autre. En effet, l'opération de réorganisation étant une opération coûteuse, il n'est a priori pas opportun de la prévoir pour les fichiers «questionnaires», qui sont en général des fichiers temporaires.

B. Addition.

Cette opération permet d'ajouter de nouvelles questions à un fichier «questionnaire» et de les résoudre, c'est-à-dire de rechercher les numéros des sous-documents qui y répondent (cf. ci- dessus, paragraphe 1.3.). Elle est commandée par l'instruction :

ADDITION [(uq)]

a. uq est le numéro d'unité logique du fichier dans lequel se trouvent les nouvelles questions, si celles- ci ne sont pas sur cartes perforées.

b. Les nouvelles questions doivent être placées immédiatement après cette instruction, et décrites sous

(24)

la forme définie ci-dessus (cf. paragraphe 1.3.).

c. Pour chaque nouvelle question, le système l'imprime telle qu'elle est fournie (une image carte ou article par ligne), puis analyse la question :

- si elle est correcte, et si la place restante dans le fichier est suffisante, il résoud puis enre- gistre cette question, et passe à la suivante ;

- si la place restante dans le fichier n'est pas suffisante, il arrête l'exécution du travail en cours, puis imprime le message suivant :

** FICHIER QUESTIONNAIRE SATURE **

ainsi que les paramètres du fichier ; il faut alors créer un nouveau fichier «questionnaire».

- si elle est incorrecte, il imprime soit l'un des trois messages suivants :

** ERREUR : NOM QUESTION ABSENT OU TROP LONG **

** ERREUR : ENONCE QUESTION ABSENT **

** ERREUR : COMMENTAIRE TROP LONG **

soit l'un des huit premiers messages cités à propos de l'opération d'addition des documents (cf. ci- dessus, paragraphe 2.2., B.) au cas où l'erreur est dans l'énoncé de la question (les messages sont iden- tiques. le même analyseur étant utilisé pour les documents et pour les questions) ; puis il passe à la question suivante.

C. Mise à jour.

Cette opération permet de mettre à jour les réponses aux questions d'un questionnaire déjà enregistré, lorsque le fichier document sur lequel il porte a évolué. Elle est commandée par l'instruction :

MISE A JOUR

a. Le système recommence la résolution de toutes les questions du questionnaire puis enregistre les nouvelles réponses dans le fichier «réponses».

D. Edition.

Cette opération permet d'éditer les réponses à certaines questions. Trois types d'édition sont possibles, chacun selon un format standard :

Type 1 : Comptage.

Les nombres de documents et de sous-documents qui répondent à chaque question sont imprimés.

Type 2 : Liste de numéros.

Les numéros des documents et des sous-documents qui répondent à chaque question sont imprimés.

Type 3.

Les valeurs prises par certains attributs des sous-documents qui répondent à chaque ques- tion sont imprimées. Il est possible de choisir les attributs dont les valeurs doivent être éditées, et, si ces valeurs sont des descripteurs, de n'éditer que les descripteurs dont les numéros appartiennent à un intervalle défini. Cette dernière possibilité permet entre autres de n'éditer que les descripteurs spéci- fiques jusqu'à un niveau déterminé, pour un descripteur générique donné. Par exemple, si pour la liste OBJ du lexique de l'exemple du paragraphe 1.2. ci-dessus, on ne désire éditer que les descripteurs désignant des instruments à corde, on précisera les bornes 4 à 6.

L'édition est réalisée soit sur listing, soit sur un support magnétique dans un fichier ayant une organisation séquentielle dont la longueur d'article (REL sur système Cil, doit être égale à 80. Chaque valeur est imprimée sur une nouvelle ligne (ou article) et peut occuper plusieurs lignes (ou articles). Il

Références

Documents relatifs

On pourra utiliser la division euclidienne de n

Détrie met en lumière le rôle énonciatif et argumentatif de l’apostrophe : celle-ci balise le changement de plan énonciatif entre narration

Le Conseil a jugé « qu’en fixant la durée minimale pendant laquelle ce schéma est mis à la disposition du public et en déterminant la forme de cette mise à disposition, qui

Tout -&gt; Structure (composants + interconnexions = comment le système est fait) Un système est une collection organisée d’objets en interaction qui forme un tout.... Architecture

[r]

UN CONSIGLIO : INIZIA CON LE GRIGLIE LE PIÙ

X en seondes que haun a réalisé suit une distribution normale N (140; 100). Déterminer le nombre de skieurs ayant réalisé un temps supérieur à 150 seondes... 2.. 2) Parmi 900

• Favoriser le contact entre l’administration et les étudiants. • Faciliter le contact entre les différentes