• Aucun résultat trouvé

Métadonnées : définitions et typologie

Faire l’économie d’une approche référentielle, définitionnelle et typolo- gique des métadonnées nous est impossible pour notre état de l’art. Il nous incombe en effet d’en faire un panorama large qui nous permettra par la suite une analyse plus fine des besoins émergents et de proposer notre propre approche.

Selon Anne J. Gilliland le terme « metadata » fait référence à toutes les informations applicables à un document (Gilliland, 2000).

Selon Broudoux et Scopsi, « dans les communautés techniques le terme métadonnées désigne des données opérationnelles produites automatique- ment par les systèmes informatiques : désignations ou emplacement de fi- chiers, informations structurelles (tailles, formats) données de repérage tem- porel (horodatages) ou géographiques » (Broudoux et al., 2011, p. 12).

Une métadonnée est « un ensemble structuré d’informations décrivant une ressource quelconque. »2. Le Dublin Core précise que cette ressource est une

ressource d’information, car « les métadonnées peuvent décrire des ensembles plus petits qu’un document, par exemple, des images, ou des fichiers sonores, à l’intérieur d’un document. »3

Selon les professionnels de l’éducation, et notamment tel que décrit dans leur dossier documentaire Indexation de ressources : métadonnées, normes et standards,4 les métadonnées ont pour objectif de :

1. faciliter la recherche d’information ; 2. faciliter l’interopérabilité ;

3. faciliter la gestion et l’archivage ; 4. gérer et protéger les droits ;

2. Patrick Peccatte, Soft Expérience http://peccatte.karefil.com/Software/Metadata.htm 3. http ://www.bibl.ulaval.ca/DublinCore/usageguide-20000716fr.htm

5. authentifier un texte.

Les métadonnées en tant qu’outil d’indexation pour faciliter l’accès aux ressources sont apparues bien avant le Web (Kovacs et al., 2005, p. 11) : « face au problème de la surcharge d’information qui hante les esprits depuis l’âge de la première bibliothèque d’Alexandrie, l’indexation a été conçue comme un dispositif d’aide et de mise en ordre, un outil pour le soulagement du lecteur, selon la formule employée pour vanter l’index du libre imprimé au XVIe siècle. » Comme le notaient Weibel et Lagoze qui font figure d’autorité dans le développement des métadonnées :

L’association de métadonnées descriptives standardisées avec des objets en réseau offre un potentiel d’amélioration substantiel des possibilités de découverte de ressources : en permettant des recherches basées sur des champs (e.g., auteur, titre), en permet- tant l’indexation d’objets non-textuels et en permettant l’accès à un contenu de substitution, ce qui est différent de l’accès au contenu de la ressource elle même (Weibel et Lagoze, 1997).5

Si notre objectif n’est pas de décrire le Dublin Core avec exhaustivité, citons cependant son apport pluriel :

1. simplicité de création et de gestion ; 2. sémantique communément comprise ; 3. envergure internationale ;

4. extensibilité.

Pour illustrer nos propos concrètement, le code source d’une page internet, telle que la notre,6 affiche ceci :

1. <html>

5. Keeping Dublin Core Simple : Cross-Domain Discovery or Resource Description ? http://www.dlib.org/dlib/january01/lagoze/01lagoze.html

2. <head>

3. <title>Jean Debaecker</title>

4. <meta name="keywords" content="Jean Debaecker">

5. <meta name="description" content="Site personnel, doctorat, thèse, activités de recherche, écoute, métadonnées, musique, fait musical, éli- citation">

6. <meta name="robots" content="INDEX, FOLLOW">

7. <meta name="revisit-after" content="3">

8. <meta http-equiv="Content-Type" content="text/html ; charset=iso- 8859-1">

9. <script language="JavaScript"> 10. if(top.frames.length > 0)

11. top.location.href=self.location ; 12. </script>

13. <meta name="verify-v1" content="x4ldw+bouEF9QPA/H50g+spdArK2Z W/UrZjl1Kn69W4=" />

14. <script>

var img = new Image() ; var subd = location.host ;

if (subd.indexOf("www.") != -1) subd=subd.substring(4) ; img.src = "counter.php ?subdomain="+subd ;

15. </script> 16. </head>

Les balises <meta> sont celles qui contiendront les métadonnées de notre page. Par exemple, la ligne numéro cinq indique une description du site web. La ligne rouge numéro six <meta name="robots" content="INDEX, FOL- LOW"> indique que les robots des moteurs de recherche peuvent indexer cette page.

Contenu Propriété intellectuelle Instanciation Couverture Collaborateur Date Description Créateur Format

Type Éditeur Identifiant Relation Droits Langue

Source Sujet

Titre

Figure 3.1 – Catégories de métadonnées par le Dublin Core

Dans cet exemple les balises <meta> doivent être comprises entre les ba- lises <head> et </head> afin de pouvoir être lues, analysées et interprétées par les robots qui indexent.

Les métadonnées peuvent être générées automatiquement, de manière autonome, par le dispositif. Par exemple : une photo prise par un smartphone contiendra dans ses métadonnées la date et l’heure, la localisation GPS, la marque du téléphone, etc. Ces métadonnées sont en général communes à beaucoup (sinon tous) de dispositifs, permettant ainsi à des plateformes en ligne telles que Picasa ou Flickr.

Le Dublin Core établit un référentiel de métadonnées normé depuis 2003 sous l’ISO 15836 : 2003 « Information et documentation - L’ensemble des éléments de métadonnées Dublin Core ; il a été adopté par l’Union européenne en 2002. Le tableau de la figure 3.1 donne les métadonnées clefs et premières des documents numériques. »

Bien sûr le projet ne s’arrête pas là et ouvre une veine vers l’Open Ar- chives Initiative Protocol for Metadata Harvesting (OAI-PMH) notamment, alimenté par le Dublin Core non qualifié (aussi dit « simple »). Ce dernier est un ensemble de description non ambiguë des ressources documentaires numé- riques. L’objectif étant « d’accroître la visibilité sur Internet des collections numériques. »7 L’OAI-PMH a été conçu suite à la Convention de Santa Fe

de 1999 « The Santa Fe Convention for the Open Archives Initiative ».

Ce protocole (OAI-PMH) fournit un cadre d’interopérabilité indépendant de l’application basée sur la récolte des métadonnées.8 Autrement dit, un

protocole ouvert de « récolte » (to harvest) et d’échange des métadonnées, dont la propriété essentielle est l’interopérabilité.

Le principe de fonctionnement est simple : d’une part on recueille des données d’un catalogue documentaire, que le protocole permet d’interroger à l’aide de requêtes. Le résultat est transmis au format Dublin Core. (Voir figure 3.29)

Notre société dite de « connaissance » est régulée par l’usage des méta- données ; il touche tous les secteurs de l’économie, notamment du patrimoine immatériel. Ces ressources documentaires représentent un enjeu de taille, tant industriel qu’universitaire.

8. http://www.openarchives.org/OAI/openarchivesprotocol.html 9. http ://www.culture.gouv.fr/culture/dll/OAI-PMH.htm

Nom Artiste Commentaires Album

Compositeur Compilation Genre Année N° de piste N° de disque Beats Per Minute Paroles

Nom pour le tri Artiste pour le tri Album pour le tri Artiste de l’album pour le tri Compositeur pour le tri Réglage du volume

Réglage de l’égaliseur Classement Début de la chanson Fin de la chanson Conserver la position de la lecture Ignorer en ordre aléatoire

Partie d’un album sans intervalle Illustration Figure 3.3 – Catégories de métadonnées d’un objet sonore

Documents relatifs