• Aucun résultat trouvé

data.bnf.fr La stratégie d'exposition des catalogues de la BnF sur le web de données :

N/A
N/A
Protected

Academic year: 2022

Partager "data.bnf.fr La stratégie d'exposition des catalogues de la BnF sur le web de données :"

Copied!
18
0
0

Texte intégral

(1)

data.bnf.fr

Gildas ILLIEN

Bibliothèque nationale de France

Directeur du département de l’information bibliographique et numérique Romain WENZ

Bibliothèque nationale de France

Responsable de data.bnf.fr au département de l’information bibliographique et numérique

Journée d'étude du GFII :

"Données culturelles et Linked Open Data"

26 mars 2013

La stratégie d'exposition

des catalogues de la BnF

sur le web de données :

(2)

Plan

 De l’importance des métadonnées

 Missions, contexte et motivations

 Les objectifs de data.bnf.fr

 La fabrique de data.bnf.fr

 Limites et bénéfices observés

 Questions/réponses

(3)

De l’importance des métadonnées

Des catalogues aux (méta)données

d’une logique d’applications et de documents à une logique de données

Les métadonnées

descriptives, techniques, administratives, sociales…

…sont des clés essentielles au fonctionnement d’une bibliothèque

Les métadonnées des bibliothèques :

un trésor à partager

…que révèle le Web sémantique

(4)

Missions et

motivations pour le Linked Open Data

Missions de service public

Dépôt légal et bibliographie nationale

Signaler le patrimoine, être opérateur des politiques publiques culturelles

Un constat : concurrence des moteurs du Web et sous-utilisation des catalogues

Motivations et contexte:

Une nécessité économique : faire plus avec moins implique de faire ensemble

Une incitation gouvernementale: data.gouv.fr

Une opportunité d’innover et de mutualiser

(5)

Principales implications

Lier les données pour permettre leur interopérabilité et les insérer dans la

structure et les usages du Web

En transformant des données structurées par et pour les bibliothèques (MARC) selon les

standards du Web sémantique

Ouvrir les données

Techniquement

Juridiquement

(6)

Data.bnf.fr :

Grands objectifs

Être plus visible.

L’enjeu du référencement

Être cohérent, être uni.

Problématique de la fédération de silos de données de structures différentes

Être économe et généreux à la fois.

Se lier à d’autres données de confiance

Se concentrer sur sa valeur ajoutée propre

Être plus utile.

Encourager les réutilisations

(7)

Des licences ouvertes

Périmètre : les métadonnées dont la BnF est productrice

 Les données aux formats historiques (MARC) sont toujours soumises à

redevance si réutilisation commerciale

 Les données au format RDF issues de data.bnf.fr sont sous licence d’Etat

(Etalab)

(8)

Data.bnf.fr : le projet

 Un marché public, avec Logilab

 Une méthode de développement agile

 Une attention particulière aux dimensions métier, innovation et changement

 Un logiciel libre : CubicWeb

 Quelques jalons :

2009: début de l’instruction

2011 : lancement d’une preuve de concept

2012 : 10% des catalogues

2013 : 20% des catalogues – un service.

(9)

Catalogue général (12 M)

Collections numérisées (2M) pages Web

pour les humains

données structurées pour les machines BnF Archives & Manuscrits

La fabrique de

data.bnf.fr

(10)

La fabrique de data.bnf.fr (1)

 Structure

FRBR, autorités,

Regroupement par « Œuvres »

Identifiants

Exposer la source

Les formats RDF

Les moteurs et schema.org

(11)

La fabrique de data.bnf.fr (2)

 Complémentarité

 Données hétérogènes

Usages complémentaires

Création automatique de liens

 R&D

reverser à la source

Avoir droit à l'erreur

(12)

En ligne

http://data.bnf.fr/11952658/dante_alighieri_la_divine_comedie/

Dates

http://data.bnf.fr/what-happened/date-1515

Rôles des auteurs

http://data.bnf.fr/11890041/honore_de_balzac/#allmanifs

Liens entre auteurs

http://data.bnf.fr/11924607/william_shakespeare/#other-pages-databnf

(13)

La fabrique de data.bnf.fr (3)

 Valeur ajoutée

S’adapter aux usages du Web

Utiliser les liens pour créer des connaissances

Dates

Auteur reliés

Géographie

Des outils nouveaux qui font parler les données : algorithmes et regroupements

(14)

Limites et bénéfices

 Pas de bon RDF sans bonnes données sources : il n’y a pas de magie.

 Adolescence et identité : lever les

malentendus sur ce que data.bnf.fr est et ce qu’il n’est PAS

 Données riches et obscures, données

pauvres et accessibles : placer le curseur au centre ou proposer plusieurs

chemins?

Données personnelles et autorités : un

questionnement

(15)

Limites et bénéfices

Chiffres clés:

 20% des notices de catalogues BnF (3.6 M documents)

 +70 000 visiteurs uniques par mois

 +80% issus des moteurs de recherche

 50-70% de conversion (vers Gallica et catalogues)

Bénéfices applicatifs : autorités, identifiants (ARK, ISNI…) : l’exposition engage la mutation

 Valorisation de communautés métier qui doutent

 Des prix (prix Stanford, Data intelligence

awards…)

(16)

Vocabulaires

publiés

(17)

OpenCat

 https://demo.cubicweb.org/library/

(18)

Merci

gildas.illien@bnf.fr romain.wenz@bnf.fr Projet:

data@bnf.fr

Références

Documents relatifs

Experimental results on measurements of the apparent thermal conductivity of pozzolana concrete are reported in this study, using an approach that considers

Le mouvement d’ouverture des données publiques (open data) constitue une opportunité nouvelle de diffusion gratuite et ouverte des ressources auprès du plus grand nombre.. Pour

Nous avons proposé un nouvel algorithme, LDRANK, pour l’ordonnancement des entités d’un graphe du web des données qui peut être creux et bruité, mais pour lequel des

4 C'est le cas par exemple du set de licences proposées par l'Open Knowledge Foundation : http://opendatacommons.org/licenses. 5 On peut citer les associations et

Le terme « fragment » se justifi e car, outre qu’il s’agit d’une partie insérée comme si de rien n’était dans un manuscrit qui est globalement un manuscrit du Tristan, le

On distingue ainsi les propriétés d’objet (object property) qui relient deux ressources entre elles (dans ce cas le sujet et l’objet du triplet sont des URIs), et les

Les structurer correctement garantit que l’on puisse les exploiter facilement pour produire de

Dans notre approche, nous introduisons la sé- paration des attributs et nous comparons les règles d’asso- ciation avec les redescriptions et les règles de traduction..