RSS / Pablo Iriarte - DocSoc 2006
La diffusion de l'information documentaire et des actualités en format RSS
Un exemple de mise en place au Centre de Documentation en Santé Publique de Lausanne
Pablo Iriarte
BiUM/CDSP – CHUV Lausanne
RSS / Pablo Iriarte - DocSoc 2006
RSS
Naissance d'un nouveau moyen de diffusion
RSS/RDF/Atom : la diffusion en XML
Typologie des flux RSS
Implications dans le domaine I+D
Méthode d’implémentation
Résultats
Conclusion
RSS / Pablo Iriarte - DocSoc 2006
Naissance d'un nouveau moyen de diffusion
1992 : CERN, What’s new?
1997 : Dave Winer, syndication XML
1999 : Netscape, RDF Site Summary 0.90
2002 : RSS 2.0 « Winer »
2003 : « blog bang » et extension de RSS aux médias en ligne. Format Atom
2005 : web 2.0 et implémentation de RSS dans les BD (A&I) archives, moteurs…
RSS / Pablo Iriarte - DocSoc 2006
RSS/RDF/Atom : la diffusion en XML
RSS : « Really Simple Syndication »,
« Rich Site Summary » ou « RDF Site Summary »
RDF = Ressource Description Framework
La guerre des formats
Hammond, Tony ; Hannay, Timo ; Lund, Ben. The Role of RSS in Science Publishing : Syndication and Annotation on the Web. D-Lib Magazine. Vol 10, n°12, décembre 2004
<http://www.dlib.org/dlib/december04/hammond/
12hammond.html>
RSS / Pablo Iriarte - DocSoc 2006
RSS / Pablo Iriarte - DocSoc 2006
Flux ou fil RSS : un simple fichier texte
Simplicité et extensibilité
Gestion intégrée dans les navigateurs (sauf IE) et bientôt les OS
Profusion des flux, des lecteurs et des moteurs ou agrégateurs
Syndication des contenus (parseurs et balises javascript)
RSS/RDF/Atom : la diffusion en XML
RSS / Pablo Iriarte - DocSoc 2006
Verticaux : généraux ou chronologiques
Horizontaux : par thème, par « tag », par auteur…
Ponctuels : spécifiques selon les critères de recherche
Parallèles : pour les commentaires ou d’un blog ou les citations d’un article
Individuels : pour chaque billet d’un blog ou page d’un wiki
Typologie des flux RSS
RSS / Pablo Iriarte - DocSoc 2006
Implications dans le domaine I+D
Veille
Surveiller en permanence une multitude des sites web sans devoir s’y rendre
Récupération de l’information textuelle « pure »
Abonnement non intrusif et complètement libre
Butinage et recherche du web « éphémère »
Le web « à la carte » avec pas ou peu de publicité
RSS / Pablo Iriarte - DocSoc 2006
Diffusion
Génération automatique du fil RSS (Blogs, CMS, SIGB)
Possibilité de créer des flux d’information thématiques
Syndication des contenus par des tiers
Indexation par les moteurs de recherche
Passerelles OAI-RSS
Conversion RSS->mail ou SMS
Implications dans le domaine I+D
RSS / Pablo Iriarte - DocSoc 2006
Constat
La méconnaissance de RSS par une bonne partie encore des professionnels et des utilisateurs
Le « déficit de compétences techniques dans les bibliothèques »
et le « désintérêt ou méconnaissance » de la plupart d’éditeurs commerciaux de systèmes intégrés de gestion de bibliothèques (SIGB)
Implications dans le domaine I+D
RSS / Pablo Iriarte - DocSoc 2006
Enjeux
1. Améliorer la visibilité de l’activité de notre centre 2. Faciliter l’activité de veille sur notre propre base de
données
3. Mettre en place une DSI qui puisse couvrir une plus grande partie de l’ensemble des ressources
électroniques ou papier disponibles
4. Faciliter l’indexation du contenu de notre base de
données par les moteurs de recherche comme Google 5. Permettre la syndication du contenu produit par le
centre dans les sites web partenaires
Méthode d’implémentation
RSS / Pablo Iriarte - DocSoc 2006
Méthode d’implémentation
Adaptation HTML -> RSS
RSS / Pablo Iriarte - DocSoc 2006
Flux selon les critères de recherche : URL contextuel
Méthode d’implémentation
RSS / Pablo Iriarte - DocSoc 2006
Méthode d’implémentation
1. Recherche des documents selon les critères de l'URL (requête GET)
3. Création du code HTML : Entête
Menu de navigation
Boucle des 20 premières notices Pied de page
2. Tri des résultats selon le choix du lecteur (stocké par un cookie) ou tri par défaut par date de parution décroissante en son absence
2. Tri des résultats par date décroissante d'entrée dans le système (les dernières notices d'abord)
OPAC (HTML) RSS (XML)
1. Recherche des documents selon les critères de l'URL (requête GET)
3. Création du code XML :
<channel>
Boucle des 20 premiers items
</channel>
Flux selon les critères de recherche : génération dynamique des résultats en format RSS
RSS / Pablo Iriarte - DocSoc 2006
Flux thématiques : actualités du site web
Méthode d’implémentation
RSS / Pablo Iriarte - DocSoc 2006
Permaliens ou « globally unique identifier »
Méthode d’implémentation
RSS / Pablo Iriarte - DocSoc 2006
Résultats
Evolution positive de l’usage des flux : 15%
des requêtes concernent les flux RSS
RSS / Pablo Iriarte - DocSoc 2006
Résultats
RSS / Pablo Iriarte - DocSoc 2006
Résultats
RSS + XSL = XHTML
RSS / Pablo Iriarte - DocSoc 2006
Conclusion
Allez-y!!!!
Pas aussi simple qu’il paraît (codage des caractères!) mais apporte une valeur ajoutée
Généralisation d’un « export RSS » pour les OPACs et bases de données documentaires
Services Web (initiatives « OpenSearch » et « SRU/SRW ») et (enfin?) Web sémantique
http://www.flickr.com/photos/orinrobertjohn/170352038/ http://www.flickr.com/photos/israelbarros/229549839/