SFX, OpenURL
et la métarecherche
François-Xavier Paré Bibliothécaire système Université de Montréal 5 octobre 2005Plan de la présentation
1) Qu’est-ce que SFX ? 2) Avant SFX 3) Avec SFX 4) En coulisse… – Principes de fonctionnement – Administration du système– Implantation et autres considérations
Qu’est-ce que SFX ?
• Logiciel acquis par l’UdeM en 2002• Permet de faire le pont entre la notice
bibliographique d’un article et le texte de cet article en format électronique:
SFX
Avant SFX
• Difficultés:
– Demande la compréhension de plusieurs concepts par l’usager (!) – Plusieurs points de rupture potentiels (erreurs de saisie, etc.)
– Processus relativement long
Notice repérée dans un index Recherche au catalogue (au titre du périodique) Recherche sur le site de l’éditeur Texte intégral
De la notice au texte intégral, 4 étapes parfois ardues…
3
Avec SFX: Processus accéléré et simplifié
Notice repérée dans un index Recherche au catalogue (au titre du périodique) Recherche sur le site de l’éditeur Texte intégralDe quatre étapes “complexes” à deux
3
1 2 4
Avec SFX: Processus accéléré et simplifié
Notice repérée dans un index Texte intégralDe quatre étapes “complexes” à deux
1 2
En coulisse: Comment ça fonctionne
Notice repérée dans un index Texte intégralSFX
En coulisse: Comment ça fonctionne
Notice repérée dans un index Texte intégralSFX
Lien OpenURL (norme NISO)
http://opurl.bib.umontreal.ca:9003/sfx_local? sid=AMS:MathSciNet&atitle=Fractal%20properties%20of%20refined%20box %20dimension%20on%20functional %20graph&aufirst=Meifeng&auinit1=M&aulast=Dai&coden=CSFOEH&date=200 5&epage=1379&genre=article&issn=0960-0779&issue=4&pages=1371-1379&spage=1371&stitle=Chaos%20Solitons%20Fractals&title=Chaos, %20Solitons%20and%20Fractals&volume=23
En coulisse: Comment ça fonctionne
Notice repérée dans un index Texte intégralSFX
Lien OpenURL Le serveur SFX:– Interprète l’OpenURL reçu (métadonnées)
– Consulte la base de connaissances (inventaire local) – Détermine quel(s) lien(s) offrir
Comment SFX décide-t-il s’il doit offrir un
lien ?
• Selon l’ISSN ou le Titre du périodique
– Est-on abonné au périodique ?
• Selon la Date, le Volume, le Numéro
– A-t-on accès à ce numéro en particulier ?
• $obj->parsedDate(">=",1999,25,1)
• Si oui à ces deux questions, un lien sera offert. • Sinon, pas de lien…
Construction du lien vers le plein texte
• SFX connait la syntaxe de lien appropriée pour les différents fournisseurs/éditeurs. • Exemples: – Emerald: http://www.emeraldinsight.com/rpsv/cgi-bin/cgi?body=linker&reqidx=00 01-253X(2005)57:1L.85 – Ovid: http://gateway.ovid.com/ovidweb.cgi ?T=JS&ID=ID&PASSWORD=PASSWORD&PAGE=fulltext&D=ovft &MODE=ovid &NEWS=N&SEARCH=0001-2815.is+and+56.vo+and+6.ip+and+492.pg – Institute of Physics: http://stacks.iop.org/0022-3727/24/21
Construction du lien vers le plein texte
• La syntaxe peut aussi varier en fonction des métadonnéesdisponibles. • Exemple (Swetswise): – ISSN: http://www.swetsnet.nl/link/access_db?issn=0001-2815 – ISSN et Volume: http://www.swetsnet.nl/link/access_db?issn=0001-2815&vol=56 – (…)
Construction du lien vers le plein texte
• En résumé: Notice repérée dans un index Texte intégralSFX
Lien OpenURL Lien formaté
http://opurl.bib.umontreal.ca:9003/ sfxlocal?genre=article&issn=0001-8732&volume=52&issue=1&spage =523 http://www.swetsnet.nl/link/access _db?issn=0001-8732&vol=52&iss=1&page=523&F T=1
La base de connaissances SFX
• Contient des informations sur:– 260+ ensembles de périodiques – Des milliers de périodiques
– Syntaxes de liens, couvertures, etc.
• Représente tous les périodiques disponibles sur le marché
– Nous devons donc indiquer au logiciel SFX ceux auxquels nous sommes abonnés…
SFX – Module d’administration web
Autres services du menu SFX
• Recherche dans Atrium • Formulaire de PEB
• Autres recherches:
– Catalogues d’autres bibliothèques montréalaises – Google Scholar
– OAIster
– ISI Journal Citation Reports
Produits “dérivés” de SFX
• Formulaire Obtenir un article:– http://opurl.bib.umontreal.ca:9003/citation/sfx_local
• Liste des périodiques électroniques:
– http://opurl.bib.umontreal.ca:9003/sfx_local/a-z/defa ult
SFX – Avantages et limites
• Avantages:– Plus simple pour les usagers:
• Plus rapide
• Évite les erreurs de saisie
– Mise en valeur de ressources électroniques acquises à fort prix…
SFX – Avantages et limites
• Limites:
– La capacité à se rendre au plein texte dépend:
• Des métadonnées offertes par la source (quantité suffisante, exactitude)
• De l’organisation du site cible (syntaxe d’URL prévisible ou non)
– Difficile de rester entièrement à jour dans la base de connaissances (malgré mises à jour mensuelles…)
– Une application de plus à gérer pour le Bureau des systèmes (implantation, maintenance, mises à jour logicielles, coût, etc.)
La métarecherche et
Avant la métarecherche (maintenant !)
• Des dizaines de bases de données disponibles • Chaque base (ou plateforme) a une interface
distincte, qu’il faut apprivoiser pour chercher correctement
• On cherche dans une seule base à la fois
– Il faut donc reprendre la même recherche dans plusieurs bases…
Avec la métarecherche
• Une seule requête est envoyée simultanément à plusieurs bases de données
• Les résultats sont ramenés dans une seule interface, en une liste consolidée
La métarecherche: fonctionnement
Métamoteur Base de données X Base de données Y Base de données Requête Requête Requête RequêteLa métarecherche: fonctionnement
Métamoteur Base de données X Base de données Y Base de données Z Résultats X + Y + Z Résultats Z Résultats Y Résultats XScénario: Envoi d’une requête
• 1- L’usager choisit les bases qu’il veutinterroger
• 2- L’usager entre une requête dans le métamoteur
• 3- Le métamoteur traduit la requête et l’envoie à chaque base choisie, dans le protocole approprié.
Traduction de la requête
• Il s’agit ici d’une communication machine-machine (métamoteur-base de données).
• Les deux machines doivent donc s’entendre sur un protocole commun afin de pouvoir “se comprendre”
– Z39.50, passerelle XML, etc.
• Le nom des champs est souvent différent d’une base à l’autre, d’où la nécessité de “traduire” la requête.
Traduction de la requête
• Exemple de requête: Titre = Guerre et paixMétamoteur Base de données X Base de données Y Base de données TI=Guerre et paix 245$a=Guerre et paix <title>Guerre et paix</title>
Traduction de la requête
• La syntaxe et le protocole appropriés pour chaque base de données sont connus du métamoteur.
– Ces informations sont contenues dans une base de connaissances (comme dans SFX…)
Scénario: Envoi d’une requête (suite et fin)
• 4- La recherche effectuée dans chaque base dedonnées.
• 5- Chaque base retourne des résultats (ou un message d’erreur…) dans son propre “langage”.
• 6- Le métamoteur doit traduire les résultats dans un langage commun.
• 7- Les résultats seront ensuite jumelés en une seule liste, dédoublonnés, triés, puis affichés pour l’usager.
Tri des résultats - pertinence
• Pour des raisons de performance, on ne
ramène que quelques dizaines de résultats au métamoteur
– On en ramène plus au besoin.
• Les premiers résultats envoyés sont généralement triés par date
Différents niveaux d’efficacité…
• Certaines bases permettent de ramener les résultats dans l’interface du métamoteur
– Z39.50, passerelles XML
• Mais ce n’est pas toujours le cas…
– “Screen scraping”
– Nombre de résultats seulement (Found [x] results)
Autres fonctionnalités des métamoteurs
• La bibliothèque peut:
– Organiser les bases de données par catégories.
– Créer à l’avance des sous-ensembles de bases de données pour l’usager (Médecine, Sciences humaines, …)
• Le métamoteur peut gérer l’authentification pour l’accès aux bases de données, selon certains critères.
• En s’inscrivant, l’usager peut sauvegarder des notices dans un dossier personnel, créer une liste de bases de données préférées, créer des alertes (DSI), etc.
• Portail de bibliothèque
Métamoteurs – Avantages et limites
• Avantages:– Simplicité et économie de temps pour l'usager
• Moins de recherches à effectuer • Moins d’interfaces à apprivoiser
– Utilisation de ressources précédemment négligées
Métamoteurs – Avantages et limites
• Limites:
– Difficile de rester entièrement à jour dans la base de connaissances (malgré mises à jour mensuelles…) – Toutes les bases n'ont la même capacité à accepter
les requêtes et retourner les résultats – Problèmes de tri (pertinence)
Un débat…
• Les métamoteurs cachent la complexité des interfaces de chaque base de données
(fonctions avancées, particularités) • Plus facile (“Google-like”)
• Trop facile ?
– Problèmes aux cycles supérieurs, marché du travail ?