CIRAD
SIST
o Module HUBBLE
Manuel d’utilisation :
Module de Recherche Fédérée
Février 2007
Ref. [Référence document]
Documentation du module HUBBLE Page 2 sur 33 Historique des versions du document
Version /
Date Auteur Commentaire Date de validation / Approbateur V0.0.1
09/01/2005 C.CHAMBERLIN Création V1.0.0 C.CHAMBERLIN Présentation V1.1.0 C.CHAMBERLIN Evolution
V1.2.0 O.DOUARCHE Vérification 08/06/2005
V1.2.1 C.CHAMBERLIN Evolution
Documentation du module HUBBLE Page 3 sur 33
Sommaire
1 PRÉAMBULE...5
1.1 OBJECTIFSDUDOCUMENT...5
2 PRÉSENTATION...6
3 LES SOURCES...8
3.1 PRÉSENTATION... 8
3.2 AJOUTER... 12
3.3 SUPPRIMER... 12
3.4 MODIFIER... 13
4 LES PAYS...14
4.1 PRÉSENTATION... 14
4.2 AJOUTER... 15
4.3 SUPPRIMER... 15
4.4 MODIFIER... 16
5 LES THEMATIQUES...17
5.1 PRÉSENTATION... 17
5.2 AJOUTER... 18
5.3 SUPPRIMER... 18
5.4 MODIFIER... 18
6 LES CATÉGORIES...19
6.1 PRÉSENTATION... 19
6.2 AJOUTER... 20
6.3 SUPPRIMER... 20
6.4 MODIFIER... 20
7 LES TYPES...21
7.1 PRÉSENTATION... 21
7.2 AJOUTER... 21
7.3 SUPPRIMER... 22
7.4 MODIFIER... 22
8 LES ERREURS...23
8.1 PRÉSENTATION... 23
8.2 RÈGLESDEFONCTIONNEMENT...23
9 LES SITES...25
9.2 AJOUTER... 26
9.3 SUPPRIMER... 26
9.4 MODIFIER... 26
9.5 VALIDER... 26
10 URL DE CONNEXION À UN AUTRE SIST...27
10.1 TESTER LECONNECTEURDU SIST DISTANT...27
10.2 CRÉERLASOURCE SIST DISTANT...27
11 CONSTRUCTION DES MASQUES DES SITES PARTENAIRES...28
11.1 URL... 28
11.2 Le masque de résultats...29
Documentation du module HUBBLE Page 4 sur 33
Documentation du module HUBBLE Page 5 sur 33
1 P RÉAMBULE
1.1 O
BJECTIFS DU DOCUMENTCe document à pour but de décrire la manipulation du moteur de recherche fédérée HUBBLE.
Il spécifie la façon de procéder pour créer et gérer les différentes sources sollicitées pas le système de recherche.
Documentation du module HUBBLE Page 6 sur 33
2 P RÉSENTATION
Voici un exemple d’écran de recherche fédérée «HUBBLE » :
Pour y accéder, il suffit de se connecteur sur la rubrique de type « HUBBLE ».
Ci-dessous l’écran de gestion du module de recherche, à partir duquel on peut agir sur les :
Les sources,
Les pays,
Les thématiques,
Les catégories,
Les types,
Les erreurs Pour y accéder :
Aller sur le « back-office » de SPIP,
Cliquez sur l’icône « Administration du site »,
Cliquez sur l’icône « Configuration du site»,
Cliquer sur l’onglet « Gestion des modules ».
Documentation du module HUBBLE Page 7 sur 33
Documentation du module HUBBLE Page 8 sur 33
3 L ES S OURCES
3.1 P
RÉSENTATION3.1.1 L’interface de gestion des sources
Modification de la source
Suppression de la source
Ajout d’une nouvelle source
Documentation du module HUBBLE Page 9 sur 33
3.1.2 Présentation d’une source
3.1.2.1 Source de catégorie « Formulaire Web »
Nom de la source
Libelle de présentation de la source au niveau du front office.
Description de la source Texte de description de la source Sélectionné par défaut
Permet de définir si la source est automatiquement sélectionnée à l’ouverture du moteur HUBBLE.
Source Active
Permet de définir si la source est disponible ou non lors d’une recherche par l’utilisateur.
Recalcule de la pertinence
Active le recalcule la pertinence de résultats d’une source, que cette source renvoi où non une pertinence.
Source protégée
Permet de définir le code de protection de la source. Si aucun code n’est saisi la source n’est pas protégée. Seules les sources dont le code a été saisi par l’utilisateur (ou les sources non protégées) seront visible dans le front-office.
Documentation du module HUBBLE Page 10 sur 33
Pays
Permet de définir le « Pays » de Source, afin d’avoir au niveau de l’interface de « recherche fédérée » (front office), une sélection automatique de certaines sources sera effectuée en fonction des différentes valeurs choisie par l’utilisateur via les différentes listes « Pays »,
« Thème », « Catégorie » et «Type ».
Thématique
Permet de définir la « Thématique » de Source, afin d’avoir au niveau de l’interface de
« recherche fédérée » (front office), une sélection automatique de certaines sources sera effectuée en fonction des différentes valeurs choisie par l’utilisateur via les différentes listes « Pays », « Thème », « Catégorie » et «Type ».
Type
Permet de définir le « Type » de Source, afin d’avoir au niveau de l’interface de « recherche fédérée » (front office), une sélection automatique de certaines sources sera effectuée en fonction des différentes valeurs choisie par l’utilisateur via les différentes listes « Pays »,
« Thème », « Catégorie » et «Type ».
Catégorie de la source
Permet de choisir la « catégorie » de la source, en fonction de cette valeur, certaines options seront disponible ou indisponible.
De plus, au niveau de l’interface de « recherche fédérée » (front office), une sélection automatique de certaines sources sera effectuée en fonction des différentes valeurs choisie par l’utilisateur via les différentes listes qui lui sont présenté « Pays », « Thème », « Catégorie » et «Type ».
Séparateur de mot-clefs
Permet de définir le séparateur de mot-clef lors de l’envoi de la requête. Par défaut, il s’agit de l’espace.
Méthode HTTP (GET/POST)
Se renseigner auprès du partenaire SIST sur la méthode utilisé.
Masque des résultats
Il s’agit du modèle d’un motif de résultat de recherche de recherche. Ce motif doit permettre d’extraire tous les items résultats. Il peut contenir plusieurs mot-clefs (ou expression) afin de définir au mieux le motif (cf. 11.2).
Nb de résultats par page Nombre de résultats présentés sur chacune des pages de réponses à la recherche.
Profondeur Nombre de résultat maximum à rechercher.
Paramètre de l’URL
Modèle de présentations de paramètre de l’URL de recherche, il peut contenir plusieurs mot- clefs (ou expression) afin de définir au mieux les différents paramètres (cf. 11.1).
URL de la source
URL de la page de recherche du partenaire SIST (cf. 11.1).
Documentation du module HUBBLE Page 11 sur 33 3.1.2.2 Source de catégorie « Site SIST »
Paramètre de l’URL
Pour la source « Site SIST », nous avons la possibilité de sélectionner la liste des sources à utiliser sur le site SIST pour y faire la recherche. Il faut définir le mot-clef SOURCE ainsi que la liste des ID des sources du site partenaire (avec pour séparateur la virgule).
Exemple : SOURCES=12,23 URL de la source
URL du site SIST.
Documentation du module HUBBLE Page 12 sur 33 3.1.2.3 Source de catégorie « Site Partenaire »
Profondeur
Indique le nombre de résultat à récupérer sur la source.
Paramètre de l’URL
Pour la source « Site Partenaire », nous avons la possibilité de définir des paramètres indispensables pour le site. La plupart du temps, ces paramètres sont inutiles.
URL de la source
URL de la page de recherche.
3.2 A
JOUTER Aller sur l’interface de gestion des sources
Cliquez sur l’icône « Stylo » afin de créer la source correspondante
3.3 S
UPPRIMER Aller sur l’interface de gestion des sources
Cliquez sur l’icône « Poubelle » afin de supprimer la source correspondante
3.4 M
ODIFIER Aller sur l’interface de gestion des sources
Documentation du module HUBBLE Page 13 sur 33
Cliquez sur l’icône « Bloc notes »
Modifier les différentes valeurs
Cliquez sur le bouton « Valider » pour enregistrer vos modifications
Documentation du module HUBBLE Page 14 sur 33
4 L ES PAYS
4.1 P
RÉSENTATION4.1.1 L’interface de gestion des pays
Modification du pays Suppression du pays
Ajout d’un pays
Documentation du module HUBBLE Page 15 sur 33
4.1.2 Présentation d’un pays
Nom du pays
Libelle du nom du pays
4.2 A
JOUTER Aller sur l’interface de gestion des pays
Cliquez sur l’icône « Stylo » afin de Créer le pays correspondante
4.3 S
UPPRIMER Aller sur l’interface de gestion des pays
Cliquez sur l’icône « Poubelle » afin de supprimer le pays correspondante
4.4 M
ODIFIERDocumentation du module HUBBLE Page 16 sur 33
Cliquez sur l’icône « Bloc notes »
Modifier les différentes valeurs
Enregistrer les modifications à l’aide du bouton « Valider »
Documentation du module HUBBLE Page 17 sur 33
5 L ES THEMATIQUES
5.1 P
RÉSENTATION5.1.1 L’interface de gestion des thématiques
5.1.2 Présentation d’une thématique
Nom de la thématique
Libelle du nom de la thématique
Modification d’une thématique Suppression d’une thématique
Ajout d’une thématique
Documentation du module HUBBLE Page 18 sur 33
5.2 A
JOUTER Aller sur l’interface de gestion des thématiques
Cliquez sur l’icône « Stylo » afin de créer la thématique correspondante
5.3 S
UPPRIMER Aller sur l’interface de gestion des thématiques
Cliquez sur l’icône « Poubelle » afin de supprimer la thématique correspondante
5.4 M
ODIFIER Aller sur l’interface de gestion de la thématique
Cliquez sur l’icône « Bloc notes »
Modifier les différentes valeurs
Enregistrer les modifications à l’aide du bouton « Valider »
Documentation du module HUBBLE Page 19 sur 33
6 L ES CATÉGORIES
6.1 P
RÉSENTATIONIl est fortement conseillé d’utiliser les 3 catégories mises à disposition, et de ne pas les modifier.
6.1.1 L’interface de gestion des catégories
6.1.2 Présentation d’une catégorie
Nom de la catégorie
Modification d’une catégorie Suppression d’une catégorie
Ajout d’une catégorie
Documentation du module HUBBLE Page 20 sur 33
Fichier de class PHP
Permet de définir les fichiers de connections PHP à utiliser en fonction de la catégorie de la source :
« ClassConnecteurWeb.php » pour l’ensemble des sources Web
« ClassConnecteurSIST.php » pour l’ensemble des autres SIST
« ClassConnecteurPartenaire.php » pour l’ensemble des sites Partenaires
« ClassConnecteurMySQLFinder.php » pour l’ensemble des sources MySQLFinder Paramétrage du connecteur
Liste des paramètres disponibles lors de la sélection de cette catégorie dans l’interface de création (ou modification) d’une source (cf. §3.1.2).
6.2 A
JOUTER Aller sur l’interface de gestion des catégories
Cliquez sur l’icône « Stylo » afin de créer la catégorie correspondante
6.3 S
UPPRIMER Aller sur l’interface de gestion des catégories
Cliquez sur l’icône « Poubelle » afin de supprimer la catégorie correspondante
6.4 M
ODIFIER Aller sur l’interface de gestion de la catégorie
Cliquez sur l’icône « Bloc notes »
Modifier les différentes valeurs
Enregistrer les modifications à l’aide du bouton « Valider »
Documentation du module HUBBLE Page 21 sur 33
7 L ES TYPES
7.1 P
RÉSENTATION7.1.1 L’interface de gestion des types
7.1.2 Présentation d’une type
Nom du type Libelle du type
7.2 A
JOUTER Aller sur l’interface de gestion des types
Cliquez sur l’icône « Stylo » afin d’ajouter un type correspondant
Modification d’un type Suppression d’un type Ajout d’un type
Documentation du module HUBBLE Page 22 sur 33
7.3 S
UPPRIMER Aller sur l’interface de gestion des types
Cliquez sur l’icône « Poubelle » afin de supprimer le type correspondant
7.4 M
ODIFIER Aller sur l’interface de gestion des types
Cliquez sur l’icône « Bloc notes »
Modifier les différentes valeurs
Enregistrer les modifications à l’aide du bouton « Valider »
Documentation du module HUBBLE Page 23 sur 33
8 L ES ERREURS
8.1 P
RÉSENTATIONLorsqu’une erreur survient sur la connexion à l’un des sites par HUBBLE, un mail peut-être envoyé à l’administrateur, de même qu’un message est ajouté dans l’interface des erreurs.
8.2 R
ÈGLES DE FONCTIONNEMENT
En cas de nouvelle erreur sur une source non présente : Un mail sera envoyé à l’administrateur
Un message sera ajouté
Libelle de la source en erreur
Dates des erreurs sur la source
Messages d’erreurs sur la source
Indique que
l’administrateur à pris connaissance de ces
erreurs. Validation des « VU »
Documentation du module HUBBLE Page 24 sur 33
Un message sera ajouté
En cas de nouvelle erreur sur une source présente et « Vu »: Un mail ne sera pas envoyé à l’administrateur
Un message sera ajouté
Documentation du module HUBBLE Page 25 sur 33
9 L ES SITES
9.1.1 Interface de gestion des sites
9.1.2 Présentation d’un site
Nom du site Libelle du site
Modification d’un site Suppression d’un site Valider d’un site
Ajout d’un site
Documentation du module HUBBLE Page 26 sur 33
9.2 A
JOUTER Aller sur l’interface de gestion des site
Cliquez sur l’icône « Stylo » afin de supprimer le site correspondant
9.3 S
UPPRIMER Aller sur l’interface de gestion des sites
Cliquez sur l’icône « Poubelle » afin de supprimer le site correspondant
9.4 M
ODIFIER Aller sur l’interface de gestion des types
Cliquez sur l’icône « Bloc notes »
Modifier les différentes valeurs
Enregistrer les modifications à l’aide du bouton « Valider »
9.5 V
ALIDER Aller sur l’interface de gestion des sites
Cliquez sur l’icône « Valider » afin de valider le site correspondant
Documentation du module HUBBLE Page 27 sur 33
10 URL DE CONNEXION À UN AUTRE SIST
Si l’on ne précise pas de paramètres, le connecteur SIST posera la question sur les sources par défaut du SIST distant. Toutefois, il est possible de définir les sources à interroger (la question sera automatique ajoutée).
10.1T
ESTER LE CONNECTEUR DUSIST
DISTANT L’URL de connexion à un autre SIST s’écris de la manière suivante : http://serveurSIST/cheminAuSIST/modules/Hubble/recepteurSIST.php?SOURCES=1,2&CRITERE=COUCOU
Dans l’exemple ci-dessus, la question « COUCOU » sera posée aux sources 12 et 1.
10.2C
RÉER LA SOURCESIST
DISTANTIl suffit d’écrire l’URL du SIST distant de la manière suivante :
http://serveurSIST/cheminAuSIST/modules/Hubble/recepteurSIST.php?SOURCES=1,2 Le critère est automatiquement ajouté.
Documentation du module HUBBLE Page 28 sur 33
11 C ONSTRUCTION DES MASQUES DES SITES PARTENAIRES
La construction des masques s’apparente à un jeu de piste pour trouver les informations nécessaires à l’élaboration correcte des différents masques d’une source (URL et résultats).
L’ensemble de site partenaire devrait fournir les informations nécessaires à l’élaboration des sources.
La source servant d’exemple est la source Google.
11.1URL
Aller sur le site : www.google.fr
Tapez dans le formulaire de recherche le mot « Coucou »
Cliquez sur page sur lien permettant d’accéder à la page N°2
11.1.1 URL de recherche
Il s’agit de la partie de l’URL permettant de faire appel au moteur de recherche, c'est-à-dire sans les paramètres.
Exemple : http://www.google.fr/search
11.1.2 Les paramètres de l’URL
Les mots-clefs & formules
Les mots-clefs et les formules permettent de définir au mieux les paramètres de l’URL. Les mots-clefs et les formules sont encadrée de la manière suivante : « ##MOTouFORMULE## ».
L’URL peut être dynamique en fonction :
du nombre de résultat,
du critère de recherche (question),
numéro de la page résultats (résultats multi pages).
Exemple d’URL de la source Google (www.google.fr)
http://www.google.fr/search?q=Coucou&hl=fr&lr=&start=10&sa=N
URL de recherche Paramètres de l’URL
Documentation du module HUBBLE Page 29 sur 33 Dans l’exemple ci-dessus, nous avons un mot-clef ##CRITERE## et une formule
##(NB_RESULTAT_PAR_PAGE*(NUM_PAGE-1))## de même que des paramètres constants (choix de la
langue, etc.).
En regardant l’url de résultats de recherche de google (en faisant plusieurs recherches et tests), nous pouvons isoler les paramètres :
- L’index de départ de présentation des résultats « start=10», - La question « q=Coucou »,
- Des paramètres statiques «hl=fr », « sa=N », « lr= ».
Le seul point difficile est la définition de « L’index de départ », puisqu’il est proportionnel au nombre de résultats de la page, au numéro de la page.
hl=fr&q=##CRITERE##&start=##(NB_RESULTAT_PAR_PAGE*(NUM_PAGE-1))##&meta=
Liste des URLs appelés pour obtenir 50 résultats
Pour la page 1 : http://www.google.fr/search?hl=fr&q=Coucou&start=0&meta=
Pour la page 2 : http://www.google.fr/search?hl=fr&q=Coucou&start=10&meta=
Pour la page 3 : http://www.google.fr/search?hl=fr&q=Coucou&start=20&meta=
Pour la page 4 : http://www.google.fr/search?hl=fr&q=Coucou&start=30&meta=
Pour la page 5 : http://www.google.fr/search?hl=fr&q=Coucou&start=40&meta=
Petites précisions sur le moteur HUBBLE
En fonction des informations du formulaire de la source « nombre de résultat par page », et la
« profondeur », le module HUBBLE détermine le nombre de page à appeler.
Lors de la recherche, HUBBLE interrogera la source sur autant de page que nécessaire, c'est-à- dire qu’il questionnera le site en fonction du masque d’URL et qu’il modifiera le compteur
« NUM_PAGE » afin d’interroger la bonne page à chaque fois.
11.2L
E MASQUE DE RÉSULTATS11.2.1 Les mots-clefs
Le système HUBBLE permet de définir à l’aide du code HTML de la page résultat, un modèle de motif de résultats permettant d’extraire les données du résultat (Titre, URL, Source, etc. ). Le système fonctionne à l’aide d’expressions régulières, les données extraites sont celles qui arrivent à vérifier le plus petit motif possible.
Voici un exemple de masque de résultat pour la source Google
<p class=g ><a href= ##link## >##title##</a> ##*## <font size=-1>##description##<nobr>
Les mots-clefs :
##TITLE## Titre du document résultat
##LINK## Lien vers le document résultat
##DESCRIPTION## Description du document résultat
##AUTHOR## Auteur du document résultat
##CATEGORY## Taux de pertinence du document résultat
##ENCLOSURE## ???
##GUID## ???
##PUBDATE## Date de publication
##SOURCE## Source du résultat (google dans notre cas)
##*## Chaîne à ignorer
Insertion de constantes
Il est possible d’inclure des chaînes de constantes au milieu des mot-clefs, et ceci afin de compléter le résultat finale de l’extraction. La constante se définira de la manière
Documentation du module HUBBLE Page 30 sur 33
Attention, seul le tag ##*## ne peut contenir de constante.
Exemple :
Si l’on définit le tag LINK de la maniere suivante ##http://fr.yahoo.com/@link##, toutes les URL extraites seront par exemple de la forme suivante http://fr.yahoo.com/public?
doc=1541851.
11.2.2 Exemple de création de masques
Nous pouvons voir dans l’exemple ci-dessus, que nous obtenons : - Le titre
- La description - L’URL du document
Ci-dessous, une extraction partielle sur code HTML de la page résultat, pour laquelle nous avons coloré chacune des réponses. A l’intérieur de chaque réponse, nous pouvons isoler des motifs (chaînes de caractères) récurrents (en noir gras), et les données à récupérer (en rouge gras).
Documentation du module HUBBLE Page 31 sur 33
Il est parfois nécessaire de faire plusieurs recherches afin de trouver le « motif récurant ».
11.2.3 Tester les motifs
Il existe un moyen de tester son masque, il suffit modifier l’URL suivante afin de l’adapter à se source.
http:// URL2MonSIST /modules/Hubble/Metier/Lanceur/LanceurConnecteurDebug.php?
URL= IdSource &CRITERE= MaQuestion
<div><p class=g><a href=http://www.coucou.org/ onmousedown="return
clk(this,'res',1)"><b>Coucou</b>.org :: Un <b>coucou</b> et plus si affinité ;-)</a><br><font size=- 1><b>Coucou</b>.org est un site de rencontre qui permet de dialoguer très simplement avec<br>
votre navigateur.<br><font color=#008000>www.<b>coucou</b>.org/ - 7k - 17 mai 2005 - </font><nobr> <a class=fl href="http://64.233.183.104/search?q=cache:bILmo-cdnbYJ:www.coucou.org/
+Coucou&hl=fr">En cache</a> - <a class=fl href="/search?
hl=fr&lr=&q=related:www.coucou.org/">Pages similaires</a></nobr></font>
<p class=g><a href=http://mamiecoucou.com/ onmousedown="return
clk(this,'res',2)">mamiecoucou.com/</a><br><font size=-1><font color=#008000> 11k - </font><nobr> <a class=fl href="http://64.233.183.104/search?q=cache:bB5gl_jc470J:mamiecoucou.com/
+Coucou&hl=fr">En cache</a> - <a class=fl href="/search?
hl=fr&lr=&q=related:mamiecoucou.com/">Pages similaires</a></nobr></font> <blockquote class=g>
<p class=g><a href=http://mamiecoucou.com/calendriers/ onmousedown="return
clk(this,'res',3)">Calendriers</a><br><font size=-1><b>...</b> choisissez l'option Réorganiser les icônes par, ensuite décochez Réorganisation<br>
automatique. Chez Mamie <b>Coucou</b> © 2001-2005 tous droits réservés.<br><font color=#008000>mamie<b>coucou</b>.com/calendriers/ - 13k - </font><nobr> <a class=fl href="http://64.233.183.104/search?q=cache:ItGNouQI4AcJ:mamiecoucou.com/calendriers/
+Coucou&hl=fr">En cache</a> - <a class=fl href="/search?
hl=fr&lr=&q=related:mamiecoucou.com/calendriers/">Pages similaires</a></nobr><br>[ <a class=fl href=/search?hl=fr&lr=&q=+site:mamiecoucou.com+Coucou>Autres résultats, domaine mamiecoucou.com</a> ]
</font> </blockquote>
<p class=g><a href=http://pages.infinit.net/mamiecou/ onmousedown="return clk(this,'res',4)">Mamie
<b>Coucou</b></a><br><font size=-1>Vous retrouverez chez moi des cartes virtuelles, des créations graphiques, des<br>
papiers à lettre, des fonds d'écran, de la poésie, une exposition de mes <b>...</b><br><font color=#008000>pages.infinit.net/mamiecou/ - 3k - </font><nobr> <a class=fl href="http://64.233.183.104/search?
q=cache:4aJndjfH9JAJ:pages.infinit.net/mamiecou/+Coucou&hl=fr">En cache</a> - <a class=fl href="/search?
hl=fr&lr=&q=related:pages.infinit.net/mamiecou/">Pages similaires</a></nobr></font>
<p class=g><a href=http://www.oiseaux.net/oiseaux/cuculiformes/coucou.gris.html onmousedown="return clk(this,'res',5)"><b>Coucou</b> gris - Cuculus canorus - Common Cuckoo or Eurasian
Cuckoo</a><br><font size=-1>Fiche d'identification du <b>coucou</b> gris ( Cuculus canorus ).
Appartient à l'ordre<br>
des Cuculiformes et fait partie de la famille des Cuculidés.<br><font
color=#008000>www.oiseaux.net/oiseaux/cuculiformes/<b>coucou</b>.gris.html - 26k - </font><nobr> <a class=fl href="http://64.233.183.104/search?
q=cache:gq1wnFHRHscJ:www.oiseaux.net/oiseaux/cuculiformes/coucou.gris.html+Coucou&hl=fr">En cache</a
> - <a class=fl href="/search?
hl=fr&lr=&q=related:www.oiseaux.net/oiseaux/cuculiformes/coucou.gris.html">Pages similaires</a></nobr></f ont>
<p class=g><a href=http://www.coucou.fr/ onmousedown="return clk(this,'res',6)"><b>Coucou</b>.fr, le spécialiste des coucous sur Internet.</a><br><font size=-1><b>Coucou</b>.fr, le spécialiste des coucous sur Internet, c'est plus de 120 coucous en<br>
majorité en stock que vous pouvez commander en ligne et recevoir chez vous <b>...</b><br><font color=#008000>www.<b>coucou</b>.fr/ - 40k - 17 mai 2005 - </font><nobr> <a class=fl
href="http://64.233.183.104/search?q=cache:a9VibKq7c0cJ:www.coucou.fr/+Coucou&hl=fr">En cache</a> - <a class=fl href="/search?hl=fr&lr=&q=related:www.coucou.fr/">Pages similaires</a></nobr></font>
<p class=g><a href=http://fr.greetings.yahoo.com/browse/Amour_et_amitie/Coucou__/
onmousedown="return clk(this,'res',7)">Cartes de voeux <b>Coucou</b> ! Yahoo! Envoie tes cartes postales
<b>...</b></a><br><font size=-1>Cartes de voeux virtuelles animées et gratuites avec Yahoo! Cartes de voeux.<br>
Envoyez par mail vos cartes postales électroniques de <b>Coucou</b> ! gratuitement.<br><font color=#008000>fr.greetings.yahoo.com/browse/Amour_et_amitie/Coucou__/ - 12k - 17 mai 2005 - </font><nobr>
<a class=fl href="http://64.233.183.104/search?
q=cache:r_2A3G06UjAJ:fr.greetings.yahoo.com/browse/Amour_et_amitie/Coucou__/
+Coucou&hl=fr">En cache</a> - <a class=fl href="/search?
hl=fr&lr=&q=related:fr.greetings.yahoo.com/browse/Amour_et_amitie/Coucou__/">Pages similaires</a></nobr>
</font>
Documentation du module HUBBLE Page 32 sur 33 - les données des pages sources,
- les pages appelées,
- les données extraites à partir du masque
Figure 1-Données de la page source
Documentation du module HUBBLE Page 33 sur 33
Figure 2-Les pages appelées
Figure 3-Liste des résultats extraits