• Aucun résultat trouvé

1.2. La genèse du moteur de recherche

1.2.2. Définition du moteur de recherche

Selon le dictionnaire Larousse, un moteur de recherche est un « logiciel à disposition

des internautes, destiné à répondre à leurs requêtes, énoncées sous la forme de mots-clés, afin d'identifier sur le web des sites, des adresses de messagerie ou des forums »74. Cette définition ne nous semble pas exhaustive ni celle d’ailleurs proposée par l’encyclopédie libre

Wikipédia pour qui un moteur de recherche est « une application web permettant de retrouver des ressources (pages web, images, vidéos, fichiers) associées à des mots quelconques »75. Cette encyclopédie essaye tout de même d’affiner sa définition en précisant qu’un moteur de recherche est « un instrument de recherche sur le web constitué de robots qui parcourent les

sites à intervalles réguliers et de façon automatique pour découvrir de nouvelles adresses ».

Afin d’obtenir une définition complète et précise de ce qu’est un moteur de recherche, il nous faut nous tourner vers les spécialistes des SIC et ceux de l’information-documentation.

S’agissant des SIC, Alexandre Serres et Marie-Laure Malingre de l’URFIST de Bretagne et des Pays de la Loire écrivent qu’un moteur de recherche est un « instrument de

recherche basé sur un recensement de ressources internet, dont tout ou partie est mémorisé

71

SIMONNOT, Brigitte. Moteurs de recherche. Op. cit.

72

Ibid.

73

SILLARD, Benoit. Parts de marché des moteurs de recherche en France. In : JDN [en ligne]. Mis à jour le 25 mai 2013. Disponible sur : http://www.journaldunet.com/ebusiness/le-net/parts-de-marche-des-moteurs-de- recherche-en-france.shtml [Consulté le 31/01/2015]

74

Moteur de recherche. Dictionnaire de français Larousse [en ligne]. Disponible à la page : http://www.larousse.fr/dictionnaires/francais/moteur/52775/locution?q=moteur+de+recherche#526753 [Consulté le 31/01/2015]

75

Moteur de recherche. Wikipédia, l’encyclopédie libre [en ligne]. 05 janvier 2015, 11 :42. Disponible à la page : https://fr.wikipedia.org/wiki/Moteur_de_recherche [Consulté le 31/01/2015]

30

sous forme d'index interrogeables par des formulaires de requête »76. Contrairement aux précédentes définitions, celle proposée par les enseignants chercheurs de l’URFIST rend bien compte de la notion d’index et fait apparaitre celle de formulaire de requête. Cependant, cette définition ne nous semble pas complète car les notions de classement et de page de résultat y sont absentes.

Les spécialistes de l’information-documentation ont, quant à eux, des définitions proches de celle d’Alexandre Serres mais, là aussi, elles diffèrent légèrement les unes des autres sans qu’aucune d’elle n’offre une vision complète de ce qu’est un moteur de recherche. Pascal Duplessis et Ivana Ballarini-Santonocito définissent le moteur de recherche comme un « serveur spécialisé permettant l’accès sur le Web à des ressources, à partir de requêtes

constituées de mots-clés ou de texte libre et selon différents paramètres »77. Ici sont clairement absentes les notions d’indexation, de classement et de page de résultat.

La définition élaborée par La FADBEN pour qui un moteur de recherche est « un outil de

recherche automatisé permettant d’indexer et de rechercher des ressources numérisées de toutes natures sur Internet, sur un réseau Intranet ou sur un poste individuel »78 ne prend pas en compte les notions de classement et de page de résultat mais cette définition est jusqu’ici la seule à ne pas envisager un moteur de recherche comme fonctionnant uniquement sur Internet.

La définition que nous retenons est celle proposée par Véronique Mesguich et Armelle Thomas dans un ouvrage publié par l’Association des professionnels de l’information et de la documentation (ADBS). Les auteurs définissent le moteur de recherche comme un « outil

automatique destiné à collecter et indexer un grand nombre de pages dans l’objectif de permettre, via des interfaces web, une interrogation par mots-clés sur le contenu de ces pages et la présentation des résultats »79. Nous retrouvons ici les notions d’indexation, de

formulaire de requête (interface permettant l’interrogation) et de page de résultat (interface

de présentation des résultats). Même si là non plus l’idée de classement n’apparait pas, cette

76

MALINGRE, Marie-Laure, SERRES, Alexandre. Rappel de la définition, du fonctionnement et de la typologie des moteurs de recherche. In : URFIST de Bretagne et des Pays de la Loire [en ligne]. 2002. Mis à jour en 2014. Disponible sur : http://www.sites.univ-rennes2.fr/urfist/ressources/moteurs-de-recherche-principes-de- fonctionnement/rappel-de-la-definition-du-fonctionnemen [Consulté le 31/01/2015]

77

DUPLESSIS, Pascal, BALLARINI-SANTONOCITO, Ivana. Moteur de recherche. Petit dictionnaire des concepts info-documentaires : Approche didactique à l’usage des enseignants documentalistes. In : SavoirsCDI [en ligne]. Paris : CNDP, 2007. Disponible sur : http://www.cndp.fr/savoirscdi/chercher/dictionnaire-des- concepts-info-documentaires.html [Consulté le 31/01/2015]

78

FADBEN. Moteur de recherche. In : Wikinotions infodoc [en ligne]. Mis à jour le 04 novembre 2014. Disponible sur : http://fadben.asso.fr/wikinotions/index.php?title=Moteur_de_recherche [Consulté le 20/02/2015]

79

MESGUICH, Véronique, THOMAS, Armelle. Net recherche 2010. Le guide pratique pour mieux trouver l’information utile et surveiller le web. 4ème

31

définition est celle que nous considérons être la plus complète. De plus, elle semble être celle qui prend le mieux en compte les différents éléments qui constituent un moteur de recherche.

Concernant ces éléments, les spécialistes des SIC tel Alexandre Serres et ceux de l’information-documentation telles que la FADBEN et l’ADBS semblent d’accord sur trois d’entre eux, même si parfois les termes diffèrent un peu. Un premier élément important est le robot d’exploration, également appelé spider ou crawler. Il s’occupe de parcourir le Web et de collecter le contenu de milliards de pages web80. Le second élément, l’indexeur81 ou encore le module d’indexation automatique82, s’occupe de construire l’index de la base de données

du moteur de recherche en indexant automatiquement les pages collectées par le robot. Le troisième élément, appelé interface web83 ou module d’interrogation84, est la seule partie accessible aux utilisateurs. Elle permet l’interaction entre le système et l’usager grâce au formulaire de recherche situé sur la page d’accueil du moteur qui sert à interroger l’index du moteur. Les moteurs proposent généralement un formulaire de recherche simple et un formulaire de recherche avancée qui offre la possibilité de complexifier sa requête afin d’affiner les résultats. Cette interface web sert également à présenter les résultats et à les afficher sur l’écran. Le mode de classement de ces résultats est propre à chaque moteur85

. Au lieu de parler de trois éléments, Alexandre Serres et Marie-Laure Malingre préfèrent utiliser l’idée de module, idée que l’on retrouve aussi par deux fois dans la terminologie utilisée par la FADBEN : un module de collecte automatique des données (le robot collecteur), un module d’indexation automatisée des données (le moteur d’indexation) et un module de gestion des requêtes et de présentation des résultats (le moteur de recherche)86. On voit clairement ici que les différentes terminologies employées renvoient aux mêmes éléments constituant un moteur de recherche et qu’aucune différence n’existe sur ce point entre les spécialistes. Pourtant, il est à noter qu’un quatrième élément est mentionné Véronique Mesguich et Armelle Thomas : celui de l’algorithme de pertinence87 qui permet au moteur de

80

FADBEN. Moteur de recherche. Op. cit. et MESGUICH, Véronique, THOMAS, Armelle. Net recherche 2010. Le guide pratique pour mieux trouver l’information utile et surveiller le web. Op. cit. p. 39.

81

MESGUICH, Véronique, THOMAS, Armelle. Net recherche 2010. Le guide pratique pour mieux trouver l’information utile et surveiller le web. Op. cit. p. 39.

82

FADBEN. Moteur de recherche. Op. cit.

83

MESGUICH, Véronique, THOMAS, Armelle. Net recherche 2010. Le guide pratique pour mieux trouver l’information utile et surveiller le web. Op. cit. p. 40.

84

FADBEN. Moteur de recherche. Op. cit.

85

FADBEN. Moteur de recherche. Op. cit. et MESGUICH, Véronique, THOMAS, Armelle. Net recherche 2010. Le guide pratique pour mieux trouver l’information utile et surveiller le web. Op. cit. p. 40.

86

MALINGRE, Marie-Laure, SERRES, Alexandre. Rappel de la définition, du fonctionnement et de la typologie des moteurs de recherche. Op. cit.

87

MESGUICH, Véronique, THOMAS, Armelle. Net recherche 2010. Le guide pratique pour mieux trouver l’information utile et surveiller le web. Op. cit. p. 40.

32

classer les résultats selon un tri informatique complexe. Le fonctionnement de cet algorithme est tenu secret car c’est là que se situe le cœur de la concurrence entre les moteurs.