Évaluation des SRI

Chapitre 2. Fondements de la recherche d’information et spécificités de la

nb ! correctement affectés à !

nb ! qui devraient être affectés à !

nb ! correctements indexés par !

nb ! qui devraient être indexés par !

nb ! correctement rejetés pour !

nb ! qui devraient être rejetés pour !

nb ! correctements non indexés par !

nb ! qui ne devraient pas être indexés par !

nb ! correctement affectés à !

nb total de ! affectés à !

nb ! correctement indexés par !

nb total de ! indexés par !

Consistance inter-indexeurs

nb ! affectés à ! par les indexeurs ! et ! nb ! affectés à ! par les indexeurs ! ou !

nb ! indexés par ! par les indexeurs ! et ! nb D indexés par ! par les indexeurs ! ou !

37 http://www.multimediaeval.org/

38 http://trec.nist.gov/

Chapitre 2. Fondements de la recherche d’information et spécificités de la

2.3. Évaluation des SRI

L’évaluation est un procédé essentiel pour comprendre si un SRI fonctionne ou non

de manière efficace. Un SRI est jugé performant s’il propose des réponses pertinentes à

la requête de recherche de l’utilisateur, tout en étant rapide. Généralement, l’évaluation

d’un SRI se concentre plutôt sur la pertinence des résultats, car un moteur de recherche

rapide n’est d’aucune utilité s’il ne donne pas de bons résultats. Dans les sous-sections

suivantes, nous allons détailler les mesures de performance pour chaque phase d’un

SRI.

2.3.1. Mesures de la qualité de l’indexation

Les résultats de la recherche dépendent en grande partie de la qualité de l’indexation.

Un document ne sera pas retrouvé s’il n’a pas été indexé. Toutefois, plusieurs travaux

effectuent une évaluation globale des systèmes de recherche par rapport à la pertinence

des résultats, ce que ne permet pas une évaluation de la qualité de l’indexation. La

nécessité de mesurer spécifiquement la qualité de l’indexation a été soulevée dans les

travaux de Soergel (1994), Kefi, Berrut et Gaussier (2005). Selon Kefi, Berrut et

Gaussier (2005), la qualité de l’indexation peut être représentée par l’exactitude et la

72

consistance. Ainsi, les mesures de la qualité de l’indexation, en lien avec les points de

vue document ou terme (cf. tableau 2.1.), doivent permettre de répondre aux questions

suivantes :

- les documents sont-ils indexés correctement ?

- les termes d’indexation sont-ils attribués correctement aux documents ?

Exactitude L’exactitude de l’indexation est liée à la présence ou à l’absence de

termes pertinents d’indexation. Ainsi, un document peut être indexé par un terme

incorrect (erreur d’excédent) ou peut ne pas être indexé par un terme pertinent (erreur

d’omission). Dans le tableau 2.1. nous présentons les mesures qui permettent de

caractériser l’exactitude de l’indexation.

Mesures de l’exactitude

Point de vue document D Point de vue terme t

Complétude

Pureté

Justesse

Tableau 2.1. Formules de calcul des mesures de l’exactitude de l’indexation

Complétude La complétude de l’indexation du point de vue document permet de

savoir si tous les documents qui devraient être indexés par le terme ont réellement été

indexés. Du point de vue terme, la complétude répond à la question : « Parmi les termes

qui devraient être affectés au document, combien ont été réellement affectés ? »

Pureté La pureté de l’indexation est liée à l’absence d’erreurs d’excédent et

d’omission. Elle peut aussi être considérée par rapport à un document ou à un terme

d’indexation.

Justesse La justesse de l’indexation permet de savoir, du point de vue

73

point de vue terme, elle détermine combien de documents indexés par le terme sont

corrects.

Consistance Dans l’indexation des documents, il est très important qu’un accord

soit fait entre les indexeurs sur le choix des termes d’indexation. Ainsi, la consistance

de l’indexation permet d’assurer que les documents similaires sont indexés par les

mêmes termes d’indexation indifféremment des annotateurs. Elle peut être mesurée en

comparant les réponses entre deux indexeurs différents (consistance inter-indexeurs), ou

entre deux indexations différentes du même document effectuées par le même indexeur

lors des sessions différentes (consistance intra-indexeur).

Mesure de la consistance

Point de vue document D Point de vue terme t

Tableau 2.2. Formules de calcul des mesures de la consistance de l’indexation

Les mesures de la qualité de l’indexation aident à améliorer le processus

d’indexation, ce qui assure par conséquent la performance de la recherche.

Une synthèse de mesures existantes est présentée par Kefi, Berrut et Gaussier (2005).

2.3.2. Mesures de la qualité de la recherche

Les mesures classiques utilisées pour évaluer la qualité de la recherche sont le rappel

et la précision. Pour mieux comprendre comment sont calculées ces deux mesures, nous

nous appuyons sur le scénario suivant : un système de recherche d’information pour la

requête ville de Nancy a retourné 120 documents. Sur 150 documents qui traitaient

Nancy comme ville, seulement 90 ont été trouvés, mais les 30 autres documents

portaient sur Nancy Sinatra.

Rappel Le rappel est la proportion de documents pertinents trouvés par rapport

74

« Parmi tous les documents pertinents existants combien ont été retrouvés? » Le rappel

R d’un SRI est calculé selon la formule suivante :

! =!"!" ! !"!#$ !" ! !"#$%&"&$'!"#$%&"&$' !"#$%é! (2.5.)

Dans le cas de notre scénario, le rappel est de 60 % (90/150). Toutefois, 40 % de

documents pertinents n’ont pas été retrouvés. Dans ce cas, on parle de silence (1-R).

Précision La précision est la proportion de documents pertinents trouvés par

rapport au nombre total de documents trouvés. Elle permet de répondre à la question

suivante : « Parmi tous les documents retrouvés combien sont pertinents ? » La

précision P d’un SRI est calculée selon la formule suivante :

! =!" ! !"#$%&"&$' !"#$%é!

!" !"!#$ !" ! !"#$%é! (2.6.)

Dans ce cas précis, la précision est de 75 % (90/120). Toutefois, 25 % de documents

! =_!"^!"^!_{!"!#$ !" !}^!"#$%&"&$'_!"#$%&"&$'^!"#$%é^! (2.5.)

! =^!"^!^!"#$%&"&$'^!"#$%é^!

!" !"!#$ !" ! !"#$%é! ^(2.6.)

! = ¹

^(2.7.)