Analyse haut niveau du corpus Cogni-CISMeF

(1)

HAL Id: hal-00925538

https://hal.archives-ouvertes.fr/hal-00925538

Submitted on 8 Jan 2014

HAL is a multi-disciplinary open access

archive for the deposit and dissemination of

sci-entific research documents, whether they are

pub-lished or not. The documents may come from

teaching and research institutions in France or

abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est

destinée au dépôt et à la diffusion de documents

scientifiques de niveau recherche, publiés ou non,

émanant des établissements d’enseignement et de

recherche français ou étrangers, des laboratoires

publics ou privés.

Analyse haut niveau du corpus Cogni-CISMeF

Guillaume Dubuisson Duplessis

To cite this version:

(2)

Analyse haut niveau du corpus Cogni-CISMeF

Synthèse de l’analyse du corpus VD et du corpus AL

Guillaume Dubuisson Duplessis

[email protected]

LITIS, INSA de Rouen

(3)

Table des matières

1 Synthèse des observations du corpus VD 6

1.1 Introduction . . . 6

1.2 Les phases du dialogue . . . 6

1.2.1 Enchaînement des différentes phases . . . 6

1.2.2 La phase de verbalisation . . . 7

1.2.3 La phase de construction de la requête . . . 8

1.2.4 La phase d’évaluation . . . 10

1.2.5 Les phases de réparation . . . 10

1.3 La recherche . . . 10

1.3.1 Description . . . 10

1.3.2 Les aspects . . . 11

1.3.3 Les requêtes et leurs ensembles de résultats . . . 12

1.3.4 Les termes évoqués au cours du dialogue . . . 13

1.4 Les stratégies . . . 17

1.4.1 La stratégie globale . . . 17

1.4.2 La stratégie initiale : la construction de la requête . . . 18

1.4.3 Les stratégies de précisions et généralisation . . . 18

1.4.4 L’alignement verbalisation/terminologie . . . 23

1.4.5 Que se passe-t-il en cas d’événement inattendu ? . . . 24

1.4.6 Comment l’expert propose-t-il des termes ? . . . 24

1.4.7 Résultat des stratégies . . . 25

1.5 Synthèse . . . 26

2 Synthèse des observations du corpus AL 28 2.1 Les phases du dialogue . . . 28

2.1.1 Des phases de clôture plus explicites . . . 28

2.1.2 Des phases de verbalisation plus courtes . . . 28

2.1.3 Des phases d’évaluation menées par l’expert . . . 29

2.1.4 Un entretien présente deux phases de recherches distinctes . . . 30

2.2 Les éléments saillants de la phase de recherche . . . 30

2.2.1 La notion d’"aspect" explicitement présente mais difficile à cerner . . . 30

2.2.2 Le terrain commun est utilisé de manière explicite par les interlocuteurs . . . 32

2.3 Les stratégies initiales et de réparation . . . 34

2.3.1 Des stratégies initiales plus courtes et moins systématiques . . . 34

2.3.2 Les stratégies de précisions et de généralisation . . . 34

2.3.3 Résultats des stratégies . . . 40

2.4 Un expert collaboratif et force de proposition . . . 42

2.4.1 Quels moyens l’expert utilise-t-il pour proposer des termes ? . . . 42

2.4.2 Un expert résolument collaboratif . . . 46

2.5 Limites de ce corpus . . . 47

2.6 Synthèse . . . 48

A Étude du corpus dialogue par dialogue du corpus VD 51 A.1 VD001 . . . 51

A.1.1 Verbalisation de la requête . . . 51

A.1.2 Phases de construction/réparation de la requête . . . 51

(4)

A.1.4 Requête de B. Thirion et requête au 06/10/2011 . . . 53

A.1.5 Évolution de la requête de cet entretien . . . 53

A.1.6 Pourquoi la requête a échoué ? . . . 55

A.1.7 Ce qu’il faut retenir de ce dialogue . . . 55

A.2 VD002 . . . 55

A.2.3 Requête au 07/10/2011 . . . 56

A.2.4 Évolution de la requête . . . 56

A.3 VD003 . . . 58

A.3.4 Ce qu’il faut retenir du dialogue . . . 62

A.4 VD004 . . . 62

A.4.3 Pourquoi la requête n’a pas fonctionné . . . 63

A.4.4 Requête en octobre 2011 . . . 63

A.5 VD005 . . . 66

A.5.2 Phase de construction/réparation de la requête . . . 66

A.5.3 Requête au 11/10/2011 . . . 68

A.6 VD006 . . . 74

A.6.3 Requête au 11/10/2011 . . . 76

A.7 VD007 . . . 78

A.7.3 Requête en 10/2011 . . . 80

A.8 VD008 . . . 82

A.9 VD009 . . . 87

B Étude du corpus dialogue par dialogue du corpus AL 91 B.1 AL01 . . . 91

B.1.1 Verbalisation de la requête . . . 91

B.1.2 Phases de construction/réparation de la requête . . . 91

B.1.3 Requête de B. Thirion et requête au 10/2011 . . . 92

B.1.4 Évolution de la requête de cet entretien . . . 92

B.1.5 Ce qu’il faut retenir de ce dialogue . . . 94

(5)

B.3 AL03 . . . 97

B.3.4 La requête en 2011 . . . 100

B.4 AL04 . . . 100

B.4.4 La requête en 2011 . . . 104

B.5 AL05 . . . 104

B.5.4 La requête en 2011 . . . 108

B.6 AL06 . . . 108

B.6.4 La requête en 2011 . . . 113

B.7 AL07 . . . 114

B.8 AL09 . . . 117

B.9 AL10 . . . 121

B.9.4 Requête en 2011 . . . 126

B.10 AL11 . . . 126

B.10.4 Requête en 2011 . . . 130

B.11 AL12 . . . 130

(6)

Liste des tableaux

1.1 Extrait du dialogue VD02. . . 9

1.2 Aspects dans les recherches des entretiens du corpus VD . . . 11

1.3 Étapes de construction de la requête dans le dialogue VD005. . . 14

1.4 Détails de la stratégie initiale . . . 18

1.5 Nombre de stratégies de précisions et de reformulation associées . . . 22

1.6 Nombre de stratégies de généralisation et de reformulation associées . . . 22

1.7 Termes extraits de la phase de verbalisation par l’expert dans les entretiens. . . 24

1.8 Termes du terrain commun ré-exploités par l’expert. . . 24

1.9 Termes proposés par l’expert grâce à ses connaissances sur le domaine. . . 25

1.10 Tableau récapitulatif des dialogues réalisés du corpus VD. . . 25

1.11 Utilisation de Google dans les entretiens . . . 26

2.1 Aspects dans les recherches des entretiens du corpus AL . . . 31

2.2 Motivations pour préciser la requête par rapport au profil de l’enquêté . . . 36

2.3 Formes des précisions relatives aux aspects de la recherche . . . 37

2.4 Motivations pour préciser la requête par rapport aux aspects de la requête . . . 37

2.5 Reformulations initiées par l’expert ou l’enquêté dans le corpus AL . . . 38

2.6 Motivations pour reformuler une requête quand des ressources sont obtenues dans le corpus AL . . . 38

2.7 Les reformulations dans le corpus AL . . . 39

2.8 Nombre de stratégies de généralisation et de reformulation associées dans le corpus AL . . 39

2.9 Nombre de stratégies de précisions et de reformulation associées dans le corpus AL . . . . 39

2.10 Tableau récapitulatif des dialogues réalisés dans le corpus AL. . . 41

2.11 Alignement direct verbalisation/terminologie dans le corpus AL . . . 42

2.12 Proposition de variation de termes à l’aide de la terminologie dans le corpus AL . . . 43

2.13 Utilisation du mode "adjacence plein texte" dans le corpus AL . . . 43

2.14 Sources des termes constituants une requête dans le corpus AL . . . 45

2.15 Limites du corpus AL . . . 48

A.1 Évolution de la requête de l’entretien VD01 . . . 54

A.6 Étapes de construction de requêtes dans le dialogue VD005. TR : Type de Ressource, T : Thème (Spécialité médicale) . . . 71

A.10 Étapes de construction de requêtes dans le dialogue VD08. . . 86

B.1 Évolution de la requête de l’entretien AL01 . . . 93

(7)

B.8 Évolution de la requête de l’entretien AL09a . . . 120

B.9 Évolution de la requête de l’entretien AL09b . . . 120

(8)

Chapitre 1

Synthèse des observations du corpus

VD

1.1 Introduction

Nous synthétisons maintenant les observations réalisées dans l’analyse dialogue par dialogue du corpus VD. Cette synthèse présente une structure commune sous-jacente des dialogues. Celle-ci est liée à la tâche de construction collaborative de requête entre un expert et un enquêté. Nous rappelons que dans cette tâche, l’enquêté arrive avec un besoin en information dans le domaine du médicale, qui est le domaine des ressources indexées par CISMeF. L’expert a les tâches suivantes :

– Aider l’utilisateur à construire une requête.

– Présenter un ensemble de résultats sous forme de ressources qui vont satisfaire les besoins de l’en-quêté.

– Modifier la requête en collaboration avec l’enquêté pour converger vers des résultats satisfaisants. L’expert met à disposition son expertise du système pour assister l’utilisateur dans sa recherche d’in-formation. Ainsi, l’expert met à portée de l’utilisateur lambda des fonctionnalités avancées du moteur de recherche difficile d’accès. De plus, il aide l’utilisateur à structurer sa recherche pour tendre vers des documents plus adaptés.

1.2 Les phases du dialogue

Le dialogue se découpe en phases qui jouent chacune un rôle dans l’avancement de la tâche. Nous allons présenter cette décomposition d’une manière générale puis nous décrivons plus précisément chacune des étapes.

1.2.1 Enchaînement des différentes phases

Les étapes qu’on peut extraire sont les suivantes :

1. Demande d’information sur l’enquêté (inhérent à l’expérience) ; 2. Verbalisation de la demande de l’enquêté sous forme de :

– Questions – cas le moins fréquent (31, 8%) – (par exemple : “Comment devient-on chauve ?” [VD04 (cf. A.4)]) ;

– Thèmes – cas le plus fréquent (68, 2%) – (par exemple : “moi j’aurais aimé avoir des renseigne-ments sur les dons d’organes” [VD01 (cf. A.1)], “Cancer du colon” [VD06 (cf. A.6)]).

3. Construction de la requête par rapport à une stratégie de l’enquêteur ; 4. Lancement de la requête ;

5. Évalutation des résultats de la requête ;

6. Réparation de la requête (encore par rapport à une stratégie de l’enquêteur) décomposable en ité-rations sur les étapes suivantes :

(a) Modification de la requête précédente ; (b) Lancement de la requête ;

(9)

(c) Évaluation des résultats.

L’enchaînement des phases est représenté par la figure 1.1.

Clôture Verbalisation Construction de _{la requête} Lancement de _{la requête} Présentation des résultats _{et évaluation}

Réparation

Figure_{1.1 – Enchaînement des différentes phases du dialogue}

Les dialogues commencent généralement par une phase d’ouverture (non représentée sur la figure) qui consiste en des salutations. Cette phase est facultative. Nous n’avons pas représenté la phase de demande d’informations sur l’enquêté qui est spécifique à l’expérience.

Le dialogue de recherche commence réellement à la phase de verbalisation qui est toujours présente. Celle-ci est suivie d’une phase de construction de la première requête qui va dépendre de la verbalisation de la demande de l’enquêté. Une fois cette première requête construite, elle est lancée. Il s’ensuit une phase de présentation des ressources trouvées et d’évaluation des résultats. Suite à cette phase d’évaluation, deux possibilités se présentent : (i) les résultats sont complètement satisfaisants ; (ii) les résultats sont partiellement satisfaisants ou non satisfaisants. Dans le premier cas, le dialogue de recherche se termine par une phase de clôture. On peut imaginer que l’enquêté recommence une recherche. Dans ce cas, le dialogue redémarre depuis la phase de verbalisation. Ce cas n’est pas présent dans le corpus. Dans le deuxième cas, l’expert et l’enquêté rentre dans une phase de réparation de la requête qui va dépendre des résultats obtenus (partiellement ou pas satisfaisants). La réparation conduit au lancement de la requête et à une nouvelle évaluation des résultats.

Il est important de noter la présence du cycle : lancement de la requête - présentation et évaluation des résultats - réparation de la requête. Cet élément est le coeur du dialogue de recherche. Tous les dialogues du corpus VD présente au moins une fois la réalisation de ce cycle de réparation.

Dans le corpus actuel, la phase de clôture est atteinte après la phase de présentation et évaluation des résultats soit parce que les résultats obtenus sont satisfaisants, soit parce que la recherche est abandonnée car les interlocuteurs jugent qu’aucun résultat ne pourra être obtenu. Cependant, nous ne pouvons pas exclure le fait que le dialogue puisse se terminer à n’importe quel moment. La figure 1.1 représente donc le déroulement “classique” du dialogue de recherche collaborative.

1.2.2 La phase de verbalisation

La phase de verbalisation permet d’établir le sujet de la recherche entre les interlocuteurs. Nous avons pu constater au cours de l’étude du corpus que ce sujet de la recherche se structure en ce que nous qualifions d’aspects. Nous les présentons plus en détails dans la section 1.3.2.

La phase de verbalisation peut être vue comme la mise en terrain commun et la structuration entre l’expert et l’enquêté d’un espace de négociation. Elle permet d’établir les aspects de la recherche (i.e. les thématiques) et d’autres contraintes comme les types de ressources. La suite de la tâche de construction/-réparation de la requête se base sur cette structuration qui influence les stratégies. Nous présentons cette structuration plus en détail dans la suite du document (cf. section 1.3).

La verbalisation se fait selon 4 schémas. Le plus courant (4 sur les 9 dialogues [VD01 (cf. A.1)], [VD02 (cf. A.2)], [VD06 (cf. A.6)], [VD07 (cf. A.7)]) est :

1. Formulation (enquêté) : “enfin je voudrais parler de leucémie en fait” [VD02]

2. Demande de précisions (Expert) : “alors des choses un petit peu plus précises sur la leucémie” [VD02] 3. Précisions (enquêté) : “les symptômes / qu’est-ce que c’est exactement ? les symptômes” [VD02] Le corpus présente des variantes de ce schéma où la précision est spontanée de la part de l’enquêté ([VD03 (cf. A.3)], [VD08 (cf. A.8)]) :

1. Formulation (enquêté) : “alors ma demande ça concerne le gonflement des membres inférieurs” [VD08] ;

2. Précisions spontanées (enquêté) : “rétention d’eau dans les membres inférieurs” [VD08]. Parfois, la première formulation est suffisante ([VD04 (cf. A.4)], [VD09 (cf. A.9)]) :

(10)

Enfin le dernier schéma possible est ([VD05 (cf. A.5)]) :

1. Formulation (enquêté) : “J’ai fait du sport récemment et j’ai eu un mal de tête et je me suis posé des questions sur mon mal de tête” [VD05]

2. Reformulation (expert) : “pourquoi j’ai eu mal à la tête en faisant du sport” [VD05]

Cette phase permet également à l’expert de cerner le profil de l’utilisateur et notamment ses familiarités avec les moteurs de recherche ou le domaine de la médecine. Par exemple, l’entretien [VD01] présente un enquêté qui est novice dans les deux domaines et qui se laisse complètement guider par l’expert. L’entretien [VD08] présente au contraire un utilisateur familier avec les deux domaines. Celui-ci insiste pour prendre la main dès le début de l’expérience et saisir lui-même la requête sur l’ordinateur. Il est également capable de proposer proactivement des termes médicaux avancés comme “système lymphatique”.

1.2.3 La phase de construction de la requête

Description

Cette phase a pour objectif de construire la première requête. De manière générale, la problématique de cette première phase est de trouver les termes de la terminologie CISMeF adaptés à la verbalisation de l’enquêté. Dans le meilleur des cas, il existe des termes dans la terminologie identiques aux termes de la verbalisation de l’enquêté (par exemple “leucémie” [VD02]). Dans le pire des cas, le terme est absent de la terminologie. L’expert et l’enquêté doivent donc collaborer pour trouver des termes de la terminologie approchant la verbalisation de l’utilisateur. Nous abordons ce point plus précisément dans la suite du document (cf. section 1.4.4).

Néanmoins, cela ne suffit pas pour créer la première requête. D’autres contraintes entrent en jeu : – La première requête créée doit être exécutable (i.e. la requête doit pouvoir être lancée pour obtenir

des résultats, cf. section 1.3.3). Cela est indépendant de l’expert.

– Elle doit couvrir l’ensemble des aspects de la recherche (cf. section 1.3.2). Cela dépend a priori de l’expert.

Nous revenons sur ces éléments plus précisément dans la section 1.4.2 qui décrit ce que nous avons appelé la stratégie initiale.

Dans le corpus VD, cette phase est très guidée par l’expert et stéréotypée (en fait, elle est couplée à l’interface de recherche avancée de CISMeF). Elle se décompose de la manière suivante :

1. Préciser la requête en utilisant l’accès thématique de CISMeF i.e. préciser un thème général (e.g. “Anatomie”, “Biologie”, “cardiologie”, etc.).

2. Préciser le ou les mots-clés (généralement extrait de la question de l’enquêté) phase de verbalisation. 3. Préciser des qualificatifs associés aux mots-clés (e.g. “Épidémiologie” associé au mot-clé “paludisme”). 4. Préciser le type de ressources (e.g. “article de périodique”, “bande dessinée”).

L’idée de cette première construction de requête est de lancer une requête qui recouvre l’ensemble des aspects de la recherche pour déterminer s’il existe des ressources.

Il faut noter que l’expert est particulièrement collaboratif dans cette phase. Bien qu’il présente un schéma stéréotypé, il tolère les utilisateurs qui souhaitent prendre l’initiative pour lancer la requête au plus vite comme par exemple dans l’entretien [VD08] ou les utilisateurs qui souhaitent préciser le mini-mum de choses (généralement juste le mot-clé) comme dans l’entretien [VD06]. De plus, l’expert propose proactivement des explications des éléments de la terminologie avant de montrer à l’utilisateur une liste dans laquelle il peut choisir. Par exemple, dans l’entretien [VD03] :

– “alors accès thématique on va dire que c’est grosso modo l’ensemble des spécialités médicales” – “le qualificatif permet de préciser un tout petit peu ce mot-clé”

– “bon on va lancer comme ça [. . . ] il va aller chercher donc sur internet l’ensemble des sites que cismef a répertorié”

Exemple d’une phase de verbalisation suivie de la construction de la requête

Le tableau 1.1 présente un extrait de dialogue du corpus. Cet exemple met en avant les phases de construction de la première requête : verbalisation (énoncés 1 à 7), propositions de thématiques (énoncés 7 à 10), proposition de l’utilisation du mot-clé “leucémie” par l’enquêteur (énoncés 10 à 13), les propositions de qualificatifs par l’enquêteur et les prises d’initiative successives de l’utilisateur qui demande d’en ajouter de nouveaux (énoncés 13 à 23), la proposition de l’enquêteur d’utiliser le type de ressources “patient” acceptée par l’enquêté (énoncés 23 à 25) et enfin le lancement de la requête.

(11)

Table 1.1: Extrait du dialogue VD02. L’interlocuteur A est l’en-quêteur, B est l’enquêté.

Énoncé Commentaire

(1) A : [...] voilà alors quelle est votre question ? Verbalisation de la demande

(2) B : je voudrais connaître (3) A : prenez votre temps / oui

(4) B : enfin je voulais parler de la leucémie en fait

(5) A : vous voudriez parler de la leucémie / “ donc je voudrais parler de la leu-cémie” que je tape / alors des choses un petit peu plus précises sur la leucémie ou

(6) B : les symptômes / qu’est-ce que c’est exactement ? les symptômes

(7) A : donc ce que c’est exactement les symptômes / ok / donc on y va aller / alors accès thématique on va dire que c’est grosso modo l’ensemble des spécialités médicales / est-ce que vous voyez des choses / vous voyez assez / est-ce que vous voyez des choses dans lesquelles vous auriez envie de classer votre demande sur la leucémie / je fais défiler donc

Proposition de thèmes

(8) B : le menu déroulant

(9) A : le menu déroulant / en fait j’explique au micro ce que je suis en train de faire pour que / voilà / vous me dites / vous m’arrêtez / si vous ne trouviez rien c’est pas grave on mettra rien / peut-être que

(10) B : jusque là j’ai pas vu

(11) A : D’accord / ok je continue à faire dérouler / y’a rien / donc nous ne mettons rien en accès thématique /

en mot clé bah écoutez je vous propose de mettre leucémie Proposition de mot clé

(12) B : leucémie

(13) A : leucémie / D’ailleurs il me le propose / on va le mettre directement et le qualificatif permet de préciser un tout petit peu ce mot clé / donc par rapport à votre question / c’est de la même façon je vais faire dérouler le menu et vous allez me dire si vous voyez des choses

Proposition de quali-ficatifs

(14) B : chimiothérapie

(15) A : alors chimiothérapie ok / alors vous souhaitez mettre d’autres qualificatifs (16) B : oui

(17) A : D’autres précisions / alors on va aller chercher / accès thématique / non c’est pas accès thématique c’est qualificatif / voilà donc je mets en fait / j’inscris qualificatif et là donc, ah je n’ai plus le menu déroulant / bah écou-tez on va aller le faire dérouler ici et c’est pareil là je vais faire continuer à se dérouler on remettra chimiothérapie éventuellement et pour l’instant (18) B : diagnostic

(19) A : diagnostic ok / donc je vais aller l’écrire diagnostic / ok je continue à faire dérouler le menu de qualificatifs

(20) B : effets indésirables

(21) A : effets indésirables / ok / alors effets indésirables / donc je continue à faire dérouler les types de ressources / donc alors le menu déroulant

(22) B : sang

(23) A : allons-y / sang et de toute façon là je pense que ça va être à peu près tout / donc on va remettre chimiothérapie comme vous vouliez au départ dans qualificatif / chimiothérapie / ok / voilà /

alors souhaitez-vous qu’on aille regarder dans un type de ressource parti-culière relative aux associations / base de données / bibliothèque médicale / etc / ou quelque chose qui soit spécifique pour les patients

Suggestion d’ajouter le type de ressources “patient”

(24) B : ouais

(25) A : oui / alors je mets type de ressource : patient / .. .

(12)

.. .

bon on va le lancer comme ça / donc ce qu’on va / il va aller chercher donc sur internet l’ensemble des sites que cismef a répertorié

Lancement de la re-quête

(26) B : D’accord

1.2.4 La phase d’évaluation

La phase de présentation et d’évaluation des résultats est l’une des plus importantes du dialogue de recherche. C’est dans cette phase que l’enquêté et l’expert jugent de la qualité des ressources obtenues. De manière générale, l’expert laisse l’enquêté juger de l’adéquation des ressources obtenues par rapport à ses attentes : “vous allez me dire si ça vous convient ou pas et pourquoi ” [VD02], “Est-ce que le document no

x vous intéresse ?” [VD03]. Les résultats obtenus peuvent être : – satisfaisant ;

– partiellement satisfaisant : pas adapté au profil de l’utilisateur (ressources pour médecin) ou n’abor-dant pas l’ensemble des aspects de la requête ;

– pas satisfaisant : document hors sujet ou déjà obtenu par une précédente requête.

Dans certains cas particuliers, l’expert est capable d’évaluer seul les résultats de la requête :

– trop de documents : un grand nombre de ressources est obtenu (e.g., 50 ressources avec la requête no_{2 de [VD02] ou 197 ressources avec la requête n}o_{6 de [VD05]).}

– pas assez de document : quand aucune ressource n’est retournée.

– les résultats obtenus ont déjà été présentés et ne convenaient pas à l’enquêté.

– les résultats sont manifestement hors sujet : dans l’entretien [VD03] l’expert est capable de juger les résultats retournés (au nombre de 2) en disant qu’ils ne remplissent pas les attentes de l’utilisateur car les ressources parlent de maladies rares et non de calvitie.

– les résultats ne recouvrent qu’un aspect de la recherche : dans l’entretien [VD05], lors de l’évaluation de la requête qui retourne 197 résultats (cf. A.5.2), l’expert est comme dans les autres dialogues capable de dire qu’il y a trop de ressources (197) mais l’expert réalise un jugement sur la qualité des documents (avantages du sport plutôt qu’inconvénient) et en tire des leçons pour la suite (à savoir, ajouter la spécialité “médecine du sport” et le mot-clé “migraine”).

– les résultats sont en inadéquation avec le profil de l’enquêté : dans l’entretien [VD07], l’expert est éga-lement capable de suggérer qu’un document ne convient pas en se basant sur le profil de l’utilisateur dans les cas suivants :

– les documents sont pour des spécialistes ;

– les documents parlent de personnes âgées alors que l’enquêté n’en est pas une.

On peut souligner le fait que les deux premiers critères sont plutôt facile à déterminer puisqu’il suffit de compter le nombre de ressources obtenues. Le troisième critère est une mémoire sur les documents obtenus précédemment au cours de la recherche. Les trois derniers critères font par contre intervenir un raisonnement plus poussé de l’expert en fonction du domaine et du profil de l’enquêté.

Enfin, il faut noter que le critère “trop de documents” n’est souvent pas le critère déterminant pour lancer une réparation. En effet, il est tout à fait possible d’obtenir de nombreuses ressources tout en ayant des documents qui répondent aux besoins de l’enquêté. Quand il y a de nombreux résultats, les interlocuteurs commencent par balayer les ressources pour voir si elles pourraient convenir ou pas. Dans le cas où elles ne conviennent pas, ils lancent une réparation. C’est le cas notamment dans l’entretien [VD05] où le premier constat est qu’un nombre important de ressources est obtenu mais que c’est le critère “les résultats ne recouvrent qu’un aspect de la recherche” qui motive la réparation.

1.2.5 Les phases de réparation

Enfin, les phases de réparation de la requête montrent que l’expert met en place un ensemble de stratégies permettant de modifier la requête pour converger vers des ressources convenant à l’enquêté. Nous les étudions plus en détail dans la section 1.4.

1.3 La recherche

1.3.1 Description

La séquence de recherche peut être vue comme un objet co-construit entre les interlocuteurs. Elle est composée d’un certain nombre d’éléments que nous allons essayer de préciser suite à ce que nous avons

(13)

observé dans le corpus. Les interlocuteurs se basent sur ces éléments pour faire de nouvelles propositions, suggestions, pour étendre ou préciser la requête. La séquence de recherche est donc une représentation d’une partie du terrain commun qui existe entre l’expert et l’enquêté.

Dans le corpus, nous avons extrait des caractéristiques importantes de cet objet. Nous ne pouvons néanmoins pas prétendre être exhaustif compte-tenu de la taille réduite du corpus VD (9 entretiens). Nous avons déjà parlé de ce que nous nommons les aspects qui font partie des caractéristiques d’une séquence de recherche. Les requêtes lancées et les ensembles de résultats associés en font également partie. En effet, les interlocuteurs ne relancent jamais deux fois la même requête. Enfin, les interlocuteurs produisent pendant le dialogue une sélection de termes candidats qui peuvent expliquer les réparations des requêtes.

Nous allons maintenant présenter chacun de ces éléments.

1.3.2 Les aspects

Les aspects sont établis pendant la phase de verbalisation. Ils représentent les points importants de la recherche. On peut les voir comme les thèmes abordés dans la verbalisation de l’enquêté. Le tableau 1.2 présente les aspects que nous avons considéré pour les 9 entretiens.

Table _{1.2: Aspects dans les recherches des entretiens du corpus} VD

no _{Verbalisation} _Aspects

01 “les démarches à accomplir si on_{veut être donneur d’organes”} 1. démarches à accomplir 2. donneur d’organes 02

“enfin je voudrais parler de leucémie en fait” “les symptômes

/ qu’est-ce que c’est exactement ? les symptômes”

1. leucémie 2. symptômes 03

“qu’est-ce qu’on sait sur l’évolution des traitements

actuels sur la migraine”

1. évolution

2. traitements actuels 3. migraine

04 “Comment devient-on chauve ?” 1. calvitie 05 “pourquoi j’ai eu mal à la tête_{en faisant du sport”} 1. mal de tête

2. sport 06a “quand doit-on s’inquiéter du_{cancer du colon”}

1. cancer 2. colon 3. diagnostic 06b “quels sont les tests disponibles”

1. cancer 2. colon

3. tests disponibles 07 “donc sur le taux de créatinine /_{quand est-il normal ou pas ?”} 1. taux de créatinine

2. normalité 08 “rétention d’eau dans les_{membres inférieurs”} 1. rétention d’eau

2. membres inférieurs 09

“donc c’était sur les préventions du glaucome alors qu’est-ce qu’il

y a ? comment on détecte ?”

1. prévention 2. glaucome 3. diagnostic

Cependant, nous devons énoncer un certain nombre de critiques aux aspects tels que présentés dans le tableau 1.2. Ce que nous avons abordé dans le tableau sont les thèmes présents dans la verbalisation de l’enquêté. La présentation sous forme de liste laisse présager une combinaison de type “et”. Par exemple, pour l’entretien no_{2, on peut raisonnablement déduire que les aspects de la recherche sont la “leucémie”}

et les “symptômes”. Néanmoins, on ressent bien instinctivement que c’est une vision simpliste des choses. Ainsi, pour l’entretien no_{5, la représentation de ““pourquoi j’ai eu mal à la tête en faisant du sport” sous}

la forme d’une conjonction entre “mal de tête” et “sport” est une approximation. La verbalisation fait apparaître un lien de concomitance entre le “mal de tête” et “sport”. La véritable question de l’enquêté est en fait sur l’existence ou non d’un lien de causalité entre son “mal de tête” et le “sport”. Ainsi, la sémantique pour représenter les aspects de la requête semble bien plus complexe qu’il n’y paraît. Les

(14)

aborder sous forme de thèmes comme dans le tableau 1.2 est une première tentative.

Ensuite, on peut aussi critiquer le fait que la détermination de ces thèmes n’est ni unique ni évidente. Ainsi, le passage dans l’entretien no_{6a de “quand doit-on s’inquiéter” à “diagnostic” n’est pas évident et}

semble très lié au domaine (voir à l’application CISMeF).

Les aspects ne semblent pas avoir tous le même poids. Ainsi, on peut classer les aspects en majeur et mineur. L’entretien no_{8 met en avant le fait que l’aspect “rétention d’eau” est plus important que}

“membres inférieurs”. En effet, les interlocuteurs n’hésitent pas à faire une requête qui couvre l’aspect “rétention d’eau” sans couvrir l’aspect “membres inférieurs”.

Pour finir, on peut envisager les aspects comme une catégorisation des termes qui vont apparaître dans la requête.

Néanmoins, les aspects de la recherche ont une réalité. Ainsi, le corpus fait apparaître de nombreux passages où, soit l’expert, soit l’enquêté, fait remarquer que la requête construite ne prend pas en compte un aspect de la recherche :

– Dans [VD05] :

– Expert : “par contre je pense quand même que si on met uniquement circulation cérébrale et base de données / on va être à peine éloigné de votre question”

– Expert : “donc je vous propose de mettre éventuellement un autre mot clé si on y arrive ou quelque chose qui serait quelque chose en rapport avec le sport”

– Dans [VD06] : “ah oui mais y’a rien sur le cancer du colon là-dedans” (enquêté)

1.3.3 Les requêtes et leurs ensembles de résultats

Les dialogues du corpus montre la création de nombreuses requêtes qui sont associées à l’ensemble de résultats qu’elles génèrent. On peut observer deux types de propriétés pour les requêtes : les propriétés indépendantes de la recherche (mais dépendante du moteur de recherche) et les propriétés dépendantes de la recherche.

Requête et notation

Une requête dans CISMeF est constituée d’éléments (simples ou composés). Un élément simple est un couple terme (ou une expression), champ d’indexation de la ressource. Les champs peuvent être spécifiques aux terminologies adoptées (comme concept MeSH, descripteur MeSH, qualificatif MeSH, MeSH concept supplémentaire, métaterme CISMeF, stratégie de recherches CISMeF, type de ressources CISMeF) ou dépendant des documents (auteur, date, titre, pays, etc.).

Les champs spécifiques aux terminologies peuvent être complétés par une affiliation (que nous appelons éléments composés), c’est-à-dire un élément dont le champ d’indexation est qualificatif.

Nous notons un élément sous la forme d’un couple :

(terme ou expression, champ d’indexation) Nous notons une affiliation sous la forme d’un couple d’éléments :

[(terme ou expression, champ d’indexation) , (terme ou expression, qualificatif )]

Une requête est une combinaison d’éléments selon des opérateurs booléens (and, or, not). Par exemple,

(don du sang, descripteur MeSH) (1.1)

est une requête, tout comme :

(don du sang, descripteur MeSH) AND

(Information patient et grand public, Type de ressources CISMeF)

(1.2)

Propriétés des requêtes

Les propriétés indépendantes de la recherche sont :

vide : une requête est vide si elle ne contient aucun élément. C’est l’état de la requête avant la phase de construction de la requête.

(15)

minimale : une requête est minimale si elle est constituée d’un nombre minimum d’éléments lui per-mettant d’être exécutable. La requête (1.1) est minimale.

composée : une requête est composée si elle n’est ni vide, ni minimale et qu’elle est exécutable. La requête (1.2) est composée.

exécutable : une requête est exécutable si elle peut être lancée sur le moteur de recherche. Les re-quêtes (1.1) et (1.2) sont exécutables.

Les propriétés vide, minimale et composée sont mutuellement exclusives. Une requête vide n’est pas exécutable contrairement aux requêtes minimale et composée.

Les propriétés dépendantes de la recherche sont liées aux aspects. Ainsi une requête peut être : complète : elle recouvre tous les aspects de la recherche (i.e., elle a un élément pour chaque aspect qui

peut être considéré comme traitant de cet aspect)

incomplète : elle ne recouvre pas tous les aspects de la recherche. Résultats d’une requête

Chaque requête est associée à l’ensemble de résultats qu’elle génère. Comme nous l’avons déjà vu en section 1.2.4, les résultats peuvent être qualifiés de satisfaisants, partiellement satisfaisants et insatis-faisants. Nous avons pu constater dans le corpus (e.g., [VD06], [VD07]) que les interlocuteurs repèrent immédiatement les ressources déjà obtenues et prises en considération (i.e. qualifiées de satisfaisantes/par-tiellement satisfaisantes/insatisfaisantes). Par conséquent, les ressources résultantes d’une requête peuvent chacune être qualifiées :

Satisfaisante : la ressource répond aux besoins de l’enquêté.

Partiellement satisfaisante : la ressource aborde les besoins ou une partie des besoins de l’enquêté. Insatisfaisante : la ressource est hors sujet.

Et également de :

Vue : la ressource a déjà été vue et qualifiée de satisfaisante/partiellement satisfaisante/insatisfaisante. Pas vue : la ressource n’a pas été qualifiée.

1.3.4 Les termes évoqués au cours du dialogue

Les termes dans le terrain commun

Les entretiens présentent des étapes de co-construction de requêtes entre l’expert et l’enquêté. Ces étapes consistent en la proposition d’opérations sur la requête comme l’ajout de termes, la suppression de termes de la requête, le lancement de la requête, le remplacement de termes, la présentation de listes de termes (spécialités médicales, qualificatifs, types de ressources) ou de résultats. Un des éléments importants pour construire la requête est le terme (ou élément) à y ajouter. Ces éléments sont ajoutés en collaboration entre l’expert et l’enquêté. Nous pouvons constater deux choses sur les éléments qui vont être ajoutés :

1. Les interlocuteurs vont essayer de mettre des éléments en rapport avec les aspects de la recherche. 2. Les interlocuteurs vont essayer de mettre des éléments en rapport avec les résultats voulus par

l’enquêté comme les types de ressources.

Les interlocuteurs vont donc se proposer mutuellement des éléments, et plus particulièrement des termes, qui peuvent être ajoutés à la requête. L’observation qu’on peut faire est que l’expert va essayer de canaliser ces propositions pour construire les requêtes les plus simples possibles tout en couvrant les aspects et les attentes de l’enquêté. Ainsi, un terme proposé n’est pas automatiquement ajouté à la requête. De plus, on observe que des termes énoncés en début de dialogue peuvent revenir dans une requête à la fin du dialogue. Ces termes font donc partie du terrain commun des interlocuteurs.

Le terrain commun possède donc une structure pour stocker les termes énoncés qui peuvent faire potentiellement partie de la requête. Mais ce terrain commun ne se contente pas de stocker des termes potentiels. Par exemple, les enquêtés jugent les spécialités médicales proposées sous forme de liste dans les entretiens [VD03] et [VD04] selon 4 critères :

– la spécialité médicale ne convient pas ; – la spécialité médicale peut peut-être convenir ; – la spécialité médicale convient ;

(16)

Le terrain commun des interlocuteurs est donc constitué de ces différents éléments car l’expert ne re-propose jamais une spécialité médicale explicitement rejetée par l’enquêté alors qu’il peut re-re-proposer une spécialité médicale jugée potentiellement adéquate par l’enquêté.

L’utilité du terrain commun est de permettre de stocker les éléments intéressants et les éléments potentiellement intéressants qui peuvent constituer une requête. Cela permet de proposer plus efficacement des requêtes alternatives pour explorer l’espace des résultats possibles.

De plus, stocker les éléments explicitement évincés par l’enquêté permet à l’expert de ne pas proposer des éléments inadéquats à la recherche.

La structure exacte du terrain commun est laissée à un travail futur plus approfondi. Nous présentons maintenant un exemple des éléments qui entrent en considération lors de la construction de la requête. Exemple avec l’entretien VD05

Nous allons prendre l’exemple de l’entretien [VD05] qui présente la co-construction d’une requête complexe constituée d’une étape de construction suivie de 8 réparations.

La phase de construction de la première requête met en avant le fait que les interlocuteurs cernent des aspects de la recherche. Dans ce cas, les aspects de la recherche sont le “mal à la tête” et le “sport” avec un lien de concomitance (ou de conséquence : sport puis mal à la tête). Ils vont ensuite essayer de construire une requête qui va adresser ces deux aspects. En effet, à la fin des phases classiques de construction de la requête (spécialité médicale/mot-clé/qualificatif/type de ressources), l’expert propose de préciser un nouveau mot-clé pour couvrir les deux aspects de la demande de l’utilisateur.

Dans le cas présent, la construction de la requête est rendue difficile par l’absence des mots-clés “mal de tête” et “sport” dans la terminologie CISMeF. C’est cela qui pousse l’expert et l’enquêté à trouver d’autres mots-clés.

Cette requête présente 3 remplacements de mots-clés. Nous pouvons raffiner ce constat. En effet, la réparation collaborative de la requête prend en compte les mots-clés précédemment proposés par rap-port aux aspects de la demande de l’utilisateur. Ainsi, dans la première réparation de la requête, on assiste à un remplacement de mot-clé : “sport” (absent de la terminologie) par “effort”. De manière plus générale, le dialogue permet à l’expert et à l’enquêté de se communiquer des termes qui entre dans un aspect de la recherche et qui pourrait constituer la requête. Ces termes font partie du terrain commun et sont réutilisés au moment des réparations de la requête. On peut représenter les différentes étapes de construction/réparation de la requête par le tableau 1.3.

Table _{1.3: Étapes de construction de requêtes dans le dialogue} VD005. TR : Type de Ressource, T : Thème (Spécialité médicale). S (pour Système) signifie proposé par l’expert, U (Utilisateur) signifie proposé par l’enquêté.

Phases|Aspects “mal de tête” “sport” Indifférent

Construction de la requête

1. mal de tête (U) (ab-sent de la terminolo-gie) 2. circulation cérébrale (S) 3. circulation sanguine (U) 1. sport (U) 2. activité physique (U) 3. effort (U) Base de données (U) (TR)

Requête (0) “Circulation cérébrale”_(mot-clé) “sport” (mot-clé) _{données (TR)}Base de

Réparation (re-formulation)

1. mal de tête (absent de la terminologie) 2. circulation cérébrale 3. circulation sanguine 1. sport (absent de la terminologie) 2. activité physique 3. effort Base de données (TR)

Requête (0) “Circulation cérébrale”_(mot-clé) “effort” (mot-clé) _{données (TR)}Base de ..

(17)

.. .

Réparation (re-formulation)

Requête (0) “Circulation sanguine”_(mot-clé) “effort” (mot-clé) _{données (TR)}Base de

Réparation (Gé-néralisation)

Requête (0) “Circulation sanguine”_(mot-clé) “effort” (mot-clé)

Réparation (Re-formulation)

1. Migraine (S) 2. mal de tête (absent

de la terminologie) 3. circulation cérébrale 4. circulation sanguine 1. sport (absent de la terminologie) 2. activité physique 3. effort Base de données (TR)

Requête (0) “Migraine” (mot-clé) “effort” (mot-clé)

1. Migraine

Requête (197) “effort” (mot-clé) +_{“sport” (mot-clé)}

Réparation (Précision)

1. Migraine

2. mal de tête (absent de la terminologie) 3. circulation cérébrale 4. circulation sanguine 1. Médecine du sport (U remarque / S propose d’ajouter) (T) 2. sport (absent de la terminologie) 3. activité physique 4. effort Base de données (TR)

Requête (0) “Migraine” (mot-clé)

“effort” (mot-clé) + “sport” (mot-clé) + “Médecine du sport” (Thème) .. .

(18)

.. .

Réparation (Gé-néralisation)

1. Migraine

2. mal de tête (absent de la terminologie) 3. circulation cérébrale 4. circulation sanguine 1. Médecine du sport (T) 2. sport (absent de la terminologie) 3. activité physique 4. effort 5. activité physique Base de données (TR)

Requête (0) “Migraine” (mot-clé) “Médecine du sport”_(Thème)

1. Douleur (S) 2. Tête (S) 3. Migraine

4. mal de tête (absent de la terminologie) 5. circulation cérébrale 6. circulation sanguine 1. Médecine du sport (T) 2. sport (absent de la terminologie) 3. activité physique 4. effort Base de données (TR)

Requête (54) “Douleur” (mot-clé) +_{“Tête” (mot-clé)} “Médecine du sport”_(Thème)

Ce tableau présente les éléments de la terminologie (ou que les interlocuteurs pensent être de la terminologie) discutés entre les interlocuteurs pendant le processus de construction de la requête. Les éléments sont regroupés en colonne par l’aspect de la recherche auquel ils sont liés (ici, soit “mal de tête”, soit “sport” ou aucun des deux). La colonne la plus à gauche présente l’étape du dialogue ainsi que le requête lancée à la fin de cette étape associée à son nombre de résultats. Quand les termes n’ont aucune précision, il s’agit de mots-clés. Sinon, leur type est précisé : type de ressources (TR) ou thème/spécialité médicale (T).

Pour la phase de construction de requête, on constate que les éléments de la terminologie en discussion qui ont été sélectionnés sont : “mal de tête” qui a été détecté par l’expert comme absent de la terminologie. Le terme est alors barré dans le tableau, signifiant qu’il a été discuté mais qu’il n’est pas retenu pour la requête. Les interlocuteurs se sont donc dirigés vers les termes “circulation cérébrale” et “circulation san-guine”. Les éléments sont ordonnés au moins partiellement suivant l’ordre d’énonciation ou sa prégnance par rapport à la recherche. De même, les mots-clés qui ont été discuté pour l’aspect “sport” de la recherche sont regroupés dans la colonne et ordonnés (par l’ordre d’énonciation de l’enquêté dans ce cas).

La requête est alors construite en fonction des éléments listés dans chaque aspect par rapport à leur ordre de priorité.

On peut constater néanmoins que le terme “activité physique” n’est jamais considéré (ni explicitement évincé ni utilisé dans une requête lors du dialogue). De plus, certains termes évincés sont réhabilités durant la requête comme le terme “sport” et ceux malgré le fait qu’ils n’appartiennent pas à la terminologie CISMeF.

Ce tableau permet de représenter les éléments qui sont en discussion ou ont été discutés et comment ils influencent la requête.

Après la phase de construction de la requête, une première requête est créée. La chose importante à remarquer est qu’elle ne contient pas tous les termes qui sont entrés en considération. Ces termes ont été proposés soit l’expert (“S”) soit par l’enquêté (“U”).

Cette première requête est lancée et ne retourne aucun résultat. Les interlocuteurs entrent alors dans une stratégie de reformulation (que nous précisons en section 1.4.3). Cette reformulation (impulsée par l’expert) se base sur les termes précédemment énoncés. À savoir, “sport” absent de la terminologie va être remplacé par “effort”. Cette seconde requête est alors lancée et ne retourne aucun résultat. Une stratégie de reformulation est de nouveau exécutée sauf que cette fois c’est le terme “circulation cérébrale” qui va être remplacé par “circulation sanguine” (énoncé dans la phase de construction de la requête). Nous pouvons préciser que cette reformulation est effectuée sous l’impulsion de l’enquêté et non de l’expert. La

(19)

nouvelle requête est alors lancée et n’obtient toujours pas de résultat. L’expert propose alors de généraliser la requête en supprimant le type de ressource. La nouvelle requête obtenue recouvre minimalement les aspects de la requête. Celle-ci ne fournit pas de résultat. L’expert propose de reformuler la requête en proposant le nouveau terme “migraine” pour l’aspect “mal de tête”. Ce terme est inséré dans la requête à la place de “circulation sanguine”. La nouvelle requête ainsi créée ne retourne toujours pas de résultat. L’expert propose alors une solution plus radicale : ne plus considérer que l’aspect “sport” de la recherche. Il propose de réhabiliter le terme “sport” qui avait été évincé en début de requête, et ce malgré le fait que ce terme n’apparaisse pas dans la terminologie CISMeF. 197 résultats sont obtenus. Les interlocuteurs entrent dans une stratégie de précision (que nous abordons en section 1.4.3). L’expert propose de réhabiliter le terme “migraine” pour l’aspect “mal de tête”. L’enquêté remarque que les 197 ressources obtenues sont plus du domaine du “conseil du sport” que de la “médecine du sport”. L’expert propose donc d’ajouter la spécialité médicale “médecine du sport” à la requête. La nouvelle requête obtenue est lancée et ne retourne pas de résultat. L’expert propose une stratégie de généralisation et propose d’évincer les termes “sport” et “effort” pour ne laisser que “migraine” et “médecine du sport”. La requête est lancée et ne retourne aucun résultat. L’expert propose alors de reformuler la requête sur l’aspect “mal à la tête”. Cependant, tous les termes précédemment évoqués ont été évincés. Plusieurs choix sont alors possibles à ce stade :

– abandonner la recherche ;

– réhabiliter “circulation cérébrale” ou “circulation sanguine” ; – proposer de nouveaux éléments.

L’expert choisit de proposer une reformulation pour “migraine” en “douleur” et “tête”. La requête est alors lancée. 54 ressources sont obtenues et ne sont pas satisfaisantes. La recherche est alors abandonnée.

Cet entretien est un excellent exemple permettant de découpler les propositions de termes, d’opérations sur la requête, de stratégies de réparation de requête tout en démontrant l’importance du terrain commun. Nous pouvons également voir que l’expert propose des nouveaux termes. Nous analysons en section 1.4.6 les sources de propositions de termes de l’expert. Cet entretien est rendu ardu par l’absence des termes “mal de tête” et “sport” dans la terminologie CISMeF. Nous analysons plus précisément les problèmes d’alignement entre la verbalisation et la terminologie en section 1.4.4. Enfin, l’absence de termes dans la terminologie a clairement un impact sur le succès ou l’échec de la recherche. Nous synthétisons cela en 1.4.7.

1.4 Les stratégies

Nous présentons maintenant les stratégies mises en place par l’expert. Nous les divisons en fonction de leur phase d’apparition. Nous appelons stratégie initiale une stratégie qui apparaît dans la phase de construction de la requête. Nous appelons stratégie de réparation (ou plus sobrement stratégie) une stratégie qui apparaît dans la phase de réparation.

1.4.1 La stratégie globale

La stratégie globale de l’expert consiste en une stratégie initiale suivie par une série de stratégies de réparation de la requête pour obtenir des documents.

Le corpus [VD09] met explicitement en avant ce phénomène. L’expert annonce à l’enquêté sa stratégie globale dès le début du dialogue en lui proposant explicitement de :

1. de réaliser sa stratégie initiale, i.e. remplir les champs ; 2. improvisation ensuite.

L’expert énonce : “alors donc on a plusieurs champs et puis ce que je vous propose dans un premier temps puis après on va voir c’est de vous / que je vous fasse dérouler puis vous me disiez si y’en a qui vous semblent parlants on peut ne rien mettre” [VD09] Cette introduction à la tâche peut se décomposer en partie :

1. Explication de l’outil et de la terminologie : “alors donc on a plusieurs champs” 2. Proposition de la stratégie en deux temps :

(a) Stratégie initiale : “ce que je vous propose dans un premier temps [...] c’est de vous / que je vous fasse dérouler puis vous me disiez si y’en a qui vous semblent parlants”

(b) Après la stratégie initiale : “puis après on va voir”

3. Précisions au sujet de la stratégie initiale : “on peut ne rien mettre” Cet exemple met en avant plusieurs caractéristiques importantes :

(20)

1. La recherche de documents est une activité opportuniste qui n’est pas complètement planifiable à l’avance.

2. Cette caractéristique s’illustre par la stratégie globale de l’expert : stratégie initiale puis succession de stratégies de réparation de la requête.

3. L’expert est coopératif et collaboratif dans le sens où il explique à l’enquêté les étapes de l’activité de recherche qu’il propose de mener collaborativement.

1.4.2 La stratégie initiale : la construction de la requête

Description

La stratégie initiale est celle qui intervient quand la requête est vide. C’est le cas particulier du début de la recherche (ou d’une nouvelle recherche) dont nous avons déjà parlé en section 1.2.3. L’expert guide l’utilisateur dans la construction de sa première requête en proposant d’ajouter des termes (sous une certaine forme) avec des recommandations sur leur nombre. Le tableau 1.4 présente la catégorie des termes proposés, la cardinalité préférée (#) par l’expert de termes de la catégorie qui doit apparaître dans la première requête et enfin la forme de proposition.

Catégorie # Forme de proposition Spécialité médicale 0 ou 1 Liste

Mot-clé n Proposition spontanée ou interrogation de l’utilisateur

Qualificatif 0 ou n Liste Type de ressources 0 ou 1 Liste

Table 1.4 – Détails de la stratégie initiale

Ce tableau met en avant le fait que l’expert propose les spécialité médicale, qualificatif et type de ressources sous la forme d’une liste dans laquelle l’enquêté peut choisir des termes. Dans un seul cas, l’expert est capable de proposer spontanément la spécialité médicale à ajouter ([VD09]). L’expert limite généralement le nombre de spécialité médicale et de type de ressources à 1 et n’impose pas leur présence. L’expert ne limite pas vraiment le nombre de qualificatifs. Néanmoins, on observe dans le corpus qu’il ne dépasse jamais 4 dans la même requête (cf. [VD02]).

Les mots-clés sont vus comme l’élément le plus important de la requête et sont ce qui la rend exé-cutable1_{. L’expert exige d’avoir au moins un mot-clé par requête. Généralement, le mot-clé est proposé}

directement par l’expert ([VD01], [VD02], [VD03], [VD04], [VD07], [VD09]). Nous abordons plus précisé-ment comprécisé-ment l’expert est capable de proposer des termes à l’enquêté en section 1.4.6. Dans les autres cas, l’expert demande à l’enquêté quel mot-clé il souhaiterait ajouter.

Cette stratégie se retrouve dans l’ensemble du corpus. Dans la grande majorité des cas (7 cas sur 9), cette phase est réalisée dans son intégralité puis la requête est lancée. Dans les deux autres cas, la stratégie est appliquée partiellement ([VD04]) ou interrompue à l’initiative de l’utilisateur ([VD08]).

Contrainte de lancement

Deux entretiens ([VD05], [VD06]) révèlent une contrainte de lancement de la première requête qui est implicite dans les autres. La contrainte est que la première requête doit aborder l’ensemble des aspects de la demande de l’enquêté. C’est-à-dire qu’il doit y avoir un élément de la requête qui doit pouvoir être associé à un aspect. Dans le cas où la requête ne recouvre pas tous les aspects, soit l’expert le fait remarquer et entame une procédure pour compléter la requête ([VD05]), soit l’enquêté le fait remarquer ([VD06]).

1.4.3 Les stratégies de précisions et généralisation

Enchaînements des différentes stratégies

Une fois la première requête lancée, les interlocuteurs vont évaluer les résultats. Nous avons pu ob-server dans le corpus les stratégies mises en place par les interlocuteurs pour trouver des ressources qui

1. Cela n’est pas parfaitement exact car des modes de recherche spécifiques à CISMeF comme le mode “adjacence plein texte” rendent la requête exécutable sans avoir besoin de mot-clé.

(21)

correspondent. L’élément central est la phase d’évaluation qui va conduire à choisir entre trois types de stratégies : la précision, la généralisation et la reformulation. La figure 1.2 représente l’enchaînement des différents types de stratégies en fonction des résultats de la requête (nombre de résultat et satisfaction, cf. 1.3.3).

Évaluation Première requête

Lancement de la requête

Résultat ?

Clôture Préciser Reformuler Généraliser

Généralisable ? Oui Non 0 résultat Satisfaction ? Résultat(s)

Satisfaisant(s) Partiellement satisfaisant(s) Non satisfaisant(s)

Figure_{1.2 – Enchaînements des différentes stratégies}

Les phases du dialogue sont représentées sur la figure par des rectangles, les décisions par des losanges et les stratégies choisies par des ellipses. Le premier critère sur lequel se base le choix de la stratégie est le nombre de résultats obtenus après le lancement de la requête. Si le nombre de résultat est nul, la stratégie à choisir dépend de la requête. Si elle est généralisable, alors la famille de stratégies choisie est la généralisation sinon la reformulation. Nous allons tacher de répondre aux questions suivantes dans la suite du document :

– Quelles sont les stratégies de généralisation ? – Quand une requête est-elle généralisable ?

Si le nombre de résultats est supérieur à 0, le choix de la famille de stratégies dépend de l’adéquation des résultats avec les attentes de l’enquêté. Si les résultats sont satisfaisants, le dialogue de recherche passe à la phase de clôture. Cela signifie que la recherche est un succès et que les interlocuteurs peuvent soit interrompre leur collaboration, soit passer à un nouveau sujet. Si les résultats sont partiellement satisfaisants, la famille de stratégies choisie sera la précision. Sinon, si les résultats ne sont pas satisfaisants (i.e. hors sujet), la famille de stratégie choisie est la reformulation.

Nous allons maintenant décrire les familles de stratégies que nous avons rencontré dans le corpus. La précision

Description Les stratégies de précisions interviennent dans 6 entretiens, à savoir [VD02], [VD03], [VD05], [VD06], [VD07], [VD09]. L’idée de ces stratégies est d’augmenter l’adéquation entre les ressources obtenues et les attentes de l’enquêté. Généralement, la précision d’une requête conduit à obtenir moins de documents. C’est un effet de bord possible mais pas il n’est pas obligatoire. Leurs caractéristiques de déclenchement sont les suivantes :

– Des résultats sont obtenus.

(22)

Ce type de stratégies dépend – de part la façon dont nous les avons définis – du critère qui rend les ressources partiellement satisfaisantes. Nous avons pu observer deux critères qui motivent les réparations de la requête dans ces cas.

Spécificité des résultats Le premier critère dépend de la précision (ou spécificité) des résultats par rapport à ce qu’attend l’enquêté. Les résultats peuvent être :

– trop spécialisés : les ressources abordent des notions trop spécifiques ; – pas assez spécialisés : les ressources abordent des notions trop générales.

Ce point est clairement connecté au profil de l’enquêté. Par exemple CISMeF permet de différencier clairement les ressources par rapport au profil médical de l’utilisateur (professionnel de la santé ou pas). Néanmoins, le profil de l’enquêté n’est pas indispensable puisque l’enquêté, bien que n’étant pas un professionnel de la santé, peut vouloir des documents particulièrement précis sur un certain sujet. Dans notre corpus, nous avons observé ces deux cas.

Le premier cas intervient dans l’entretien [VD03] où l’enquêté juge les documents pas assez spécifique : “ça ratisse un peu trop large”. La précision est initiée par l’enquêté qui propose spontanément d’ajouter un nouveau terme “zomig”. Cet exemple est typique pour démontrer l’importance de l’initiative mixte dans ce genre de système.

Le deuxième cas intervient dans l’entretien [VD07] où l’enquêté juge les documents trop spécialisés. L’expert en conclut immédiatement que le levier sur lequel jouer pour améliorer la pertinence des résultats dépend du profil de l’enquêté. Il comprend que le public visé par les auteurs du document ne correspond pas au profil de l’enquêté. Il lui propose alors d’ajouter le type de ressources “patient”.

Pour résumer, nous avons donc un critère discriminant “trop spécifique/pas assez spécifique” qui est a priori indépendant du moteur de recherche. Le problème est ensuite de comprendre pourquoi les résultats sont trop ou pas assez spécifiques. Une fois que cela est identifié. Il faut utiliser les fonctionnalités du moteur de recherche pour corriger la requête. Dans notre cas, nous avons observé que cela peut dépendre du profil de l’utilisateur qui ne correspond pas au public visé par les documents. L’initiative mixte semble également un atout considérable car elle permet à l’utilisateur de prendre la main et d’éviter ainsi de devoir détecter les raisons d’hyper ou sous-spécificité.

Les aspects abordés dans la requête Le deuxième critère dépend des aspects de la recherche (cf. 1.3.2). Si la requête est incomplète (i.e. elle ne recouvre pas tous les aspects de la recherche, cf. 1.3.3) alors les interlocuteurs vont essayer de la préciser (i.e. lui ajouter un ou plusieurs éléments). Cette stratégie intervient dans les entretiens [VD02], [VD03], [VD05], [VD06] et [VD09].

Dans le cas de cette expérience et de CISMeF, la précision s’effectue dans 4 cas sur 5 par l’ajout d’un qualificatif correspondant au mieux à l’aspect manquant. Dans l’autre cas ([VD05]), la précision est effectuée à l’aide d’une spécialité médicale.

Il faut noter qu’il n’est pas toujours évident de déterminer pourquoi les résultats ne sont que partiel-lement satisfaisants. Le cas le plus difficile est quand la requête est incomplète mais que les documents ne sont pas clairement déconnectés de l’aspect manquant. C’est le cas dans l’entretien [VD05] où la recherche doit porter sur le lien entre le “mal de tête” et le “sport”. Une requête est lancée avec les mots-clés “effort” et “sport” et n’adresse donc manifestement pas l’aspect “mal de tête”. Néanmoins, les nombreux résultats (au nombre de 197) abordent des sujets divers et variés en rapport avec le sport. Il faut un raisonnement de l’expert pour conclure que les documents parlent plus spécifiquement des bienfaits du sport alors qu’ils sont à la recherche d’inconvénients que le sport pourrait avoir. Il propose alors d’ajouter la spécialité médicale “Médecine du sport”.

Enfin, cette stratégie n’est pas toujours la plus adéquate dans le cas de CISMeF. En effet, préciser la requête en lui ajoutant un qualificatif ne fait qu’afficher un sous-ensemble des résultats obtenus avec la requête sans le qualificatif. Elle est donc à réserver dans les cas où beaucoup de documents sont obtenus. La reformulation dans le cas d’obtention de ressources non satisfaisantes

Dans certains cas, les ressources obtenues après avoir lancé la requête sont directement rejetées par les interlocuteurs. Il s’agit du cas où les ressources sont clairement non satisfaisantes. Ce cas apparaît dans les entretiens [VD01], [VD08].

L’expert réalise généralement le constat d’inadéquation entre la requête et ce qui est attendu par l’enquêté : “les pistes qu’on a prises ne fonctionnent pas donc on va essayer de partir sur autre chose” [VD08].

La reformulation de la requête peut reposer sur des termes précédemment énoncés durant la discussion mais qui n’ont pas servi à construire une requête (ou une combinaison de termes qui n’a pas été réalisée