• Aucun résultat trouvé

Les stratégies de précisions et de généralisation

Dans le document Analyse haut niveau du corpus Cogni-CISMeF (Page 36-42)

2.3 Les stratégies initiales et de réparation

2.3.2 Les stratégies de précisions et de généralisation

Nous avons recensé 74 requêtes sur les 11 entretiens du corpus AL. Cependant, ce corpus n’est ex- ploitable que partiellement. Cela provient du fait que l’expert ne verbalise pas complètement les phases d’évaluation et les réparations sur les requêtes qu’il effectue. Nous revenons plus en détail sur ces limites dans la section 2.5. Avant d’entamer cette partie, nous devons souligner que sur les 74 requêtes effectuées, 18 ne sont pas “sûres” ce qui signifie que leur contenu n’a pas été complètement verbalisé par l’expert mais que certains éléments ont pu être déduits par le dialogue. 8 requêtes sont strictement inconnues.

Des stratégies de généralisation "classiques"

Compte-tenu de la stratégie globale de l’expert qui consiste à partir sur des requêtes peu précises pour les préciser ensuite, nous observons un faible nombre de stratégies de généralisation. Elles interviennent dans les entretiens [AL01], [AL06], [AL10], [AL11], [AL12]. Cela représente un total de 7 requêtes. Des requêtes généralisables et donc généralisées Les entretiens [AL10] et [AL12] font apparaître une situation que nous avons déjà vue dans le corpus VD, à savoir :

– Le nombre de résultat retourné par la requête est nulle.

– La requête est généralisable car elle recouvre l’ensemble des aspects majeurs de la recherche et qu’il est possible de lui enlever un terme en conservant une requête complète pour les aspects majeurs et qui n’a pas déjà été effectuée.

Concernant l’entretien [AL10], la requête est généralisée par la suppression d’un mot-clé tandis que dans l’entretien [AL12], la requête est généralisée par la suppression d’un qualificatif.

Des requêtes généralisables par violation de la contrainte sur les aspects Les entretiens [AL11] et [AL12] présentent des cas où les requêtes sont à recouvrement minimal, complètes pour les aspects majeurs et ne retournent pas de résultat.

L’entretien [AL11] affiche deux requêtes de ce type. Dans le premier cas, l’expert propose une reformu- lation de la spécialité médicale. Cette reformulation a pour effet de rendre la requête incomplète pour les aspects majeurs. La même opération est réalisée directement à la suite car la requête ne retourne toujours pas de résultat. Néanmoins, celle-ci est initiée par l’enquêté.

Dans l’entretien [AL12], la requête est généralisée “classiquement” par l’expert par la suppression d’un de ses termes rendant la requête incomplète pour les aspects majeurs.

Une requête à la fois généralisée et précisée L’entretien [AL01] présente un cas intéressant. La requête réalisée est complète et à recouvrement minimal. L’expert a alors deux choix :

– Généraliser la requête (i.e. lui retirer un élément) en violant la contrainte sur les aspects,

– ou reformuler la requête (ce qui peut conduire à conserver une requête complète pour les aspects ou pas comme nous l’avons vu précédemment).

L’expert choisit ici de généraliser la requête en lui retirant la spécialité médicale. Il viole donc la contrainte sur les aspects. Néanmoins, il ne s’arrête pas là car il propose à l’enquêté d’ajouter un nouvel élément à la requête, à savoir le qualificatif “contre-indication”. A priori, l’expert choisit à la fois de généraliser et préciser la requête ce que nous n’avions pas observé dans le corpus VD.

En fait, un cas similaire peut être trouvé dans l’entretien du corpus VD [VD06] à la seule différence que la généralisation était initiée par l’expert et la précision par l’enquêté.

Comment expliquer cela ? L’explication est en fin de compte très claire quand on regarde le dialogue et qu’on considère le rôle de la généralisation. Comme nous l’avons vu, le rôle de la généralisation est l’exploration des résultats en omettant certaines contraintes trop restrictives quitte à perdre de la précision. Lorsque l’expert propose à l’enquêté de tester “contre-indication”, il indique que c’est un test “à tout hasard”. L’expert verbalise donc son but d’exploration. Cela n’est donc pas en contradiction avec ce que nous avons vu précédemment.

Une généralisation alors qu’on obtient des résultats utilisant la hiérarchie terminologique L’étude du corpus AL nous permet de raffiner les conditions de déclenchement des stratégies de générali- sation. En effet, l’entretien [AL12] présente un exemple où une requête retourne effectivement 2 résultats, mais celle-ci est tout de même généralisée. En fait, les 2 résultats ont été précédemment obtenus et évalués comme partiellement satisfaisants. Une condition de déclenchement plus générale pour les stratégies de généralisation est la suivante : aucun résultat nouveau n’est obtenu.

La deuxième caractéristique intéressante de cette généralisation est l’usage de la hiérarchie termino- logique pour généraliser la requête. En effet, celle-ci est constituée de l’élément “cholestérol HDL” trouvé suite à un alignement verbalisation/terminologie. Lors de cet alignement, d’autres termes avait été trouvés dont “cholestérol” qui est un parent dans l’arbre terminologique de “cholestérol HDL”. Les interlocuteurs conservent cette propriété en tête car la généralisation consiste à “reformuler” “cholestérol HDL” par “cholestérol”.

Discussion En conclusion, nous avons observé 7 réparations de généralisation/reformulation dont : – 2 requêtes généralisées sans violation de la contrainte sur les aspects ([AL10], [AL12]) ;

– 2 requêtes reformulées avec violation de la contrainte sur les aspects ([AL11]) ; – 1 requête généralisée avec violation de la contrainte sur les aspects ([AL12]) ; – 1 requête présentant un exemple de reformulation/précision ([AL01]) ; – et enfin, 1 requête présentant une généralisation terminologique ([AL12]).

5 requêtes sur 7 entrent dans le cadre de ce qu’on a observé dans le corpus VD. Le dialogue [AL01] présente une utilisation opportuniste d’une stratégie de précision dans une de généralisation par l’expert. L’entretien [AL12] nous a permis de raffiner les conditions de déclenchement des stratégies de généralisation et de présenter un cas de généralisation terminologique.

Des stratégies de précision beaucoup plus nombreuses

Nous avons recensé 41 requêtes de précision qui se décomposent en précisions relatives au profil de l’enquêté, autres précisions (dont celles relatives aux aspects) et les reformulations.

Les stratégies de précision relatives au profil de l’enquêté Parmi l’ensemble des requêtes de précisions, 5 sont des précisions relatives au profil de l’enquêté qui se soldent toujours par l’ajout du type de ressources “patient”. Elles interviennent dans 4 entretiens sur 11 : [AL02], [AL04], [AL05] et [AL07]. Les motivations sont synthétisées dans le tableau 2.2. On peut voir qu’elles sont liées aux résultats des requêtes. Pour un cas, nous ne sommes pas capables de définir la raison de l’ajout du type de ressources car l’expert n’a pas assez verbalisé. Même s’il y a de fortes probabilités pour que cela soit pour l’une des deux autres raisons évoquées dans le tableau, nous avons préféré le conserver en “indéfini”.

Motivation # Entretien(s)

Trop de résultats 2 [AL02], [AL04] Partiellement satisfaisants 2 [AL05]

Indéfini 1 [AL07]

Table2.2 – Motivations pour préciser la requête par rapport au profil de l’enquêté

La stratégie de précision par rapport au profil est complétée par l’utilisation opportuniste d’une stra- tégie de reformulation sur un mot-clé dans l’entretien [AL05]. La motivation de l’expert pour réaliser cette opération est de remarquer que les documents sont indexées par “dorsalgie” plutôt que par “mal de dos”. Enfin, dans l’entretien [AL06], l’expert anticipe une précision en informant qu’elle n’apportera pas de résultats : “on voudrait peut-être des documents euh : destinés particulièrement aux patients plus qu’à des médecins / mais on n’en trouve pas”.

Les précisions relatives aux aspects de la recherche 15 précisions sont relatives aux aspects. C’est-à-dire que la requête est incomplète vis-à-vis de la demande de l’enquêté et que les interlocuteurs cherchent à la compléter.

Ce type de précisions revêt plusieurs formes que nous synthétisons dans le tableau 2.3. La forme la plus courante est d’ajouter un mot-clé à la requête. Cette opération est très proche de celle qui consiste à ajouter un terme en adjacence plein texte. En effet, le mode adjacence plein texte est utilisé par l’expert quand il suppose que le terme n’appartient pas à la terminologie et qu’aucun équivalent satisfaisant ne peut être trouvé facilement (ou par raisonnement). On retrouve également l’ajout de qualificatif qui était prépondérant dans le corpus VD. On observe également que les interlocuteurs utilisent les spécialités médicales en en ajoutant ou en en remplaçant (car il ne peut y avoir qu’une seule spécialité médicale par recherche). Enfin, le dernier cas ([AL01]) consiste en deux opérations de modification de la requête initiée par l’expert. Néanmoins, cette modification est à prendre avec beaucoup de précaution car la retranscription de la requête n’est pas certaine. On peut ajouter que si la suppression du qualificatif a lieu, elle est due au fait qu’il a été ajouté “à tout hasard” par l’expert dans la phase de généralisation directement précédente.

Forme # Entretien(s)

Ajout de mots-clés 6 [AL04], [AL05], [AL06], [AL10], [AL12]

Ajout de qualificatifs 3 [AL02], [AL09(a)], [AL09(b)]

Ajout/remplacement de spécialités médi- cales

3 [AL04], [AL10], [AL11]

Ajout de termes en adjacence plein texte 2 [AL05], [AL10] Ajout de termes en adjacence plein texte

et suppression d’un qualificatif (pas sûr)

1 [AL01]

Table2.3 – Formes des précisions relatives aux aspects de la recherche

Compte-tenu de la stratégie globale de l’expert et de la petite taille des phases de verbalisation, nous pouvons observer que ces précisions peuvent être précédée d’une demande explicite de raffinement des aspects de la recherche dans 3 recherches ([AL06], [AL09(a)], [AL09(b)]). On peut par exemple observer les demandes de raffinement suivantes au cours du dialogue dans l’entretien [AL06] :

– “vous voulez savoir l’évolution le diagnostic ? les traitements possibles ?” – “donc c’est des douleurs articulaires à quel niveau ?”

Nous regroupons les motivations qui poussent les interlocuteurs à préciser la requête dans le tableau 2.4. On peut voir que les deux principales raisons sont le fait que la requête retourne trop de résultats ou que les résultats obtenus sont partiellement satisfaisants (i.e. ils n’adressent qu’un sous-ensemble des aspects de la recherche). Notons que le critère “Trop de résultats” est subjectif à l’expert. Cela se voit clairement dans le dialogue [AL12] où l’expert juge que la requête no4 retourne trop de résultats (à savoir 13). Il entre

alors dans une stratégie de précisions en 2 requêtes qui ne conduisent à aucune ressource satisfaisante. Il propose alors explicitement à l’enquêté de revenir sur la requête no4 et la ré-execute. Les deux cas de

motivations indéfinis sont dus à des verbalisations pas assez explicites de l’expert.

Motivation # Entretiens

Partiellement satisfaisants 7 [AL01], [AL04], [AL05], [AL10], [AL11], [AL12] Trop de résultats 6 [AL02], [AL05], [AL06], [AL09(b)], [AL10]

Indéfini 2 [AL09(a)], [AL12]

Table2.4 – Motivations pour préciser la requête par rapport aux aspects de la requête

Autres types de précision D’autres types de stratégie de précision plus marginaux ont été observés. Ils sont au nombre de 3 mais sont particulièrement intéressants. Ils interviennent tous dans l’entretien [AL12].

Nous pouvons commencer par la précision en rapport avec la hiérarchie terminologique qui, à l’instar de ce qu’on a vu dans les stratégies de généralisation (cf. 2.3.2), consiste en l’utilisation de la terminologie pour préciser. Cette précision est motivée par l’obtention d’un trop grand nombre de résultats. L’expert propose de préciser la requête en passant de “cholestérol” à “cholestérol HDL” issu de la phase d’alignement verbalisation/terminologie.

Un second type de précision est en rapport avec une option de recherche de CISMeF qui permet de préciser si l’on veut un élément en mode explosion ou pas. Par défaut, l’élément est en mode explosion. Quand un élément est en mode explosion, la recherche a lieu sur cet élément de la terminologie ainsi que sur tous ses fils. Sinon, la recherche n’a lieu que sur l’élément strictement. Ainsi, pour préciser une requête sur le “cholestérol”, l’expert propose de désactiver le mode explosion. Cela est clairement lié au fait qu’il a testé avec un élément plus précis dans la terminologie (“cholestérol HDL”) et que les résultats n’étaient pas concluants.

Le troisième type de précision est issu de l’initiative mixte associée au terrain commun. Ainsi, dans les premiers résultats des requêtes, l’enquêté remarque qu’il y a un nom de traitement qui ressort à tester : “déjà un nom éventuellement d’un traitement / à essayer / un nom de traitement”. Cette piste est tout d’abord mise en attente par l’expert qui souhaite réaliser d’autres requêtes. Puis, cette piste est reprise vers la fin du dialogue pour trouver des documents intéressants : “d’accord donc là on avait trouvé un document / euh : je ne sais plus où c’était / sur un traitement spécifique / vous vouliez préciser ? sur le /”. La précision a lieu sur un élément préalablement écarté par les interlocuteurs pour reconsidérations futures.

Les reformulations Nous avons listé 18 reformulations dans le corpus AL. Les reformulations appa- raissent dans 7 entretiens sur 11, à savoir : [AL02], [AL03], [AL04], [AL05], [AL07], [AL10] et [AL11]. Elles prennent place généralement quand un petit nombre de ressources est obtenu mais qu’elles ne sont pas satisfaisantes.

Une des spécificités des reformulations est qu’elles sont d’initiative mixte alors que les stratégies de généralisation et de précision sont généralement de l’initiative de l’expert. Nous avons synthétisé dans le tableau 2.5 les reformulations initiées par l’expert et par l’enquêté. Il est clair que le nombre de reformula- tion initiée par l’enquêté est faible (3/18). Cependant, quand l’expert initie une reformulation, il n’hésite pas à solliciter l’enquêté. L’interaction entre l’enquêté et l’expert est donc essentielle.

Entretien Expert Enquêté

[AL02] 1 [AL03] 1 [AL04] 3 [AL05] 4 1 [AL07] 2 1 [AL10] 3 [AL11] 1 1

Table2.5 – Reformulations initiées par l’expert ou l’enquêté dans le corpus AL

Ainsi, l’expert n’hésite pas à solliciter l’enquêté. Dans l’entretien [AL03], il lui propose d’extraire des termes associées aux notices des ressources pour en trouver qui correspondent mieux à sa demande. Cela conduit l’enquêté à choisir le terme “arthroscopie” qui est ensuite utilisé pour reformuler la requête. L’expert n’hésite pas à demander explicitement à l’enquêté s’il a des reformulations. Par exemple, dans l’entretien [AL03], l’expert demande : “il y a pas un synonyme de cette maladie ?”. Enfin, l’expert demande clairement des clarifications à l’enquêté sur sa demande, par exemple :

– “sur les maux de tête c’est quoi précisément en fait ?” [AL05]

– “qu-est-ce que vous entendez par problèmes avec la nourriture ?” [AL07]

– “je ne sais pas si vous voulez des renseignements sur un sport particulier ?” [AL10]

Enfin, nous pouvons nous intéresser à la répartition des motivations pour initier une reformulation. Nous avons synthétisé cela dans le tableau 2.6.

Motivation # Entretien(s)

Ressources non intéressantes 11 [AL02], [AL03], [AL04], [AL05], [AL10], [AL11]

Partiellement satisfaisant 2 [AL05], [AL07]

Terminologie 2 [AL04], [AL05]

Trop de résultat 1 [AL07]

Indéfini 2 [AL05], [AL07]

Table2.6 – Motivations pour reformuler une requête quand des ressources sont obtenues dans le corpus AL

Comme nous pouvons le voir, la majeure partie des reformulations est motivée par le fait que les ressources ne sont pas intéressantes. Comme nous l’avons dit dans la section 2.1.3, les phases d’évaluation sont menées par l’expert qui verbalise peu. Il est souvent difficile de connaître de manière certaine les raisons qui font qu’une ressource est insatisfaisante. Néanmoins, nous avons pu observer les cas suivants qui font qu’une ressource est insatisfaisante :

– Dans l’entretien [AL02], la première requête ne retourne qu’un seul résultat, l’expert en conclut qu’il n’y a pas assez de résultats.

– Les résultats sont hors-sujets. – Les résultats ont déjà été vus.

– Les résultats ne sont pas adaptés au profil de l’enquêté (e.g., ils parlent d’enfant alors que l’enquêté n’en est pas un [AL05]).

Les ressources partiellement satisfaisantes sont soit des ressources qui abordent tous les aspects de la recherche mais qui sont trop précises ([AL07]), soit des ressources qui n’abordent pas tous les aspects de la requête. Dans ce dernier cas, nous avons vu que généralement l’expert préférait préciser la requête. Cependant, il arrive que les interlocuteurs interagissent et choisissent de reformuler un terme comme dans l’entretien [AL05] où ils remplacent l’ensemble des mots-clés d’une requête par un seul : “maux de tête”.

La reformulation terminologique intervient dans 2 entretiens quand les interlocuteurs ont saisi des termes qui n’appartiennent pas à la terminologique. Ils les reformulent aussitôt.

La reformulation qui a lieu parce qu’il y a trop de résultats est en fait commandée par l’enquêté. Enfin, les reformulations dont la motivation est indéfinie le sont, soit parce que la verbalisation de l’ex- pert n’est pas assez claire ([AL05]), soit parce que la reformulation est commandée par l’enquêté ([AL07]) : “on aurait pu raffiner sur l’anorexie ah / de la même façon en regardant les documents concernant les patients ?” [AL07].

En quoi consistent les reformulations ? Le tableau 2.7 synthétise la réponse.

Proposé par l’expert Proposé par l’enquêté

Utilisation de nouveaux termes 8 4

Entretiens [AL02], [AL04], [AL07],[AL10], [AL11] [AL03], [AL05], [AL07], [AL10]

Par l’expert Par l’enquêté

Réutilisation de termes du ter- rain commun

4 3

Entretiens [AL04], [AL05] [AL05], [AL07], [AL11]

Table 2.7 – Les reformulations dans le corpus AL

Les reformulations consistent à construire une nouvelle requête. Cela peut être fait en modifiant une partie de la requête existante ou en reformulant complètement une requête à partir de zéro. Pour remplacer un terme, les interlocuteurs en proposent de nouveaux, ou réutilisent des termes du terrain commun.

Le tableau 2.7 met en avant l’importance de l’interaction. En effet, même si l’enquêté n’initie que 3 reformulations sur 14, il participe (en étant sollicité par l’expert) aux autres reformulations. On peut voir que 12 termes sur 19 termes utilisés dans les reformulations sont des nouveaux termes (soit 63%). 1/3 de ces nouveaux termes proviennent de l’enquêté tandis que le reste provient de l’expert (nous voyons dans la section 2.4.1 sur quoi se base l’expert pour tirer de noveaux termes).

Un autre moyen est de réutiliser des termes du terrain commun. On peut voir que la part accordée à la réutilisation approche les 37% ce qui n’est pas négligeable.

Synthèse sur l’utilisation des stratégies de réparation

Nous avons synthétisé dans le tableau 2.8 le nombre de stratégies de généralisation et de reformulation réalisées dans le corpus AL, ainsi que le nombre de stratégies de précision et de reformulation dans le tableau 2.9.

Total Initiées par l’expert Initiées par l’enquêté

Généralisation 4 4

Reformulation 3 2 1

Table2.8 – Nombre de stratégies de généralisation et de reformulation associées dans le corpus AL

Total Initiées par l’expert Initiées par l’enquêté

Précisions 23 23

Reformulation 18 15 3

Table 2.9 – Nombre de stratégies de précisions et de reformulation associées dans le corpus AL L’idée que fait ressortir l’étude de ces chiffres est que la stratégie globale de l’expert a clairement une influence sur les stratégies locales de modifications des requêtes. Ainsi, le corpus AL présente une utilisation massive de requêtes de précision et de reformulations associées à l’obtention de ressources non satisfaisantes pour l’enquêté : 41 réparations sur les 48 exploitables (soit environ 85%) !

L’utilisation des stratégies de généralisation et de reformulations associées est clairement marginale, mais indispensable pour sortir les interlocuteurs d’une requête qui ne retourne pas de nouveaux résultats. La stratégie globale de l’expert qui conduit à la construction d’une première requête très générale conduit logiquement à une succession de stratégies de précision dans la suite du dialogue.

Ces résultats sont à mettre en parallèle avec ceux obtenus pour le corpus VD où la stratégie de l’expert était opposée. Dans ce dernier cas, il s’agissait d’une première requête très précise qui conduisait à des successions de généralisation puis de précisions. Les corpus VD et AL présentent deux stratégies globales de la part des experts qui conduisent à une répartition différente dans l’usage de stratégies locales de modifications de requêtes qui sont de même nature.

Ensuite, nous pouvons remarquer que les stratégies locales sont principalement initiées par l’expert dans le corpus AL. Cependant, cela ne signifie pas que l’interaction entre l’expert et l’enquêté est nulle durant les phases de réparation, bien au contraire ! Même si la réparation est initiée par l’expert, cela ne l’empêche pas de solliciter l’enquêté pour avoir son avis sur un terme, pour lui demander de raffiner sa demande ou de trouver de nouvelles reformulations pour les termes de la requête. Les modifications sont clairement coopératives. L’enquêté n’hésite d’ailleurs pas à prendre l’initiative pour proposer de complé- ter une requête (e.g., [AL03]). Les dialogues laissent complètement la place à l’opportunisme puisque 3 reformulations sont initiées par l’enquêté.

Enfin, le rôle complémentaire des stratégies de généralisation et de précisions ressort également de l’étude de ce corpus. La stratégie globale dans le corpus AL consiste à partir d’une requête floue afin de se laisser un maximum de chances. Cela est confirmé par les faits suivants :

Dans le document Analyse haut niveau du corpus Cogni-CISMeF (Page 36-42)