• Aucun résultat trouvé

Analyse et expansion des textes en question-réponse

N/A
N/A
Protected

Academic year: 2021

Partager "Analyse et expansion des textes en question-réponse"

Copied!
16
0
0

Texte intégral

(1)

Analyse et expansion des textes en question-réponse

Bernard JACQUEMIN b_jacquemin@yahoo.fr

7èmes Journées internationales d’Analyse statistique de données textuelles

(2)

Introduction

Des constatations

augmentation exponentielle des données textuelles

manque de structure dans l’information qu’ils contiennent accès difficile à une information précise

Solution actuelle : question answering par expansion de requête Solution proposée :

construction d’une structure informationnelle fournissant un accès expansion de l’information plutôt que de la question

(3)

Introduction – Exemple

Question : Qui est le général des Perses ? Enrichissement de la question :

Qui est le

universel chef g´en´eral sup´erieur

vague

des Perses ?

« Dans le chef des Perses, la stratégie était (. . .) »

(4)

Plan

Pourquoi traiter les documents plutôt que la question ? Traitements appliqués aux documents

analyse morpho-syntaxique désambiguïsation sémantique enrichissement synonymique

application de patrons de dérivation indexation des résultats

Interrogation de la structure Évaluation du système

Perspectives

(5)

Architecture du système

(6)

Traiter la base documentaire

De quel chef Domitien est − il le successeur ?

Document contenant le réponse : article Domitien :

Second fils de Vespasien, Domitien succéda à l’empereur Titus et poursuivit la remise en ordre de l’État.

(7)

Traiter la base documentaire

commandant heritier´

De quel chef Domitien est − il le successeur ?

cuisinier dauphin

Document contenant le réponse : article Domitien :

Second fils de Vespasien, Domitien succéda à l’empereur Titus et poursuivit la remise en ordre de l’État.

⇒ utilisation du contexte plus large des documents

⇒ indexation des traitements des documents en une structure de l’information

(8)

Traitements – Analyse morpho-syntaxique

Segmentation et analyse morphologique : NTM (Xerox) découpage du texte en mots

proposition d’analyses morphologiques

étiquette sémantique pour chacune des analyses proposées

Désambiguïsation catégorielle et analyse syntaxique : XIP (Xerox) choix contextuel de la catégorie grammaticale

construction des dépendances syntaxiques entre lexèmes qui en sont les arguments

affectation des étiquettes sémantiques aux lexèmes sous forme de traits

Stockage du « squelette informationnel » dans l’index sous forme des dépendances entre les mots, et de traits morphologiques,

syntaxiques et sémantiques

(9)

Traitements – Désambiguïsation sémantique

Règles de désambiguïsation extraites du dictionnaire Dubois

Conditions d’application syntaxiques et lexicales ou sémantiques

patrons lexico-syntaxiques extraits des exemples

patrons syntaxiques extraits de la sous-catégorisation

généralisation sémantique des patrons lexico-syntaxiques

Assignation d’un trait de sens au lexème désambiguïsé Construction d’une règle de désambiguïsation

Verbe « remporter » au sens « gagner » remporter une victoire

Dépendance de « remporter » : VARG[DIR](remporter,victoire) Règles de désambiguïsation (lexicale – sémantique avec étiquette

sémantique MIL pour victoire) :

remporter : VARG[DIR](remporter,victoire) sens « gagner » n˚2 remporter : VARG[DIR](remporter,[MIL]) sens « gagner » n˚2

Pompée à remporté des batailles en Orientremporté[sens=2]

(10)

Traitement – Enrichissement synonymique

utilisation des synonymes correspondant au numéro de sens adjonction des synonymes dans la structure

utilisation de dépendances syntaxiques disjonctives

Second fils de Vespasien, Domitien succéda à l’empereur Titus Dépendances originales impliquant empereur :

VARG[INDIR](succéda,empereur) NN(empereur,Titus)

Synonymes du sens n˚1 d’empereur (déterminé par l’analyse sémantique) :

chef, monarque

Dépendances disjonctives :

VARG[INDIR](succ´eda, empereur OU chef OU monarque) NN(empereur OU chef OU monarque, Titus)

(11)

Traitement – Dérivation morphologique

Dérivés liés au sens du lexème dont ils dérivent

« tracteur » dérive de « tirer » au sens « remorquer »

« tracteur » ne dérive pas de « tirer » au sens « faire feu »

Le dérivé est d’une catégorie grammaticale différente du mot originel

table de correspondance des schémas syntaxiques en fonction :

de la catégorie originelle de la catégorie du dérivé

du type de dérivation (suffixe)

Schéma syntaxique originel de Domitien succéda à l’empereur Titus : SUBJ(succéda,Domitien) VARG[indir](succéda,empereur) Dérivé : « successeur »

Nouvelles dépendances :

NMOD(Domitien, successeur) NARG[INDIR](successeur, de, empereur) Correspondance textuelle :

« Domitien, successeur de l’empereur Titus »

(12)

Interrogation

Analyse morpho-syntaxique

identification des lexèmes et des dépendances syntaxiques élimination des caractéristiques propres à la question

catégorisation de l’objet de la question

Construction d’une structure compatible avec la structure informationnelle

Mise en correspondance de la structure informationnelle avec celle de la question

« De quel chef Domitien est-il le successeur ? » Structure de la question (dépendances) :

NMOD[SPRED](Domitien,successeur) NMOD[INDIR](successeur,de,chef) SUBJ(est,Domitien)

(13)

Interrogation

SUBJ(est,Domitien) FOCUS(chef)

NMOD[SPRED] ( Domitien ,successeur)

NMOD[INDIR] ( successeur ,de, chef [FOCUS,SOC,COM,HER,humain])

Document contenant la réponse : article Domitien

« [. . .] Domitien succéda à l’ empereur Titus [. . .] »

SUBJ(succéda,Domitien) SUBJ(succéda OU remplacer,Domitien)

VARG[INDIR](succéda,à,empereur) VARG[DIR](remplacer,empereur OU chef OU [...]) NN(empereur,Titus) NN(empereur OU chef OU souverain,Titus)

NMOD[INDIR] ( successeur ,de, empereur OU chef OU [...]) NMOD ( Domitien ,successeur)

(14)

Évaluation

200 questions par 8 externes (TREC-8) fenêtre : la phrase

base documentaire : 50 articles d’encyclopédie une réponse au moins dans les documents

baseline :

mots-clefs sans enrichissements mots-clefs et synonymes bruts

Enrichissement Score Pas de réponse

Plancher 0.295 139

Synonymes (sans sémantique) 0.303 137 Synonymes (avec sémantique) 0.487 100 Tous les enrichissements 0.504 97

(15)

Conclusions et perspectives

Besoins de plus synonymes et d’un moteur logiques Dégradation de la requête

pondération de la correspondance question-réponse pondération du type de dépendance

L’approche est généraliste et linguistique

L’approche fournit une structure de l’information

(16)

Merci pour votre attention

Avez-vous des questions ?

Références

Documents relatifs

Il ressort des extraits des travaux prépara- toires du décret attaqué cités que le législateur décrétal entendait, notamment, créer les conditions propices à l'instauration

Du fait de leur participation au Jeu et de l’acceptation de leur lot, les gagnants autorisent la Rmn-Grand Palais à publier sur la Fan Page Facebook du Grand

Certains interprètes constatent certes que les responsables de la colère impériale furent des magiciens, mais ils ne sont pas prêts à remettre en cause l'exécution des lettrés :

C’est pré- cisément cette «lésion» à laquelle veulent remé- dier la loi et la jurisprudence suisses en permet- tant exceptionnellement à la partie lésée de dénoncer un

Les voyages d’Hadrien ne sont donc pas le fait d’un dilettante, d’un esthète attentif à ses plaisirs, ils sont un moyen de gouverner avec efficacité pour un prince qui aime la

Les dédicants étaient peut-être en charge du sanctuaire de la fontaine vicinale, dans le cadre d’un culte des Lares Augustes organisé à Nîmes, comme à Rome, par quartiers..

Tous les courtisans du palais et tous les proches de la jeune princesse Adrosis, sauf Joanna, lui conseillaient de se réconcilier avec l’empereur Hadrien son père, ne fut-ce

Plus particulièrement, elle doit nous rappeler que, d’abord, c’est dans un groupe d’otages qu’Euthyme, le fils de Jean, avait été envoyé à Constantinople, à Nicéphore