Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Interroger un corpus par le sens
Une approche linguistique
Bernard JACQUEMIN
Institut des Sciences Cognitives CNRS – UMR 5015 67, boulevard Pinel 69675 Bron (France) Bernard.Jacquemin@isc.cnrs.fr
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Probl ´ematique
La probl ´ematique
Trouver une information pr ´ecise dans un corpus textuel
Des difficult ´es
Une profusion de documents textuels ing ´erable
Un manque de structure dans l’information qu’ils contiennent
Des disciplines concern ´ees
Extraction d’information : requ ˆete g ´en ´eralement
pr ´ed ´etermin ´ee, r ´eponse conforme `a un champ informationnel Question-r ´eponse : question factuelle et ponctuelle, r ´eponse atomique / dans une phrase / reformul ´ee
Des solutions apport ´ees par plusieurs disciplines
Utiliser des mots-clefs et des index (Google. . .) Expansion de la requ ˆete (synonymes, hyp ´eronymes, d ´eriv ´es. . .)
Des m ´ethodes linguistiques marginales (morphologie, ontologies. . .)
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Probl ´ematique
La probl ´ematique
Trouver une information pr ´ecise dans un corpus textuel
Des difficult ´es
Une profusion de documents textuels ing ´erable
Un manque de structure dans l’information qu’ils contiennent
Des disciplines concern ´ees
Extraction d’information : requ ˆete g ´en ´eralement
pr ´ed ´etermin ´ee, r ´eponse conforme `a un champ informationnel Question-r ´eponse : question factuelle et ponctuelle, r ´eponse atomique / dans une phrase / reformul ´ee
Des solutions apport ´ees par plusieurs disciplines
Utiliser des mots-clefs et des index (Google. . .) Expansion de la requ ˆete (synonymes, hyp ´eronymes, d ´eriv ´es. . .)
Des m ´ethodes linguistiques marginales (morphologie, ontologies. . .)
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Probl ´ematique
La probl ´ematique
Trouver une information pr ´ecise dans un corpus textuel
Des difficult ´es
Une profusion de documents textuels ing ´erable
Un manque de structure dans l’information qu’ils contiennent
Des disciplines concern ´ees
Extraction d’information : requ ˆete g ´en ´eralement
pr ´ed ´etermin ´ee, r ´eponse conforme `a un champ informationnel Question-r ´eponse : question factuelle et ponctuelle, r ´eponse atomique / dans une phrase / reformul ´ee
Des solutions apport ´ees par plusieurs disciplines
Utiliser des mots-clefs et des index (Google. . .) Expansion de la requ ˆete (synonymes, hyp ´eronymes, d ´eriv ´es. . .)
Des m ´ethodes linguistiques marginales (morphologie, ontologies. . .)
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Probl ´ematique
La probl ´ematique
Trouver une information pr ´ecise dans un corpus textuel
Des difficult ´es
Une profusion de documents textuels ing ´erable
Un manque de structure dans l’information qu’ils contiennent
Des disciplines concern ´ees
Extraction d’information : requ ˆete g ´en ´eralement
pr ´ed ´etermin ´ee, r ´eponse conforme `a un champ informationnel Question-r ´eponse : question factuelle et ponctuelle, r ´eponse atomique / dans une phrase / reformul ´ee
Des solutions apport ´ees par plusieurs disciplines
Utiliser des mots-clefs et des index (Google. . .) Expansion de la requ ˆete (synonymes, hyp ´eronymes, d ´eriv ´es. . .)
Des m ´ethodes linguistiques marginales (morphologie, ontologies. . .)
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Probl ´ematique
La probl ´ematique
Trouver une information pr ´ecise dans un corpus textuel
Des difficult ´es
Une profusion de documents textuels ing ´erable
Un manque de structure dans l’information qu’ils contiennent
Des disciplines concern ´ees
Extraction d’information : requ ˆete g ´en ´eralement
pr ´ed ´etermin ´ee, r ´eponse conforme `a un champ informationnel Question-r ´eponse : question factuelle et ponctuelle, r ´eponse atomique / dans une phrase / reformul ´ee
Des solutions apport ´ees par plusieurs disciplines
Utiliser des mots-clefs et des index (Google. . .) Expansion de la requ ˆete (synonymes, hyp ´eronymes, d ´eriv ´es. . .)
Des m ´ethodes linguistiques marginales (morphologie, ontologies. . .)
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Probl ´ematique
La probl ´ematique
Trouver une information pr ´ecise dans un corpus textuel
Des difficult ´es
Une profusion de documents textuels ing ´erable
Un manque de structure dans l’information qu’ils contiennent
Des disciplines concern ´ees
Extraction d’information : requ ˆete g ´en ´eralement
pr ´ed ´etermin ´ee, r ´eponse conforme `a un champ informationnel Question-r ´eponse : question factuelle et ponctuelle, r ´eponse atomique / dans une phrase / reformul ´ee
Des solutions apport ´ees par plusieurs disciplines
Utiliser des mots-clefs et des index (Google. . .) Expansion de la requ ˆete (synonymes, hyp ´eronymes, d ´eriv ´es. . .)
Des m ´ethodes linguistiques marginales (morphologie, ontologies. . .)
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Probl ´ematique
La probl ´ematique
Trouver une information pr ´ecise dans un corpus textuel
Des difficult ´es
Une profusion de documents textuels ing ´erable
Un manque de structure dans l’information qu’ils contiennent
Des disciplines concern ´ees
Extraction d’information : requ ˆete g ´en ´eralement
pr ´ed ´etermin ´ee, r ´eponse conforme `a un champ informationnel Question-r ´eponse : question factuelle et ponctuelle, r ´eponse atomique / dans une phrase / reformul ´ee
Des solutions apport ´ees par plusieurs disciplines
Utiliser des mots-clefs et des index (Google. . .) Expansion de la requ ˆete (synonymes, hyp ´eronymes, d ´eriv ´es. . .)Des m ´ethodes linguistiques marginales (morphologie, ontologies. . .)
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Exemple
Question
De quel chef Domitien est-il le successeur ?
g ´en ´eral h ´eritier
empereur succ ´eder
. . . .
cuisinier remplac¸ant
cheveu succ ´edan ´e
. . . .
Document contenant le r ´eponse : article Domitien
Second fils de Vespasien, il
succ ´eda
`a l’
empereur
Titus
et
poursuivit la remise en ordre de l’ ´
Etat.
Identification du sens
=⇒
CONTEXTE suffisamment large
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Exemple
Question
De quel
chef
Domitien est-il le
successeur
?
g ´en ´eral h ´eritier
empereur succ ´eder
. . . .
cuisinier remplac¸ant
cheveu succ ´edan ´e
. . . .
Document contenant le r ´eponse : article Domitien
Second fils de Vespasien, il
succ ´eda
`a l’
empereur
Titus
et
poursuivit la remise en ordre de l’ ´
Etat.
Identification du sens
=⇒
CONTEXTE suffisamment large
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Exemple
Question
De quel
chef
Domitien est-il le
successeur
?
g ´en ´eral h ´eritier
empereur succ ´eder
. . . .
cuisinier remplac¸ant
cheveu succ ´edan ´e
. . . .
Document contenant le r ´eponse : article Domitien
Second fils de Vespasien, il
succ ´eda
`a l’
empereur
Titus
et
poursuivit la remise en ordre de l’ ´
Etat.
Identification du sens
=⇒
CONTEXTE suffisamment large
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Exemple
Question
De quel
chef
Domitien est-il le
successeur
?
g ´en ´eral h ´eritier
empereur succ ´eder
. . . .
cuisinier remplac¸ant
cheveu succ ´edan ´e
. . . .
Document contenant le r ´eponse : article Domitien
Second fils de Vespasien, il
succ ´eda
`a l’
empereur
Titus
et
poursuivit la remise en ordre de l’ ´
Etat.
Identification du sens
=⇒
CONTEXTE suffisamment large
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Exemple
Question
De quel
chef
Domitien est-il le
successeur
?
g ´en ´eral h ´eritier
empereur succ ´eder
. . . .
cuisinier remplac¸ant
cheveu succ ´edan ´e
. . . .
Document contenant le r ´eponse : article Domitien
Second fils de Vespasien, il
succ ´eda
`a l’
empereur
Titus
et
poursuivit la remise en ordre de l’ ´
Etat.
Identification du sens
=⇒
CONTEXTE suffisamment large
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Exemple
Question
De quel
chef
Domitien est-il le
successeur
?
g ´en ´eral h ´eritier
empereur succ ´eder
. . . .
cuisinier remplac¸ant
cheveu succ ´edan ´e
. . . .
Document contenant le r ´eponse : article Domitien
Second fils de Vespasien, il
succ ´eda
`a l’
empereur
Titus
et
poursuivit la remise en ordre de l’ ´
Etat.
Identification du sens
=⇒
CONTEXTE suffisamment large
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Approche propos ´ee
Principe g ´en ´eral suivi
«
Chercher un sens plut ˆot qu’un mot
»
l’information ´etudi ´ee est constitu ´ee
du sens des mots significatifs et de leur caract ´eristiques s ´emantiques
des relations entre les ´el ´ements informatifs
de toute paraphrase permettant de transformer la forme sans trop modifier le sens
l’information recherch ´ee se compose
des sens des mots et de leurs relations dans la requ ˆete de la cat ´egorisation de l’objet de la requ ˆete
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Approche propos ´ee
Principe g ´en ´eral suivi
«
Chercher un sens plut ˆot qu’un mot
»
l’information ´etudi ´ee est constitu ´ee
du sens des mots significatifs et de leur caract ´eristiques s ´emantiques
des relations entre les ´el ´ements informatifs
de toute paraphrase permettant de transformer la forme sans trop modifier le sens
l’information recherch ´ee se compose
des sens des mots et de leurs relations dans la requ ˆete de la cat ´egorisation de l’objet de la requ ˆete
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Approche propos ´ee
Principe g ´en ´eral suivi
«
Chercher un sens plut ˆot qu’un mot
»
l’information ´etudi ´ee est constitu ´ee
du sens des mots significatifs et de leur caract ´eristiques s ´emantiques
des relations entre les ´el ´ements informatifs
de toute paraphrase permettant de transformer la forme sans trop modifier le sens
l’information recherch ´ee se compose
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Identifier les ´el ´ements d’une structure
Construction d’une structure informationnelle
identification de l’information des documents indexation de cette information documentaire
enrichissement de cette information pour la paraphraser au maximum sans pratiquement en modifier le sens
Identification de l’information
identification des ´el ´ements d’information : les mots significatifs
identification des relations entre les ´el ´ements d’information : les relations syntaxiques entre mots significatifs
identification de la signification des ´el ´ements
d’information : le sens des mots significatifs dans leur contexte
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Identifier les ´el ´ements d’une structure
Construction d’une structure informationnelle
identification de l’information des documents indexation de cette information documentaire
enrichissement de cette information pour la paraphraser au maximum sans pratiquement en modifier le sens
Identification de l’information
identification des ´el ´ements d’information : les mots significatifs
identification des relations entre les ´el ´ements d’information : les relations syntaxiques entre mots significatifs
identification de la signification des ´el ´ements
d’information : le sens des mots significatifs dans leur contexte
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Identification des mots
Analyseur morphologique
NTM(Normalizer - Tokenizer - Morphological analyzer )[A¨ıt-Mokhtar, 1998]
Son deuxi `eme fils [. . .]
Mot du texte lemme Analyse morphologique Traits ajout ´es
son son +PP3S+InvGen+SG+Poss
son son +Masc+SG+Noun+ +SOM+AGR
PP3S Pronom personnel 3 `eme sg MascMasculin
InvGenInvariable en genre SG Singulier
SG Singulier NounNom
Poss Possessif SOMRelatif au corps
AGR Agriculture
normalisation des mots (r `egles sous forme de transducteur) segmentation des mots (lexique sous forme de transducteur) analyse morphologique (transducteur `a deux ´etats)
possibilit ´es d’ajouts de donn ´ees aux lexiques ( ´etiquettes s ´emantiques)
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Identification des mots
Analyseur morphologique
NTM(Normalizer - Tokenizer - Morphological analyzer )[A¨ıt-Mokhtar, 1998]
Son deuxi `eme fils [. . .]
Mot du texte lemme Analyse morphologique Traits ajout ´es
son son +PP3S+InvGen+SG+Poss
son son +Masc+SG+Noun+ +SOM+AGR
PP3S Pronom personnel 3 `eme sg MascMasculin
InvGenInvariable en genre SG Singulier
SG Singulier NounNom
Poss Possessif SOMRelatif au corps
AGR Agriculture
normalisation des mots (r `egles sous forme de transducteur) segmentation des mots (lexique sous forme de transducteur) analyse morphologique (transducteur `a deux ´etats)
possibilit ´es d’ajouts de donn ´ees aux lexiques ( ´etiquettes s ´emantiques)
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Identification des mots
Analyseur morphologique
NTM(Normalizer - Tokenizer - Morphological analyzer )[A¨ıt-Mokhtar, 1998]
Son
deuxi `eme fils [. . .]
Mot du texte lemme Analyse morphologique Traits ajout ´es
son son +PP3S+InvGen+SG+Poss
son son +Masc+SG+Noun+ +SOM+AGR
PP3S Pronom personnel 3 `eme sg MascMasculin
InvGenInvariable en genre SG Singulier
SG Singulier NounNom
Poss Possessif SOMRelatif au corps
AGR Agriculture
normalisation des mots (r `egles sous forme de transducteur) segmentation des mots (lexique sous forme de transducteur) analyse morphologique (transducteur `a deux ´etats)
possibilit ´es d’ajouts de donn ´ees aux lexiques ( ´etiquettes s ´emantiques)
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Identification des mots
Analyseur morphologique
NTM(Normalizer - Tokenizer - Morphological analyzer )[A¨ıt-Mokhtar, 1998]
Son
deuxi `eme fils [. . .]
Mot du texte lemme Analyse morphologique Traits ajout ´es
son son +PP3S+InvGen+SG+Poss
son son +Masc+SG+Noun+ +SOM+AGR
PP3S Pronom personnel 3 `eme sg MascMasculin
InvGenInvariable en genre SG Singulier
SG Singulier NounNom
Poss Possessif SOMRelatif au corps
AGR Agriculture
normalisation des mots (r `egles sous forme de transducteur) segmentation des mots (lexique sous forme de transducteur) analyse morphologique (transducteur `a deux ´etats)
possibilit ´es d’ajouts de donn ´ees aux lexiques ( ´etiquettes s ´emantiques)
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Identification des mots
Analyseur morphologique
NTM(Normalizer - Tokenizer - Morphological analyzer )[A¨ıt-Mokhtar, 1998]
Son
deuxi `eme fils [. . .]
Mot du texte lemme Analyse morphologique Traits ajout ´es
son son +PP3S+InvGen+SG+Poss
son son +Masc+SG+Noun+ +SOM+AGR
PP3S Pronom personnel 3 `eme sg MascMasculin
InvGenInvariable en genre SG Singulier
SG Singulier NounNom
Poss Possessif SOMRelatif au corps
AGR Agriculture
normalisation des mots (r `egles sous forme de transducteur) segmentation des mots (lexique sous forme de transducteur) analyse morphologique (transducteur `a deux ´etats)
possibilit ´es d’ajouts de donn ´ees aux lexiques ( ´etiquettes s ´emantiques)
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Identification des mots
Analyseur morphologique
NTM(Normalizer - Tokenizer - Morphological analyzer )[A¨ıt-Mokhtar, 1998]
Son
deuxi `eme fils [. . .]
Mot du texte lemme Analyse morphologique Traits ajout ´es
son son +PP3S+InvGen+SG+Poss
son son +Masc+SG+Noun+ +SOM+AGR
PP3S Pronom personnel 3 `eme sg MascMasculin
InvGenInvariable en genre SG Singulier
SG Singulier NounNom
Poss Possessif SOMRelatif au corps
AGR Agriculture
normalisation des mots (r `egles sous forme de transducteur) segmentation des mots (lexique sous forme de transducteur) analyse morphologique (transducteur `a deux ´etats)
possibilit ´es d’ajouts de donn ´ees aux lexiques ( ´etiquettes s ´emantiques)
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Dictionnaire
«
Dubois
»
: ´etiquettes
s ´emantiques
Exemple : abaisser 01
Domaine locatif, lieux
Classe Transformation, changement - Sujet anim ´e - Circons-tanciel ”avec”
Op ´erateur rendre quelque chose bas ou devenir bas
Sens baisser, descendre
Exemple On abaisse le rideau de fer, le store. Le rideau s’abaisse vers le bas
Conjugaison 1econjugaison - paradigme : pleurer - auxiliaire avoir Construction Transitif direct - Sujet humain - COD inanim ´e -
Cir-constanciel instrumental
D ´eriv ´es adjectifs en -ant (abaissant) - noms en -ment (abais-sement) et en -eur (abaisseur )
Nom d ´eriv ´e pr ´efix ´e `a partir de baisse Lexique dictionnaire de base 15 000 mots
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Dictionnaire
«
Dubois
»
: ´etiquettes
s ´emantiques
Exemple : abaisser 01
Domaine locatif, lieuxClasse Transformation, changement - Sujet anim ´e - Circons-tanciel ”avec”
Op ´erateur rendre quelque chose bas ou devenir bas
Sens baisser, descendre
Exemple On abaisse le rideau de fer, le store. Le rideau s’abaisse vers le bas
Conjugaison 1econjugaison - paradigme : pleurer - auxiliaire avoir Construction Transitif direct - Sujet humain - COD inanim ´e -
Cir-constanciel instrumental
D ´eriv ´es adjectifs en -ant (abaissant) - noms en -ment (abais-sement) et en -eur (abaisseur )
Nom d ´eriv ´e pr ´efix ´e `a partir de baisse Lexique dictionnaire de base 15 000 mots
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Dictionnaire
«
Dubois
»
: ´etiquettes
s ´emantiques
Exemple : abaisser 01
Domaine
locatif, lieux Classe
Transformation, changement - Sujet anim ´e - Circons-tanciel ”avec”
Op ´erateur rendre quelque chose bas ou devenir bas
Sens baisser, descendre
Exemple On abaisse le rideau de fer, le store. Le rideau s’abaisse vers le bas
Conjugaison 1econjugaison - paradigme : pleurer - auxiliaire avoir
Construction Transitif direct - Sujet humain - COD inanim ´e - Cir-constanciel instrumental
D ´eriv ´es adjectifs en -ant (abaissant) - noms en -ment (abais-sement) et en -eur (abaisseur )
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Identification des relations
Analyseur syntaxique
XIP(Xerox Incremental Parser )[Roux, 1999]
´
Enonc ´e :
«
Il reconstruisit Rome ruin ´ee par les incendies.
»
Extraction de
DEPENDANCES´
:
SUBJ(reconstruisit,Il) 2e argument sujet du 1er argument
SUBJ(ruin´ee,incendies)
VMOD[INDIR](ruin´ee,par,incendies) 3e argument compl. agent 1er argument
VARG[DIR](reconstruisit,Rome) 2e argument COD du 1er argument
NMOD[ADJ](Rome,ruin´ee) 2e argument ´epith `ete du 1er argument
XIP effectue un d ´ecoupage du texte en syntagmes minimaux, que nous n’exploitons pas
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Identification des relations
Analyseur syntaxique
XIP(Xerox Incremental Parser )[Roux, 1999]
´
Enonc ´e :
«
Il reconstruisit Rome ruin ´ee par les incendies.
»
Extraction de
DEPENDANCES´
:
SUBJ(reconstruisit,Il) 2e argument sujet du 1er argument
SUBJ(ruin´ee,incendies)
VMOD[INDIR](ruin´ee,par,incendies) 3e argument compl. agent 1er argument
VARG[DIR](reconstruisit,Rome) 2e argument COD du 1er argument
NMOD[ADJ](Rome,ruin´ee) 2e argument ´epith `ete du 1er argument
XIP effectue un d ´ecoupage du texte en syntagmes minimaux, que nous n’exploitons pas
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Identification des relations
Analyseur syntaxique
XIP(Xerox Incremental Parser )[Roux, 1999]
´
Enonc ´e :
«
Il reconstruisit Rome ruin ´ee par les incendies.
»
Extraction de
DEPENDANCES´
:
SUBJ(reconstruisit,Il) 2e argument sujet du 1er argument
SUBJ(ruin´ee,incendies)
VMOD[INDIR](ruin´ee,par,incendies) 3e argument compl. agent 1er argument
VARG[DIR](reconstruisit,Rome) 2e argument COD du 1er argument
NMOD[ADJ](Rome,ruin´ee) 2e argument ´epith `ete du 1er argument
XIP effectue un d ´ecoupage du texte en syntagmes minimaux, que nous n’exploitons pas
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Identification des relations
Analyseur syntaxique
XIP(Xerox Incremental Parser )[Roux, 1999]
´
Enonc ´e :
«
Il reconstruisit Rome ruin ´ee par les incendies.
»
Extraction de
DEPENDANCES´
:
SUBJ(reconstruisit,Il) 2e argument sujet du 1er argument
SUBJ(ruin´ee,incendies)
VMOD[INDIR](ruin´ee,par,incendies) 3e argument compl. agent 1er argument
VARG[DIR](reconstruisit,Rome) 2e argument COD du 1er argument
NMOD[ADJ](Rome,ruin´ee) 2e argument ´epith `ete du 1er argument
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Identification du sens des mots
Utilisation d’un d ´esambigu¨ısateur s ´emantique pour
identifier le sens des mots polys ´emiques dans les documents
un syst `eme informatique voit des ambigu¨ıt ´es l `a o `u un humain les r ´esout (ambigu¨ıt ´e art ´efactuelle) : il remporte [la victoire / les
assiettes]
importance du contexte syntaxique
utilisation efficace de dictionnaires et de corpus ´etiquet ´es
permettre un enrichissement focalis ´e sur le sens des mots
⇒
besoin d’informations lexicales riches et coh ´erentes
Extraction des r `egles `a partir d’un dictionnaire
(choix dusens selon le contexte syntaxico-s ´emantique)
sch ´ema syntaxique (syntaxe uniquement) il boit – il boit de l’eau sch ´ema syntaxico-s ´emantique (syntaxe et s ´emantique) embrasser
quelqu’un6=embrasser quelque chose
analyse syntaxique d’un exemple (lexique et syntaxe)
VARG[DIR](remporter,victoire)
g ´en ´eralisation de l’analyse d’un exemple (syntaxe et s ´emantique)
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Identification du sens des mots
Utilisation d’un d ´esambigu¨ısateur s ´emantique pour
identifier le sens des mots polys ´emiques dans les documents
un syst `eme informatique voit des ambigu¨ıt ´es l `a o `u un humain les r ´esout (ambigu¨ıt ´e art ´efactuelle) : il remporte [la victoire / les
assiettes]
importance du contexte syntaxique
utilisation efficace de dictionnaires et de corpus ´etiquet ´es
permettre un enrichissement focalis ´e sur le sens des mots
⇒
besoin d’informations lexicales riches et coh ´erentes
Extraction des r `egles `a partir d’un dictionnaire
(choix dusens selon le contexte syntaxico-s ´emantique)
sch ´ema syntaxique (syntaxe uniquement) il boit – il boit de l’eau sch ´ema syntaxico-s ´emantique (syntaxe et s ´emantique) embrasser
quelqu’un6=embrasser quelque chose
analyse syntaxique d’un exemple (lexique et syntaxe)
VARG[DIR](remporter,victoire)
g ´en ´eralisation de l’analyse d’un exemple (syntaxe et s ´emantique)
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Identification du sens des mots
Utilisation d’un d ´esambigu¨ısateur s ´emantique pour
identifier le sens des mots polys ´emiques dans les documents
un syst `eme informatique voit des ambigu¨ıt ´es l `a o `u un humain les r ´esout (ambigu¨ıt ´e art ´efactuelle) : il remporte [la victoire / les
assiettes]
importance du contexte syntaxique
utilisation efficace de dictionnaires et de corpus ´etiquet ´es
permettre un enrichissement focalis ´e sur le sens des mots
⇒
besoin d’informations lexicales riches et coh ´erentes
Extraction des r `egles `a partir d’un dictionnaire
(choix dusens selon le contexte syntaxico-s ´emantique)
sch ´ema syntaxique (syntaxe uniquement) il boit – il boit de l’eau sch ´ema syntaxico-s ´emantique (syntaxe et s ´emantique) embrasser
quelqu’un6=embrasser quelque chose
analyse syntaxique d’un exemple (lexique et syntaxe)
VARG[DIR](remporter,victoire)
g ´en ´eralisation de l’analyse d’un exemple (syntaxe et s ´emantique)
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Identification du sens des mots
Utilisation d’un d ´esambigu¨ısateur s ´emantique pour
identifier le sens des mots polys ´emiques dans les documents
un syst `eme informatique voit des ambigu¨ıt ´es l `a o `u un humain les r ´esout (ambigu¨ıt ´e art ´efactuelle) : il remporte [la victoire / les
assiettes]
importance du contexte syntaxique
utilisation efficace de dictionnaires et de corpus ´etiquet ´es
permettre un enrichissement focalis ´e sur le sens des mots
⇒
besoin d’informations lexicales riches et coh ´erentes
Extraction des r `egles `a partir d’un dictionnaire
(choix dusens selon le contexte syntaxico-s ´emantique)
sch ´ema syntaxique (syntaxe uniquement) il boit – il boit de l’eau sch ´ema syntaxico-s ´emantique (syntaxe et s ´emantique) embrasser
quelqu’un6=embrasser quelque chose
analyse syntaxique d’un exemple (lexique et syntaxe)
VARG[DIR](remporter,victoire)
g ´en ´eralisation de l’analyse d’un exemple (syntaxe et s ´emantique)
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Identification du sens des mots
Utilisation d’un d ´esambigu¨ısateur s ´emantique pour
identifier le sens des mots polys ´emiques dans les documents
un syst `eme informatique voit des ambigu¨ıt ´es l `a o `u un humain les r ´esout (ambigu¨ıt ´e art ´efactuelle) : il remporte [la victoire / les
assiettes]
importance du contexte syntaxique
utilisation efficace de dictionnaires et de corpus ´etiquet ´es
permettre un enrichissement focalis ´e sur le sens des mots
⇒
besoin d’informations lexicales riches et coh ´erentes
Extraction des r `egles `a partir d’un dictionnaire
(choix dusens selon le contexte syntaxico-s ´emantique)
sch ´ema syntaxique (syntaxe uniquement) il boit – il boit de l’eau sch ´ema syntaxico-s ´emantique (syntaxe et s ´emantique) embrasser
quelqu’un6=embrasser quelque chose
analyse syntaxique d’un exemple (lexique et syntaxe)
VARG[DIR](remporter,victoire)
g ´en ´eralisation de l’analyse d’un exemple (syntaxe et s ´emantique)
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Identification du sens des mots
Utilisation d’un d ´esambigu¨ısateur s ´emantique pour
identifier le sens des mots polys ´emiques dans les documents
un syst `eme informatique voit des ambigu¨ıt ´es l `a o `u un humain les r ´esout (ambigu¨ıt ´e art ´efactuelle) : il remporte [la victoire / les
assiettes]
importance du contexte syntaxique
utilisation efficace de dictionnaires et de corpus ´etiquet ´es
permettre un enrichissement focalis ´e sur le sens des mots
⇒
besoin d’informations lexicales riches et coh ´erentes
Extraction des r `egles `a partir d’un dictionnaire
(choix dusens selon le contexte syntaxico-s ´emantique)
sch ´ema syntaxique (syntaxe uniquement) il boit – il boit de l’eau sch ´ema syntaxico-s ´emantique (syntaxe et s ´emantique) embrasser
quelqu’un6=embrasser quelque chose
analyse syntaxique d’un exemple (lexique et syntaxe)
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Dictionnaire
«
Dubois
»
: champs
syntaxico-s ´emantiques
Exemple : abaisser 01
Domainelocatif, lieux Classe
Transformation, changement - Sujet anim ´e - Circons-tanciel ”avec”
Op ´erateur rendre quelque chose bas ou devenir bas
Sens baisser, descendre
Exemple
On abaisse le rideau de fer, le store. Le rideau s’abaisse vers le bas
Conjugaison 1econjugaison - paradigme : pleurer - auxiliaire avoir Construction
Transitif direct - Sujet humain - COD inanim ´e - Cir-constanciel instrumental
D ´eriv ´es adjectifs en -ant (abaissant) - noms en -ment (abais-sement) et en -eur (abaisseur )
Nom d ´eriv ´e pr ´efix ´e `a partir de baisse Lexique dictionnaire de base 15 000 mots
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Dictionnaire
«
Dubois
»
: champs
syntaxico-s ´emantiques
Exemple : abaisser 01
Domainelocatif, lieux Classe
Transformation, changement - Sujet anim ´e - Circons-tanciel ”avec”
Op ´erateur rendre quelque chose bas ou devenir bas
Sens baisser, descendre
Exemple
On abaisse le rideau de fer, le store. Le rideau s’abaisse vers le bas
Conjugaison 1econjugaison - paradigme : pleurer - auxiliaire avoir
Construction
Transitif direct - Sujet humain - COD inanim ´e -
Cir-constanciel instrumental
D ´eriv ´es adjectifs en -ant (abaissant) - noms en -ment (abais-sement) et en -eur (abaisseur )
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Dictionnaire
«
Dubois
»
: champs
syntaxico-s ´emantiques
Exemple : abaisser 01
Domainelocatif, lieux Classe
Transformation, changement - Sujet anim ´e - Circons-tanciel ”avec”
Op ´erateur rendre quelque chose bas ou devenir bas
Sens baisser, descendre
Exemple
On abaisse le rideau de fer, le store. Le rideau s’abaisse vers le bas
Conjugaison 1econjugaison - paradigme : pleurer - auxiliaire avoir
Construction
Transitif direct - Sujet humain - COD inanim ´e -
Cir-constanciel instrumental
D ´eriv ´es adjectifs en -ant (abaissant) - noms en -ment (abais-sement) et en -eur (abaisseur )
Nom d ´eriv ´e pr ´efix ´e `a partir de baisse Lexique dictionnaire de base 15 000 mots
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Dictionnaire
«
Dubois
»
: champs
syntaxico-s ´emantiques
Exemple : abaisser 01
Domainelocatif, lieux Classe
Transformation, changement - Sujet anim ´e - Circons-tanciel ”avec”
Op ´erateur rendre quelque chose bas ou devenir bas
Sens baisser, descendre
Exemple
On abaisse le rideau de fer, le store. Le rideau s’abaisse vers le bas
Conjugaison 1econjugaison - paradigme : pleurer - auxiliaire avoir Construction
Transitif direct - Sujet humain - COD inanim ´e - Cir-constanciel instrumental
D ´eriv ´es adjectifs en -ant (abaissant) - noms en -ment (abais-sement) et en -eur (abaisseur )
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Dictionnaire
«
Dubois
»
: champs
syntaxico-s ´emantiques
Exemple : abaisser 01
Domaine
locatif, lieux Classe
Transformation, changement - Sujet anim ´e - Circons-tanciel ”avec”
Op ´erateur rendre quelque chose bas ou devenir bas
Sens baisser, descendre
Exemple
On abaisse le rideau de fer, le store. Le rideau s’abaisse vers le bas
Conjugaison 1econjugaison - paradigme : pleurer - auxiliaire avoir Construction
Transitif direct - Sujet humain - COD inanim ´e - Cir-constanciel instrumental
D ´eriv ´es adjectifs en -ant (abaissant) - noms en -ment (abais-sement) et en -eur (abaisseur )
Nom d ´eriv ´e pr ´efix ´e `a partir de baisse Lexique dictionnaire de base 15 000 mots
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Dictionnaire
«
Dubois
»
: champs
syntaxico-s ´emantiques
Exemple : abaisser 01
Domaine
locatif, lieux Classe
Transformation, changement - Sujet anim ´e - Circons-tanciel ”avec”
Op ´erateur rendre quelque chose bas ou devenir bas
Sens baisser, descendre
Exemple
On abaisse le rideau de fer, le store. Le rideau s’abaisse vers le bas
Conjugaison 1econjugaison - paradigme : pleurer - auxiliaire avoir
Construction
Transitif direct - Sujet humain - COD inanim ´e -
Cir-constanciel instrumental
D ´eriv ´es adjectifs en -ant (abaissant) - noms en -ment (abais-sement) et en -eur (abaisseur )
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Construction des r `egles de d ´esambigu¨ısation
Si remporter est la cible de la d ´esambigu¨ısation et qu’il
poss `ede un objet direct qui porte le trait
MIL
(militaire),
alors le sens choisi est
«
gagner
»
remporter : VARG[DIR](remporter,[MIL]) ⇒ sens « gagner »
Information extraite du dictionnaire
«
Dubois
»
:
le verbe«remporter»au sens«gagner»(remporter une bataille)
sch ´ema syntaxique : verbe transitif direct
contrainte syntaxico-s ´emantique : objet direct de domaine MIL (militaire) issu de la g ´en ´eralisation de l’exemple On remporte la victoire sur ses adversaires
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Construction des r `egles de d ´esambigu¨ısation
Si remporter est la cible de la d ´esambigu¨ısation et qu’il
poss `ede un objet direct qui porte le trait
MIL
(militaire),
alors le sens choisi est
«
gagner
»
remporter : VARG[DIR](remporter,[MIL]) ⇒ sens « gagner »
Information extraite du dictionnaire
«
Dubois
»
:
le verbe«remporter»au sens«gagner»(remporter une bataille)
sch ´ema syntaxique : verbe transitif direct
contrainte syntaxico-s ´emantique : objet direct de domaine MIL (militaire) issu de la g ´en ´eralisation de l’exemple On remporte la victoire sur ses adversaires
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Construction des r `egles de d ´esambigu¨ısation
Si remporter est la cible de la d ´esambigu¨ısation et qu’il
poss `ede un objet direct qui porte le trait
MIL
(militaire),
alors le sens choisi est
«
gagner
»
remporter : VARG[DIR](remporter,[MIL]) ⇒ sens « gagner »
Information extraite du dictionnaire
«
Dubois
»
:
le verbe«remporter»au sens«gagner»(remporter une bataille)
sch ´ema syntaxique : verbe transitif direct
contrainte syntaxico-s ´emantique : objet direct de domaine MIL (militaire) issu de la g ´en ´eralisation de l’exemple On remporte la victoire sur ses adversaires
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Utilisation des r `egles de d ´esambigu¨ısation
Mode d’application des r `egles :
un ensemble de r `egles conditionnelles sous forme d’une grammaire XIP
exploitation du lexique identifi ´e apr `es la d ´esambigu¨ısation cat ´egorielle (remporter, victoire)
exploitation des d ´ependances de l’analyse syntaxique (VARG[DIR](remporter,victoire))
exploitation des traits s ´emantiques attach ´es au mots (victoire[MIL])
Information ajout ´ee par les r `egles :
Adjonction d’un trait de num ´ero de sens (correspondant `a l’acception s ´electionn ´ee) pour les mots d ´esambigu¨ıs ´es (remporter[NS2]: gagner)
Adjonction des traits s ´emantiques correspondant au sens choisi pour les mots d ´esambigu¨ıs ´es (remporter[MIL]: gagner) Une ambigu¨ıt ´e de sens peut subsister (remporter[NS2]un prix[SPO]ou remporter[NS3]un match[SPO])
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Utilisation des r `egles de d ´esambigu¨ısation
Mode d’application des r `egles :
un ensemble de r `egles conditionnelles sous forme d’une grammaire XIP
exploitation du lexique identifi ´e apr `es la d ´esambigu¨ısation cat ´egorielle (remporter, victoire)
exploitation des d ´ependances de l’analyse syntaxique (VARG[DIR](remporter,victoire))
exploitation des traits s ´emantiques attach ´es au mots (victoire[MIL])
Information ajout ´ee par les r `egles :
Adjonction d’un trait de num ´ero de sens (correspondant `a l’acception s ´electionn ´ee) pour les mots d ´esambigu¨ıs ´es (remporter[NS2]: gagner)
Adjonction des traits s ´emantiques correspondant au sens choisi pour les mots d ´esambigu¨ıs ´es (remporter[MIL]: gagner) Une ambigu¨ıt ´e de sens peut subsister (remporter[NS2]un prix[SPO]ou remporter[NS3]un match[SPO])
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Dictionnaire
«
Dubois
»
Exemple : abaisser 01
Domaine locatif, lieux ClasseTransformation, changement - Sujet anim ´e - Circonstanciel ”avec”
Op ´erateur rendre quelque chose bas ou devenir bas Sens
baisser, descendre Exemple
On abaisse le rideau de fer, le store. Le rideau s’abaisse vers le bas
Conjugaison 1econjugaison - paradigme : pleurer - auxiliaire avoir
Construction
Transitif direct - Sujet humain - COD inanim ´e - Circonstanciel instrumental
D ´eriv ´es
adjectifs en -ant (abaissant) - noms en -ment (abaissement) et en -eur (abaisseur )
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Dictionnaire
«
Dubois
»
Exemple : abaisser 01
Domaine locatif, lieux ClasseTransformation, changement - Sujet anim ´e - Circonstanciel ”avec”
Op ´erateur rendre quelque chose bas ou devenir bas
Sens
baisser, descendre
Exemple
On abaisse le rideau de fer, le store. Le rideau s’abaisse vers le bas
Conjugaison 1econjugaison - paradigme : pleurer - auxiliaire avoir
Construction
Transitif direct - Sujet humain - COD inanim ´e - Circonstanciel instrumental
D ´eriv ´es
adjectifs en -ant (abaissant) - noms en -ment (abaissement) et en -eur (abaisseur )
Nom
d ´eriv ´e pr ´efix ´e `a partir de baisse Lexique dictionnaire de base 15 000 mots
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Dictionnaire
«
Dubois
»
Exemple : abaisser 01
Domaine locatif, lieux ClasseTransformation, changement - Sujet anim ´e - Circonstanciel ”avec”
Op ´erateur rendre quelque chose bas ou devenir bas Sens
baisser, descendre Exemple
On abaisse le rideau de fer, le store. Le rideau s’abaisse vers le bas
Conjugaison 1econjugaison - paradigme : pleurer - auxiliaire avoir
Construction
Transitif direct - Sujet humain - COD inanim ´e - Circonstanciel instrumental
D ´eriv ´es
adjectifs en -ant (abaissant) - noms en -ment (abaissement) et en -eur (abaisseur )
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Dictionnaire
«
Dubois
»
Exemple : abaisser 01
Domaine locatif, lieux ClasseTransformation, changement - Sujet anim ´e - Circonstanciel ”avec”
Op ´erateur rendre quelque chose bas ou devenir bas
Sens
baisser, descendre
Exemple
On abaisse le rideau de fer, le store. Le rideau s’abaisse vers le bas
Conjugaison 1econjugaison - paradigme : pleurer - auxiliaire avoir
Construction
Transitif direct - Sujet humain - COD inanim ´e - Circonstanciel instrumental
D ´eriv ´es
adjectifs en -ant (abaissant) - noms en -ment (abaissement) et en -eur (abaisseur )
Nom
d ´eriv ´e pr ´efix ´e `a partir de baisse
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Apports d’autres ressources (1)
Un constat
Le dictionnaire Dubois manque de synonymes
Solution propos ´ee :
r ´ecup ´eration de listes dans Bailly, Memodata,
EuroWordNet
un synonyme suppl ´ementaire est ajout ´e `a un sens du
Dubois si les indices s ´emantiques du sens et du
synonyme correspondent
exemple
le mot ravir au sens voler
synonymes fournis par les autres dictionnaires : enlever et charmer
ravir : domaine = SOC ; classe = S4
enlever au sens n◦6 (priver de) : domaine = SOC ; classe = S4
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Apports d’autres ressources (1)
Un constat
Le dictionnaire Dubois manque de synonymes
Solution propos ´ee :
r ´ecup ´eration de listes dans Bailly, Memodata,
EuroWordNet
un synonyme suppl ´ementaire est ajout ´e `a un sens du
Dubois si les indices s ´emantiques du sens et du
synonyme correspondent
exemple
le mot ravir au sens voler
synonymes fournis par les autres dictionnaires : enlever et charmer
ravir : domaine = SOC ; classe = S4
enlever au sens n◦6 (priver de) : domaine = SOC ; classe = S4
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Apports d’autres ressources (1)
Un constat
Le dictionnaire Dubois manque de synonymes
Solution propos ´ee :
r ´ecup ´eration de listes dans Bailly, Memodata,
EuroWordNet
un synonyme suppl ´ementaire est ajout ´e `a un sens du
Dubois si les indices s ´emantiques du sens et du
synonyme correspondent
exemple
le mot ravir au sens voler
synonymes fournis par les autres dictionnaires : enlever et charmer
ravir : domaine = SOC ; classe = S4
enlever au sens n◦6 (priver de) : domaine = SOC ; classe = S4
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Apports d’autres ressources (1)
Un constat
Le dictionnaire Dubois manque de synonymes
Solution propos ´ee :
r ´ecup ´eration de listes dans Bailly, Memodata,
EuroWordNet
un synonyme suppl ´ementaire est ajout ´e `a un sens du
Dubois si les indices s ´emantiques du sens et du
synonyme correspondent
exemple
le mot ravir au sens voler
synonymes fournis par les autres dictionnaires : enlever et charmer
ravir : domaine = SOC ; classe = S4
enlever au sens n◦6 (priver de) : domaine = SOC ; classe = S4
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Apports d’autres ressources (1)
Un constat
Le dictionnaire Dubois manque de synonymes
Solution propos ´ee :
r ´ecup ´eration de listes dans Bailly, Memodata,
EuroWordNet
un synonyme suppl ´ementaire est ajout ´e `a un sens du
Dubois si les indices s ´emantiques du sens et du
synonyme correspondent
exemple
le mot ravir au sens voler
synonymes fournis par les autres dictionnaires : enlever et charmer
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Apports d’autres ressources (1)
Un constat
Le dictionnaire Dubois manque de synonymes
Solution propos ´ee :
r ´ecup ´eration de listes dans Bailly, Memodata,
EuroWordNet
un synonyme suppl ´ementaire est ajout ´e `a un sens du
Dubois si les indices s ´emantiques du sens et du
synonyme correspondent
exemple
le mot ravir au sens voler
synonymes fournis par les autres dictionnaires : enlever et charmer
ravir : domaine =SOC; classe =S4
enlever au sens n◦6 (priver de) : domaine =SOC; classe =S4
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Apports d’autres ressources (1)
Un constat
Le dictionnaire Dubois manque de synonymes
Solution propos ´ee :
r ´ecup ´eration de listes dans Bailly, Memodata,
EuroWordNet
un synonyme suppl ´ementaire est ajout ´e `a un sens du
Dubois si les indices s ´emantiques du sens et du
synonyme correspondent
exemple
le mot ravir au sens voler
synonymes fournis par les autres dictionnaires : enlever et charmer
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Apports d’autres ressources (2)
Un constat
L’information de d ´erivation ne suffit pas
Les contraintes de d ´erivation relient un d ´eriv ´e `a un sens particulier du mot original
le d ´eriv ´e coupant du verbe couper
correspond au sens trancher (n◦1)
ne correspond pas `a interrompre l’ ´electricit ´e (n◦12)
Les indications de d ´erivation du Dubois manquent de pr ´ecision
g ´en ´eration de d ´eriv ´es (existants) gr ˆace `a l’outil de [Gaussier99] ´elimination des inexistants gr ˆace au Dubois
distribution par sens des d ´eriv ´es gr ˆace auDubois
Pour le verbe«couper»
Formes g ´en ´er ´ees Instruction Dubois Num ´ero de sens Dubois
coup – suppression
coupure d ´eriv ´e nominal en -ure 1, 7, 9, 10,12, 14, 16 coupable – suppression
coupant adjectif verbal en -ant 1, 2
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Apports d’autres ressources (2)
Un constat
L’information de d ´erivation ne suffit pas
Les contraintes de d ´erivation relient un d ´eriv ´e `a un sens particulier du mot original
le d ´eriv ´e coupant du verbe couper
correspond au sens trancher (n◦1)
ne correspond pas `a interrompre l’ ´electricit ´e (n◦12)
Les indications de d ´erivation du Dubois manquent de pr ´ecision
g ´en ´eration de d ´eriv ´es (existants) gr ˆace `a l’outil de [Gaussier99] ´elimination des inexistants gr ˆace au Dubois
distribution par sens des d ´eriv ´es gr ˆace auDubois
Pour le verbe«couper»
Formes g ´en ´er ´ees Instruction Dubois Num ´ero de sens Dubois
coup – suppression
coupure d ´eriv ´e nominal en -ure 1, 7, 9, 10,12, 14, 16 coupable – suppression
coupant adjectif verbal en -ant 1, 2
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Apports d’autres ressources (2)
Un constat
L’information de d ´erivation ne suffit pas
Les contraintes de d ´erivation relient un d ´eriv ´e `a un sens particulier du mot original
le d ´eriv ´e coupant du verbe couper
correspond au sens trancher (n◦1)
ne correspond pas `a interrompre l’ ´electricit ´e (n◦12)
Les indications de d ´erivation du Dubois manquent de pr ´ecision
g ´en ´eration de d ´eriv ´es (existants) gr ˆace `a l’outil de [Gaussier99] ´elimination des inexistants gr ˆace au Dubois
distribution par sens des d ´eriv ´es gr ˆace auDubois
Pour le verbe«couper»
Formes g ´en ´er ´ees Instruction Dubois Num ´ero de sens Dubois
coup – suppression
coupure d ´eriv ´e nominal en -ure 1, 7, 9, 10,12, 14, 16 coupable – suppression
coupant adjectif verbal en -ant 1, 2
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Apports d’autres ressources (2)
Un constat
L’information de d ´erivation ne suffit pas
Les contraintes de d ´erivation relient un d ´eriv ´e `a un sens particulier du mot original
le d ´eriv ´e coupant du verbe couper
correspond au sens trancher (n◦1)
ne correspond pas `a interrompre l’ ´electricit ´e (n◦12)
Les indications de d ´erivation du Dubois manquent de pr ´ecision
g ´en ´eration de d ´eriv ´es (existants) gr ˆace `a l’outil de [Gaussier99] ´elimination des inexistants gr ˆace au Dubois
distribution par sens des d ´eriv ´es gr ˆace auDubois
Pour le verbe«couper»
Formes g ´en ´er ´ees Instruction Dubois Num ´ero de sens Dubois
coup – suppression
coupure d ´eriv ´e nominal en -ure 1, 7, 9, 10,12, 14, 16 coupable – suppression
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Construction de la structure
Squelette de la structure informationnelle : les r ´esultats
des analyses
unit ´es lexicales relations syntaxiques
traits morphologiques, syntaxiques et s ´emantiques
Enrichissement synonymique
construction de d ´ependances disjonctives (lemme/synonyme)
Enrichissement par d ´erivation morphologique
contrainte
identification des d ´eriv ´es possibles transformation de la structure syntaxique
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Construction de la structure
Squelette de la structure informationnelle : les r ´esultats
des analyses
unit ´es lexicales relations syntaxiques
traits morphologiques, syntaxiques et s ´emantiques
Enrichissement synonymique
construction de d ´ependances disjonctives (lemme/synonyme)
Enrichissement par d ´erivation morphologique
contrainte
identification des d ´eriv ´es possibles transformation de la structure syntaxique
Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion
Construction de la structure
Squelette de la structure informationnelle : les r ´esultats
des analyses
unit ´es lexicales relations syntaxiques
traits morphologiques, syntaxiques et s ´emantiques
Enrichissement synonymique
construction de d ´ependances disjonctives (lemme/synonyme)
Enrichissement par d ´erivation morphologique
contrainte
identification des d ´eriv ´es possibles transformation de la structure syntaxique