• Aucun résultat trouvé

Interroger un corpus par le sens

N/A
N/A
Protected

Academic year: 2021

Partager "Interroger un corpus par le sens"

Copied!
82
0
0

Texte intégral

(1)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Interroger un corpus par le sens

Une approche linguistique

Bernard JACQUEMIN

Institut des Sciences Cognitives CNRS – UMR 5015 67, boulevard Pinel 69675 Bron (France) Bernard.Jacquemin@isc.cnrs.fr

(2)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Probl ´ematique

La probl ´ematique

Trouver une information pr ´ecise dans un corpus textuel

Des difficult ´es

Une profusion de documents textuels ing ´erable

Un manque de structure dans l’information qu’ils contiennent

Des disciplines concern ´ees

Extraction d’information : requ ˆete g ´en ´eralement

pr ´ed ´etermin ´ee, r ´eponse conforme `a un champ informationnel Question-r ´eponse : question factuelle et ponctuelle, r ´eponse atomique / dans une phrase / reformul ´ee

Des solutions apport ´ees par plusieurs disciplines

Utiliser des mots-clefs et des index (Google. . .) Expansion de la requ ˆete (synonymes, hyp ´eronymes, d ´eriv ´es. . .)

Des m ´ethodes linguistiques marginales (morphologie, ontologies. . .)

(3)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Probl ´ematique

La probl ´ematique

Trouver une information pr ´ecise dans un corpus textuel

Des difficult ´es

Une profusion de documents textuels ing ´erable

Un manque de structure dans l’information qu’ils contiennent

Des disciplines concern ´ees

Extraction d’information : requ ˆete g ´en ´eralement

pr ´ed ´etermin ´ee, r ´eponse conforme `a un champ informationnel Question-r ´eponse : question factuelle et ponctuelle, r ´eponse atomique / dans une phrase / reformul ´ee

Des solutions apport ´ees par plusieurs disciplines

Utiliser des mots-clefs et des index (Google. . .) Expansion de la requ ˆete (synonymes, hyp ´eronymes, d ´eriv ´es. . .)

Des m ´ethodes linguistiques marginales (morphologie, ontologies. . .)

(4)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Probl ´ematique

La probl ´ematique

Trouver une information pr ´ecise dans un corpus textuel

Des difficult ´es

Une profusion de documents textuels ing ´erable

Un manque de structure dans l’information qu’ils contiennent

Des disciplines concern ´ees

Extraction d’information : requ ˆete g ´en ´eralement

pr ´ed ´etermin ´ee, r ´eponse conforme `a un champ informationnel Question-r ´eponse : question factuelle et ponctuelle, r ´eponse atomique / dans une phrase / reformul ´ee

Des solutions apport ´ees par plusieurs disciplines

Utiliser des mots-clefs et des index (Google. . .) Expansion de la requ ˆete (synonymes, hyp ´eronymes, d ´eriv ´es. . .)

Des m ´ethodes linguistiques marginales (morphologie, ontologies. . .)

(5)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Probl ´ematique

La probl ´ematique

Trouver une information pr ´ecise dans un corpus textuel

Des difficult ´es

Une profusion de documents textuels ing ´erable

Un manque de structure dans l’information qu’ils contiennent

Des disciplines concern ´ees

Extraction d’information : requ ˆete g ´en ´eralement

pr ´ed ´etermin ´ee, r ´eponse conforme `a un champ informationnel Question-r ´eponse : question factuelle et ponctuelle, r ´eponse atomique / dans une phrase / reformul ´ee

Des solutions apport ´ees par plusieurs disciplines

Utiliser des mots-clefs et des index (Google. . .) Expansion de la requ ˆete (synonymes, hyp ´eronymes, d ´eriv ´es. . .)

Des m ´ethodes linguistiques marginales (morphologie, ontologies. . .)

(6)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Probl ´ematique

La probl ´ematique

Trouver une information pr ´ecise dans un corpus textuel

Des difficult ´es

Une profusion de documents textuels ing ´erable

Un manque de structure dans l’information qu’ils contiennent

Des disciplines concern ´ees

Extraction d’information : requ ˆete g ´en ´eralement

pr ´ed ´etermin ´ee, r ´eponse conforme `a un champ informationnel Question-r ´eponse : question factuelle et ponctuelle, r ´eponse atomique / dans une phrase / reformul ´ee

Des solutions apport ´ees par plusieurs disciplines

Utiliser des mots-clefs et des index (Google. . .) Expansion de la requ ˆete (synonymes, hyp ´eronymes, d ´eriv ´es. . .)

Des m ´ethodes linguistiques marginales (morphologie, ontologies. . .)

(7)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Probl ´ematique

La probl ´ematique

Trouver une information pr ´ecise dans un corpus textuel

Des difficult ´es

Une profusion de documents textuels ing ´erable

Un manque de structure dans l’information qu’ils contiennent

Des disciplines concern ´ees

Extraction d’information : requ ˆete g ´en ´eralement

pr ´ed ´etermin ´ee, r ´eponse conforme `a un champ informationnel Question-r ´eponse : question factuelle et ponctuelle, r ´eponse atomique / dans une phrase / reformul ´ee

Des solutions apport ´ees par plusieurs disciplines

Utiliser des mots-clefs et des index (Google. . .) Expansion de la requ ˆete (synonymes, hyp ´eronymes, d ´eriv ´es. . .)

Des m ´ethodes linguistiques marginales (morphologie, ontologies. . .)

(8)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Probl ´ematique

La probl ´ematique

Trouver une information pr ´ecise dans un corpus textuel

Des difficult ´es

Une profusion de documents textuels ing ´erable

Un manque de structure dans l’information qu’ils contiennent

Des disciplines concern ´ees

Extraction d’information : requ ˆete g ´en ´eralement

pr ´ed ´etermin ´ee, r ´eponse conforme `a un champ informationnel Question-r ´eponse : question factuelle et ponctuelle, r ´eponse atomique / dans une phrase / reformul ´ee

Des solutions apport ´ees par plusieurs disciplines

Utiliser des mots-clefs et des index (Google. . .) Expansion de la requ ˆete (synonymes, hyp ´eronymes, d ´eriv ´es. . .)

Des m ´ethodes linguistiques marginales (morphologie, ontologies. . .)

(9)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Exemple

Question

De quel chef Domitien est-il le successeur ?

g ´en ´eral h ´eritier

empereur succ ´eder

. . . .

cuisinier remplac¸ant

cheveu succ ´edan ´e

. . . .

Document contenant le r ´eponse : article Domitien

Second fils de Vespasien, il

succ ´eda

`a l’

empereur

Titus

et

poursuivit la remise en ordre de l’ ´

Etat.

Identification du sens

=⇒

CONTEXTE suffisamment large

(10)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Exemple

Question

De quel

chef

Domitien est-il le

successeur

?

g ´en ´eral h ´eritier

empereur succ ´eder

. . . .

cuisinier remplac¸ant

cheveu succ ´edan ´e

. . . .

Document contenant le r ´eponse : article Domitien

Second fils de Vespasien, il

succ ´eda

`a l’

empereur

Titus

et

poursuivit la remise en ordre de l’ ´

Etat.

Identification du sens

=⇒

CONTEXTE suffisamment large

(11)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Exemple

Question

De quel

chef

Domitien est-il le

successeur

?

g ´en ´eral h ´eritier

empereur succ ´eder

. . . .

cuisinier remplac¸ant

cheveu succ ´edan ´e

. . . .

Document contenant le r ´eponse : article Domitien

Second fils de Vespasien, il

succ ´eda

`a l’

empereur

Titus

et

poursuivit la remise en ordre de l’ ´

Etat.

Identification du sens

=⇒

CONTEXTE suffisamment large

(12)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Exemple

Question

De quel

chef

Domitien est-il le

successeur

?

g ´en ´eral h ´eritier

empereur succ ´eder

. . . .

cuisinier remplac¸ant

cheveu succ ´edan ´e

. . . .

Document contenant le r ´eponse : article Domitien

Second fils de Vespasien, il

succ ´eda

`a l’

empereur

Titus

et

poursuivit la remise en ordre de l’ ´

Etat.

Identification du sens

=⇒

CONTEXTE suffisamment large

(13)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Exemple

Question

De quel

chef

Domitien est-il le

successeur

?

g ´en ´eral h ´eritier

empereur succ ´eder

. . . .

cuisinier remplac¸ant

cheveu succ ´edan ´e

. . . .

Document contenant le r ´eponse : article Domitien

Second fils de Vespasien, il

succ ´eda

`a l’

empereur

Titus

et

poursuivit la remise en ordre de l’ ´

Etat.

Identification du sens

=⇒

CONTEXTE suffisamment large

(14)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Exemple

Question

De quel

chef

Domitien est-il le

successeur

?

g ´en ´eral h ´eritier

empereur succ ´eder

. . . .

cuisinier remplac¸ant

cheveu succ ´edan ´e

. . . .

Document contenant le r ´eponse : article Domitien

Second fils de Vespasien, il

succ ´eda

`a l’

empereur

Titus

et

poursuivit la remise en ordre de l’ ´

Etat.

Identification du sens

=⇒

CONTEXTE suffisamment large

(15)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Approche propos ´ee

Principe g ´en ´eral suivi

«

Chercher un sens plut ˆot qu’un mot

»

l’information ´etudi ´ee est constitu ´ee

du sens des mots significatifs et de leur caract ´eristiques s ´emantiques

des relations entre les ´el ´ements informatifs

de toute paraphrase permettant de transformer la forme sans trop modifier le sens

l’information recherch ´ee se compose

des sens des mots et de leurs relations dans la requ ˆete de la cat ´egorisation de l’objet de la requ ˆete

(16)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Approche propos ´ee

Principe g ´en ´eral suivi

«

Chercher un sens plut ˆot qu’un mot

»

l’information ´etudi ´ee est constitu ´ee

du sens des mots significatifs et de leur caract ´eristiques s ´emantiques

des relations entre les ´el ´ements informatifs

de toute paraphrase permettant de transformer la forme sans trop modifier le sens

l’information recherch ´ee se compose

des sens des mots et de leurs relations dans la requ ˆete de la cat ´egorisation de l’objet de la requ ˆete

(17)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Approche propos ´ee

Principe g ´en ´eral suivi

«

Chercher un sens plut ˆot qu’un mot

»

l’information ´etudi ´ee est constitu ´ee

du sens des mots significatifs et de leur caract ´eristiques s ´emantiques

des relations entre les ´el ´ements informatifs

de toute paraphrase permettant de transformer la forme sans trop modifier le sens

l’information recherch ´ee se compose

(18)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

(19)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Identifier les ´el ´ements d’une structure

Construction d’une structure informationnelle

identification de l’information des documents indexation de cette information documentaire

enrichissement de cette information pour la paraphraser au maximum sans pratiquement en modifier le sens

Identification de l’information

identification des ´el ´ements d’information : les mots significatifs

identification des relations entre les ´el ´ements d’information : les relations syntaxiques entre mots significatifs

identification de la signification des ´el ´ements

d’information : le sens des mots significatifs dans leur contexte

(20)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Identifier les ´el ´ements d’une structure

Construction d’une structure informationnelle

identification de l’information des documents indexation de cette information documentaire

enrichissement de cette information pour la paraphraser au maximum sans pratiquement en modifier le sens

Identification de l’information

identification des ´el ´ements d’information : les mots significatifs

identification des relations entre les ´el ´ements d’information : les relations syntaxiques entre mots significatifs

identification de la signification des ´el ´ements

d’information : le sens des mots significatifs dans leur contexte

(21)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Identification des mots

Analyseur morphologique

NTM(Normalizer - Tokenizer - Morphological analyzer )[A¨ıt-Mokhtar, 1998]

Son deuxi `eme fils [. . .]

Mot du texte lemme Analyse morphologique Traits ajout ´es

son son +PP3S+InvGen+SG+Poss

son son +Masc+SG+Noun+ +SOM+AGR

PP3S Pronom personnel 3 `eme sg MascMasculin

InvGenInvariable en genre SG Singulier

SG Singulier NounNom

Poss Possessif SOMRelatif au corps

AGR Agriculture

normalisation des mots (r `egles sous forme de transducteur) segmentation des mots (lexique sous forme de transducteur) analyse morphologique (transducteur `a deux ´etats)

possibilit ´es d’ajouts de donn ´ees aux lexiques ( ´etiquettes s ´emantiques)

(22)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Identification des mots

Analyseur morphologique

NTM(Normalizer - Tokenizer - Morphological analyzer )[A¨ıt-Mokhtar, 1998]

Son deuxi `eme fils [. . .]

Mot du texte lemme Analyse morphologique Traits ajout ´es

son son +PP3S+InvGen+SG+Poss

son son +Masc+SG+Noun+ +SOM+AGR

PP3S Pronom personnel 3 `eme sg MascMasculin

InvGenInvariable en genre SG Singulier

SG Singulier NounNom

Poss Possessif SOMRelatif au corps

AGR Agriculture

normalisation des mots (r `egles sous forme de transducteur) segmentation des mots (lexique sous forme de transducteur) analyse morphologique (transducteur `a deux ´etats)

possibilit ´es d’ajouts de donn ´ees aux lexiques ( ´etiquettes s ´emantiques)

(23)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Identification des mots

Analyseur morphologique

NTM(Normalizer - Tokenizer - Morphological analyzer )[A¨ıt-Mokhtar, 1998]

Son

deuxi `eme fils [. . .]

Mot du texte lemme Analyse morphologique Traits ajout ´es

son son +PP3S+InvGen+SG+Poss

son son +Masc+SG+Noun+ +SOM+AGR

PP3S Pronom personnel 3 `eme sg MascMasculin

InvGenInvariable en genre SG Singulier

SG Singulier NounNom

Poss Possessif SOMRelatif au corps

AGR Agriculture

normalisation des mots (r `egles sous forme de transducteur) segmentation des mots (lexique sous forme de transducteur) analyse morphologique (transducteur `a deux ´etats)

possibilit ´es d’ajouts de donn ´ees aux lexiques ( ´etiquettes s ´emantiques)

(24)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Identification des mots

Analyseur morphologique

NTM(Normalizer - Tokenizer - Morphological analyzer )[A¨ıt-Mokhtar, 1998]

Son

deuxi `eme fils [. . .]

Mot du texte lemme Analyse morphologique Traits ajout ´es

son son +PP3S+InvGen+SG+Poss

son son +Masc+SG+Noun+ +SOM+AGR

PP3S Pronom personnel 3 `eme sg MascMasculin

InvGenInvariable en genre SG Singulier

SG Singulier NounNom

Poss Possessif SOMRelatif au corps

AGR Agriculture

normalisation des mots (r `egles sous forme de transducteur) segmentation des mots (lexique sous forme de transducteur) analyse morphologique (transducteur `a deux ´etats)

possibilit ´es d’ajouts de donn ´ees aux lexiques ( ´etiquettes s ´emantiques)

(25)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Identification des mots

Analyseur morphologique

NTM(Normalizer - Tokenizer - Morphological analyzer )[A¨ıt-Mokhtar, 1998]

Son

deuxi `eme fils [. . .]

Mot du texte lemme Analyse morphologique Traits ajout ´es

son son +PP3S+InvGen+SG+Poss

son son +Masc+SG+Noun+ +SOM+AGR

PP3S Pronom personnel 3 `eme sg MascMasculin

InvGenInvariable en genre SG Singulier

SG Singulier NounNom

Poss Possessif SOMRelatif au corps

AGR Agriculture

normalisation des mots (r `egles sous forme de transducteur) segmentation des mots (lexique sous forme de transducteur) analyse morphologique (transducteur `a deux ´etats)

possibilit ´es d’ajouts de donn ´ees aux lexiques ( ´etiquettes s ´emantiques)

(26)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Identification des mots

Analyseur morphologique

NTM(Normalizer - Tokenizer - Morphological analyzer )[A¨ıt-Mokhtar, 1998]

Son

deuxi `eme fils [. . .]

Mot du texte lemme Analyse morphologique Traits ajout ´es

son son +PP3S+InvGen+SG+Poss

son son +Masc+SG+Noun+ +SOM+AGR

PP3S Pronom personnel 3 `eme sg MascMasculin

InvGenInvariable en genre SG Singulier

SG Singulier NounNom

Poss Possessif SOMRelatif au corps

AGR Agriculture

normalisation des mots (r `egles sous forme de transducteur) segmentation des mots (lexique sous forme de transducteur) analyse morphologique (transducteur `a deux ´etats)

possibilit ´es d’ajouts de donn ´ees aux lexiques ( ´etiquettes s ´emantiques)

(27)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Dictionnaire

«

Dubois

»

: ´etiquettes

s ´emantiques

Exemple : abaisser 01

Domaine locatif, lieux

Classe Transformation, changement - Sujet anim ´e - Circons-tanciel ”avec”

Op ´erateur rendre quelque chose bas ou devenir bas

Sens baisser, descendre

Exemple On abaisse le rideau de fer, le store. Le rideau s’abaisse vers le bas

Conjugaison 1econjugaison - paradigme : pleurer - auxiliaire avoir Construction Transitif direct - Sujet humain - COD inanim ´e -

Cir-constanciel instrumental

D ´eriv ´es adjectifs en -ant (abaissant) - noms en -ment (abais-sement) et en -eur (abaisseur )

Nom d ´eriv ´e pr ´efix ´e `a partir de baisse Lexique dictionnaire de base 15 000 mots

(28)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Dictionnaire

«

Dubois

»

: ´etiquettes

s ´emantiques

Exemple : abaisser 01

Domaine locatif, lieux

Classe Transformation, changement - Sujet anim ´e - Circons-tanciel ”avec”

Op ´erateur rendre quelque chose bas ou devenir bas

Sens baisser, descendre

Exemple On abaisse le rideau de fer, le store. Le rideau s’abaisse vers le bas

Conjugaison 1econjugaison - paradigme : pleurer - auxiliaire avoir Construction Transitif direct - Sujet humain - COD inanim ´e -

Cir-constanciel instrumental

D ´eriv ´es adjectifs en -ant (abaissant) - noms en -ment (abais-sement) et en -eur (abaisseur )

Nom d ´eriv ´e pr ´efix ´e `a partir de baisse Lexique dictionnaire de base 15 000 mots

(29)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Dictionnaire

«

Dubois

»

: ´etiquettes

s ´emantiques

Exemple : abaisser 01

Domaine

locatif, lieux Classe

Transformation, changement - Sujet anim ´e - Circons-tanciel ”avec”

Op ´erateur rendre quelque chose bas ou devenir bas

Sens baisser, descendre

Exemple On abaisse le rideau de fer, le store. Le rideau s’abaisse vers le bas

Conjugaison 1econjugaison - paradigme : pleurer - auxiliaire avoir

Construction Transitif direct - Sujet humain - COD inanim ´e - Cir-constanciel instrumental

D ´eriv ´es adjectifs en -ant (abaissant) - noms en -ment (abais-sement) et en -eur (abaisseur )

(30)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Identification des relations

Analyseur syntaxique

XIP(Xerox Incremental Parser )[Roux, 1999]

´

Enonc ´e :

«

Il reconstruisit Rome ruin ´ee par les incendies.

»

Extraction de

DEPENDANCES

´

:

SUBJ(reconstruisit,Il) 2e argument sujet du 1er argument

SUBJ(ruin´ee,incendies)

VMOD[INDIR](ruin´ee,par,incendies) 3e argument compl. agent 1er argument

VARG[DIR](reconstruisit,Rome) 2e argument COD du 1er argument

NMOD[ADJ](Rome,ruin´ee) 2e argument ´epith `ete du 1er argument

XIP effectue un d ´ecoupage du texte en syntagmes minimaux, que nous n’exploitons pas

(31)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Identification des relations

Analyseur syntaxique

XIP(Xerox Incremental Parser )[Roux, 1999]

´

Enonc ´e :

«

Il reconstruisit Rome ruin ´ee par les incendies.

»

Extraction de

DEPENDANCES

´

:

SUBJ(reconstruisit,Il) 2e argument sujet du 1er argument

SUBJ(ruin´ee,incendies)

VMOD[INDIR](ruin´ee,par,incendies) 3e argument compl. agent 1er argument

VARG[DIR](reconstruisit,Rome) 2e argument COD du 1er argument

NMOD[ADJ](Rome,ruin´ee) 2e argument ´epith `ete du 1er argument

XIP effectue un d ´ecoupage du texte en syntagmes minimaux, que nous n’exploitons pas

(32)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Identification des relations

Analyseur syntaxique

XIP(Xerox Incremental Parser )[Roux, 1999]

´

Enonc ´e :

«

Il reconstruisit Rome ruin ´ee par les incendies.

»

Extraction de

DEPENDANCES

´

:

SUBJ(reconstruisit,Il) 2e argument sujet du 1er argument

SUBJ(ruin´ee,incendies)

VMOD[INDIR](ruin´ee,par,incendies) 3e argument compl. agent 1er argument

VARG[DIR](reconstruisit,Rome) 2e argument COD du 1er argument

NMOD[ADJ](Rome,ruin´ee) 2e argument ´epith `ete du 1er argument

XIP effectue un d ´ecoupage du texte en syntagmes minimaux, que nous n’exploitons pas

(33)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Identification des relations

Analyseur syntaxique

XIP(Xerox Incremental Parser )[Roux, 1999]

´

Enonc ´e :

«

Il reconstruisit Rome ruin ´ee par les incendies.

»

Extraction de

DEPENDANCES

´

:

SUBJ(reconstruisit,Il) 2e argument sujet du 1er argument

SUBJ(ruin´ee,incendies)

VMOD[INDIR](ruin´ee,par,incendies) 3e argument compl. agent 1er argument

VARG[DIR](reconstruisit,Rome) 2e argument COD du 1er argument

NMOD[ADJ](Rome,ruin´ee) 2e argument ´epith `ete du 1er argument

(34)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Identification du sens des mots

Utilisation d’un d ´esambigu¨ısateur s ´emantique pour

identifier le sens des mots polys ´emiques dans les documents

un syst `eme informatique voit des ambigu¨ıt ´es l `a o `u un humain les r ´esout (ambigu¨ıt ´e art ´efactuelle) : il remporte [la victoire / les

assiettes]

importance du contexte syntaxique

utilisation efficace de dictionnaires et de corpus ´etiquet ´es

permettre un enrichissement focalis ´e sur le sens des mots

besoin d’informations lexicales riches et coh ´erentes

Extraction des r `egles `a partir d’un dictionnaire

(choix du

sens selon le contexte syntaxico-s ´emantique)

sch ´ema syntaxique (syntaxe uniquement) il boit – il boit de l’eau sch ´ema syntaxico-s ´emantique (syntaxe et s ´emantique) embrasser

quelqu’un6=embrasser quelque chose

analyse syntaxique d’un exemple (lexique et syntaxe)

VARG[DIR](remporter,victoire)

g ´en ´eralisation de l’analyse d’un exemple (syntaxe et s ´emantique)

(35)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Identification du sens des mots

Utilisation d’un d ´esambigu¨ısateur s ´emantique pour

identifier le sens des mots polys ´emiques dans les documents

un syst `eme informatique voit des ambigu¨ıt ´es l `a o `u un humain les r ´esout (ambigu¨ıt ´e art ´efactuelle) : il remporte [la victoire / les

assiettes]

importance du contexte syntaxique

utilisation efficace de dictionnaires et de corpus ´etiquet ´es

permettre un enrichissement focalis ´e sur le sens des mots

besoin d’informations lexicales riches et coh ´erentes

Extraction des r `egles `a partir d’un dictionnaire

(choix du

sens selon le contexte syntaxico-s ´emantique)

sch ´ema syntaxique (syntaxe uniquement) il boit – il boit de l’eau sch ´ema syntaxico-s ´emantique (syntaxe et s ´emantique) embrasser

quelqu’un6=embrasser quelque chose

analyse syntaxique d’un exemple (lexique et syntaxe)

VARG[DIR](remporter,victoire)

g ´en ´eralisation de l’analyse d’un exemple (syntaxe et s ´emantique)

(36)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Identification du sens des mots

Utilisation d’un d ´esambigu¨ısateur s ´emantique pour

identifier le sens des mots polys ´emiques dans les documents

un syst `eme informatique voit des ambigu¨ıt ´es l `a o `u un humain les r ´esout (ambigu¨ıt ´e art ´efactuelle) : il remporte [la victoire / les

assiettes]

importance du contexte syntaxique

utilisation efficace de dictionnaires et de corpus ´etiquet ´es

permettre un enrichissement focalis ´e sur le sens des mots

besoin d’informations lexicales riches et coh ´erentes

Extraction des r `egles `a partir d’un dictionnaire

(choix du

sens selon le contexte syntaxico-s ´emantique)

sch ´ema syntaxique (syntaxe uniquement) il boit – il boit de l’eau sch ´ema syntaxico-s ´emantique (syntaxe et s ´emantique) embrasser

quelqu’un6=embrasser quelque chose

analyse syntaxique d’un exemple (lexique et syntaxe)

VARG[DIR](remporter,victoire)

g ´en ´eralisation de l’analyse d’un exemple (syntaxe et s ´emantique)

(37)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Identification du sens des mots

Utilisation d’un d ´esambigu¨ısateur s ´emantique pour

identifier le sens des mots polys ´emiques dans les documents

un syst `eme informatique voit des ambigu¨ıt ´es l `a o `u un humain les r ´esout (ambigu¨ıt ´e art ´efactuelle) : il remporte [la victoire / les

assiettes]

importance du contexte syntaxique

utilisation efficace de dictionnaires et de corpus ´etiquet ´es

permettre un enrichissement focalis ´e sur le sens des mots

besoin d’informations lexicales riches et coh ´erentes

Extraction des r `egles `a partir d’un dictionnaire

(choix du

sens selon le contexte syntaxico-s ´emantique)

sch ´ema syntaxique (syntaxe uniquement) il boit – il boit de l’eau sch ´ema syntaxico-s ´emantique (syntaxe et s ´emantique) embrasser

quelqu’un6=embrasser quelque chose

analyse syntaxique d’un exemple (lexique et syntaxe)

VARG[DIR](remporter,victoire)

g ´en ´eralisation de l’analyse d’un exemple (syntaxe et s ´emantique)

(38)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Identification du sens des mots

Utilisation d’un d ´esambigu¨ısateur s ´emantique pour

identifier le sens des mots polys ´emiques dans les documents

un syst `eme informatique voit des ambigu¨ıt ´es l `a o `u un humain les r ´esout (ambigu¨ıt ´e art ´efactuelle) : il remporte [la victoire / les

assiettes]

importance du contexte syntaxique

utilisation efficace de dictionnaires et de corpus ´etiquet ´es

permettre un enrichissement focalis ´e sur le sens des mots

besoin d’informations lexicales riches et coh ´erentes

Extraction des r `egles `a partir d’un dictionnaire

(choix du

sens selon le contexte syntaxico-s ´emantique)

sch ´ema syntaxique (syntaxe uniquement) il boit – il boit de l’eau sch ´ema syntaxico-s ´emantique (syntaxe et s ´emantique) embrasser

quelqu’un6=embrasser quelque chose

analyse syntaxique d’un exemple (lexique et syntaxe)

VARG[DIR](remporter,victoire)

g ´en ´eralisation de l’analyse d’un exemple (syntaxe et s ´emantique)

(39)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Identification du sens des mots

Utilisation d’un d ´esambigu¨ısateur s ´emantique pour

identifier le sens des mots polys ´emiques dans les documents

un syst `eme informatique voit des ambigu¨ıt ´es l `a o `u un humain les r ´esout (ambigu¨ıt ´e art ´efactuelle) : il remporte [la victoire / les

assiettes]

importance du contexte syntaxique

utilisation efficace de dictionnaires et de corpus ´etiquet ´es

permettre un enrichissement focalis ´e sur le sens des mots

besoin d’informations lexicales riches et coh ´erentes

Extraction des r `egles `a partir d’un dictionnaire

(choix du

sens selon le contexte syntaxico-s ´emantique)

sch ´ema syntaxique (syntaxe uniquement) il boit – il boit de l’eau sch ´ema syntaxico-s ´emantique (syntaxe et s ´emantique) embrasser

quelqu’un6=embrasser quelque chose

analyse syntaxique d’un exemple (lexique et syntaxe)

(40)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Dictionnaire

«

Dubois

»

: champs

syntaxico-s ´emantiques

Exemple : abaisser 01

Domaine

locatif, lieux Classe

Transformation, changement - Sujet anim ´e - Circons-tanciel ”avec”

Op ´erateur rendre quelque chose bas ou devenir bas

Sens baisser, descendre

Exemple

On abaisse le rideau de fer, le store. Le rideau s’abaisse vers le bas

Conjugaison 1econjugaison - paradigme : pleurer - auxiliaire avoir Construction

Transitif direct - Sujet humain - COD inanim ´e - Cir-constanciel instrumental

D ´eriv ´es adjectifs en -ant (abaissant) - noms en -ment (abais-sement) et en -eur (abaisseur )

Nom d ´eriv ´e pr ´efix ´e `a partir de baisse Lexique dictionnaire de base 15 000 mots

(41)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Dictionnaire

«

Dubois

»

: champs

syntaxico-s ´emantiques

Exemple : abaisser 01

Domaine

locatif, lieux Classe

Transformation, changement - Sujet anim ´e - Circons-tanciel ”avec”

Op ´erateur rendre quelque chose bas ou devenir bas

Sens baisser, descendre

Exemple

On abaisse le rideau de fer, le store. Le rideau s’abaisse vers le bas

Conjugaison 1econjugaison - paradigme : pleurer - auxiliaire avoir

Construction

Transitif direct - Sujet humain - COD inanim ´e -

Cir-constanciel instrumental

D ´eriv ´es adjectifs en -ant (abaissant) - noms en -ment (abais-sement) et en -eur (abaisseur )

(42)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Dictionnaire

«

Dubois

»

: champs

syntaxico-s ´emantiques

Exemple : abaisser 01

Domaine

locatif, lieux Classe

Transformation, changement - Sujet anim ´e - Circons-tanciel ”avec”

Op ´erateur rendre quelque chose bas ou devenir bas

Sens baisser, descendre

Exemple

On abaisse le rideau de fer, le store. Le rideau s’abaisse vers le bas

Conjugaison 1econjugaison - paradigme : pleurer - auxiliaire avoir

Construction

Transitif direct - Sujet humain - COD inanim ´e -

Cir-constanciel instrumental

D ´eriv ´es adjectifs en -ant (abaissant) - noms en -ment (abais-sement) et en -eur (abaisseur )

Nom d ´eriv ´e pr ´efix ´e `a partir de baisse Lexique dictionnaire de base 15 000 mots

(43)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Dictionnaire

«

Dubois

»

: champs

syntaxico-s ´emantiques

Exemple : abaisser 01

Domaine

locatif, lieux Classe

Transformation, changement - Sujet anim ´e - Circons-tanciel ”avec”

Op ´erateur rendre quelque chose bas ou devenir bas

Sens baisser, descendre

Exemple

On abaisse le rideau de fer, le store. Le rideau s’abaisse vers le bas

Conjugaison 1econjugaison - paradigme : pleurer - auxiliaire avoir Construction

Transitif direct - Sujet humain - COD inanim ´e - Cir-constanciel instrumental

D ´eriv ´es adjectifs en -ant (abaissant) - noms en -ment (abais-sement) et en -eur (abaisseur )

(44)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Dictionnaire

«

Dubois

»

: champs

syntaxico-s ´emantiques

Exemple : abaisser 01

Domaine

locatif, lieux Classe

Transformation, changement - Sujet anim ´e - Circons-tanciel ”avec”

Op ´erateur rendre quelque chose bas ou devenir bas

Sens baisser, descendre

Exemple

On abaisse le rideau de fer, le store. Le rideau s’abaisse vers le bas

Conjugaison 1econjugaison - paradigme : pleurer - auxiliaire avoir Construction

Transitif direct - Sujet humain - COD inanim ´e - Cir-constanciel instrumental

D ´eriv ´es adjectifs en -ant (abaissant) - noms en -ment (abais-sement) et en -eur (abaisseur )

Nom d ´eriv ´e pr ´efix ´e `a partir de baisse Lexique dictionnaire de base 15 000 mots

(45)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Dictionnaire

«

Dubois

»

: champs

syntaxico-s ´emantiques

Exemple : abaisser 01

Domaine

locatif, lieux Classe

Transformation, changement - Sujet anim ´e - Circons-tanciel ”avec”

Op ´erateur rendre quelque chose bas ou devenir bas

Sens baisser, descendre

Exemple

On abaisse le rideau de fer, le store. Le rideau s’abaisse vers le bas

Conjugaison 1econjugaison - paradigme : pleurer - auxiliaire avoir

Construction

Transitif direct - Sujet humain - COD inanim ´e -

Cir-constanciel instrumental

D ´eriv ´es adjectifs en -ant (abaissant) - noms en -ment (abais-sement) et en -eur (abaisseur )

(46)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Construction des r `egles de d ´esambigu¨ısation

Si remporter est la cible de la d ´esambigu¨ısation et qu’il

poss `ede un objet direct qui porte le trait

MIL

(militaire),

alors le sens choisi est

«

gagner

»

remporter : VARG[DIR](remporter,[MIL]) ⇒ sens « gagner »

Information extraite du dictionnaire

«

Dubois

»

:

le verbe«remporter»au sens«gagner»(remporter une bataille)

sch ´ema syntaxique : verbe transitif direct

contrainte syntaxico-s ´emantique : objet direct de domaine MIL (militaire) issu de la g ´en ´eralisation de l’exemple On remporte la victoire sur ses adversaires

(47)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Construction des r `egles de d ´esambigu¨ısation

Si remporter est la cible de la d ´esambigu¨ısation et qu’il

poss `ede un objet direct qui porte le trait

MIL

(militaire),

alors le sens choisi est

«

gagner

»

remporter : VARG[DIR](remporter,[MIL]) ⇒ sens « gagner »

Information extraite du dictionnaire

«

Dubois

»

:

le verbe«remporter»au sens«gagner»(remporter une bataille)

sch ´ema syntaxique : verbe transitif direct

contrainte syntaxico-s ´emantique : objet direct de domaine MIL (militaire) issu de la g ´en ´eralisation de l’exemple On remporte la victoire sur ses adversaires

(48)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Construction des r `egles de d ´esambigu¨ısation

Si remporter est la cible de la d ´esambigu¨ısation et qu’il

poss `ede un objet direct qui porte le trait

MIL

(militaire),

alors le sens choisi est

«

gagner

»

remporter : VARG[DIR](remporter,[MIL]) ⇒ sens « gagner »

Information extraite du dictionnaire

«

Dubois

»

:

le verbe«remporter»au sens«gagner»(remporter une bataille)

sch ´ema syntaxique : verbe transitif direct

contrainte syntaxico-s ´emantique : objet direct de domaine MIL (militaire) issu de la g ´en ´eralisation de l’exemple On remporte la victoire sur ses adversaires

(49)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Utilisation des r `egles de d ´esambigu¨ısation

Mode d’application des r `egles :

un ensemble de r `egles conditionnelles sous forme d’une grammaire XIP

exploitation du lexique identifi ´e apr `es la d ´esambigu¨ısation cat ´egorielle (remporter, victoire)

exploitation des d ´ependances de l’analyse syntaxique (VARG[DIR](remporter,victoire))

exploitation des traits s ´emantiques attach ´es au mots (victoire[MIL])

Information ajout ´ee par les r `egles :

Adjonction d’un trait de num ´ero de sens (correspondant `a l’acception s ´electionn ´ee) pour les mots d ´esambigu¨ıs ´es (remporter[NS2]: gagner)

Adjonction des traits s ´emantiques correspondant au sens choisi pour les mots d ´esambigu¨ıs ´es (remporter[MIL]: gagner) Une ambigu¨ıt ´e de sens peut subsister (remporter[NS2]un prix[SPO]ou remporter[NS3]un match[SPO])

(50)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Utilisation des r `egles de d ´esambigu¨ısation

Mode d’application des r `egles :

un ensemble de r `egles conditionnelles sous forme d’une grammaire XIP

exploitation du lexique identifi ´e apr `es la d ´esambigu¨ısation cat ´egorielle (remporter, victoire)

exploitation des d ´ependances de l’analyse syntaxique (VARG[DIR](remporter,victoire))

exploitation des traits s ´emantiques attach ´es au mots (victoire[MIL])

Information ajout ´ee par les r `egles :

Adjonction d’un trait de num ´ero de sens (correspondant `a l’acception s ´electionn ´ee) pour les mots d ´esambigu¨ıs ´es (remporter[NS2]: gagner)

Adjonction des traits s ´emantiques correspondant au sens choisi pour les mots d ´esambigu¨ıs ´es (remporter[MIL]: gagner) Une ambigu¨ıt ´e de sens peut subsister (remporter[NS2]un prix[SPO]ou remporter[NS3]un match[SPO])

(51)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Dictionnaire

«

Dubois

»

Exemple : abaisser 01

Domaine locatif, lieux Classe

Transformation, changement - Sujet anim ´e - Circonstanciel ”avec”

Op ´erateur rendre quelque chose bas ou devenir bas Sens

baisser, descendre Exemple

On abaisse le rideau de fer, le store. Le rideau s’abaisse vers le bas

Conjugaison 1econjugaison - paradigme : pleurer - auxiliaire avoir

Construction

Transitif direct - Sujet humain - COD inanim ´e - Circonstanciel instrumental

D ´eriv ´es

adjectifs en -ant (abaissant) - noms en -ment (abaissement) et en -eur (abaisseur )

(52)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Dictionnaire

«

Dubois

»

Exemple : abaisser 01

Domaine locatif, lieux Classe

Transformation, changement - Sujet anim ´e - Circonstanciel ”avec”

Op ´erateur rendre quelque chose bas ou devenir bas

Sens

baisser, descendre

Exemple

On abaisse le rideau de fer, le store. Le rideau s’abaisse vers le bas

Conjugaison 1econjugaison - paradigme : pleurer - auxiliaire avoir

Construction

Transitif direct - Sujet humain - COD inanim ´e - Circonstanciel instrumental

D ´eriv ´es

adjectifs en -ant (abaissant) - noms en -ment (abaissement) et en -eur (abaisseur )

Nom

d ´eriv ´e pr ´efix ´e `a partir de baisse Lexique dictionnaire de base 15 000 mots

(53)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Dictionnaire

«

Dubois

»

Exemple : abaisser 01

Domaine locatif, lieux Classe

Transformation, changement - Sujet anim ´e - Circonstanciel ”avec”

Op ´erateur rendre quelque chose bas ou devenir bas Sens

baisser, descendre Exemple

On abaisse le rideau de fer, le store. Le rideau s’abaisse vers le bas

Conjugaison 1econjugaison - paradigme : pleurer - auxiliaire avoir

Construction

Transitif direct - Sujet humain - COD inanim ´e - Circonstanciel instrumental

D ´eriv ´es

adjectifs en -ant (abaissant) - noms en -ment (abaissement) et en -eur (abaisseur )

(54)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Dictionnaire

«

Dubois

»

Exemple : abaisser 01

Domaine locatif, lieux Classe

Transformation, changement - Sujet anim ´e - Circonstanciel ”avec”

Op ´erateur rendre quelque chose bas ou devenir bas

Sens

baisser, descendre

Exemple

On abaisse le rideau de fer, le store. Le rideau s’abaisse vers le bas

Conjugaison 1econjugaison - paradigme : pleurer - auxiliaire avoir

Construction

Transitif direct - Sujet humain - COD inanim ´e - Circonstanciel instrumental

D ´eriv ´es

adjectifs en -ant (abaissant) - noms en -ment (abaissement) et en -eur (abaisseur )

Nom

d ´eriv ´e pr ´efix ´e `a partir de baisse

(55)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Apports d’autres ressources (1)

Un constat

Le dictionnaire Dubois manque de synonymes

Solution propos ´ee :

r ´ecup ´eration de listes dans Bailly, Memodata,

EuroWordNet

un synonyme suppl ´ementaire est ajout ´e `a un sens du

Dubois si les indices s ´emantiques du sens et du

synonyme correspondent

exemple

le mot ravir au sens voler

synonymes fournis par les autres dictionnaires : enlever et charmer

ravir : domaine = SOC ; classe = S4

enlever au sens n6 (priver de) : domaine = SOC ; classe = S4

(56)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Apports d’autres ressources (1)

Un constat

Le dictionnaire Dubois manque de synonymes

Solution propos ´ee :

r ´ecup ´eration de listes dans Bailly, Memodata,

EuroWordNet

un synonyme suppl ´ementaire est ajout ´e `a un sens du

Dubois si les indices s ´emantiques du sens et du

synonyme correspondent

exemple

le mot ravir au sens voler

synonymes fournis par les autres dictionnaires : enlever et charmer

ravir : domaine = SOC ; classe = S4

enlever au sens n6 (priver de) : domaine = SOC ; classe = S4

(57)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Apports d’autres ressources (1)

Un constat

Le dictionnaire Dubois manque de synonymes

Solution propos ´ee :

r ´ecup ´eration de listes dans Bailly, Memodata,

EuroWordNet

un synonyme suppl ´ementaire est ajout ´e `a un sens du

Dubois si les indices s ´emantiques du sens et du

synonyme correspondent

exemple

le mot ravir au sens voler

synonymes fournis par les autres dictionnaires : enlever et charmer

ravir : domaine = SOC ; classe = S4

enlever au sens n6 (priver de) : domaine = SOC ; classe = S4

(58)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Apports d’autres ressources (1)

Un constat

Le dictionnaire Dubois manque de synonymes

Solution propos ´ee :

r ´ecup ´eration de listes dans Bailly, Memodata,

EuroWordNet

un synonyme suppl ´ementaire est ajout ´e `a un sens du

Dubois si les indices s ´emantiques du sens et du

synonyme correspondent

exemple

le mot ravir au sens voler

synonymes fournis par les autres dictionnaires : enlever et charmer

ravir : domaine = SOC ; classe = S4

enlever au sens n6 (priver de) : domaine = SOC ; classe = S4

(59)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Apports d’autres ressources (1)

Un constat

Le dictionnaire Dubois manque de synonymes

Solution propos ´ee :

r ´ecup ´eration de listes dans Bailly, Memodata,

EuroWordNet

un synonyme suppl ´ementaire est ajout ´e `a un sens du

Dubois si les indices s ´emantiques du sens et du

synonyme correspondent

exemple

le mot ravir au sens voler

synonymes fournis par les autres dictionnaires : enlever et charmer

(60)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Apports d’autres ressources (1)

Un constat

Le dictionnaire Dubois manque de synonymes

Solution propos ´ee :

r ´ecup ´eration de listes dans Bailly, Memodata,

EuroWordNet

un synonyme suppl ´ementaire est ajout ´e `a un sens du

Dubois si les indices s ´emantiques du sens et du

synonyme correspondent

exemple

le mot ravir au sens voler

synonymes fournis par les autres dictionnaires : enlever et charmer

ravir : domaine =SOC; classe =S4

enlever au sens n6 (priver de) : domaine =SOC; classe =S4

(61)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Apports d’autres ressources (1)

Un constat

Le dictionnaire Dubois manque de synonymes

Solution propos ´ee :

r ´ecup ´eration de listes dans Bailly, Memodata,

EuroWordNet

un synonyme suppl ´ementaire est ajout ´e `a un sens du

Dubois si les indices s ´emantiques du sens et du

synonyme correspondent

exemple

le mot ravir au sens voler

synonymes fournis par les autres dictionnaires : enlever et charmer

(62)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Apports d’autres ressources (2)

Un constat

L’information de d ´erivation ne suffit pas

Les contraintes de d ´erivation relient un d ´eriv ´e `a un sens particulier du mot original

le d ´eriv ´e coupant du verbe couper

correspond au sens trancher (n◦1)

ne correspond pas `a interrompre l’ ´electricit ´e (n◦12)

Les indications de d ´erivation du Dubois manquent de pr ´ecision

g ´en ´eration de d ´eriv ´es (existants) gr ˆace `a l’outil de [Gaussier99] ´elimination des inexistants gr ˆace au Dubois

distribution par sens des d ´eriv ´es gr ˆace auDubois

Pour le verbe«couper»

Formes g ´en ´er ´ees Instruction Dubois Num ´ero de sens Dubois

coup – suppression

coupure d ´eriv ´e nominal en -ure 1, 7, 9, 10,12, 14, 16 coupable – suppression

coupant adjectif verbal en -ant 1, 2

(63)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Apports d’autres ressources (2)

Un constat

L’information de d ´erivation ne suffit pas

Les contraintes de d ´erivation relient un d ´eriv ´e `a un sens particulier du mot original

le d ´eriv ´e coupant du verbe couper

correspond au sens trancher (n◦1)

ne correspond pas `a interrompre l’ ´electricit ´e (n◦12)

Les indications de d ´erivation du Dubois manquent de pr ´ecision

g ´en ´eration de d ´eriv ´es (existants) gr ˆace `a l’outil de [Gaussier99] ´elimination des inexistants gr ˆace au Dubois

distribution par sens des d ´eriv ´es gr ˆace auDubois

Pour le verbe«couper»

Formes g ´en ´er ´ees Instruction Dubois Num ´ero de sens Dubois

coup – suppression

coupure d ´eriv ´e nominal en -ure 1, 7, 9, 10,12, 14, 16 coupable – suppression

coupant adjectif verbal en -ant 1, 2

(64)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Apports d’autres ressources (2)

Un constat

L’information de d ´erivation ne suffit pas

Les contraintes de d ´erivation relient un d ´eriv ´e `a un sens particulier du mot original

le d ´eriv ´e coupant du verbe couper

correspond au sens trancher (n◦1)

ne correspond pas `a interrompre l’ ´electricit ´e (n◦12)

Les indications de d ´erivation du Dubois manquent de pr ´ecision

g ´en ´eration de d ´eriv ´es (existants) gr ˆace `a l’outil de [Gaussier99] ´elimination des inexistants gr ˆace au Dubois

distribution par sens des d ´eriv ´es gr ˆace auDubois

Pour le verbe«couper»

Formes g ´en ´er ´ees Instruction Dubois Num ´ero de sens Dubois

coup – suppression

coupure d ´eriv ´e nominal en -ure 1, 7, 9, 10,12, 14, 16 coupable – suppression

coupant adjectif verbal en -ant 1, 2

(65)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Apports d’autres ressources (2)

Un constat

L’information de d ´erivation ne suffit pas

Les contraintes de d ´erivation relient un d ´eriv ´e `a un sens particulier du mot original

le d ´eriv ´e coupant du verbe couper

correspond au sens trancher (n◦1)

ne correspond pas `a interrompre l’ ´electricit ´e (n◦12)

Les indications de d ´erivation du Dubois manquent de pr ´ecision

g ´en ´eration de d ´eriv ´es (existants) gr ˆace `a l’outil de [Gaussier99] ´elimination des inexistants gr ˆace au Dubois

distribution par sens des d ´eriv ´es gr ˆace auDubois

Pour le verbe«couper»

Formes g ´en ´er ´ees Instruction Dubois Num ´ero de sens Dubois

coup – suppression

coupure d ´eriv ´e nominal en -ure 1, 7, 9, 10,12, 14, 16 coupable – suppression

(66)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Construction de la structure

Squelette de la structure informationnelle : les r ´esultats

des analyses

unit ´es lexicales relations syntaxiques

traits morphologiques, syntaxiques et s ´emantiques

Enrichissement synonymique

construction de d ´ependances disjonctives (lemme/synonyme)

Enrichissement par d ´erivation morphologique

contrainte

identification des d ´eriv ´es possibles transformation de la structure syntaxique

(67)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Construction de la structure

Squelette de la structure informationnelle : les r ´esultats

des analyses

unit ´es lexicales relations syntaxiques

traits morphologiques, syntaxiques et s ´emantiques

Enrichissement synonymique

construction de d ´ependances disjonctives (lemme/synonyme)

Enrichissement par d ´erivation morphologique

contrainte

identification des d ´eriv ´es possibles transformation de la structure syntaxique

(68)

Interroger un corpus par le sens B. Jacquemin Introduction Outils d’analyse Analyse morphologique Analyse syntaxique D ´esambigu¨ısation s ´emantique Ressources lexicales Structurer l’information Interroger les documents Conclusion

Construction de la structure

Squelette de la structure informationnelle : les r ´esultats

des analyses

unit ´es lexicales relations syntaxiques

traits morphologiques, syntaxiques et s ´emantiques

Enrichissement synonymique

construction de d ´ependances disjonctives (lemme/synonyme)

Enrichissement par d ´erivation morphologique

contrainte

identification des d ´eriv ´es possibles transformation de la structure syntaxique

Références

Documents relatifs

Le treillis de la phrase représente sous la forme d'un graphe toutes les séquences d'étiquettes possibles, pour une séquence données de mots.. Un noeud correspond à une

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des

Pour d´eriver un analyseur syntaxique d’une grammaire non-contextuelle ´ecrite dans le style EBNF :.. Introduire une fonction def A: Unit pour chaque

Cet aspect est particulièrement important pour le problème qui nous intéresse ici : il s’agit d’une approche intrinsèquement robuste dans le sens où ce qui est construit n’est

Cette infrastructure vise à fa- ciliter la réutilisation de l’analyseur stochastique MALT [11] pour le français parlé et comprend (i) la définition d’un schéma d’annotation

i ) Les Xis(er) sont majoritairement agentifs et transitifs. circulable, skiable). Malgré cela, nous avons rejeté la structure [ [Xité] able], pas tant parce que ce cas de figure

les cours Automates et Calculabilit´ e en majeure M1 pour les grammaires formelles, et Compilation en majeure M2 pour les analyseurs syntaxiques... Sch´ ema g´

les cours Automates et Calculabilit´ e en majeure M1 pour les grammaires formelles, et Compilation en majeure M2 pour les analyseurs syntaxiques.. Sch´ ema g´