D ´efis scien tifiques du T raitemen t Informatique de
la Langue
G ´erard Huet
INRIA
17Septembre2002,ENSCachan
-1-
P etit historique
•TraductionAutomatique
•LerapportALPAC(1966)
•Chomsky-Sch¨utzenberger
•Th´eoriedeslangagesformels
•Compilationdeslangagesdeprogrammation
•PROLOG
•Transducteursrationnels
•M´ethodesstatistiques
-2-
Applications
•Reconnaissancedelaparole
•Interfacehomme-machine
•Localisation/internationalisation
•Traitementdetextes
•Recherched’informations
•Philologie
•Assistance`alatraduction
•G´en´erationdetextesmultilingues
-3-
Niv eaux de repr ´esen tation du langage
•Phonologie-dusignalaufluxdephon`emes
•Segmentation-desphon`emesauxmots
•Morphologie-fluxdemots´etiquet´es
•Syntaxe-structurearborescente
•S´emantiquepropositionnelle
•S´emantiqueintentionnelleetmodale
•Structureinformationnelledudiscours
•Structurerh´etorique
•Pragmatique-cequeparlerveutdire
-4-
Th ´eories linguistiques
•Saussure-dualit´edusigne
•Tesni`ere-d´ependances
•Chomsky-grammaireg´en´erative
•Colmerauer-programmationlogique
•Lambek-grammairescat´egorielles
•Joshi-TAG
•Chomsky- ¯X,G&B,Minimalisme
•Psychologie,Sciencescognitives
-5-
Informatique th ´eorique
•Hi´erarchiedeslangagesformels
•Automatesettransducteursd’´etatfini
•Analysesyntaxique
•Algorithmique,complexit´e
•S´emantiqueformelle
•λ-calcul
•Mod`elescat´egoriques
-6-
Th ´eorie de la d ´emonstration
•Math´ematisationdelalogique
•BooleFrege
•HilbertBrouwer
•CantorRussell
•Heyting
•G¨odelChurchKleene
•PrawitzHerbrand
•TarskiScott
•CurryHowarddeBruijn
•Martin-L¨ofGirard
-7-
En tre la Logique et l’Alg `ebre
•LogiqueLin´eairecommeFondementsLogiques
•NiContraction,NiAffaiblissement
•S´equentscommeSacsdeLitt´eraux
•LambekSyntacticCalculus\/
•LLNonCommutative
•LLNonAssociative
•Pr´e-groupes
-8-
En tre la Syn taxe et la S ´eman tique
•LambekSyntacticCalculus:collesyntaxique
•≈LLnon-commutative
•MontagueSemanticscommes´emantiquepropositionnelle
•≈Logiqued’ordresup´erieur+modalit´es
•d´efinissableenLLavecmodalit´es
•R´eseauxded´emonstration
•G´eom´etriedel’interaction
•Machinedecontraintes
-9-
Probl `emes ouv erts
•HorscontextevsGram.Cat´eg.
•Complexit´edelareconnaissance
•Langagesd’arbresd’analyse
•Langagesfaiblementcontextuels
•Gram.Univ.vslexicalis´ee
•Apprentissage
•RecodagedesTAGs
•CodagedesGram.minimalistes
•Synth`ese`apartirdelangagepivot
-10-
Plus loin dans la S ´eman tique
•Pronoms
•Ellipses,Focus,Accent
•Anaphores
•D´eictiques
•Quantificateursg´en´eralis´es
•DRT
•Situations
•Logiquedynamique,´epist´emologique
•S´emantiquedeKripke
•Logiquehybride
-11-
F o cus sur les anaphores
•R´esolutiond’´equations
•Unificationde1erordre
•Equationsentremots
•Xa=aX
•aXa=YbY
•Equationspolynomiales
•Th´eoriedestypesdeChurch
•Unificationd’ordresup´erieur
-12-
R ´esolution d’anaphores par unification
•JohnlikesMaryandPeterdoestoo.
•like(j,m)∧R(p)
•R(j)=like(j,m)
•R←λx.like(x,m)
•*R←λx.like(j,m)
-13-
Exemples gradu ´es
•JohnlikeshiswifeandPetertoo.
•JohnsaysthathelikeshismotherandPeterdoestoo.
•JohnspenthispaycheckbutPetersavedit.
•MarywantstogotoSpainandFredwantstogotoPerubutbecauseoflimitedresources,onlyoneofthemwill.
-14-
P as trop loin dans la S ´eman tique
•Connaissanceslinguistiques
•Connaissancessurlemonde
•Bonsens
•Cyc
•Wordnet
•Nomenclatures,taxonomies
•Thesaurus,ontologies
•Logiquesdedescription
-15-
En tre la P arole et la Linguistique
•TheWatergatetapes
•Languecommejeudelinguistes
•PublicationstypiquesenCL
-16-
Le d ´efi applicatif (1)
•Pauvret´edeslogicielslibres
•Raret´edesressourceslinguistiques
•Manquedeprotocolesd’´evaluation
•Pr´e´eminenceedel’anglais
•Rechercheorient´eephantasmes
•Pˆat´eetechnocratique
•Lavalorisationmalcomprise
•Desstart-ups`aFT
•Untissuindustrielfragile
-17-
Le d ´efi applicatif (2)
•Impl´ementerlesalgorithmes
•Lestestersurdesdonn´eesenvraiegrandeur
•Construiredesbiblioth`equesmodulaires
•Coop´ereraveclesmeilleures´equipes
•Importerlesressourceslinguistiques
•Endernierressort,lesconstruire
•NiProlog,niC++
•Nepascourirderri`erelesmodes
•Maisutiliserlatechnologier´ecente
•Travaillersurladur´ee
-18-
Le d ´efi applicatif (3)
•Souvenirsd’unimpl´ementeur
•Mentaur/CentaurevsEmacsetWord
•ML,Caml,ObjectiveCaml,PidginML
•Zen
•http://pauillac.inria.fr/huet/ZEN
-19-
Conseils `a un jeune cherc heur
•Choisirundomainepastropmou
•Acqu´erirlesbasesconceptuelles
•Impl´ementerdesmaquettesdocument´ees
•Ecolesd’´et´e,tutoriels
•Changerdesujetderecherchetousles5ans
•Changededisciplineaumoinsunefoisdanssavie
•Explorerenlargeur
•SeekapplicationsfortheJoyofit
•Dowhatonlyyoucando
•NesoyezpasunmoutondePanurge
-20-