Article pp.185-203 du Vol.46 n°1 (2005)

(1)

Rubrique préparée par Denis Maurel

LI (Laboratoire d’informatique de l’Université François-Rabelais de Tours) [email protected]

Elèna Chingareva-Slavine, Sémiotique, linguistique et modélisation Hermès-Lavoisier, 2003, 264 pages, ISBN 2-7462-0549-1

par Maryvonne Abraham

GET- ENST-Bretagne et laboratoire LaLICC, UMR 8139-CNRS, Paris IV [email protected]

Cet ouvrage propose une approche systémique de la modélisation du signe, de la langue et de la communication. Il présente les bases ontologiques, méthodologiques, stratégiques et technologiques de la modélisation d’objets linguistiques. Il explicite l’influence de la pragmatique sur le signe et la langue en construisant un ensemble de modèles présentés graphiquement, dont il illustre la réalisation technologique. L’ouvrage vise surtout les questions de l’approche documentaire de la langue et les problèmes d’organisation et de consultation de thésaurus.

Elèna Chingareva-Slavine propose une modélisation de la langue et de la communication d’un point de vue sémiotique en vue de renouveler l’approche documentaire qui repose sur la langue. L’auteur définit le développement systémique du génie linguistique comme une science se situant à la jonction de trois disciplines :

– la sémiotique, qui modélise et systématise les systèmes de signes (aussi bien naturels qu’artificiels), leurs manifestations et comportements dans différents types de systèmes sémiotiques (langues, langages, codes, etc.) et de communication ;

– la linguistique appliquée, qui modélise la langue naturelle (en tant que système de signes linguistiques, le plus puissant et le plus complexe au niveau sémiotique) en se fondant sur les recherches structurales et appliquées de la théorie linguistique ;

– la linguistique informatique, ou informatique linguistique, qui formalise des langages et des communications homme-machine en informatisant la théorie linguistique.

Nous reprenons dans ce compte-rendu un certain nombre d’affirmations et de définitions proposées par l’auteur. Tout d’abord, nous ne pouvons qu’adhérer aux objectifs annoncés : une théorie linguistique homogène, formulée en un ensemble

(2)

ordonné d’unités, de rapports, de structures et représentée sous forme graphique.

L’auteur précise que cette approche constitue une réponse forte à l’actuelle « crise des mots-clés » en TALN et juge nécessaire de remplacer la stratégie lexicale, qui atomise le sens des textes, par une stratégie sémantico-pragmatique profonde.

L’auteur ajoute que le linguiste doit désormais reprendre l’initiative et proposer des modèles sémantiques et pragmatiques dynamiques de la langue à implémenter sur ordinateur.

Pour Elèna Chingareva-Slavine, les échecs constatés dans le traitement informatique du sens des textes en langue naturelle viennent en grande partie de l’inaptitude des linguistes à décrire de manière plus ou moins formelle la pragmatique que l’auteur considère comme l’un des aspects sémiotiques fondamentaux du texte : la pragmatique polarise, modifie et focalise le sens des textes lors de la communication, ce qui signifie que le sens du texte varie lors de son introduction dans la communication selon les repères pragmatiques (qui ne coïncident pas toujours !) des communicants, l’émetteur et le récepteur. La stratégie alors adoptée pour résoudre les problèmes informatiques liés à la modélisation de la LN, doit conjuguer les acquis de la sémiotique et ceux de la linguistique. C’est l’objectif de l’ingénierie linguistique. Comme il est impossible de construire ex nihilo un modèle sémiotique de la langue, il faut successivement construire un modèle sémiotique du signe linguistique, puis développer ce modèle en un modèle de système de la langue. Et seulement ensuite, introduire le modèle sémiotique de la langue dans la communication, modéliser le langage, puis la parole. L’organisation des chapitres explicite la démarche et donne le ton de l’ouvrage.

Le premier chapitre, intitulé le modèle sémiotique du signe linguistique (ontologie), est consacré à la systématisation sémiotique de la théorie du signe linguistique, et se propose, par un grand nombre de définitions préliminaires : i) de définir le contenu componentiel et relationnel du signe; ii) de construire un modèle sémiotique du signe ; iii) de construire un système de coordonnées linguistiques en vue de réaliser par la suite le déploiement du modèle du signe en modèle de la langue et de la communication langagière ; iv) de définir la place de la pragmatique, introduite dans l’ensemble des composants internes du signe.

Le chapitre 2 présente une méthodologie de construction du modèle sémiotique du système de la langue, considéré comme un ensemble de signes, hiérarchiquement organisé et intégré dans un système de coordonnées linguistiques. Le modèle se structure en une architecture en quatre niveaux sémiotiques (référentiel, sémantique, syntactique, lexical), parcourue par trois axes de coordonnées linguistiques : paradigmatique, syntagmatique, stylistique.

Au chapitre 3, le modèle sémiotique est utilisé pour décrire la technologie de modélisation de l’intégralité des objets linguistiques et des rapports entre leurs modèles. La stratégie vise la compatibilité entre la simulation de la compétence linguistique, la modélisation de thésaurus et la modélisation du monde réel et de la pragmatique.

(3)

Le chapitre 4 traite de la modélisation du niveau référentiel (Réf-niveau), niveau extra-linguistique où l’on traite du monde réel : classification d’objets du monde réel, espace situationnel et fascination (sphère émotionnelle de la langue, fonction des conditions d’une communication donnée) par une reformulation des niveaux de la langue, de leurs relations dans le cadre du travail documentaire. La question de la taxonomie et des difficultés d’établir un rapport avec des langues différentes est soulevée.

Le chapitre 5 traite de la modélisation du niveau sémantique (Sém-niveau) : les catégories sémiotiques de base sont réalisées dans : 1) le thésaurus, vu comme l’ensemble des paradigmes sémantiques ; 2) la Grammaire sémantique, ensemble des structures de rôles sémantiques profonds ; 3) et la Stylistique, ensemble des scénarios structurels des corpus de textes déterminés.

Au chapitre 6 est abordée la modélisation du niveau syntaxique (Synt-niveau), défini comme l’union de quatre ensembles : celui des paradigmes grammaticaux (parties du discours), l’ensemble des Structures syntaxiques profondes, l’ensemble des Structures stylistiques déterminées par les trames textuelles du Sem-niveau, enfin l’ensemble des focalisations pragmatiques de tous les modèles du Synt-niveau.

Le dernier chapitre (7) traite la modélisation du niveau lexical (Lex-niveau), qui représente le plan de l’expression du dernier niveau de la hiérarchie de la langue. Ce niveau est le seul représentant « physique et matériel » de la langue qui peut être soumis à une observation linguistique directe puis au traitement (analyse ou synthèse) assisté par ordinateur. Le niveau est divisé en 6 couches, (mise à part la couche Phonologique) : 1) morphologique ; 2) lexicologique ; 3) phraséologique ; 4) phrastique ; 5) transphrastique ; 7) textuel.

La bibliographie et les exemples révèlent des influences et une tradition linguistique russe.

En conclusion, à la lecture de ce livre, très définitoire, la volonté d’unification par la sémiotique plutôt que par la linguistique ou la sémantique ne fait pas de doute.

L’ouvrage, assez ardu par ses très nombreuses définitions parfois imprécises (on découvre après quelques dizaines de pages que rapport et relation sont employés indifféremment) demande une attention soutenue du lecteur. Les définitions et descriptions qui constituent l’essentiel de chaque chapitre peuvent paraître fastidieuses à retenir pour un sémiologue amateur. L’aboutissement des définitions et des relations qu’elles entretiennent entre elles est donné sous forme graphique détaillée, plus visuelle, dont l’objectif est de servir de modélisation à l’informaticien pour une réalisation opératoire. Les questions de cet ouvrage touchent à l’ingénierie linguistique, à la linguistique générale et structurelle et à l’enseignement des langues fondé sur les modèles structuraux et assistés par ordinateur. La fonction communicative de la langue est constamment présente dans le modèle. L’influence implicite de la pragmatique dans les pratiques documentaires destine l’ouvrage aux enseignants et étudiants des facultés de linguistique ainsi qu’aux chercheurs en TALN et ingénieurs-linguistes. Nous laissons à ces derniers le soin d’évaluer si les

(4)

objectifs de départ en termes de réponse aux problèmes du TAL sont effectivement atteints et si l’informatisation du modèle graphique proposée est de nature à améliorer le travail documentaire.

José Rouillard, VoiceXML : Le langage d’accès à Internet par téléphone Vuibert, 2004, 224 pages, ISBN 2-7117-4826-x

par Luiggi Sansonetti

EA2290 SYLED – EA170 CALIPSO – ILPGA, Université Paris 3 [email protected]

Cet ouvrage présente le langage VoiceXML, standard permettant l’accès à Internet par téléphone. L’approche se veut pragmatique en donnant les bases du langage, en passant par son histoire, et les outils nécessaires pour la mise en œuvre d’un serveur vocal avec des exemples concrets d’applications vocales.

Le premier chapitre présente de façon générale le pourquoi d’un tel langage.

L’auteur nous rappelle les fondements historiques avec les projets pionniers comme PhoneWeb, Phone Markup Language, VoxML, SpeechML pour aboutir à la recommandation du W3C nommée VoiceXML (1.1). Après avoir cité les quelques applications vocales existantes comme l’IHM ou le DHM (1.2), José Rouillard nous pose la question suivante : pourquoi créer des applications vocales ? (1.3). Il y a de plus en plus de téléphones portables et ils sont de plus en plus sophistiqués. Avec un téléphone, il n’y a plus de problème de compatibilité graphique pour la connexion Internet. Le handicap de lecture/écriture est balayé. Il s’agit d’une interaction mains libres et/ou yeux libres. L’auteur souligne le fait qu’en écoutant nous pouvons regarder autre chose en même temps. Les avantages pour les entreprises sont nombreux : informations disponibles 24/24, contact permanent avec l’employé et/ou le client.

Il y a deux grands types d’applications vocales (1.4) : les requêtes pour obtenir des informations d’ordre général et consulter des données, et les transactions pour exécuter une action spécifique comme une mise à jour des données. Le langage à balise qu’est VoiceXML va présenter à l’utilisateur les données de manière vocale.

Les avantages d’un tel langage par rapport au HTML sont que les applications sont interactives, le langage VoiceXML gère déjà les mêmes infrastructures que pour les interfaces visuelles, peut aussi gérer dynamiquement en intégrant l’ASP et le PHP, l’environnement est ouvert (et donc non propriétaire) et multi-plates-formes, les entrées se font par voix et/ou par clavier du téléphone (DTMF), les aides peuvent être nombreuses et variées (1.5). Mais la technologie vocale reste source d’erreurs car l’utilisateur a un certain débit, une certaine prosodie, un accent avec les ambiguïtés, les noms propres, les mots inconnus. Les grammaires vocales sont limitées car il s’agit d’un langage interprété et non compilé. Il y a dans la langue une

(5)

surcharge cognitive qui serait difficile à implémenter (trop de nuances, de sous- menus). Et il y a surtout un dernier point : la volonté de l’homme à parler à une machine.

En considérant tous ces paramètres et ces possibilités, il reste à concevoir une machine conversationnelle à états finis prenant en compte un état à la fois (1.6). Pour ce faire, il y a deux types de dialogues : les formulaires qui sont dirigés ou à initiative mixte et les menus qui proposent plusieurs choix. Le fonctionnement d’une telle application est alors assez simple : nous avons un utilisateur qui passe par le réseau téléphonique et arrive sur une passerelle VoiceXML. Cette passerelle va envoyer une requête http à un serveur pour consulter une base de données.

Dans le deuxième chapitre, l’auteur nous décrit les moyens possibles pour aborder les bases du développement d’applications en VoiceXML. Tout d’abord, nous pouvons simuler une interaction avec un ordinateur (2.1) pour tester son application avec IBM Websphere Voice Server SDK. Nous obtenons le schéma de communication suivant :

[Téléphone – Réseau – Passerelle] – [Serveur]

[Simulation par ordinateur] – [Réel]

Nous pouvons ensuite avoir une interaction réelle mais avec un hébergement distant (2.2), par exemple si on n’a pas le matériel disponible. Pour cette solution intermédiaire, l’auteur nous présente quelques hébergeurs et services comme VoiceXML Gateway (2.2.1), Sophone (2.2.2) et VoxBuilder (2.2.3). Le schéma est alors légèrement différent :

[Téléphone – Réseau] – [Passerelle] – [Serveur]

[Réel] – [Hébergement distant par un service] – [Réel]

Enfin, nous pouvons avoir une interaction réelle avec un hébergement local (2.3).

Mais il faut disposer alors de tous les logiciels et matériels nécessaires. Le schéma peut être représenté ainsi :

[Téléphone – Réseau] – [Passerelle] – [Serveur]

[Réel] – [Hébergement local] – [Réel]

Dans le troisième chapitre, José Rouillard nous donne tous les éléments de base du langage (3.1) pour faire parler et faire écouter la machine à travers des petits exemples très faciles à réaliser. Pour faire parler une machine, il y a la diffusion de synthèses vocales en mode TTS pour Text-To-Speech (3.2.1), de fichiers sonores au format wave par exemple (3.2.2). Il est possible d’améliorer la prononciation à l’aide de pauses, d’emphases, en proposant des choix de voix (3.2.3). Pour faire écouter une machine, il y a la reconnaissance vocale qui permet à l’utilisateur de parler plutôt que de taper sur une touche (3.3.1). L’enregistrement vocal permet de stocker un message pour un traitement ultérieur (3.3.2). Enfin, dans certains cas, l’utilisateur utilise sa voix comme le clavier (3.3.3).

(6)

Le quatrième chapitre (le plus gros) explique comment gérer un dialogue homme-machine en VoiceXML. Le tout est, comme précédemment, illustré de petits exemples simples et concrets. Nous voyons d’abord le rôle des grammaires vocales (internes et externes) pour comprendre ce que dit l’utilisateur (4.1). Il peut y avoir des importations de grammaires (4.1.3) ainsi que de variables et expressions ECMAScript (4.2). Pour gérer un dialogue homme-machine, le langage VoiceXML permet d’effectuer des branchements conditionnels de type « si … alors … sinon » (4.3.1). Il est également possible de proposer des aides aux utilisateurs pour les guider dans leurs choix ou expliciter une demande (4.3.2). Pour guider l’utilisateur, les principales applications vocales procèdent par menus et formulaires (4.4). Cette structure permet de diriger le dialogue (4.5), comme de laisser l’utilisateur prendre, à un moment autorisé, l’initiative de l’interaction (4.6). Ces transitions dans les dialogues à initiative mixte peuvent se faire par sous-dialogues internes ou externes (4.7). Elles peuvent aussi se faire par des envois simples ou par liens associé à une grammaire vocale (4.8). Beaucoup d’autres éléments sont possibles en VoiceXML comme les transferts d’appels et les déconnexions (4.9), la mise en mémoire d’objets ou composants (comme une horloge par exemple), l’intégration de scripts de calculs (4.10), la gestion de plusieurs documents (4.11) ou plusieurs sessions (4.12). Ce chapitre se termine par une dizaine de conseils pour améliorer les dialogues homme- machine (4.14).

Le dernier chapitre consiste à résumer toutes les notions vues jusque-là en trois études de cas. Le premier exemple est un jeu qui consiste à retrouver le nombre choisi par l’ordinateur (5.1). Le deuxième exemple est une calculatrice vocale (5.2).

Et le dernier utilise un service Web des codes postaux pour retrouver le nom de la ville française associée à son code postal (5.3). Les annexes présentent la procédure d’installation d’IBM Voice Serer SDK (A), les balises de VoiceXML avec tous les attributs autorisés (B), des listes de ressources tant opérateurs ou passerelles (C.1) que documents relatives au langage (C.2).

Pour conclure, l’ouvrage de José Rouillard, par son approche simple et détaillée, nous donne envie de programmer en VoiceXML, de comprendre ce langage et permet également d’aller plus loin avec les nombreux exemples d’applications et la qualité des annexes.

(7)

Sandrine Reboul-Touré, Florence Mourlhon-Dallies et Florimond

Rakotonoelina (éds.), Les discours de l’internet : nouveaux corpus, nouveaux modèles ? Presses Sorbonne Nouvelle, 2004, 204 pages, ISBN 2-87854-314-9

par Natacha Espinosa

EA170 CALIPSO, Université Paris 3 [email protected]

Cet ouvrage rassemble neuf contributions de chercheurs issus des sciences humaines qui effectuent un tour d’horizon des problèmes linguistiques posés par les corpus issus d’Internet. Ces contributions font suite à une journée scientifique organisée en 2002, par l’équipe du SYLED-CEDISCOR, sur l’influence de l’Internet et les modifications de l’analyse des nouveaux corpus engendrés. Les théories sous-jacentes sont principalement issues de la linguistique, en particulier de l’analyse de discours et de l’analyse conversationnelle, de la linguistique informatique et des sciences de l’information et de la communication. Les articles présentés mettent en lumière les questionnements qui reposent la possibilité et la pertinence, ou pas, de transposer des méthodes d’analyse existantes sur les nouveaux corpus électroniques issus d’Internet. Les corpus qui ont permis d’éclairer le questionnement central de cet ouvrage sont issus des forums de discussion, des listes de diffusion, des causettes (chats), des courriels et des pages personnelles, rendant ainsi compte d’énoncés produits par les usagers de la langue dans des situations de communication concrètes.

L’ouvrage se divise en trois parties, la première propose des Retours sur l’analyse conversationnelle, la seconde des Entrées en linguistique de discours et une troisième partie propose deux articles sur des Approches spécifiques. L’avant propos élaboré par les coordinatrices de la revue éclairent sur la problématique du numéro : Les discours de l’Internet : quels enjeux pour la recherche ? Les trois parties ne sont pas organisées selon les types de corpus mais selon les approches théoriques, issues des sciences du langage, qui ont permis l’analyse de ces corpus.

L’objectif est de revisiter les modèles théoriques dits classiques ainsi que les modes de recueil, de constitution et d’analyse de corpus en se questionnant sur la pertinence de les transposer sur ces nouveaux modèles de discours.

Dans la première partie, les auteurs s’interrogent sur la possibilité, ou non, d’appliquer les modèles et les outils de l’analyse conversationnelle sur ces nouveaux corpus reposant sur des dispositifs de communication différents considérés, dans chacun des cas, comme un modèle de conversation. Les auteurs tentent de définir la notion de conversation dans ces nouveaux échanges discursifs en les comparant à la conversation en face à face.

M. Marcoccia analyse la transposition des catégories de l’analyse conversationnelle sur des corpus issus des forums de discussions. En particulier, il ouvre une discussion sur la caractérisation du corpus lui-même, la structuration et les paramètres inhérents à ce type de corpus. L’auteur propose l’analyse d’un corpus en

(8)

s’appuyant sur la complexité du cadre participatif de Goffman et met en évidence un questionnement sur l’impact du temps entre les échanges et la complexité des échanges tronqués dans les forums.

J. Anis présente, dans son article, une analyse d’une interaction sur une liste de diffusion et plus particulièrement traite de la dynamique discursive présente dans le corpus. Ici, la définition de l’interaction est une adaptation plus « souple » de celle proposée par Kebrat-Orecchioni. L’auteur propose une analyse longitudinale des séquences conversationnelles mises en jeu dans une conversation écrite collective asynchrone. Il montre que les phénomènes discursifs impliquées dans des échanges électroniques ne sont pas différents de ceux impliqués dans une conversation en face à face. Par contre, il définit cette interaction comme une conversation discontinue, mettant en jeu des caractéristiques spatio-temporelles qui permettent une expansion des polylogues en termes de nombre des participants, de durée et de densité dialogique.

P. Chardenet propose de montrer le problème méthodologique qui incombe à l’analyste lorsqu’il s’agit d’analyser un cadre participationnel instable où tous les locuteurs « parlent » en même temps (causette-chat). Il appuie son étude sur un corpus extrait d’un corpus multilingue et sur les interactions entre enseignants et apprenants et entre apprenants eux-mêmes. L’auteur ouvre le questionnement sur l’analyse de la mise ne contact des langues par l’écrit sur une échelle de proximité qui va de l’alternance entre interventions au mélange de langue dans l’énoncé. Il montre que cette analyse ne peut pas se faire uniquement sur l’analyse des tours de parole, mais qu’il faut tenir compte d’un processus interactionnel d’aménagement linguistique mis en jeu par les locuteurs et l’alternance des langues entre ces derniers.

C. Celik et F. Mangenot présentent une analyse sur un cas particulier de communication pédagogique médiatisée par ordinateur, dans le cadre d’une formation à distance. Ils proposent un exemple de mode écrit qui fait appel au code écrit asynchrone (Mangenot). Leur analyse permet de repérer de nouvelles caractéristiques communicationnelles associées à des interactions pédagogiques repérables dans leur corpus. Les auteurs montrent que la communication sur un forum peut parfois revêtir les caractéristiques de la communication présentielle et offrir les marques énonciatives pouvant témoigner de la constitution d’une communauté d’apprentissage.

Dans la seconde partie, les auteurs traitent des notions du discours et la notion de genre étudiées à partir de corpus recueillis dans les forums de discussion.

P. von Münchow présente, dans son article, les configurations discursives repérées dans le discours rapporté. L’auteur définit le discours rapporté comme une opération métadiscursive de représentation d’un acte d’énonciation par un autre acte d’énonciation. A partir de recherches antérieures (von Münchow, 2001), l’auteur a comparé la distribution des différents types de discours rapporté dans le forum avec celle analysée dans d’autres genres discursifs, comme celui du journal

(9)

télévisé, et montre que les formes de la modélisation d’emprunt et de la modélisation autonymique d’emprunt sont davantage présentes dans les forums.

L’article de J.-Y. Colin et F. Mourlhon-Dallies a pour but de montrer qu’il existe des ressemblances au niveau des caractéristiques formelles entre les écrits issus des forums de discussion et les écrits issus du courrier des lecteurs de magazines. Pour illustrer leur propos, les auteurs présentent une analyse comparative sur la notion de genre dans ces deux corpus. Cette étude s’interroge sur la filiation discursive entre ces deux types de corpus et sur ce que pourrait être une « génétique discursive » en analyse du discours, permettant ainsi de revisiter la notion de « genre discursif à la lumière de la communication médiée par ordinateur.

La dernière partie présente des travaux élaborés à partir de pages personnelles et de messages électroniques.

V. Beaudoin, S. Fleury et M. Pasquier traitent les notions de l’instance de l’énonciation et la notion de genre à travers un nouveau terrain d’expérimentation que constituent les pages personnelles. Le corpus a été construit à partir de 101 426 pages personnelles. L’analyse de ce corpus s’est axée sur la répartition de traits de différentes natures : des traits « textuels », des traits présentionnels et structurels. A l’aide de nombreux outils d’identification, d’aspiration, de normalisation, etc., l’analyse du corpus sur 6 mois a permis de mettre en évidence l’évolution des pages personnelles : soit elles sont abandonnées, soit elles évoluent et, généralement, migrent vers d’autres lieux d’hébergement. Les auteurs mettent en évidence que l’évolution des pages personnelles témoignent d’une fonction de terrain d’expérimentation et constituent un lieu d’apprentissage de l’écriture hypertextuelle pour les internautes qui visitent ou construisent ces pages.

B. Hénocque propose une analyse formelle de messages électroniques, en s’attachant à la longueur des messages, leur contenu, les codes utilisés, etc. L’auteur fait aussi une analyse sur la variété structurelle, culturelle et identitaire de ces messages recueillis sur un serveur intranet d’entreprise. Il montre les limites de ces messages dans la communication des entreprises et de la persistance du média papier. Le corpus analysé a été construit à partir des résultats d’une enquête menée sur les pratiques de communication électronique dans 92 entreprises en 1997 et en 2001. A la lumière des résultats, l’auteur conclut sur le fait que le message électronique en intranet d’entreprise est subordonnée aux hiérarchies internes, à la culture de la « maison » comme à la culture des utilisateurs.

L’ensemble des contributions montre que la recherche sur les discours de l’Internet véhicule de nouvelles problématiques sur les concepts classiques et rappelle qu’il n’est pas si simple de transposer les théories et méthodologies attestées sur ces nouveaux « genres discursifs » et ces « communications médiatisées par ordinateur ». L’objectif de cet ouvrage est d’inciter les chercheurs à re-visiter les champs disciplinaires tant au niveau des catégories d’analyse que de la méthodologie même de recueil et d’analyse de ces nouveaux corpus.

(10)

Catherine Fuchs, La linguistique cognitive

Editions Ophrys, 2004, 262 pages, ISBN 2-7080-1035-2 par Patrick Saint-Dizier

IRIT-CNRS [email protected]

La linguistique cognitive est une discipline vaste, avec de nombreuses ramifications vers un grand nombre de dimensions de la linguistique, de la psychologie, de la neurologie, des mathématiques et de l’informatique. Ce livre en présente les principaux enjeux scientifiques d’une façon approfondie, en situant les courants actuels dans une perspective historique.

Un ouvrage bienvenu

Saluons cet ouvrage qui arrive à point nommé pour la communauté française en linguistique, sciences cognitives et traitement du langage naturel, à un moment où ces paradigmes, qui ont structuré nombre de recherches dans les 15 dernières années, subissent des évolutions majeures. La perspective historique, sur une génération, dans laquelle ce livre s’inscrit pour présenter à la fois les fondements théoriques, les recherches actuelles et les acquis, est particulièrement précieuse.

Ce livre n’est pas un manuel à vocation didactique : si l’on y trouve la présentation de la plupart des courants des sciences cognitives et de leurs applications, avec nombre de références vers les ouvrages fondateurs ou de synthèse, il dresse plutôt un bilan de la discipline. Il est aussi, et peut-être avant tout, un plaidoyer qui démontre la place centrale qu’occupent les sciences cognitives dans les champs de la linguistique, de la psychologie, de la neurologie, des mathématiques et de l’informatique. Ajoutons-y, plus globalement, les sciences de l’homme et les sciences sociales.

Les articles de ce volume mettent bien en perspective les problèmes intellectuels profonds, difficultés scientifiques, épistémologiques, et méthodologiques que rencontrent les chercheurs de la discipline. Les articles sont riches, passionnants, bien documentés et d’un style vivant. Leur lecture contraste singulièrement avec les documents ultra-techniques que l’on rencontre de plus en plus souvent, sans perspective intellectuelle à moyen ou long terme qui soit porteuse.

Nous devons à Catherine Fuchs, organisatrice de cet ouvrage, une excellente introduction aux sciences cognitives, précise et dense, suivie de la présentation détaillée du contenu de l’ouvrage. Ce livre est en quelque sorte structuré en deux parties : (1) une présentation des principaux courants de la linguistique cognitive, à travers quatre articles : Grammaire formelle et cognition de Alain Rouveret, Les grammaires cognitives de Bernard Victorri, Le fonctionalisme linguistique et les

(11)

enjeux cognitifs, présenté par Jacques François, et Grammaire diachronique et cognition : l’exemple du chinois par Alain Peyraube, puis (2) une mise en perspective de ces courants dans des champs associés : Eléments de psychologie cognitive : des représentations à la compréhension par Jean-François Le Ny, Linguistique, pathologie du langage et cognition, présenté par Jean-Luc Nespoulous, et, enfin, Intelligence artificielle, linguistique et cognition par Gérard Sabah. Les quelques paragraphes qui suivent commentent quelque peu ces contributions, l’absence d’exhaustivité ne doit bien entendu pas être interprétée comme un jugement a priori.

La première partie de l’ouvrage s’articule d’une façon subtile : deux articles particulièrement impressionnants s’interpellent, stigmatisant les différences de vues entre une linguistique cognitive où les grammaires formelles (comprendre les évolutions variées de l’approche transformationnelle) sont proposées comme des modèles adéquats de la cognition linguistique (A. Rouveret) et une vision néo- fonctionnaliste (J. François) qui va opposer à une vision déductive et absolue, à la recherche d’universaux, une approche plus expérimentale, graduelle, inductive, dynamique, centrée sur l’identification de principes cognitifs. L’article de A. Rouveret, qui s’appuie sur une longue tradition, montre à travers quelques cas précis comment la théorie transformationnelle a évolué, avec l’objectif de construire des modèles explicites, formalisables, de plus en plus abstraits de la langue et d’expliquer la compétence des individus en précisant comment le savoir linguistique est acquis. Principes et paramètres et leur acquisition sont développés, en montrant la méthodologie sous-jacente, et comment ces travaux aboutissent au programme Minimaliste. En réponse, l’article de J. François, est d’abord sur la défensive, puis l’atmosphère se détend, au fur et à mesure que l’argumentation se fait de plus en plus précise. Les principaux points abordés montrent que le langage ne peut être appréhendé que dans un cadre global en termes de discours, parole et contexte (les contraintes du monde réel). Les systèmes linguistiques sont alors analysés comme des équilibres dynamiques et non des états stables idéalisés, caractérisés par des éléments de grammaire formelle. Sont aussi évoqués des aspects majeurs tels que l’évolution de l’espèce via l’entraînement de la mémoire à long terme, l’acquisition et l’évolution des langues et le renouvellement des communautés linguistiques. Ces deux articles concluent de façon pacifiée à la nécessité d’une intégration des visions associées à ces deux approches.

A côté de ces deux articles quasi titanesques, on trouve deux autres contributions, tout aussi passionnantes, mais davantage centrées sur une problématique. La contribution de B. Victorri nous présente les fondements des grammaires cognitives, en particulier à travers ses « pères fondateurs » : R. Langacker, L. Talmy, G. Lakoff et G. Fauconnier, pour ne citer que les plus marquants. L’auteur nous montre que ces travaux placent la sémantique (les structures conceptuelles ou les espaces mentaux) au cœur du langage, la grammaire étant réduite à un rôle de mise en forme. Le sous- système grammatical détermine la structure d’un énoncé tandis que le sous-système lexical contribue à en déterminer le contenu. Des aspects particulièrement profonds

(12)

sont abordés autour de la notion de prototype et du phénomène fondamental pour l’élaboration et l’évolution d’une langue que constitue la métaphore. Une présentation originale de la théorie des espaces mentaux (G. Fauconnier) permet de bien saisir comment les « potentiels de sens » prennent corps dans le cadre d’un discours complet, en contexte. Pour terminer ce panorama, l’article de A. Peyraube nous montre, via des exemples concrets empruntés au chinois ancien et contemporain, comment les travaux en typologie des langues, dans une perspective diachronique, permettent de dégager des universaux linguistiques et cognitifs. L’idée fondamentale est que, derrière les variations et les changements grammaticaux, il y a des principes organisateurs plus abstraits qui dessinent les contours du fonctionnement de la faculté du langage.

La seconde partie de l’ouvrage est tout aussi passionnante. J.-F. Le Ny, en s’appuyant sur les expériences dégagées de ses nombreux travaux en sémantique psychologique, nous montre les différences entre mémoire à long terme et mémoire de travail quant au traitement des connaissances, de la signification et de l’interprétation. Les notions de représentation et de processus sont analysées dans le cadre du traitement de l’information. Une section importante du chapitre est consacrée aux techniques et méthodes en sémantique psychologique, tout à fait éclairantes quant à leurs difficultés, leurs objectifs et leurs limites. L’article suivant, de J.-L. Nespoulous, nous plonge dans le domaine de la neuropsycholinguistique, qui analyse, en particulier à travers les pathologies du langage, l’architecture fonctionnelle du langage. Ainsi, par l’observation clinique d’une lésion cérébrale, comme celle liée à l’aphasie, on peut observer le fractionnement « distribué’ en composants et sous-composants de la faculté complexe du langage (mémoire et processus). A travers l’analyse de différents types de dissociations, l’auteur nous montre comment on peut construire un modèle de la modularité du fonctionnement du cerveau humain relativement au langage, et à la représentation des connaissances plus généralement. Ce livre se termine par un chapitre dédié à l’intelligence artificielle et au traitement du langage naturel comme « applications » ou modèles calculatoires pour les sciences cognitives, rédigé par G. Sabah. Ce chapitre débute par un historique du traitement automatique des langues, de la syntaxe à la sémantique. Cette présentation est particulièrement attachante lorsque l’on considère les défis et les rêves qui ont animés les pionniers de cette discipline. On y voit aussi se dessiner les contours des tendances contemporaines de la linguistique et de l’IA à travers des défis et résultats extravagants ou des échecs. On y note aussi l’absence de dogmatisme, la curiosité, mais aussi l’attention au formel et à la place de l’humain dans la communication avec une machine. Ce foisonnement intellectuel est particulièrement rafraîchissant si l’on considère la grisaille technique qui enveloppe à présent certains types de travaux. G. Sabah nous montre ensuite comment la discipline a évolué vers des préoccupations moins techniques qui montrent le degré de maturité atteint : recherche de robustesse des analyses, importance des corpus qui attestent des usages et volonté d’évaluation des résultats. Ce chapitre se termine par une reprise des thématiques de la première partie (par exemple, les limites d’une intelligence désincarnée) en une sorte d’avertissement aux pratiquants du traitement

(13)

des langues qui ont parfois tendance à perdre de vue la réalité de la langue dans le cadre d’applications à la langue exagérément simplifiée.

Cet ouvrage de grande qualité est d’une grande lisibilité et d’une immense portée scientifique. Le public visé est large : des vieux « routiers » du domaine qui prendront plaisir aux débats et évocations de ces articles, aux étudiants qui y trouveront à la fois une démarche scientifique saine et de nombreuses références.

Souhaitons à présent que cet ouvrage puisse être traduit et trouve toute sa place dans notre communauté scientifique.

Francis Corblin, Claire Gardent (éd.), Interpréter en contexte Hermès Lavoisier, 2005, 346 pages, ISBN 2-7462-0984-5 par Daniel Kayser

LIPN (UMR 7030 du CNRS), Institut Galilée, Université Paris-Nord [email protected]

Ce recueil de 9 chapitres écrits par d’excellents auteurs est intéressant en lui-même, mais aussi par le constat qu’il permet au lecteur de tirer sur l’état de notre domaine : ne serions-nous pas dans une impasse ?

Impression générale

Je recommande vivement la lecture de ce recueil parce qu’il rassemble sous une même couverture les réflexions de certains des meilleurs spécialistes des approches symboliques. Mais cette recommandation ne va pas sans critiques !

D’abord, je trouve que ce livre ne tient pas les promesses de son titre. Un point commun des études qu’il contient est qu’elles dépassent le niveau d’une seule phrase. Mais certaines d’entre elles semblent limiter leur intérêt pour le contexte à la présence, dans les phrases précédentes, de référents potentiels pour des pronoms se trouvant dans une phrase cible. Heureusement, d’autres chapitres en ont une vision plus large, mais le lecteur qui espérerait trouver une liste des facteurs contextuels qui influencent l’interprétation restera sur sa faim. Même si, en définitive, une bonne partie de ces facteurs se trouvent traités ici ou là, chaque étude ne s’intéresse qu’à des fragments de cette liste, et aucune ne présente de solution de principe expliquant comment combiner ces facteurs. Ce n’est pas vraiment un reproche, tant cette question est difficile, mais on peut regretter qu’elle ne soit pas au moins mentionnée.

Le choix des thématiques traitées et de leur agencement dans le livre n’est pas apparent. L’introduction des « directeurs » du volume résume bien chaque contribution et, comme je ne pourrais mieux faire que de la paraphraser, je me contenterai de donner une idée du livre en énumérant quelques thèmes abordés : la

(14)

prosodie, la cohérence discursive, la possibilité de ramener tous les usages d’un mot à un sens unique, la désambiguïsation lexicale par les types pointés de Pustejovsky, par abduction ou par exploration contextuelle, les sémantiques dites dynamiques, l’anaphore, les relations réciproques. Chaque chapitre a son intérêt propre et, s’il n’est pas toujours facile à lire, c’est parce que la substance en est ardue. Cependant, chacun des auteurs a fait le maximum pour la rendre assimilable par un lecteur rai- sonnablement familier avec le domaine ; l’effort de lecture est donc toujours récom- pensé par une meilleure compréhension de ce qui est en jeu.

Critique méthodologique

Chaque auteur présente quelques exemples, qui illustrent avec clarté des concepts théoriques difficiles. Mais aucun d’eux n’explicite rigoureusement la classe d’énoncés dont ces exemples sont censés être représentatifs. Dès lors, même si on est convaincu – et on ne l’est pas toujours ! – de l’analyse qui en est donnée, on n’a aucun moyen d’évaluer si cette analyse s’étend à la totalité ou, soyons réalistes, à une fraction significative des énoncés de cette classe. D’ailleurs l’idée même d’évaluation n’affleure nulle part. Je ne me fais pas ici l’avocat de ces campagnes systématiques, dont je critique au contraire souvent certains effets pervers, mais je pense que le domaine couvert ici restera dans l’impasse où il se trouve, s’il ne prend pas conscience de la nécessité de définir ses critères de succès. J’utilise à dessein le mot d’impasse : c’est une appréciation extrêmement dure et je voudrais donner deux arguments expliquant pourquoi je la crois néanmoins fondée.

La place des connaissances sur le monde

Beaucoup, si ce n’est tous les auteurs de ce recueil, reconnaissent l’importance des connaissances sur le monde pour interpréter en contexte. Mais tout se passe comme si, ne sachant pas ou ne voulant pas représenter ces connaissances, ils sup- posaient le problème résolu et imaginaient que la connaissance pertinente s’insérait d’elle-même, au moment opportun, dans leur analyse. Je choisis comme cible l’exemple (11) de Nicholas Asher et Laurent Roussarie, mais il y en a de semblables pratiquement dans chaque chapitre¹ : Jean a passé une très agréable soirée hier. Il a fait un excellent repas. Il a mangé du saumon. Il s’est régalé d’un copieux plateau de fromages. Ensuite il a remporté un concours de danse. Les auteurs affirment que la dernière phrase est un changement local de topique, ce que je ne conteste certainement pas, mais d’où leur vient cette information ? Prévoient-ils une sorte de dictionnaire ou d’ontologie dans lequel le concept concours de danse est associé à un topique T, et le concept repas, à un topique T’ ? Si oui, croient-ils à l’existence

1. Pour me faire pardonner, je dirai que leur chapitre est l’un de ceux dont la problématique me paraît générale, alors que quelques autres traitent un problème local dont je ne vois pas bien comment la solution fait progresser le problème d’ensemble.

(15)

d’une liste fermée de topiques ? Ou suffit-il (p.275) de l’échec de l’inférence cherchant à rattacher concours de danse à repas ? Mais quelles seraient les prémisses de telles inférences ? Plus loin, ils ajoutent : « Par un (ou plusieurs) axiomes encyclopédique(s) indiquant un sous-type possible entre une soirée et un concours de danse, nous pouvons inférer [que la dernière phrase est une élaboration de la première]. » Mais si cette phrase a le mérite de signaler que leur entreprise nécessite de tels axiomes (ce que les autres auteurs laissent dans un flou encore plus artistique), ils ne donnent pas la moindre preuve de leur existence, pas de piste pour les découvrir, et ils supposent que leur système saura les trouver parmi une myriade d’autres, au moment où il en aura besoin.

Tant qu’à me montrer critique, je signale quelques autres causes de frustration : – le manque d’explicitation, au sein de certains chapitres, des raisons pour les- quelles on saute d’un sujet à l’autre ;

– l’hétérogénéité des inacceptabilités : on traite de la même façon certaines phrases ou certains enchaînements qui sont effectivement impossibles dans le contexte défini par l’auteur, et d’autres qui sont seulement un peu incongrus… voire acceptables ;

– quelques coquilles, qui ont parfois la mauvaise idée de se nicher dans des formules déjà difficiles à comprendre ; le lecteur finit par rectifier de lui-même, mais la matière est assez compliquée comme cela pour ne pas lui infliger cette tâche supplémentaire !

Compositionnalité et vérité

L’autre raison qui me fait parler d’impasse est l’idée reçue qui sous-tend presque toutes les contributions de ce recueil : une sémantique formelle se devrait d’être compositionnelle, et renvoyer, au moins partiellement, à la notion de vérité. Des livres entiers – et même un numéro de TAL – discutent cette question, et il n’est pas question d’y revenir ici, mais je pense que cette idée n’est que l’avatar d’une vénérable tradition philosophique qui n’est pas réexaminée comme elle devrait l’être à la lumière des difficultés rencontrées. Or à ce sujet, le chapitre de Hans Kamp – qui, lui aussi, aborde des questions que je trouve centrales – est très important.

Cherchant à se défendre de critiques qui ont été faites à ses premiers écrits, notamment des péchés de non-compositionnalité et de représentationnalisme (comprendre : la dépendance de la représentation à la forme, et pas seulement au sens), il conclut que, dans une certaine mesure en effet, la DRT possède ces caractéristiques, et que ce n’est pas un inconvénient. Voilà un premier pas ; peut-être un jour franchira-t-il le second, et cessera-t-il de fonder la DRT sur les conditions de vérité ?

(16)

Conclusion

Malgré les volées de bois vert que j’ai administrées, je dois honnêtement recon- naître les qualités de ce recueil : peu d’ouvrages, surtout en français, présentent aussi bien et permettent de comparer quelques approches formelles de la sémantique et de la pragmatique (je pense aux livres de Michel Chambreuil, qui nous donne ici un remarquable exposé comparatif de la sémantique dynamique de Groenendijk et Stokhof et de la sémantique des situations de Barwise et Perry). Il faut remercier les auteurs d’ajouter une contribution, et non des moindres, à ce petit rayon de nos bi- bliothèques, d’autant que si certains se délectent dans leur formalisme, la plupart d’entre eux font l’effort de (bien) expliquer à quoi il sert. Ces chapitres seront donc précieux pour préparer des cours de sémantique formelle. Enfin, le ton général du livre est d’une grande honnêteté : personne ne prétend résoudre plus que la classe modeste des problèmes sur laquelle il se concentre.

Mais cette même modestie, venant des meilleurs auteurs, me paraît révélatrice de la situation actuelle : ajouter un (n+1)^ème opérateur modal ou un (n+1)^ème type d’entités à une théorie sémantique existante résoudra peut-être le problème local auquel l’un ou l’autre d’entre eux se consacre. Mais opérer ainsi perpétuera une fuite en avant qui n’a que trop duré. Un constat s’impose, à mon avis, lorsqu’on referme ce recueil : mettant en regard la débauche d’ingéniosité à laquelle d’excellents chercheurs se livrent depuis des décennies avec la simplicité des exemples qu’ils traitent, on ne peut que se demander s’il faut persévérer dans cette voie. Est-ce ainsi que l’on répondra au défi que représente la facilité avec laquelle nous, êtres humains, inter- prétons en contexte ?

Frédéric Landragin, Dialogue homme-machine multimodal Hermès Lavoisier, 2004, 272 pages, ISBN 2-7462-0992-6 par Andrei Popescu-Belis

ISSCO/TIM/ETI, Université de Genève [email protected]

Ce livre représente la version publiée d’une thèse de doctorat qui s’intéresse au phénomène de la référence aux objets dans le dialogue homme-machine multimodal. L’ouvrage étudie les rapports entre la perception d’une scène visuelle sur un écran, les gestes de désignation des objets sur cet écran, et les expressions linguistiques utilisées pour faire référence à ces objets. Un modèle fondé sur la notion de domaine de référence intègre ces trois aspects. Deux applications sont décrites à la fin de l’ouvrage, esquissant ainsi des perspectives de validation et d’extension du modèle proposé.

La thèse de F. Landragin est organisée en trois parties. La première pose le problème de la compréhension des références aux objets dans le dialogue homme-

(17)

machine et délimite les champs théoriques de la recherche. La deuxième partie développe deux concepts clés de la thèse, les domaines de référence et la saillance des objets, avant de présenter l’élément central, à savoir le modèle de fusion multimodale proposé pour la résolution des références. La troisième partie présente brièvement des applications du modèle et de nombreuses suggestions pour son extension.

L’ouvrage bénéficie d’une présentation claire : chaque chapitre est introduit par une liste de questions qui y seront traitées et se conclut par un résumé récapitulatif.

L’exposé privilégie les discussions et les exemples, en réduisant le formalisme au strict minimum. Cela permet de traiter à l’intérieur d’un même ouvrage de questions aussi diverses que la structuration des perceptions visuelles, l’analyse des gestes de désignation, la classification des expressions référentielles tels les groupes nominaux et les pronoms, la communication ostensive-inférentielle dans le cadre de la théorie de la pertinence et des propositions d’implémentation informatique. À ce titre, les chapitres introductifs offrent au lecteur un panorama de chacun de ces thèmes.

L’équilibre entre la généralité souhaitée pour les analyses théoriques d’une part, et les cas particuliers (exemples et applications) d’autre part, est globalement atteint.

Le type d’interaction auquel s’intéresse l’auteur est un dialogue de commande où l’utilisateur humain indique au système informatique certains objets figurant sur un écran, ou bien des objets à créer. Cette situation d’interaction paraît en effet avoir fourni la plupart des exemples cités dans la thèse. Dans cette situation, le statut respectif de la perception visuelle, des gestes produits par l’utilisateur et des énoncés émis est relativement asymétrique et fortement contraint, ce qui assigne des limites aux considérations théoriques de la thèse.

Le chapitre 4 aborde l’une des notions clés, celle de domaine de référence, à savoir un sous-ensemble d’objets du contexte visuel, possédant certaines propriétés communes (telles la classe ou la position), et parmi lesquels sera sélectionné le référent de l’expression référentielle courante (ou les référents dans le cas d’une expression plurielle). L’une des contributions les plus novatrices de la thèse consiste à étendre cette notion en vue de structurer le contexte visuel, ici l’ensemble des objets visibles sur un écran, alors qu’à l’origine les domaines de référence concernent le contexte discursif (travaux de A. Reboul et de S. Salmon-Alt notamment). Le chapitre 4 propose ainsi une méthode de calcul des domaines de référence faisant appel à une représentation arborescente du contexte visuel sous la forme de « dendrogrammes ». L’ordonnancement des objets dans les domaines de référence est étudié dans le court chapitre 6. Le chapitre 5 présente la notion de saillance et propose des critères pour déterminer la saillance visuelle des objets du contexte graphique, et dans une moindre mesure des critères de saillance linguistique concernant les objets du discours.

Le chapitre 7 contient le noyau de la thèse, à savoir l’intégration des domaines de référence provenant du contexte visuel avec l’interprétation en termes de domaines de référence sous-spécifiés du message émis par l’utilisateur, message qui peut être

(18)

un énoncé comprenant une expression référentielle, ou un geste de désignation, ou leur combinaison. Pour ce qui est de l’interprétation linguistique, une classification des expressions nominales et de leurs effets sur les domaines de référence est proposée ; celle-ci semble toutefois moins formalisée que celle proposée par S. Salmon-Alt dans sa thèse (chapitre 8), avec laquelle une comparaison aurait été justifiée. La procédure finale de résolution de la référence multimodale par appariement des domaines est décrite synthétiquement, puis illustrée sur un exemple.

Enfin, la dernière section du chapitre 7, extraite d’une communication à une conférence, propose une quantification de la pertinence des expressions référentielles, au sens de la théorie de la pertinence (Sperber et Wilson). L’apport de cette tentative encore peu formalisée n’est pas entièrement clair et il semble que cette quantification soit davantage utile à la génération des expressions référentielles, abordée seulement à la section 9.3, où l’on retrouve la fin de la communication mentionnée.

La partie applicative de la thèse est la plus courte. Une architecture abstraite regroupant les fonctionnalités nécessaires au modèle de résolution est proposée au chapitre 8. Deux projets au sein desquels le modèle a été appliqué sont esquissés au chapitre 9. Si l’on admet volontiers que des simplifications sont nécessaires en vue d’une implémentation, celles introduites pour le premier projet (page 222) paraissent s’éloigner trop de la complexité du modèle proposé dans la thèse (qu’elles précèdent en réalité). Enfin, l’application du modèle à la génération d’expressions référentielles ouvre de nouvelles perspectives en conclusion de la thèse.

Ce bref résumé illustre l’étendue des domaines abordés et la principale contribution théorique de la thèse. Il fait également ressortir deux éléments qui auraient pu permettre de justifier bien plus solidement la proposition avancée, en l’opérationnalisant : une étude empirique des désignations dans un contexte concret, ainsi qu’une évaluation de l’implémentation du modèle. Une étude empirique d’un corpus recueilli selon la méthode du magicien d’Oz semble à vrai dire avoir précédé la thèse. La typologie des références multimodales dégagée de cette étude devrait permettre de montrer l’importance du modèle proposé pour la résolution de nombreux cas difficiles.

Quant à une évaluation des performances du modèle par rapport à la tâche en vue de laquelle il a été construit (la résolution des références aux objets), il est à déplorer que les indications des résultats soient absentes de la thèse. La notion même d’évaluation semble évitée, au profit de l’idée de validation, dans la brève discussion du 3.2.3 (pages 98 à 101). Pourtant, s’il est peu probable que le modèle proposé soit simplement « valide » ou « invalide », on souhaiterait en revanche connaître ses points forts et ses limites : quels types de références ne sont pas traités ? Le modèle génère-t-il parfois des prédictions erronées ? Cela se produit-il fréquemment ou non dans le contexte de certaines applications ? Comment le modèle se compare-t-il à d’autres approches plus élémentaires ? Est-il suffisamment robuste ?

(19)

L’auteur souligne qu’il y a plusieurs façons d’évaluer la qualité d’un modèle : par son implémentation dans un système, par son application sur un corpus, par la comparaison avec des sujets humains, etc. Curieusement, l’auteur choisit (page 101)

« la validation par des échanges dans la communauté scientifique », i.e. par les publications – et en effet la thèse est composée d’extraits d’un nombre considérable de publications de son auteur. L’auteur choisit également la validation du modèle par

« son exploitation dans des domaines pour lesquels il n’a pas été conçu ». On peut légitimement se demander pourquoi ne pas commencer par une exploitation dans le domaine pour lequel il a été conçu, à savoir le dialogue de commande pour la manipulation d’objets sur un écran. Les deux extensions applicatives du modèle (chapitre 9) concernent la désignation d’objets en trois dimensions dans une pièce virtuelle, et la navigation multimodale, intégrant des commandes à retour de force, dans une collection d’enregistrements musicaux. L’évaluation de ces implémentations semble toutefois absente, bien que des méthodologies d’évaluation existent déjà pour de telles applications.

En conclusion, la lecture de cette thèse pluridisciplinaire riche en informations, qui aborde les modalités visuelle, gestuelle et langagière, sera utile à tous ceux qui conçoivent des systèmes de dialogue homme-machine multimodaux et qui se heurtent (inévitablement) au problème de la résolution des références. La thèse intéressera également les linguistes et les pragmaticiens qui étudient la correspondance entre les expressions référentielles et les informations perceptives provenant du contexte visuel, en particulier dans la perspective de la théorie de la pertinence.