Article pp.199-219 du Vol.45 n°3 (2004)

(1)

Rubrique préparée par Denis Maurel

LI (Laboratoire d’informatique de l’Université François-Rabelais de Tours) [email protected]

Alain Polguère, Lexicologie et sémantique lexicale, Les Presses de l’Université de Montréal, 2003, 260 pages, ISBN 2-7606-1860-9

par Gérard Huet INRIA-Rocquencourt [email protected]

Ce petit livre couvre les notions essentielles de lexicologie, selon l’école de Mel’Cuk

« Sens-Texte »

Le premier chapitre rappelle la terminologie Saussurienne – distinction entre langue et langage, etc. On peut s’étonner de la terminologie « appareil phonatoire », qui est moins naturelle qu’ « appareil vocatif », symétrique de l’appareil auditif.

Le chapitre 2 explique le concept de signe. La définition de signifiant n’y est pas aussi limpide qu’on pourrait le souhaiter, au niveau de l’ « abstraction dans la forme » notamment. Un minimum d’explications préalables sur la phonétique aurait pu dégager les notions de phonème et d’alphabet phonétique pour mieux expliquer le signifiant comme suite de phonèmes, faisant abstraction du signal sonore, et muni d’une notation appropriée. L’auteur veut faire l’économie de ces notions, mais ne peut éviter la difficulté. Il pose comme représentation du signifiant d’un mot-signe sa forme italique, mais dans toute la suite les italiques sont employées essentiellement pour dénoter les signes et non pas seulement leur signifiant. Dès le premier exemple (ronron), le signifiant est noté par la notation phonétique /.../ – parachutée hélas sans explication.

L’auteur discute rapidement de deux aspects du signe : la notion de signe grammatical et la notion de signe complexe. Les deux aspects sont bien sûr reliés, et en fait la décomposition morphologique sous-jacente à la notion de signe grammatical est d’une certaine manière en contradiction avec le postulat Saussurien sur l’arbitraire du signe, car la notion même de morphologie repose sur le fait que dans une certaine mesure, la sémantique est compositionnelle, c’est-à-dire que le

(2)

sens est un morphisme vis-à-vis de la structure morphologique : le signifié de `a+b`

est obtenu par composition du signifié de `a` et du signifié de `b`. On ne peut donc espérer trouver l’arbitraire qu’au niveau des racines étymologiques. Le problème se complique par le niveau de conscience plus ou moins grand qu’un locuteur peut avoir de cette décomposition : un locuteur averti verra le rapport entre graine et grenier, un linguiste comparatiste verra des substrats lointains lui permettant de deviner le sens d’un mot à travers des dérivations phonétiques complexes. Une question importante « Pourquoi doit-on considérer que le mode de communication langagière est avant tout sonore et non écrit ? » est rejetée dans l’exercice 3. Une petite discussion de ce problème aurait mérité développement dans le texte. Par exemple, la langue des signes nécessite une extension des définitions, ou une justification de pourquoi elle n’est pas considérée dans cet ouvrage (en effet, le problème de représentation d’un lexique de la langue des signes pose notamment un problème spécifique de codage du signifiant).

Le chapitre 3 pose des définitions très précises de mot-forme, lexème, locution, lexie, vocable. Ces définitions, qui ne font pas l’objet d’un consensus parmi tous les lexicologues, ont le mérite de proposer un cadre terminologique rigoureux à cet ouvrage.

Le chapitre 4 porte sur la morphologie. L’auteur louvoie avec la phonologie, qui est esquivée dans cet ouvrage – la notion de phonème n’apparaît qu’à l’état d’allusion ; alors que les mots-forme devraient être définis comme des suites de phonèmes, les exemples ne présentent en général que les représentations écrites.

Afin d’éviter la notion d’euphonie, l’auteur esquive la difficulté en définissant le morphème comme un ‘regroupement’ de ‘morphes’ « alternatifs ». Ceci cache le fait que ces alternatifs ne sont pas équivalents, et que l’euphonie apparie précisément les morphes de part et d’autre d’une agglutination – absorb-tion donne absorption par surdification du b devant le t, et ce mécanisme fonctionnel est escamoté par les notions proposées.

La flexion est définie comme ‘combinaison’ (non précisée à nouveau, on parle aussi de ‘greffe’) d’un radical et d’un affixe. Ceci suffit en effet pour le français, mais il existe dans d’autres langues des flexions verbales qui combinent un radical avec à la fois un préfixe et un suffixe (aoriste avec augment en grec par exemple).

L’arabe est encore plus complexe. Ceci dit, l’auteur ne prétend pas présenter un ouvrage complet de linguistique générale – il s’agit d’un ouvrage introductif qui limite ses exemples au français.

Le chapitre 5 aborde la structure du lexique, et les classifiants lexicaux d’un corpus (vocabulaire, index, concordance). Le chapitre 6 discute du sens linguistique.

Les notions de dénotation et de référent sont distinguées, comme il est d’usage. On aborde les notions de sens logique, avec les prédicats, et les graphes sémantiques chers à la théorie Sens-Texte.

Le chapitre 7 aborde les relations sémantiques lexicales. Les notions exposées ici sont assez floues. Un vocabulaire de théorie des ensembles est utilisé, mais ce n’est

(3)

qu’un leurre théorique, car on ne dit pas de quoi sont composés les « ensembles » sensés représenter les sens lexicaux. La hiérarchie sémantique correspond à ces

« ontologies » dont l’intelligence artificielle a été longtemps friante, mais qui ne sont vraiment convaincantes que dans la partie du lexique qui correspond à la description systématique des sciences naturelles : le chien est un animal, etc. Ce qui importe, finalement, n’est pas un point de vue d’ensembles extensionnellement formés de

‘points’, mais plutôt un point de vue intensionnel déductif – ce qu’on tend à exprimer de nos jours avec les logiques de description. La « conversivité » semble un anglicisme pour la notion de réciprocité. Quant à l’homonymie, elle soulève un lièvre de taille avec la notion d’homographie. Tout à coup apparaît une notion étrange, celle de « signifiant écrit », qui menace tout l’édifice conceptuel échafaudé par l’auteur. Les signifiants étaient jusqu’alors des chaînes de phonèmes notés avec l’alphabet phonétique, et ici on sort du chapeau des signifiants écrits qui mériteraient tout de même certaines précautions. Par exemple, l’homographie est définie comme une relation entre lexies, et non entre mots-forme, ce qui semblerait plus logique.

Que fait l’auteur des « poules du couvent qui couvent » ? Il y a là deux mots-forme de même orthographe mais de lexies différentes, n’ayant pas la même classe grammaticale. Y a-t-il homographie entre « couvent » et « couver » ? Quid de clé et de clef, sont-ce deux lexies synonymes ou une seule lexie ayant deux orthographes possibles ? Dans le deuxième cas, quel est le « signifiant écrit » de cette lexie ? La réforme de l’orthographe est elle un changement de la langue ? Le signifiant écrit ouvre la boîte de Pandore.

Le reste du chapitre 7 introduit la notion de fonction lexicale, à partir de numéros d’arguments de prédicats. Ce traitement ne distingue pas clairement la notion de rôle sémantique. On ne comprend pas bien comment la notion de sujet peut rendre compte du rôle sémantique d’agent, alors que la voix (actif/passif) est un intermédiaire nécessaire. Aussi il est affirmé que S0 (la « contrepartie nominale ») fait correspondre sommeil à dormir. Mais « endormissement » est un autre candidat, et on ne peut pas faire l’économie de la notion d’aspect pour distinguer entre états et transitions. A trop réduire le bagage sémantique, les notions deviennent floues.

Le chapitre 8 s’intitule « analyse du sens ». Ce chapitre vise à préciser les notions sémantiques esquissées précédemment, et à expliquer certaines difficultés. Mais la difficulté principale sous-jacente est le modèle discret inadéquat du sens, hérité d’une modélisation ensembliste peu précise. Cette difficulté se voit bien sur la

« définition » d’ambiguïté : « une expression linguistique est ambiguë lorsqu’elle peut être associée à plus d’un sens ». Ici le mot « sens » est employé comme un substantif comptable, alors qu’il y a glissement continu entre les sens. Les sens devraient avoir une modélisation topologique plutôt que simplement ensembliste, et les fonctions lexicales devraient être des applications continues. Une notion de mesure permettrait alors d’exprimer l’ambiguïté comme une quantité non discrète.

Le chapitre se termine par une discussion sur la notion de métaphore, et sur la distinction entre métaphore figée et métaphore d’interprétation libre.

(4)

Le chapitre 9 aborde la pragmatique, la nature communicative du discours et les actes de parole. Il évoque la notion de présupposition, mais ne distingue pas clairement les notions de posé, de présupposé et de sous-entendu  distinctions que Ducrot a très clairement exposé, par exemple dans « Le dire et le dit ».

Le livre se conclut par des notions de lexicographie. Au bout du compte, ce petit livre est utile comme introduction aux notions principales de la théorie Sens-Texte.

On peut regretter un traitement sémantique trop succinct, qui rend imprécis la notion de sens, mais la sémantique est un puits sans fond, et même les ouvrages beaucoup plus volumineux ne sont guère plus précis sur la modélisation théorique du sens, qui reste élusif et rebelle à une mathématisation trop naïve. La lexicologie est un art plus qu’une science, et un ouvrage introductif à la structure du lexique ne peut prétendre à une couverture convaincante de l’ensemble des notions linguistiques. Cet ouvrage a le mérite de poser clairement un certain nombre de notions de base (lexie, vocable), de structurer les différentes difficultés lexicographiques progressivement, et de proposer à la fin de chaque chapitre des lectures complémentaires bien choisies. Le lecteur recommande cet ouvrage comme manuel introductif à la lexicologie du français.

Notons que cet ouvrage a reçu au Canada un prix du ministre au Concours des prix du ministre de l’Education 2003-2004 au premier cycle de l’enseignement universitaire, avec une mention spéciale pour la qualité de la langue.

Xuan Luong (éd.), La distance intertextuelle, Corpus, 2, Edizioni dell’ORSO, 2003, 233 pages, ISSN 1 638-9808.

par Bénédicte Pincemin CNRS & LLI, Université Paris 13 [email protected]

Cette livraison de Corpus rassemble d’importantes et passionnantes contributions au terrain de la statistique textuelle. Elle rend compte à la fois des acquis méthodologiques (conduite d’une analyse avec des techniques confirmées) et scientifiques (incidence – faible – des choix d’indexation ; incidence textuelle majeure des différences d’époque et de genre littéraire qui dominent les variations d’auteur ; présentation très complète de la distance de Labbé), tout en présentant plusieurs recherches innovantes ouvrant des perspectives prometteuses (la possibilité d’allier des descriptions multiples et de définir une « distance compromis » qui les coordonne ; la recherche de nouveaux modes de caractérisation des textes plus sensibles à leur nature et à leur structure, notamment linguistique et syntagmatique).

(5)

Ce numéro de la revue Corpus consacré à « la distance intertextuelle » s’ouvre sur un article de synthèse de Jean-Pierre Barthélémy, Xuan Luong et Sylvie Mellet :

« Prenons nos distances pour comparer des textes, les analyser et les représenter ».

Plutôt qu’une synthèse technique détaillée, les auteurs présentent succinctement les principaux lieux de débat, et y apportent l’éclairage issu de leur expérience : la subjectivité et les limites de tout calcul appliqué aux textes, la caractérisation des mesures de distance les unes par rapport aux autres, l’éventail des questions auxquelles le calcul de distances intertextuelles peut apporter des éléments de réponse significatifs.

En particulier, les auteurs pointent et commentent les trois choix significatifs que requiert la mise en œuvre d’une distance intertextuelle : (i) le mode d’indexation et de représentation du texte ; (ii) l’adoption d’une métrique ; (iii) et bien souvent, comme cela est systématisé dans ce numéro, un mode de présentation graphique et spatial des proximités et écarts entre les textes.

Chacun des trois choix (i) (ii) et (iii) est le lieu de compromis et d’introduction de biais. Aussi, « La vocation des méthodes de statistique descriptive en analyse de données textuelles n’est pas de trancher entre des hypothèses, mais d’en suggérer.

(Nous les aimons lorsqu’elles sont contre-intuitives). [...] compte tenu des réserves présentées [correspondant aux trois choix] (i), (ii) et (iii), le calculateur ne saurait se substituer au linguiste. » (p. 8) Plus loin (p. 47-48), Brunet confirmera : « La distance entre deux textes, c’est comme la distance entre deux êtres ou entre deux cultures. Il ne semble pas qu’on puisse appliquer là la mesure. [...] Cette difficulté ne tient pas seulement au caractère approximatif des mesures, que cache la précision illusoire des décimales, mais surtout à la multiplicité des points de vue, des angles et des perspectives, l’objet à cataloguer étant aussi rebelle à la géométrie et à la régularité qu’un rhizome de gingembre ou de topinambour. »

L’étape de l’indexation des textes

Concernant l’indexation du texte (i), dans le contexte de la maturité des techniques d’analyse morphosyntaxique automatique des corpus, la discussion porte actuellement principalement sur l’incidence de l’identification et du décompte des mots selon leur forme graphique (fléchie), ou bien selon leur lemme, ou bien selon leur étiquette morphosyntaxique (partie du discours accompagnée éventuellement d’informations de flexion). Kastberg et Brunet soulignent la convergence et l’étonnante stabilité des résultats par delà les multiples traductions et appauvrissements – voire maltraitements – du matériau textuel. Plutôt que de hiérarchiser les formes d’indexation, on s’attachera donc plutôt à les caractériser pour différents usages. Ainsi, les approches fondées sur les formes fléchies ou les lemmes sont a priori plus sensibles à la thématique des textes que celles fondées sur les codes grammaticaux ; l’usage de la morphosyntaxe n’est pas moins reconnu comme une dimension essentielle de la textualité, et une étude qui vise le contraste

(6)

des styles d’écriture pourra préférer une approche plus grammaticale que lexicale (Luong et Mellet, Brunet). Pour rendre compte de la complémentarité des différentes indexations, Bécue-Bertaut illustre l’intérêt de recourir à l’analyse factorielle multiple pour allier ces différentes représentations sans les confondre ni les disperser.

S’agissant de caractériser un texte, les chiffres à soumettre au calcul n’ont pas nécessairement à être les fréquences (ou pondérations) d’items linguistiques (formes fléchies, lemmes ou fréquences) : ils peuvent être conçus plus souplement comme une série de mesures. Les données ne s’imposent pas au chercheur : c’est à lui de définir d’une part les composantes du texte pertinentes pour son analyse (par exemple telle catégorie grammaticale, tels temps verbaux), et d’autre part leur mode de mesure sur le texte (proportion – par rapport à quoi –, moyenne, rang, etc.). Les articles de Longrée et Luong, et de Luong et Mellet, amorcent une telle démarche.

Cela ouvre de nouvelles perspectives de recherche quant à la manière de former des jeux de mesures pertinents et cohérents pour chaque analyse.

Une voie également plus sensible à la linéarité textuelle est explorée dans la contribution de Longrée et Luong : plutôt que de caractériser les œuvres des historiens latins par la fréquence des temps et modes verbaux employés, l’idée est de rendre compte des effets de succession, d’enchaînement et de rupture au fil de chaque texte. Cela conduit à la mise au point de mesures syntagmatiques.

L’observation des séquences permet d’autres types de rapprochements intertextuels : par exemple, « si les œuvres de César et de Suétone s’opposent quant aux proportions de présents et de parfaits en principale, les deux auteurs affectionnent l’un comme l’autre les longues séquences de parfaits » (Longrée et Luong, p. 138).

Le choix de la mesure pour le calcul des distances intertextuelles

Les contributions rassemblées pour ce numéro de Corpus illustrent essentiellement trois distances. Les analyses factorielles sont dressées à partir d’une distance du chi-2 ; Bécue introduit néanmoins une « distance compromis », appropriée au cas d’un tableau multiple juxtaposant plusieurs descriptions. Les analyses arborées sont réalisées avec le logiciel Hyperbase, qui implémente deux mesures de distance : l’indice de Jaccard et la distance de Labbé. L’article de Brunet expose de façon claire et illustrée les principes et les limites du premier, intuitif mais peu significatif dès que les tailles des textes sont inégales ; il explique l’introduction de la distance de Labbé notamment par le souci de prendre en compte les fréquences des mots (et pas simplement leur présence/absence, qui valorise la thématique mais aussi les variantes et coquilles, et neutralise les écarts d’usage sur les mots les plus courants, sans doute plus révélateurs des choix stylistiques).

Une bonne partie des contributions recourt à la distance de Labbé qui est présentée par son auteur pp. 95-118. Cet article important résume la démarche de

(7)

conception de la mesure, puis s’attache à préciser les biais de cette mesure et à en définir les conditions et limites d’usage.

Du bon usage des représentations graphiques

En ce qui concerne ce troisième point de choix (iii), s’il est bien reconnu ici que les représentations graphiques des distances intertextuelles comportent toujours une part de biais, il est fait peu cas en pratique des précautions interprétatives absolument nécessaires pour déjouer les illusions générées par la réduction de l’information. Sans doute les auteurs des différentes contributions ont-ils eu soin de recourir aux indicateurs fournis par les méthodes de calcul (tels que cosinus carrés et contributions pour l’analyse factorielle et n’ont pas détaillé ce dépouillement pour en épargner l’austérité au lecteur (on se limite à préciser la part d’inertie des axes considérés, rendant compte du degré de fidélité globale de la projection).

Néanmoins, signalons que Ludovic Lebart a mis au point plusieurs outils à la fois parfaitement rigoureux au plan de la statistique et très parlants par leur expression graphique, « permettant de transformer une visualisation plaisante en un document scientifique » (Lebart, 2004, actes des 7e JADT).

Stéphane Chaudiron, Evaluation des systèmes de traitement de l’information, Lavoisier, 2004, 374 pages, ISBN 2-7462-0862-8

par Olivier Bellot et Patrice Bellot LIA – Université d’Avignon/CNRS

[email protected], [email protected]

L’ouvrage collectif Evaluation des systèmes de traitement de l’information sous la direction de Stéphane Chaudiron dresse un panorama exhaustif des méthodes les plus couramment employées lorsqu’il s’agit d’évaluer un système de traitement automatique des langues écrites ou orales. La première partie est consacrée aux moteurs de recherche d’informations, la seconde au traitement de l’information textuelle, la troisième au traitement de la parole et la dernière aux approches orientées « usage » dans l’évaluation. Les références bibliographiques sont à la fois riches et récentes et la lecture de l’ensemble particulièrement intéressante. Le problème épineux de la place des utilisateurs est bien abordé tout au long de cet ouvrage qui propose ainsi un regard critique et constructif bienvenu sur les désormais incontournables campagnes d’évaluation. Toutefois, ces contributions auraient mérité un chapitre de synthèse reprenant les points et interrogations génériques d’un processus d’évaluation. La lecture isolée d’un chapitre donne souvent à tort l’illusion d’une autosuffisance (aucune mention d’un chapitre pour un autre).

(8)

Le premier chapitre (C. Fluhr) est consacré à la recherche d’informations, essentiellement documentaire par opposition aux moteurs questions-réponses abordés dans le chapitre 3. Les principaux critères d’évaluation sont présentés avant un descriptif détaillé des campagnes internationales d’évaluation TREC, CLEF et Amaryllis. Les différentes pistes de ces campagnes sont énumérées (grandes collections, systèmes interactifs, interlingue…) ce qui donne autant de points d’entrées dans l’univers de l’évaluation.

Le chapitre 2 (N. Boujemaa) est dédié aux systèmes de recherche par le contenu visuel. Le chapitre débute par une présentation succincte des principes de recherche d’images. L’énonciation des deux modes d’évaluation, quantitative vs. qualitative, est illustrée d’exemples particulièrement représentatifs et de pointeurs vers des bases d’images de référence et les campagnes associées (TRECVID, Bencathlon, TC12, BIRDS-I). Les mesures de similarité et les critères d’évaluation cités permettent non seulement d’établir un parallèle avec ceux décrits dans le premier chapitre mais également d’envisager leur transposition vers les moteurs de recherche d’information textuelle.

Dans le chapitre 3 (B. Grau), ce sont les moteurs de questions-réponses qui sont abordés en soulignant ce qui les distingue des moteurs de recherche documentaire aussi bien en fonction des objectifs recherchés que des méthodes employées. Les pistes questions-réponses et les questions des campagnes TREC, CLEF (monolingues ou multilingues) et NTCIR (langues asiatiques) sont présentées avant de décrire et de discuter les mesures d’évaluation. L’évolution de ces dernières mise en parallèle avec celle des moteurs de recherche est l’occasion de vérifier à quel point penser de nouveaux objectifs conduit à de nouvelles mesures qui elles-mêmes entraînent des modifications majeures des systèmes.

Le chapitre 4 (P. Paroubek) concerne l’analyse morphosyntaxique et l’analyse syntaxique de données textuelles présentes dans de très nombreux processus de traitement automatique des langues. D’intéressantes questions, largement illustrées, sont posées : nécessité d’évaluer cette analyse non pas dans l’absolu uniquement mais par rapport au niveau de performance d’un humain, définition de la référence à mettre en place (identification des frontières des constituants de base notamment, choix des jeux d’étiquettes…), utilisabilité des résultats de l’analyse dans d’autres processus ; autant d’interrogations valables pour évaluation.

Le chapitre 5 (A. Nazarenko et T. Poibeau) traite des systèmes d’analyse et de compréhension de texte, dont l’évaluation reste encore largement problématique à cause de la difficulté à définir la tâche visée et de la complexité de ces systèmes (ces deux points sont largement détaillés). Plutôt que d’évaluer la « compréhension » – généralement sous la forme d’un jeu de questions-réponses spécifiques tel celui employé lors du projet européen Fracas –, il est plutôt d’usage de se limiter à l’un de ses aspects dont, par exemple, l’extraction de connaissances. C’est dans ce contexte que sont présentées les conférences américaines d’évaluation MUC ayant eu lieu entre 1987 et 1998 et les mesures associées. Le lien entre les systèmes de

(9)

compréhension et les moteurs de questions-réponses ou de résumé automatique est clairement mis en évidence.

Le chapitre 6 (W. M. El Hadi) est consacré aux méthodes d’acquisition de ressources terminologiques (ART) illustrées par les campagnes d’évaluation coordonnées par l’Université Lille 3 : l’ARC A3 lancé par l’AUPELF en 1994 et CESART dans le cadre du programme Technolangue. L’acquisition terminologique est subdivisée en plusieurs tâches : acquisition automatique de termes, structuration de terminologie, structuration de relations sémantiques, élaboration d’ontologies.

Une description des campagnes citées plus haut suit la présentation de ces tâches et précède une discussion sur les critères habituellement employés tout en proposant de nombreuses pistes novatrices (prise en compte de l’usage, protocoles différenciés suivant les catégories d’outils, modèles fondés sur le gain de temps…).

Le chapitre 7 (J.-L. Minel) traite des systèmes de résumé automatique et plus particulièrement des seuls systèmes véritablement opérationnels à savoir ceux produisant des résumés par extraction de phrases (par opposition à une représentation sémantique du texte qui conduirait à la génération d’un résumé). Ces systèmes sont souvent basés sur la notion de pertinence d’une phrase, notion qui doit elle-même être remise en cause comme l’ont montré de nombreuses expériences largement citées ici. Les évaluations les plus récentes sont alors présentées dans le détail qu’il s’agisse de « TIPSTER text summarization evaluation (SUMMAC) », du programme DUC (Document Understanding Conference) inspiré des campagnes TREC et MUC ou bien du protocole associé au système SERAPHIN. Ces évaluations peuvent être basées sur un jury humain mais elles définissent également des tâches spécifiques pour lesquelles l’obtention d’un résumé peut apporter des gains en temps ou en qualité. Le chapitre se termine en proposant notamment d’évaluer les capacités de navigation au sein des documents offertes par le système qui ne serait plus un créateur de résumés mais un outil de filtrage adapté aux besoins de l’utilisateur.

Le chapitre 8 (F. Bimbot et G. Gravier), consacré à l’évaluation des systèmes de reconnaissance de parole, débute par une présentation sommaire des différentes tâches sur lesquelles ces systèmes pourront être évalués (dictée vocale, dialogue ou encore indexation de documents sonores). Les principales caractéristiques à prendre en compte pour estimer le profil d’un système de reconnaissance sont ensuite passées en revue : le type de parole en entrée (mots isolés, enchaînés, en contexte, parole continue ou spontanée), la complexité linguistique (taille du vocabulaire, ambiguïté acoustique des mots composant ce vocabulaire, perplexité des modèles linguistiques utilisés), la dépendance ou non au locuteur de test (le système est-il prévu pour être utilisé par un seul et même utilisateur ou peut-il être utilisé par n’importe quelle personne a priori inconnue du système ?), les conditions d’utilisation (environnement bruité ou instruments d’acquisition dégradant le signal) ou encore le profil des utilisateurs (grand public ou utilisation professionnelle). L’évaluation d’un système, pour avoir un sens, doit obligatoirement se faire en tenant compte des facteurs précités. Trop souvent, seul le taux d’erreur de reconnaissance est pris en

(10)

compte. Les auteurs abordent donc ici d’autres mesures de performance pertinentes utilisées dans le contexte de l’évaluation, suivant le profil du système, dans les cas de reconnaissance en ensemble fermé (tous les mots du test sont inclus dans le vocabulaire du système) ou ouvert (possibilité d’existence de mots hors vocabulaire). L’ensemble des notions est présenté sous l’angle de la théorie de la détection, tout en faisant le lien avec les métriques utilisées dans d’autres domaines (détection, vérification du locuteur, recherche d’information). Enfin, pour conclure, quelques grandes campagnes d’évaluation passées et à venir sont présentées.

Dans le chapitre 9 (C. d’Allessandro), les systèmes de synthèse de la parole du type I (annonces simples préenregistrées) au type III (système apte à synthétiser n’importe quel message inconnu a priori) sont présentés dans leur fonctionnement global. La suite est subdivisée en deux parties : d’une part les évaluations globales, évaluant uniquement la sortie du système sans tenir compte des différents modules mis en jeu, et d’autre part les évaluations analytiques portant séparément sur chaque composant du synthétiseur (transcription graphème-phonème, qualité de la concaténation des phonèmes, génération de la prosodie etc.). Pour l’évaluation de la qualité de la synthèse, et contrairement aux systèmes de reconnaissance automatique de la parole par exemple, il est très difficile d’avoir recours aux évaluations automatiques ; ainsi, dans la majorité des cas, ces évaluations se feront directement par des utilisateurs, soulevant le problème du choix des testeurs (utilisateurs entraînés ou non, enfants, spécialistes de phonétique), de la rapidité et du coût des évaluations. Les évaluations globales des systèmes de synthèse peuvent se grouper en trois familles : l’évaluation de l’intelligibilité de la synthèse sur des segments courts, la compréhension au niveau de la phrase ou enfin l’évaluation globale de la qualité. Enfin, l’évaluation de chaque composante du système est détaillée dans la partie évaluation analytique.

Dans le chapitre 10 (I. Magrin-Chagnolleau), la première partie est consacrée à la présentation des systèmes de vérification du locuteur. Chaque module est sommairement exposé, puis les différentes applications de la vérification sont passées en revue ainsi que leurs erreurs possibles car, là encore, on ne peut correctement évaluer un système sans tenir compte de l’application à laquelle le système est destiné. L’évaluation des performances d’un système tient compte principalement de deux types d’erreur : le TFA (taux de fausse acceptation) et le TFR (taux de faux rejet). Les autres scores qui sont présentés et dont on peut tenir compte pour l’évaluation seront les fonctions de coût de détection (DCF), ou encore les courbes DET (Detection Error Trade-off) ou enfin les EPC (Expected Performance Curves). Enfin, les deux grandes campagnes d’évaluations en vérification du locuteur sont présentées (NIST et Technolangue EVALDA/ESTER, première campagne sur des données francophones).

Le chapitre 11 (L. Devillers) conclut la partie sur le traitement de la parole en évoquant les systèmes de dialogue oral en insistant sur l’importance d’évaluer ces systèmes à la fois du point de vue du concepteur mais aussi de l’usager. Le manque de tâches de référence dans le dialogue oral et l’insuffisance des campagnes récentes

(11)

sont présentés comme un frein à l’évolution des systèmes et par conséquent à leur adaptation par un large public. L’absence de méthodologie standard fait place à un grand nombre d’évaluations largement décrites dans ce chapitre en compagnie des tâches qui y sont associées : EAGLES, DISC, ATIS, Communicator, ARISE, ARC B2 de l’AUPELF, Technolangue EVALDA/MEDIA, méthodologie DEFI (GDR-I3 du CNRS)…

La place de l’usager et, plus spécifiquement, la mesure de la satisfaction de l’usager en situation, dans l’évaluation des systèmes de recherche d’information est au centre du chapitre 12 (S. Chaudiron). Ce chapitre débute par la présentation des protocoles mis en œuvre selon le paradigme système (par opposition à l’approche usager) adopté très largement dans les évaluations. Parmi les critiques : non prise en compte des pratiques réelles des usagers (utilisateur occasionnel ou expert) et de la possibilité de trouver une information intéressante simplement en navigant sur le web et en suivant les liens hypertextes, caractère binaire et individuel des indicateurs de pertinence (un document est jugé pertinent ou non sans considérer les autres documents), critères parfois insuffisants, pooling method soupçonnée de laisser peu de place aux systèmes très différents des autres. Sont ensuite présentées les pistes de recherche pouvant conduire à une évaluation selon le paradigme usager : redéfinition de la notion de pertinence, approche cognitive (rôle des interfaces, différences individuelles, modélisation des processus cognitifs et des comportements), approche « processus » (la recherche d’information est vue comme un processus dynamique et instable en interaction avec l’usager) et enfin approche holistique (intégration de la recherche d’information dans un cadre d’interprétation cognitif global et évaluation tenant compte à la fois de l’usager, de la source d’information et des différents composants du système). Ces multiples pistes pour

« une autre évaluation » démontrent combien cette dernière peut être un champ de recherche au-delà de la simple comparaison de technologies, aussi utile soit elle.

Le chapitre 13 (T. Hartley et A. Popescu-Belis) concerne les systèmes de traduction totalement automatique. Les différentes méthodes d’évaluation tenant compte du contexte d’utilisation des systèmes de traduction automatique sont décrites (en particulier le cadre d’évaluation FEMTI défini à l’issue du projet ISLE) en même temps que les métriques associées ainsi que les principales campagnes organisées depuis 1966 (ALPAC) : campagnes DARPA dans les années 1990, campagnes NIST en 2002-2003, évaluations JEIDA, ATA, SAE et enfin CESTA (Technolangue Evalda en 2004). Le chapitre se termine par une discussion autour de l’évaluation des métriques elles-mêmes et une présentation de quelques comparaisons récentes.

Le chapitre 14 (M. Ihadjedene) évoque les approches spécifiques aux moteurs de recherche sur internet en tenant compte à la fois de l’efficacité ressentie par les usagers mais aussi de l’acceptabilité des contraintes techniques. Ce chapitre reprend quelques unes des récentes études sur les pratiques informationnelles de l’internet (nombre de moteurs utilisés, tendance à formuler une ou plusieurs variantes d’une requête, emploi ou non des modules de reformulation automatique…) ou sur

(12)

l’analyse des requêtes posées aux moteurs du web tout en proposant un scénario type d’usage. L’auteur conclut en réaffirmant que l’évaluation des moteurs du web doit combiner enquêtes statistiques et microanalyses cernant la réalité et la diversité des usages.

Le chapitre 15 (J. Le Marec) discute de la prise en compte des études d’usage dans le champ culturel. Pour ce faire, l’auteur discute le protocole d’enquête conduisant à une étude d’usage et notamment le problème de l’identification de l’« objet » d’un usage observable (interface, service, dispositif technique…). Il illustre ce propos par la description d’études conduites en milieu muséal (usage de bornes interactives pédagogiques) et destinées à fournir des éléments d’aide à la conception. Cela souligne la pertinence de la collaboration entre développement technique et études d’usages, du moins tant que ces dernières parviennent à dépasser le strict cadrage institutionnel des modèles d’évaluation et d’accompagnement du développement technique.

Michael Carl and Andy Way (eds), Recent advances in example-based machine translation, Kluwer Academic Publishers, Dordrecht, 2003, 520 pages,

ISBN 1-4020-1400-7 par René Joseph Lavie

MODYCO (Modèles, Dynamiques, Corpus), UMR 7114, Paris 10 et CNRS [email protected]

Cet ouvrage collectif (après les rencontres de Santiago de Compostela en septembre 2001) comporte une introduction et quatorze articles. La rule-based machine translation est la méthode de traduction automatique qui apparaît d’abord. Elle est basée sur des dictionnaires et des grammaires à règles faits par des linguistes ; elle est coûteuse à développer, dépend de ressources lexicales rarement disponibles et est vulnérable à l’ajout de règles qui déstabilisent et dégradent l’édifice. La corpus- based machine translation cherche à réduire ces coûts d’acquisition par la mise en œuvre de corpus bilingues alignés selon deux voies : a) les systèmes de statistical machine translation (Jelinek, IBM) qui apprennent (sur un mode non supervisé) un modèle de traduction à partir de corpus bilingues alignés, en se basant sur un modèle statistique complexe, et b) l’example-based machine translation qui est un peu intermédiaire entre rule-based machine translation et statistical machine translation car elle peut aussi recourir à des règles. Mais ces règles ne sont pas de celles que peuvent produire les linguistes : elles sont plus redondantes, plus contextuelles, à la fois plus précises et plus générales. L’example-based machine translation naît au début des années 80 (pour d’autres, dans les années 60) et ce livre est la première compilation en un volume de ses différentes approches. Il donne une vision précise de l’état de l’art dans ce domaine.

(13)

Les articles 1, 2, 3 et 4 concernent les fondements de l’example-based machine translation. Les articles 5, 6, 7, et 8 ne concernent que des approches run-time de l’example-based machine translation : les alignements entre phrases et leur mapping sur la phrase à traduire sont tous calculés dynamiquement. Les correspondances inférieures aux phrases alignées restent implicites. Les articles 9 à 16 concernent l’example-based machine translation « compilée ». Pour ces approches, à partir des phrases alignées, des données de correspondance sont élaborées, codées explicitement et stockées. Si, comme les précédentes, elles comportent un module final de traduction, elles le font ainsi précéder d’un module d’ « extraction ».

Les fondements de l’example-based machine translation

An overview of example-based machine translation, Harold Sommers (Manchester) : rappels historiques. Comme la rule-based machine translation, l’example-based machine translation comprend les phases d’identification (matching), d’alignement et de recombinaison. Il faut donc étudier comment les exemplaires sont stockés, identifiés, retrouvés, et adaptés aux cas à traduire.

What is example-based machine translation ? Davide Turcato et Fred Popovitch (Burnaby, Canada) : certaines approches example-based machine translation linguistiquement fondées recouvrent d’autres approches de la traduction qui sont aussi linguistiquement fondées mais ne reposent pas sur des exemplaires. Pour les caractériser, il faut regarder comment les connaissances déclaratives sont représentées (deux approches sont « synonymes » quand elles utilisent les connaissances de la même façon). Conclusion : ce qui caractérise le mieux l’example-based machine translation est la traduction par analogie.

Example-based machine translation in a controlled environment, Reinhardt Schäler (Limerick, Irlande), Andy Way (Dublin), Michael Carl (Saarbrücken) : limites des systèmes translation memory conventionnels. Lexique d’expressions linguistiquement fondé (PL = phrasal lexicon) appris à partir de textes bilingues. Ce lexique dépend d’un domaine et fait des correspondances exactes entre unités sous- phrastiques (ce que ne font pas les translation memorys).

Example-based machine translation seen as a case-based reasoning, Bróna Colins (Dublin) et Harold Somers (Manchester) : EMBT est un cas particulier de case-based Reasoning (CBR). Cette technique, bien connue en IA, peut faire progresser la traduction automatique.

Les approches run-time de l’example-based machine translation

Toutes les approches example-based machine translation demandent des corpus alignés par phrases. Mais pour certaines (les quatre articles suivants), le savoir implicite n’est pas extractible comme un préalable et ne peut être acquis qu’au run-

(14)

time. Une mesure de similarité permet d’identifier les exemplaires de la langue source les plus proches de la phrase à traduire. Des schémas de traduction sont générés à l’acte, puis remplis par des traductions mot à mot. La notion de similarité est donc ici tout aussi importante que dans l’approche translation memory.

L’avantage de l’example-based machine translation est que la qualité augmente avec le nombre d’exemplaires sans demander la retouche de règles ou d’entrées lexicales.

Formalizing translation memory, Emmanuel Planas (Grenoble) et Osamu Furuse (Yokosuka, Japon) : les auteurs donnent donnent une base théorique aux translation memorys en formalisant la notion de correspondance floue au moyen d’un treillis.

Example-based machine translation using DP-matching between word sequnces, Eiichiro Sumita (Kyoto, Japon) : on prend comme meilleurs exemplaires ceux qui partagent les classes sémantiques les plus semblables. Les schémas de traduction sont générés au vol en généralisant les différences. Ils sont temporaires et ne sont ni conservés ni réutilisés. La méthode requiert un savoir sur la similarité sémantique des mots, un thésaurus et un dictionnaire bilingue. Elle est robuste, meilleure que les précédentes et s’étend à la traduction multilingue.

A hybrid rule and example-based method for machine translation, Francis Bond (Kyoto, Japon) et Satoshi Shirai (Kanagawa, Japon) : On cherche à combiner les deux voies : rule-based machine translation et corpus-based machine translation.

On sélectionne d’abord les exemplaires les meilleurs selon une technique corpus- based machine translation. Puis on génère des templates de traduction comme dans l’article précédent. Enfin, par une méthode rule-based machine translation, on les traduit par parties en y remplaçant les parties correspondantes du template cible.

Example-based machine translation of post-tagged sentences via inductive learning, Tantely Andriamanankasina, Kenji Araki et Koji Tochinai (Sapporo, Japon) : contrastant avec les trois précédentes, cette approche est basée sur des exemplaires stockés qui sont a) alignés sur des parties de phrases et b) préétiquetés par classes lexicales. Des parties de phrases peuvent être extraites au run-time ce qui permet de faire sans un lexique bilingue. Des corrections manuelles sont possibles et peuvent s’ajouter à la base de données.

L’example-based machine translation compilée

Dans les quatre articles précédents le savoir sous-phrastique n’était pas préparé à l’avance et n’était traité qu’au run-time. Les quatre articles suivants assurent maintenant cette extraction ; ces modèles comportent donc tous un module extracteur, préalable au module de traduction. Ils diffèrent principalement par les ressources qu’ils présupposent : exemplaires étiquetés morphologiquement et lemmatisés, un dictionnaire bilingue et une extraction à partir du corpus bilingue, un étiqueteur POS, une grammaire de traduction obtenue par inférence.

(15)

Les articles suivants concernent la phase de précompilation du corpus aligné bilingue. Comme précédemment, on suppose que les données de traduction peuvent en être extraites et stockées séparément mais maintenant les représentations sont structurées.

Extracting translation knowledge from parallel corpora, Yamamoto &

Matsumoto (Nara, Japon) : pour extraire des traductions de mots et d’expressions, les relations de dépendances sont-elles statistiquement efficaces ? La précision atteint 90 % en dépit de l’imprécision des parsers stochastiques. Jusqu’à quel point les indices linguistiques obtenus avec des outils NP peuvent-ils être mis à profit pour extraire des unités de traduction ? Parmi trois méthodes, une méthode de n-grammes chunk bounded se révèle la meilleure.

Finding translation patterns from dependency structures, Hideo Watanabe (Kanagawa, Japon), Sadao Kurohashi (Tokyo, Japon) et Eiji Aramaki (Kyoto, Japon) : parmi des paires d’arbres de dépendance, pour trouver des correspondances structurelles utilisables pour la traduction, en premier lieu, on cherche des correspondances de mots d’après un dictionnaire bilingue ; ensuite, on construit des correspondances d’expressions qui contiennent les précédentes. Même vulnérabilité aux erreurs de parsing qu’à l’article 13 ci-dessus. Correction manuelle et séparée possible.

A best-fit alignment algorithm for extraction of transfer mappings, Arul Menezes Stephen D. Richardson (Redmond, Washington, Etats-Unis) : Partant de a) un corpus bilingue parsé, b) une morphologie flexionnelle, c) une lemmatisation, et d) un étiquetage des relations entre mots, sont automatiquement acquises des correspondances de transfert qui sont des paires de formes logiques. Ceci combine une analyse par règles et une génération par transfert exemplariste.

Translation with examples, the LFG-data oriented translation [data oriented translation] models of translation, Andy way (Dublin) : étude contrastive de quatre modèles d’example-based machine translation hybrides associant LFG et data oriented parsing (DOP). Examen de deux problèmes fondamentaux de délimitation de frontière et de « friction » de frontière. On montre que l’association LFG-data oriented translation résout la « friction » de frontière.

(16)

Mireille Bilger, Frédéric Sabio, Paul Cappeau, Catherine Chanet, Autour du Corpus de référence du français parlé, Université de Provence, 2004, 268 pages, ISBN 2-85399-571-2

par Marton Naray-Szabo LLI : CNRS et Université Paris 13 Université Péter Pázmány (Hongrie) [email protected]

Le numéro 18 de Recherches sur le français parlé vise deux objectifs : présnter le nouveau corpus de référence du français parlé (CRFP), et illustrer l’usage qu’on peut en faire dans le domaine de la syntaxe, de la pragmatique et de l’étude de la prosodie (pauses, amorces de morphèmes, etc.). Le numéro est présenté par Paul Cappeau. Suivent les dix articles qui constituent l’essentiel de l’ouvrage.

Le Corpus de Référence du Français Parlé est un recueil de 134 enregistrements transcrits et alignés sur le son (soit 440 000 mots). Il ambitionne d’être une ressource représentative du français parlé urbain de l’Hexagone, dans son usage général et courant, tant sur le plan géographique que sociolinguistique (âge, sexe, niveau d’études) ; il prend également en compte la situation de parole (parole privée, parole professionnelle et parole publique) et le nombre de locuteurs concernés dans les séquences dialogiques. La transcription totalement alignée (orthographique et phonétique) se caractérise par la compatibilité avec tous les logiciels de traitement de textes : l’application de l’alphabet SAMPA et de certains autres signes est une nouveauté par rapport aux versions précédentes. Sont indiqués divers types de pauses, de bruits et d’éléments métalinguistiques.

En ce qui concerne les fondements théoriques, les auteurs se réfèrent notamment aux travaux de Claire Blanche-Benveniste, à des grammaires telles que celles de Le Goffic, Riegel, Guillaume, ainsi qu’aux nouvelles syntaxes (Anne Abeillé). Le recours à la théorie des zones de Skårup, dans les études de Paul Cappeau et de Sandrine Caddéo, permet une description particulièrement adaptée aux phénomènes de l’oral. Les sujets s’organisent autour de trois grands axes : les pronoms (dont les pronoms disjoints et les pronoms conjoints), les connecteurs et les phénomènes prosodiques dans les corpus.

A la lumière des faits quantitatifs observables, on constate que la classe des pronoms disjoints (ou « détachés » : moi, toi, lui/elle, nous, vous, eux/elles) ne forme pas un paradigme homogène. Outre son rôle de sujet, le pronom disjoint peut entrer dans diverses constructions comme le clivage, la restriction ou la relativation. Quatre groupes sont distingués suite au dépouillement de Paul Cappeau (qui compare trois corpus dont l’un est prélevé dans des journaux) : moi (distribution et valeurs de fréquence uniques), toi et vous (souvent sous la forme interrogative dans les clivées), lui et eux (directement antéposables au verbe), et nous, elle et elles (très peu fréquents et donnant lieu à confusion avec leur correspondants conjoints). Leur

(17)

fonction la plus importante reste pourtant la structure « associée » au sujet (pronominal ou non). Mylène BlascoDulbecco relève une série de différences entre le comportement des pronoms disjoints et celui des SN détachés (irrégularité dans la distribution des prépositions, mobilité syntaxique extraordinaire, existence de certains tours semi-figés interdisant l’insertion). Parmi les combinaisons pronoms disjoints/conjoints, c’est la première et la troisième personne du singulier qui sont examinées en détail. Les fonctionnements des séquences moi... je et je... moi sont radicalement différents. Pour moi je plus particulièrement, à part l’emploi contrastif, on a quelques verbes de discours (l’insertion est impossible entre moi et je) qui forment des collocations usuelles, autrement les verbes doivent être clivés ou impersonnels. La séquence je... moi sert principalement de prolongement syntaxique et sémantique au clitique, mais l’insistance sur la première personne, ou la mise en contraste avec d’autres éléments peuvent également entrer en jeu, ainsi que le figement des tours je sais pas moi. A propos des suites lui, SN et SN, lui, Sandrine Caddéo montre qu’elles ont un comportement radicalement différent. En ce qui concerne l’étude du comportement syntaxique des pronoms conjoints (clitiques) dans la langue parlée, il reste de nouveaux terrains à explorer : par exemple la distribution du pronom y comme complément locatif : Frédéric Sabio prend soin de bien séparer l’emploi locatif de y des emplois non pronominaux ou pronominaux non locatifs.

Souvent, les y locatifs ne réfèrent pas directement à un lieu « concret » dans le sens absolu du terme : sont plutôt concernés le « chemin d’accès » au sens figuré, l’espace de temps ou une collectivité d’individus, ce qui donne lieu à des ambiguïtés dans l’analyse. Quand on examine la distribution statistique, on constate que les verbes avec lesquels se combine le pronom étudié sont cinq fois plus nombreux à l’écrit qu’à l’oral. Les sous-corpus diffèrent également suivant le caractère valenciel/rectionnel et l’usage cérémonieux du pronom.

Passons au cas des adverbes. On est confronté à une quantité massive de résultats statistiques concernant la présence et la distribution des adverbes en -ment selon les sous-corpus (Mireille Bilger). Quatre des ces adverbes sont soumis à une enquête plus approfondie : les sémantismes de vraiment, de justement, de évidemment et de effectivement peuvent varier en fonction de l’environnement syntaxique et lexical.

Une partie des études traitent du statut et du contexte pragmaticogrammatical des éléments (pronoms ou connecteurs). Cela se manifeste tout particulièrement dans l’article de Catherine Chanet, qui traite des marqueurs discursifs. En excluant les termes phatiques et « régulateurs » (du type tu vois, tu sais, etc.), l’auteur englobe les

« connecteurs » (mais, alors) et les « particules » (ben, voilà), qui ont en commun d’être non référentiels et de donner des instructions de représentation. Ces expressions sont non seulement problématiques du point de vue de l’étiquetage morpho-syntaxique, mais il se trouve que la catégorisation purement morphologique n’est pas pertinente pour le classement des marqueurs. C’est plutôt en fonction du statut pragmatique qu’il convient d’examiner leur fréquence. Quatre marqueurs sont particulièrement chargés sémantiquement aussi bien que syntaxiquement : bon, bien, quoi et enfin.

(18)

Les trois derniers articles ajoutent aux précédentes analyses sur les aspects proprement liés à l’oral : les méthodes d’identification et quelques cas de double interprétation ou de non-interprétabilité dans les amorces morphémiques dans la transcription (Marie-Noëlle Roubaud). L’identification doit reposer sur des connaissances multiples comme le contexte, le champ lexical ou le paradigme grammatical du mot concerné. Trois formes sont à distinguer suivant le contexte immédiat : les amorces complétées, les amorces modifiées et les amorces laissées inachevées (Sandrine Henry et Bertille Pallaud). Sont également déterminés, dans les corpus, les effectifs en fonction des catégories grammaticales ainsi que du nombre d’itérations d’un élément donné. L’article enfin d’Estelle Campione étudie l’interférence entre les pauses silencieuses (démarcatives ou non démarcatives) et les pauses remplies (euh) d’un point de vue fonctionnel.

Cet ouvrage a l’avantage de présenter à la fois un corpus et les pistes possibles de son exploitation en linguistique descriptive et théorique. Les auteurs appartiennent à la même équipe (DELIC), ce dont témoigne la cohérence de la vision d’ensemble, en dépit de la diversité des points de vue envisagés. Plusieurs études comparent le CRFP avec d’autres corpus (recueil Corpaix et certains petits corpus écrits, surtout dans le domaine de la presse), ce qui met en évidence des différences attribuables au type de discours. Par ailleurs, les sujets abordés sont presque tous susceptibles de donner lieu à des applications dans le domaine du TAL. Dans la construction des dictionnaires électroniques, on pourra profiter dans certains cas de l’étiquetage pragmaticosyntaxique des connecteurs. Grâce aux valeurs de fréquence observées dans le corpus, les entrées du dictionnaire rendront possible une meilleure désambiguïsation des conjonctions en contexte, et des pronoms conjoints et disjoints. D’autre part, l’acquisition de connaissances nouvelles sur les amorces morphémiques devrait faciliter la reconstruction du contenu que le locuteur avait l’intention de communiquer.

La publication même de cet ouvrage est une preuve de la fécondité de l’œuvre de Claire Blanche-Benveniste. L’idée est en train de devenir commune qu’il ne saurait exister de linguistique descriptive digne de ce nom qui fasse abstraction de l’oral.

Les dix articles de Autour du Corpus de référence du français parlé donnent une idée aux linguistes de toutes les disciplines des profits multiples qu’ils peuvent tirer des grands corpus d’oral. Ces derniers ont certes besoin d’être développés en quantité et en variété de types de discours. Mais tels quels, ils constituent déjà une mine considérable d’informations linguistiques encore non exploitées.

(19)

Francis Grossmann, Agnès Tutin, Les Collocations. Analyse et traitement, Travaux et Recherches en Linguistique Appliquée, De Werelt, 2003, 144 pages

par Antonio Balvet UMR Silex

[email protected]

Cet ouvrage est issu des journées d’étude qui se sont tenues à Grenoble en 2001, autour du problème de l’analyse et du traitement des collocations. Les éditeurs soulignent que ce thème n’a pas connu le même succès en France que dans le monde anglo-saxon, ils proposent donc, avec cette publication, de « contribuer à une meilleure connaissance d’une problématique encore souvent méconnue ».

Les éditeurs F. Grossmann et A. Tutin proposent tout d’abord « Quelques pistes pour le traitement des collocations », texte dans lequel ils remontent à C. Bally pour une première typologie des unités polylexicales à comportement idiomatique : les collocations, à la différence des unités phraséologiques, sont des expressions semi- figées binaires, constituées de deux expressions linguistiques (p. 7-8).

L’ensemble des contributions reprendra cette caractérisation des collocations, quelque peu restrictive à nos yeux : pourquoi ne pas envisager des réseaux de collocations, autrement dit des collocations de plus de deux éléments ? D’ailleurs, une fois posée cette caractérisation, les éditeurs citent, dans la catégorie des

« collocations transparentes », c’est-à-dire « comportant des collocatifs facilement compréhensibles mais imprédictibles du point de vue lexical et/ou syntaxique », il pleut à boire debout (fr. québ.), qui en comporte 5.

Dans la suite de leur exposé, les éditeurs justifient le point de vue qui sera illustré dans l’ensemble des contributions : une modélisation linguistique des collocations est non seulement possible, bien que délicate, mais également nécessaire, « pour de nombreuses applications comme la lexicographie, le TAL ou l’enseignement/

apprentissage des langues maternelles ou étrangères ». Par leur choix de la théorie

Sens-Texte (TST) de I.

remettent en cause la pertinence d’une modélisation reposant sur une approche non taxinomique stricte, en l’occurrence « une définition de type prototypique » et un classement sur un continuum de figement des expressions étudiées.

Une fois le problème posé dans le cadre de la TST, il s’agit, pour les éditeurs du recueil, de procéder à une modélisation des collocations dans un but précis : « mettre en évidence les mécanismes, parfois complexes, qui régulent les associations sur le plan syntaxique et sémantique ».

Tutin et Grossmann placent la question de la modélisation des collocations sur le terrain de l’adaptabilité maximale à plusieurs domaines d’application. Pour ce faire, ils énoncent « quelques principes pour le traitement linguistique des collocations », que nous résumons ci-dessous :

(20)

– l’adéquation descriptive, s’appuyant sur une description sémantique et syntaxique fines, ainsi que sur la description des relations sémantiques et syntaxiques liant le collocatif à la base ;

– l’adéquation explicative, reposant sur la différenciation des collocations selon le type de motivation – à savoir « associations collocationnelles reposant sur des procédés sémantiques productifs (métaphore, comparaison) et celles fondées sur des régularités sémantiques » – mais également sur des mécanismes capables de rendre compte de régularités syntaxiques et sémantiques observées dans les associations lexicales.

Pour Tutin et Grossmann, seules les fonctions lexicales (FL), fournissant la base de la TST, semblent à même de produire des modélisations fines des collocations, par leur filiation avec la tradition phraséologique russe, centrée sur les phénomènes de figement.

Tutin et Grossmann poursuivent en exposant de façon synthétique les différents types de FL, les règles de composition ainsi que les configurations disponibles dans le DEC. Tout en soulignant les propriétés qui font du DEC un cadre adéquat pour la modélisation des collocations, les éditeurs de l’ouvrage font également part de quelques réserves : la description syntaxique des collocations leur apparaît insuffisante, en ce qu’elle ne mentionne que rarement les alternances (transformations) possibles. De plus, le métalangage leur apparaît « parfois complexe et opaque : les définitions des FL semblent parfois approximatives » et

« les règles de combinaison et de configuration des FL peuvent apparaître fantaisistes et ne suivent pas toujours une syntaxe rigoureuse ». Tutin et Grossmann poursuivent en soulignant que les FL sont principalement dévolues à l’encodage plutôt qu’au décodage et « ne proposent pas de mécanismes explicatifs des associations collocationnelles, bien que les dernières versions du DEC fassent une place aux mécanismes d’héritage des collocations ».

L’ensemble de l’introduction à l’ouvrage nous amène à la conclusion que Tutin et Grossmann considèrent le DEC et les FL comme un cadre approprié à la description des collocations, comme une sorte de « prétraitement des cooccurrences dans une langue donnée », bien que l’adéquation explicative doive être recherchée ailleurs. De ce fait, la prépondérance des communications se plaçant dans le cadre de la lexicologie explicative et combinatoire nous apparaît quelque peu surprenante.

La première contribution (I.

expressions à comportement idiomatique dans le cadre de la TST, dans l’optique d’une pratique lexicographique. La deuxième contribution (G. Williams) fournit une mise en perspective historique de la problématique des collocations, centrée sur l’école contextualiste britannique, la linguistique de corpus et les travaux de Firth.

La troisième contribution (M. Alonso Ramos) aborde des problèmes, qualifiés de théoriques par les éditeurs du recueil, liés au statut lexical des collocations. La quatrième contribution (S. Kahane) (dé)montre l’insuffisante cohérence interne du DEC existant, dans sa structure comme dans les étapes du travail de description, en

(21)

s’appuyant sur le traitement du lexème BLESSURE et de ses collocatifs (ex : profonde, grave, cuisante…). Dans la cinquième contribution, T. Fontenelle cherche à résoudre deux problèmes posés par l’adoption de la TST comme cadre de formalisation et de description des collocations. Les trois dernières contributions abordent des problèmes liés à la modélisation des collocations dans le champ de la terminologie et de la didactique.

L’originalité et l’intérêt, à nos yeux, de ce recueil de contributions, est de proposer une description et une classification des collocations qui fait souvent défaut dans la majorité des publications consacrées à ces unités, habituellement plutôt centrées sur les techniques de repérage et d’extraction automatique de ces unités et sur l’évaluation de l’efficacité des techniques mises en œuvre.

Cependant, nous soulignons une possibilité de méprise, induite par le sous-titre de l’ouvrage : « analyse et traitement », qui appelle, justement, un collocatif de

« traitement », à savoir « automatique » (traitement automatique). Or, en-dehors de la contribution de Th. Fontenelle et du rappel historique de G. Williams sur la naissance de la linguistique de corpus, ce point n’est pas abordé dans le recueil. La contribution de G. Williams se place ainsi en marge par rapport à l’ensemble des contributions d’auteurs affiliés à la TST, qui présupposent que ce modèle, bien que perfectible ainsi que le (dé)montre S. Kahane, est une base globalement saine pour la description et la formalisation de ces unités, dans une perspective lexicographique.

Ce faisant, il nous semble qu’une partie importante, dans les applications abordées dans l’ouvrage (i.e. didactique des langues et TALN), des apports de la tradition anglo-saxonne dans le domaine est ainsi perdue. Par exemple, aucune contribution ne traite des unités telles que les « lexical bundles » (ex. : « what I think is », « I want you to », « ça vous dérange si ») identifiées par D. Biber et qui, d’après lui, permettent de réaliser un besoin communicationnel, qui pourrait être traité, nous semble-t-il, par le système des FL de la TST.