• Aucun résultat trouvé

des Langues Assisté par Ordinateur

3.3 Analyse syntaxique et détection d’erreurs

3.3.2 Règles syntaxiques et traitement des erreurs

3.3.2.2 Contraintes et relâchement de contraintes

Les contraintes sont des conditions qui doivent être vérifiées pour per-mettre la combinaison de constituants entre eux ; elles sont donc une restric-tion qui s’applique aux règles de réécriture vues précédemment. Le premier type de contrainte est celui des règles de réécriture elles-mêmes. Ainsi, à l’aide de la grammaire (10) p. 103, on ne pourra pas dériver les exemples suivants, qui sont agrammaticaux.

(14) a. * dormir chat gentil.

b. * chat le mange souris la.

D’après notre grammaire, aucune dérivation ne permet de débuter une phrase par un verbe, ce qui élimine (14a). Aucune règle ne permet de dériver N Det, ce qui élimine (14b). Le second type de contrainte s’applique aux règles de réécriture pour en restreindre la portée. Voici deux règles de (10) enrichies de contraintes sur leur application :

(15) a. S →NP VP, {accord en nombre, accord en personne}

b. NP → Det N, {accord en nombre, accord en genre}

L’accord entre les éléments d’un syntagme est vérifié par l’intersection des valeurs d’ensembles. L’exemple (16) montre pour la phrase (12a) que la règle d’accord de (15b) est vérifiée. Le nouvel ensemble de traits qui résulte de l’intersection est ensuite utilisé pour vérifier la règle (15a).

(16) les{pers = 3; gen=masc, fem; nb=pl} ∩ pitbulls{pers=3; gen=masc;

nb=pl} = {pers=3; gen=masc; nb=pl}

En outre, le second type de contrainte consiste à respecter le cadre de sous-catégorisation d’un élément lexical, ou d’un de ses cadres s’il en compte plusieurs. Enfin, un troisième type de contrainte porte sur des critères de sélection sémantique grâce à des traits contenus dans le lexique, pour autant que celui-ci soit riche et que la grammaire prévoie un traitement sémantique de base. Considérons les exemples suivants :

(17) a. ? L’oreiller mord.

b. ? Le chat lit une BD.

c. ? L’agneau dévore le loup.

Les phrases en (17) respectent les règles d’accord. Pourtant, elles sont difficilement acceptables. Des contraintes sémantiques sont généralement as-sociées aux verbes. Ainsi, en (17a),mordre possède un trait sémantique qui stipule que son sujet doit être animé. Si l’on n’est pas dans un monde de fiction, (17b) est impossible car liredemande un sujet humain. Enfin, (17c) relève du champ sémantique des mots :dévoreimplique un sujet carnivore34. Ainsi, la détection d’erreurs dépend d’un lexique riche et consistant. Dans le cadre de l’ALAO, pour que le but pédagogique puisse être atteint, il faut définir une couverture grammaticale et un lexique adapté à la tâche, afin de couvrir le plus exactement possible le champ grammatical à couvrir par l’application.

Passons maintenant aux techniques de relâchement de contraintes, qui permettent à l’analyseur syntaxique de produire une structure complète même en cas d’erreur de l’utilisateur. Dans ce cas, il est utile d’indiquer dans la structure grammaticale l’endroit et la nature de l’erreur. La rétroac-tion du système est alors plus efficace puisque l’apprenant sait précisément où il a commis des erreurs et peut y remédier. En outre, certains systèmes proposent une ou plusieurs corrections.

L’idée du relâchement de contraintes est très intuitive : dans une situation normale, un analyseur cherche à produire une analyse syntaxique complète d’une phrase en tenant compte de règles qui conditionnent les combinaisons des éléments de la phrase. Si l’analyseur ne peut donner une structure à la phrase complète, on peut tenter de désactiver une ou plusieurs contrain-tes sur ces règles, tant au niveau du mot qu’à celui du syntagme, pour obtenir une analyse complète. Cette technique est plus largement décrite chez Vandeventer Faltin (2003, chap. 3), dont nous nous inspirons.

De nombreux ouvrages traitent du relâchement de contraintes (Wei-schedel et al., 1978; Weischedel et Black, 1980; Kwasny et Sondheimer, 1981; Hayes et Mouradian, 1981; Weischedel et Sondheimer, 1983; Gran-ger, 1983; Carbonell et Hayes, 1984; Vandeventer, 2000; Vandeventer Faltin, 2003; Menzel, 2004). Afin de limiter le nombre d’analyses, les contraintes ne doivent être relâchées que si aucune analyse complète de la phrase peut être obtenue. Vandeventer Faltin (2003, p. 69) identifie deux actions à accomplir

34. Laissons également de côté le problème de la polysémie des mots :dévorer peut avoir un sens figuré comme dansdévorer un livreoudévorer des yeux.Loupdésigne également un poisson et est utilisé dans l’expressionvieux loup de merpour un marin expérimenté.

pour que le diagnostic soit efficace :

i. Le lieu où une contrainte a été relâchée doit être mémorisé pour faci-liter le diagnostic ;

ii. Si les contraintes impliquent la vérification de valeurs de traits et le calcul de nouveaux traits pour le syntagme résultant de la combinai-son (comme l’exemple (16) p. 107), en cas d’erreur, l’intersection des ensembles des traits sera vide et l’on ne pourra pas vérifier ce trait pour produire une phrase complète. Dans ce cas, on opérera l’union de l’ensemble. Dans d’autres cas, il sera nécessaire de définir un trait par défaut.

Passons maintenant à l’ordre d’application du relâchement et l’oppor-tunité de relâcher certaines règles. D’un côté, les contraintes dures sont difficilement relâchables. Il est en effet peu souhaitable d’autoriser n’im-porte quelle combinaison de syntagmes, ce qui conduirait à une explosion du nombre de structures (Imlah et du Boulay, 1985; Vandeventer Faltin, 2003). Quelques règles d’ordre des adjectifs et des adverbes peuvent être néanmoins relâchées, car la structure varie peu. D’un autre côté, pour les contraintes douces ou conditionnelles, il est important de définir quelles sont les erreurs qu’il faut détecter et quelles contraintes doivent être relâchées.

Concluons par quelques réflexions sur les avantages et inconvénients po-sés par le relâchement de contraintes. Nous avons déjà évoqué le principal avantage : l’apprenant obtient une structure complète de sa production et peut ensuite utiliser les informations fournies pour remédier à son erreur.

Une analyse complète montre aussi que la machine a pu donner un sens et une structure à une phrase, ce qui présente un aspect valorisant pour l’apprenant :

"Being able to reach a complete parse, even if containing errors and having required the use of relaxed contraints, is also an in-dication that the sentence grammaticality, although not perfect, is not too far off the mark." (Vandeventer Faltin, 2003, p. 71)

Le principal inconvénient est la surgénération de structures. Vu l’ambi-guïté du langage naturel, un analyseur produit parfois plusieurs dizaines de structures différentes pour une phrase simple. Des centaines d’autres phrases ont été éliminées par l’application de contraintes. En relâchant des contrain-tes, on augmente considérablement le nombre de structures produites. En effet, par effet boule de neige, une contrainte relâchée ouvrira la voie à une

analyse qui peut aboutir ensuite à d’autres relâchements de contraintes.

D’autre part, parmi les différentes analyses, il est parfois préférable de sé-lectionner une analyse contenant des erreurs plutôt qu’une structure sans erreurs. Dans tous ces cas, il est alors nécessaire d’éliminer les structures les plus improbables par des heuristiques.