• Aucun résultat trouvé

Nous avons rapidement présenté la théorie sens-texte dont la paraphrase repré- sente un des éléments porteurs. Ensuite, nous avons abordé les fonctions lexicales, outils de paraphrasage, l’une des découvertes les plus importantes dans la TST, et que nous avons considérée comme un des meilleurs moyens linguistiques de pa- raphrasage existant. Nous avons donné quelques exemples de FL et avons, par la suite, discuté des avantages et inconvénients du modèle du point de vue du traite- ment automatique de la paraphrase. Les FL représentent ainsi une possibilité de générer des paraphrases sophistiquées dans le sens où elles vont au-delà de simples transformations syntaxiques. De plus, le concept de FL est quasi-universel car elles ne dépendent pas d’une langue spécifique.

Cependant, les FL présentent deux inconvénients majeurs en traitement auto- matique de la paraphrase. D’abord, ces outils de paraphrasage fonctionnent bien dans le sens de la production (génération de paraphrases) mais ne conviennent pas à l’analyse (reconnaissance de paraphrases). Le deuxième porte sur des difficultés dans le développement des ressources de FL : cette tâche exige un temps de travail

long en raison d’une part du nombre élevé de FL et de l’autre de leur annotation ainsi que de la définition des entrées lexicales qui n’est pas définitive.

La grammaire guidée par prédicat

2.1

Aperçu global

La grammaire guidée par prédicat (Predicate Driven Grammar abrégé en PDG) de Schuster (2009) est, comme son nom l’indique, une grammaire formelle qui s’ins- pire de la théorie des prédicats linguistiques. Il s’agit ici du prédicat dans le sens de « mot sémantiquement plein » plutôt que de prédicat dans le sens d’une opposition sujet-prédicat comme dans la logique d’Aristote. Le prédicat ne se restreint pas au verbe, d’autres parties du discours comme l’adjectif, l’adverbe, le nom, voire certaines conjonctions et prépositions, peuvent avoir une valeur de prédicat.

L’auteur propose non seulement une grammaire formelle destinée au traitement automatique, il expose à travers son livre des réflexions intéressantes concernant cette grammaire. On peut aussi dire que la théorie linguistique et la grammaire formelle PDG se répondent. La démarche ressemble à celle que l’on retrouve chez Chomsky, pourtant les réflexions sur la linguistique chez Schuster s’avèrent plus poussées.

Les travaux de Schuster ont pour origine en large partie la théorie sens-texte qui 17

modélise la langue en termes de relations entre le sens (représentation mentale) et le texte (produit langagier : texte, parole). La tâche de la linguistique dans cette perspective consiste alors à décrire la relation entre le sens et le texte. Ainsi, Schuster déclare :

I would say that the facts which linguistics has to find must be such that they contribute to a description of a text-meaning relation and that a linguistic theory can be said to be correct and complete, if it returns for each input text t the set of meanings which t can have and for each meaning m the set of texts which express m. Equivalently, a linguistic theory can be said to be correct and complete, if it returns for each input text t the set of its paraphrases.

Traduction : Je dirais que les faits que la linguistique tâche de

trouver doivent être tels qu’ils contribuent à la description de la rela- tion sens-texte et qu’une théorie linguistique peut être dite correcte et complète, si elle retourne, pour chaque texte d’entrée « t » l’ensemble des sens que « t » peut avoir et pour chaque sens « s » l’ensemble des textes qui expriment « s ». Parallèlement, une théorie linguistique peut être dite correcte et complète, si elle retourne pour chaque texte « t » l’ensemble de ses paraphrases.

Certes, les postulats de la théorie de Schuster tournent autour de la théorie sens-texte, il n’en va pas de même pour sa grammaire formelle PDG qui présente un mélange de concepts venant de plusieurs écoles. En effet, on retrouve dans les descriptions de la PDG : la grammaire hors contexte et la notion de syntagme, qui sont probablement venues des théories de N. Chomsky (1957, 1965) ; les fonc- tions lexicales de la théorie sens-texte ; les transformations de Z. S. Harris (1970)

pour définir la relation paraphrastique ; le lexique-grammaire chez Gross (1975). Considérons la règle de PDG suivante :

arity 2

syntax s =⇒ vp–have -n-nf s

meaning doubt[s=oper](he,love(she,he)) text He has doubts she loves him owners doubt

Figure 2.1 – Une des règles de PDG pour l’entrée lexicale doubt

Toutes les règles de PDG codées sous forme de cinq sous-règles sont composées de :

1. arity (arité ou le nombre d’arguments du prédicat), ici 2 arguments

2. syntax (syntaxe indiquant la structure de la phrase), la phrase est composée d’ :

– un syntagme verbal vp–have

– un prédicat au pluriel -n-nf (-n indique la place du prédicat doubt, -nf pluriel)

– une phrase s

3. meaning (sens sous forme d’une extension de la logique des prédicats) 4. text (text correspond à la phrase canonique de cette règle)

5. owners (propriétaires ou prédicats).

Faisons une décomposition des concepts présents dans la règle de grammaire suivante. La grammaire hors contexte et la notion de syntagme se trouvent dans la partie syntax qui présente la règle de réécriture « s =⇒ vp–have -n-nf s ». Dans la partie meaning, doubt[s=oper] correspond à la fonction lexicale Oper de la théorie sens-texte dont l’application à doubt donne « have doubts ». Une telle

règle de grammaire, vue dans son ensemble, s’inspire du lexique-grammaire, c’est- à-dire qu’on y trouve une règle locale. Une règle locale s’oppose à une règle globale dans la mesure où cette dernière se fonde sur une partie du discours et est censée s’appliquer à un certain nombre de mots, par exemple « s → nom verbe-intransitif

nom », alors qu’une règle locale présuppose une syntaxe et une sémantique propres

à un mot, à titre d’exemple la règle de grammaire pour le mot doubt ci-dessus. Les inconvénients des règles de grammaires dites globales ont été démontrés par M. Gross (1979). Enfin, Schuster modélise la relation paraphrastique à l’aide de transformations que nous expliquerons dans le prochain chapitre.

Tout mélange complexe de concepts qu’il soit, la PDG se démarque des autres grammaires formelles par son aspect non modulaire. L’auteur pense qu’une règle de grammaire ne doit pas être modulaire, autrement dit qu’elle doit contenir de l’information morphosyntaxique et sémantique car ce ne serait pas approprié de procéder d’une manière séquentielle à l’analyse de différents niveaux linguistiques. La non-modularité se voit ainsi opposée à la plupart des théories linguistiques, par exemple, la théorie sens-texte où 7 strates ont été définies ou comme chez Chomsky et Tesnière (1959) qui séparent la syntaxe et la sémantique.

Nous ne prétendons pas faire une présentation exhaustive de la PDG même si plusieurs éléments nous paraissent intéressants. Passons au sujet qui nous intéresse le plus, à savoir la paraphrase dans la PDG.