Une grammaire universelle
“Montague's theory of linguistic analysis provides the linguist with the means of doing model theoretic interpretation of natural language through translation.
Such fundamental semantic notions as truth, synonymy and validity are defined for intensional logic. Montague showed in 'Universal Grammar' that the definitions of these notions carry over to natural language if we translate natural language expressions into intensional logic according to certain principles.”
Halvorsen & Ladusaw
L'objectif que se fixe Montague dans UG est de ''combler le fossé'' entre la syntaxe et la sémantique et d'exposer pour la première fois un algorithme adéquat pour une analyse à la fois syntaxique et sémantique des langages artificiels et de nos langues naturelles. Pour ce faire, après avoir fourni une syntaxe et une sémantique (cette dernière en deux parties: une théorie de la signification et une théorie de la référence), Montague définit des fonctions de traduction d'un langage à un autre puis montre dans le reste de l'article comment ce système permet d'analyser (i.e. de générer sans présupposer la syntaxe et la sémantique) un langage artificiel, la logique intensionnelle et une langue naturelle, en l'occurrence un fragment de l'anglais.
Avant de définir la syntaxe de son algorithme, Montague met en place un certain nombre de notions d'arrière plan indispensables. Parmi ces notions, nous nous intéresserons ici celle d'opération et à celle d'algèbre.
Une opération est une relation qui donne un résultat unique pour chaque séquence d'arguments. Par exemple, la négation est une opération puisqu'à chaque expression p elle associe une seule entité alors que la synonymie par exemple n'est pas une opération puisqu'à un même mot, on peut associer plusieurs synonymes.
Une algèbre est un système consistant en un ensemble d'objets A et un ensemble indexé d'opérations définies sur les objets de l'ensemble. Par exemple, le calcul propositionnel est, selon cette définition, une algèbre avec A représentant l'ensemble des expressions bien formés du langage et l'ensemble d'opérations {F1, F2} avec l'opération F1 le connecteur de négation et l'opération F2 l'opération de conjonction. Étant donné que la conjonction et la négation constituent un ensemble suffisant de connecteurs pour la logique des propositions, notre algèbre ainsi définie permet de reconstruire cette logique. En partant d'algèbres contenant des opérations aussi basiques que celle de concaténation, l'opération
d'identité, celle de composition (qui permet d'appliquer une fonction au résultat de l'application d'une autre fonction), Montague veut arriver à générer la langue (ou le fragment) à analyser comme algèbre. Une fois cela fait, il sera possible de prendre cette algèbre A1 comme langage‐objet et, s'inspirant de Tarski; utiliser une autre algèbre A2 comme métalangage dans lequel on définirait un prédicat
« vrai en A1 ». Pour cela, Montague veut que sa théorie permette de définir des relations d'homomorphisme entre les différentes algèbres. Une relation d'homomorphisme est une relation qui permet de transformer une algèbre en une autre tout en préservant la structure de la première algèbre. C'est cette relation d'homomorphisme qui permet de passer du langage‐objet au métalangage dans lequel est défini le concept de vérité applicable aux énoncés du langage‐objet.
Armés de ces concepts d'arrière plan, intéressons‐nous à présent à la manière dont Montague va les mettre en œuvre pour construire une syntaxe et une sémantique applicables tout autant aux langages formels qu'aux langues naturelles.
Syntaxe
Du point de vue syntaxique, un langage se définit par la donnée d'une paire <DL, R> où DL est un langage désambiguïsé et R une relation d'ambiguïsation. La relation d'ambiguïsation R a pour fonction d'établir l'équivalence entre certaines phrases du langage désambiguïsé et d'autres phrases du langage. Une expression Φ du langage est syntaxiquement ambiguë si et seulement si il existe au moins deux autres expressions Φ' et Φ'' qui sont reliées à Φ par la relation R [i.e. si et seulement si: ΦRΦ' et ΦRΦ'']. Tout langage contenant une expression syntaxiquement ambiguë est lui‐même dit syntaxiquement ambiguë. Dans le cadre de l'analyse des langues naturelles, la relation d'ambiguïsation R permet, une fois que notre système a engendré toutes les expressions possibles du point de vue syntaxique, de rendre compte de la relation qui existe entre une expression syntaxiquement ambiguë et ses différentes lectures possibles79. Le langage désambiguïsé est un système qui définit une famille de catégories syntaxiques. Par catégorie syntaxique, Montague entend l'ensemble des expressions appartenant au type syntaxique de cette catégorie. Montague, en effet, indexe les catégories par le type d'expressions qu'elles admettent et définit par exemple une catégorie Xs contenant les toutes les phrases ('sentence' en anglais.) du langage et elles seules. Pour construire un langage désambiguïsé, il faut spécifier les choses suivantes.
Tout d'abord un ensemble d'expressions de base pour chaque catégorie syntaxique. Ces expressions de base sont le lexique à partir duquel seront dérivées toutes les autres expressions du langage. Notons que ce lexique montagovien ne correspond pas au lexique tel que le définit le programme chomskyen. Étant donné que des considérations sémantiques, et particulièrement le souci de respecter le principe de compositionnalité, guident la syntaxe de Montague, le découpage de son lexique syntaxique de base ne
79 Plus concrètement, cette relation d'ambiguïsation doit par exemple permettre de relier la phrase: (a): « Jean cherche une licorne » à ses deux lectures possibles. La lecture non référentielle ou de dicto (a'): « Jean cherche une licorne (croyant que de tels animaux existent) » et la lecture référentielle ou de re (a''): « Il existe une licorne telle que Jean la cherche. »
reflète pas ce qu'il serait dans un programme de recherche focalisé sur la syntaxe. Ainsi, alors que croire que est une unité lexicale de base dans la syntaxe montagovienne, il serait décomposé dans une syntaxe générative en un verbe croire et une conjonction que. De fait, dans le système montagovien, les expressions de base peuvent appartenir à n'importe quelle catégorie syntaxique y compris dans des catégories comme VP (phrase verbale), NP (phrase nominale) ou même S (Phrase) qui sont évidemment complexes pour n'importe quel linguiste80 générativiste. Dans ce cadre donc, appartenir à une catégorie de base ne signifie pas que l'expression est non décomposable mais uniquement que c'est un point de départ indispensable pour générer toutes les autres parties du langage et en justifier les propriétés syntaxiques et sémantiques. La préoccupation première de Montague est de choisir le lexique de sorte que toute la grammaire obéisse au principe de compositionnalité i.e. à l'exigence que le sens d'une expression complexe soit déterminé par le sens et la structure de ses constituants.
En plus de ce lexique, il faut fournir un ensemble de règles syntaxiques permettant de générer des expressions non basiques à partir des expressions de base du langage. Ces règles permettent de définir une nouvelle catégorie syntaxique en générant directement toutes les expressions du langage qui sont membres de cette catégorie. Prenons un exemple concret pour voir comment fonctionnent ces règles montagoviennes. On peut par exemple avoir la règle:
(R1): <F5<DET,NOM>NP>
Ce que la règle (R1) exprime, c'est qu'il y a une opération F5 qui concatène les membres de la catégorie DET (les déterminants) avec les membres de la catégorie NOM (les nominaux) pour donner un élément appartenant à la catégorie NP (les phrases nominales). Cette règle permet de générer mécaniquement tous les éléments de la catégorie NP. Le problème bien sûr avec cette règle, c'est qu'en l'état il n'y a aucun mécanisme empêchant la génération de NP sémantiquement inacceptables. Par exemple, puisque ''une'' appartient à la catégorie DET et ''fils'' à la catégorie NOM, F5 génère le NP ''une fils''.
L'opération F5 sur‐génère donc.
Que les règles syntaxiques sur‐génèrent des expressions syntaxiquement correctes mais inacceptables d'un point de vue sémantique ne serait pas un problème. Ce qui est plus gênant, c'est qu'il y a également une surgénération d'expressions incorrectes du point de vue syntaxique puisqu'en l'état, le système engendre toutes les expressions possibles du point de vue combinatoire sans que des règles plus complexes comme celles d'accord s'appliquent. C'est le rôle des règles structurelles que de faire le tri parmi les expressions produites par les règles syntaxiques pour ne retenir que celles qui appartiennent à la langue à analyser. Ce tri se fait par la définition de règles syntaxiques qui s'appliquent à tour de rôle et qui finissent sélectionner toutes et uniquement les expressions grammaticales de la langue et par n'engendrer que des phrases grammaticales en composant ces expressions. A chaque étape de la dérivation, il y a des règles combinatoires qui produisent toutes les expressions possibles et d'autres règles qui sélectionnent les expressions syntaxiquement acceptables parmi ces possibilités.
80 Dans EFL, la phrase It rains appartient au lexique, dans la catégorie Xt des phrases.
Sémantique
Dans UG, Montague propose que la syntaxe aille de pair avec une sémantique duelle. En même temps que l'on construit une syntaxe, on doit construire une théorie de la signification et une théorie de la référence.
Théorie de la signification
La théorie de la signification proposée dans UG est un formalisme permettant d'associer de manière systématique des significations aux éléments du lexique syntaxique déjà fourni et à définir un homomorphisme entre le lexique et les règles sémantiques ainsi définis et le lexique et les règles syntaxiques précédentes. De ce fait, en construisant notre syntaxe, nous construisons en parallèle la signification des expressions syntaxiques que nous dérivons. A priori, cette démarche tombe sous le coup des critiques lewissiennes de la sémantique traductionnelle. Nous verrons par la suite comment Montague évite cet écueil mais pour l'instant, entrons un peu plus dans le détail de la théorie de la signification qu'il propose.
Montague ne dit pas encore ce que sont les significations qu'il faut assigner aux expressions du langage. Ce qui est nécessaire à ce niveau, c'est de formaliser la notion d'interprétation. Et pour interpréter la syntaxe précédemment proposée, il suffit de trois choses.
1. Il faut d'abord fournir un ensemble B de significations. Cet ensemble contient toutes les significations associées aux expressions de base de notre syntaxe mais également des significations qui ne sont pas associées aux éléments du lexique.
2. Il faut ensuite définir une fonction f qui assigne un élément de B à tout objet du lexique syntaxique que nous avons précédemment défini.
3. Il faut enfin définir un ensemble d'opérations sémantiques G tels que
<B,G> est une algèbre et qu'il y a autant de règles sémantiques Gx qu'il a été précédemment défini de règles syntaxiques Fx. Notons par ailleurs que les membres de l'ensemble G sont tels qu'il y a une correspondance stricte entre les Fx et les Gx. Par exemple, à une règle syntaxique à n places Fn correspondra une règle sémantique à n places Gn.
En spécifiant un univers de significations, B, un ensemble d'opérations sémantiques G et une fonction, f, assignant des significations aux éléments du lexique syntaxique, nous avons défini un formalisme tel qu'il nous permettra d'assigner automatiquement une signification à chaque expression du langage.
Nous avions en effet vu que notre formalisme syntaxique permettait d'engendrer toutes et uniquement les expressions bien formées du langage. Puisque le formalisme sémantique que nous venons de construire est homomorphe à notre syntaxe, il va de manière concomitante engendrer les significations de toutes les expressions du langage. Nous avons donc là une théorie qui, contrairement à celle de Chomsky, fournit dans le même mouvement une dérivation de la syntaxe et de la sémantique des expressions du langage.
Reste à présent la question de savoir s'il ne s'agit pas là d'une classique sémantique traductionnelle qui assigne de mystérieuses significations à des entités syntaxiques sans nous être d'aucune aide dans la compréhension de ce qu'est une signification. Dire que l'élément a du lexique syntaxique correspond à une entité sémantique donnée, b, et donner des règles de combinaisons qui permettent d'engendrer des entités sémantiques n'est une avancée sur le plan de
la théorie sémantique que si nous savons comment relier ces entités au monde extérieur et comment nous pouvons découvrir les conditions de vérité des énoncés que nous engendrons. Le second volet de la sémantique que propose Montague a justement pour objectif de résoudre ce problème.
Théorie de la référence
Pour le moment, la sémantique qui est proposée est interne au langage et échoue à nous donner un mécanisme pour décider à quel type d'objets nos expressions réfèrent et, surtout, quelles sont les conditions de vérité des propositions que nous engendrons. Montague introduit la notion de type sémantique pour fixer la référence des expressions du langage et engendrer de manière automatique les conditions de vérité des propositions.
Nous avons vu que les expressions de notre langage appartiennent à des catégories syntaxiques auxquelles correspondent des catégories sémantiques.
Nous avons par ailleurs vu que Montague définit des opérations sur ces catégories, opérations qui posent par exemple qu'une expression appartenant à telle catégorie s'associe à une expression appartenant à telle autre catégorie pour donner une expression de telle autre catégorie. Pour rappel, cf. la règle (R1) qui nous enjoint de combiner un déterminant avec un nom pour former une phrase nominale.
(R1): <F5<DET,NOM>NP>
Ce que propose Montague, pour compléter son système, c'est de spécifier pour chaque catégorie, quel type d'objet lui servent de dénotation. Il nous faut donc définir un ensemble de types sémantiques et affecter à chacune des catégories précédemment définies un type. Il faut de plus que ce choix se fasse de sorte que l'application des règles définies dans la syntaxe et dans la théorie de la signification engendre automatiquement des expressions ayant le bon type.
Suivons d'abord la définition récursive de l'ensemble T des types par Montague avant de voir comment l'affectation de ces types aux expressions du langage permet de compléter la grammaire universelle en nous dotant d'une sémantique vériconditionnelle.
Trois axiomes suffisent définir l'ensemble T des types:
(1)e et t appartiennent à T. Avec e le type des entités et t le type des valeurs de vérité.
(2)Si r et s appartiennent à T, alors la paire ordonnée <r,s> appartient à T et est le type des fonctions qui ont pour argument les objets de type r et pour résultat des objets de type s. Donc, <e,t>, <e,<e,t>>, <<e,t>, t> etc., appartiennent à T.
(3)Pour chaque type r, le type du sens des objets de type r, est la paire ordonnée <s,r>. Les objets de type <s,r>, les sens, sont des fonctions des mondes possibles aux expressions de type r.
Comment cette axiomatique permet‐elle tout à la fois de servir à fixer les dénotations des expressions et de préciser les conditions de vérité des propositions? Afin de répondre à cette question, éclaircissons la distinction entre dénotation, sens et signification dans la sémantique montagovienne. Avec l'axiome (3), est introduite une notion de sens différente de la notion de signification. Montague juge en effet nécessaire la distinction entre sens et
signification si l'on veut un système qui permette également de traiter les indexicaux.
Nous avons vu que Montague définissait un homomorphisme entre des catégories syntaxiques et des catégories sémantiques et que cela se faisait en associant de manière systématique des significations aux éléments de sa syntaxe.
L'on peut donc en conclure que ces significations sont avant tout des entités linguistiques et plus précisément sémantiques. C'est d'ailleurs pour cette raison que la critique lewissienne de la sémantique traductionnelle marcherait également pour la sémantique montagovienne si cette dernière se limitait à la théorie de la signification décrite plus haut.
L'introduction d'un mécanisme de fixation du type de référence approprié permet de sortir du cercle linguistique et d'avoir une sémantique réellement vériconditionnelle. La démarche de Montague est la suivante. Acceptons avec Frege que les expressions du langage ont un sens et une dénotation. Acceptons également qu'une proposition complète a pour dénotation une valeur de vérité.
En partant de cela, nous pouvons reconstruire le schéma d'axiomes (1)‐(3) exposé plus haut. A un extrême, nous avons les propositions qui dénotent des valeurs de vérité et à l'autre extrême, nous avons les noms qui dénotent des objets. Ce sont là les deux types primitifs e et t de Montague. Si nous nommons T l'ensemble des dénotations possibles des expressions du langage, nous pouvons d'ores et déjà définir deux sous ensembles de T: un premier, De, qui contient toutes les entités et dont les membres ont donc le type e et un second, Dt contenant les deux valeurs de vérité qui sont les dénotations possibles des phrases. Reste à présent à trouver le type de dénotation adéquat pour toutes les expressions du langage qui ne sont ni des noms, ni des propositions complètes.
S'aidant des règles syntaxiques et sémantiques déjà définies, Montague réussit à assigner aux expressions de chaque catégorie un type tel que l'application des règles qui engendrent des propositions aboutisse mécaniquement à la dérivation type t pour la proposition. Illustrons cela par l'exemple simple de la phrase (a) qui suit.
(a) Jean marche
Nous savons que « Jean », en tant que NP dénotant une entité, est du type e. Nous savons également que la phrase « Jean marche. » dénote une valeur de vérité et est donc de type t. Étant donnée la contrainte du principe de compositionnalité, le verbe intransitif, « marche » dénote nécessairement une fonction des entités aux valeurs de vérité. Le verbe intransitif, « marche » est de ce fait de type <e,t>, type qui appartient à l'ensemble T en vertu de la règle (2) du système d'axiomes (1)‐(3). Montague attribue un type à chacune des catégories sémantiques définies de sorte que l'application des règles syntaxiques et sémantiques engendrent automatiquement les conditions de vérité des propositions. A titre indicatif, nous mettons ci‐après un tableau81 contenant quelques catégories syntaxiques accompagnées de leur type sémantique. Notons que Partee, dans ce tableau, écrit « e→t » là où nous écririons: <e,t>.
81 Tiré d'un cours de Barbara Partee à l'université de Moscou (2005). MGU: Formal Semantics and Current Issues in Semantics‐ Lecture note 2 disponible à l'adresse suivante:
http://people.umass.edu/partee/MGU_2005/MGU05_formal_semantics.htm
Pour que ces conditions de vérité ne soient elles‐mêmes pas strictement confinées à un univers logique virtuel, il faut arriver à faire le lien avec le monde.
C'est là qu'interviennent les sens.
Les significations ne sont pas à confondre avec les sens frégéens tels que les définit Montague dans sa théorie de la référence. Nous avons vu que les significations sont des entités linguistiques; les sens frégéens quant à eux sont des dénotations. Ce sont des fonctions assurant le lien entre le langage et le monde. Pour éclairer la nature de ces sens, prenons l'exemple de la phrase (b) suivante.
(b) Marie est aphone.
Nous avons ici, un NP: « Marie » et un VP: « est aphone ». En tant que nom propre, Marie est de type <e> tandis que le VP « est aphone » est de type <e,t> ce qui permet de générer le type <t> pour la phrase (b). Si nous appliquons l'axiome (3), nous trouvons que le sens frégéen du NP « Marie » a pour type <s,e> cela veut dire que ce sens met en relation l'expression « Marie » avec sa dénotation dans un monde possible. De manière analogue, un sens de type <s,<e,t>> fait le lien entre le VP « est aphone »et un monde possible. Dans ce système, nous pouvons dire que les entités de type <s,e> sont des concepts individuels, les
Nous avons ici, un NP: « Marie » et un VP: « est aphone ». En tant que nom propre, Marie est de type <e> tandis que le VP « est aphone » est de type <e,t> ce qui permet de générer le type <t> pour la phrase (b). Si nous appliquons l'axiome (3), nous trouvons que le sens frégéen du NP « Marie » a pour type <s,e> cela veut dire que ce sens met en relation l'expression « Marie » avec sa dénotation dans un monde possible. De manière analogue, un sens de type <s,<e,t>> fait le lien entre le VP « est aphone »et un monde possible. Dans ce système, nous pouvons dire que les entités de type <s,e> sont des concepts individuels, les