• Aucun résultat trouvé

Linguistique et mathématique : de la théorique au traitement analytique des données.

N/A
N/A
Protected

Academic year: 2022

Partager "Linguistique et mathématique : de la théorique au traitement analytique des données."

Copied!
12
0
0

Texte intégral

(1)

183

LINGUISTIQUE ET MATHEMATIQUE : DE LA THEORIQUE AU TRAITEMENT ANALYTIQUE DES DONNEES.

---

LINGUISTICS AND MATHEMATICS: FROM THEORY TO ANALYTICAL DATA PROCESSING

Noureddine SAMLAK FLAM, Université Cadi Ayyad, Maroc nourdoo@hotmail.com

Résumé :

Cet article a pour objectif de donner quelques exemples des théories mathématiques qui ont servies l’étude de la langue sur plusieurs aspects et qui ont contribué même à la conception des théories linguistiques parfaitement élaborées en donnant un nouvel élan à cette discipline avec les linguistes du 20ème siècle. Nous allons illustrer cela avec des exemples concerts de traitements mathématique de la langue à travers plusieurs types de modèles.

Mots-clés : Linguistique, mathématique, théories, traitement, données.

Abstract :

This article aims to give some examples of the mathematical theories which have served the study of language on several aspects and which have even contributed to the design of perfectly developed linguistic theories by giving a new impetus to this discipline with linguists of the 20th century. We will illustrate this with live examples of mathematical language processing through several types of models.

Keywords: Linguistics, mathematics, theories, processing, data.

Introduction

La rencontre entre linguistique et mathématique semble, a priori, une démarche périlleuse de réunir deux disciplines de spécialistes aux horizons hétérogènes par la simple volonté de trouver des passerelles entre deux sciences pilotes et séduisantes dans le domaine de la recherche. De ce fait, si rencontre il y a, de quel genre s’agit-il ? Comment la linguistique, qui a pour objet de décrire et d’étudier des faits de langage, peut-elle exploiter les théories mathématiques à son propre compte ? Comment peut-elle transformer les faits observés en calcul et créer une linguistique mathématique comme le cas de la physique, de la chimie ou de la biologie qui ont su intégrer les théories mathématiques dans les calculs des forces, des énergies, de la vitesse, des distances et même des probabilités de faits qui peuvent se manifester ou non dans la réalité. Et si l’on accepte, comme le précise Solomon, que ces sciences aient besoin « d’un métalangage mixte, dont une composante est naturelle et l’autre est formelle, alors on ne peut dénier cette même exigence à la linguistique. »1

Pour ce faire, la linguistique peut, selon Descles et Fuchs (1969) 2, employer soit des techniques mathématiques déjà existantes dans les traitements des phénomènes de la langue, soit imaginer un nouveau modèle de forme mathématique capable de s’adapter avec les

1 Solomon Marcus (1988), « Mathématique et linguistique », In Mathématiques et sciences humaines, tome 103, Ed Numdam, p8.

2 Descles Jean-Pierre et Fuchs Catherine (1969), « Linguistique et mathématique », In: L'Homme, tome 9 n°3.

p94.

(2)

184

propriétés et les contraintes de cette discipline en s’inspirant des lois dégagées de l’observation des langues naturelles. Si le linguiste procède comme tel il devient donc légitime de parler d’une linguistique mathématique qui aura pour objectif de traiter les données linguistique en recourant à la théorisation, l’observation et l’expérimentation. Il est à signaler que plusieurs tentatives de fondement de cette nouvelle approche ont été élaborées à travers l’histoire des sciences et du langage.

1. Quelques précisions théoriques

1.1 Linguistique et raisonnement logique

Le rapport entre mathématique et linguistique débute bien avant le fondement de la linguistique mathématique et l’intégration des principes scientifiques dans l’étude de la langue et avant même l’essor de la linguistique historique et comparée des langues naturelles. En effet, ce rapport s’est tissé dès l’antiquité et le moyen âge avec les travaux sur la logique1 qui se trouve intimement liée au langage humain comme en témoignent nombreux penseurs et mathématiciens de ces époques. L’opinion commune attribue la fondation de la logique à Aristote, trois siècles avant Jésus-Christ. Selon Retoré, les bases de cette logique sont « les catégories, qui correspondent aux prédicats, et les termes2 qui en fait correspondent assez mal aux termes de la logique contemporaine. Combinés entre eux, ces éléments donnent lieu à des propositions.»3 Celles-ci peuvent être vraies ou fausses et constituent les fondements des célèbres syllogismes4 d’Aristote. Avec René Descartes, la tentative de recourir à des règles d’une grammaire logique pour créer une langue sans irrégularités, ouvre plusieurs perspectives de recherche. Leibniz poursuit cette ambition en considérant que « nos pensées sont la somme de plus petites pensées »5, c'est-à-dire d’éléments décomposables en unités atomiques et se combinent de nouveau pour donner naissance à plusieurs types de raisonnements. La logique se transforme alors en calcul d’un grand nombre de possibilités qu’on peut traiter avec les formules algébriques et mathématiques. L’exemple de la notion d’égalité6 (si deux objets ont les mêmes propriétés, ils sont égaux) illustre largement cela à travers la théorie des types et le langage de programmation. En plus, l’apport de Leibniz ne se limite pas à cela, il est possible, selon O’Connelle, de voir en lui :

« Le lointain précurseur de la linguistique mathématique dont Chomsky fut un pionnier. Dans son De Arte Combinatoria (1666), Leibniz avait pour projet, jamais abouti d’ailleurs, de créer une langue universelle (…) susceptible de décrire tout type de concept, qu’il s’agisse de science ou de métaphysique pour pouvoir générer une infinité de discours dans tous les champs de la

1 Nombreux chercheurs se sont interrogés également sur la notion de « logique » et sa différence avec

« cohérence » voir notamment Gustave Guillaume qui considère que logique et affaire des philosophes alors que le linguiste devrait s’intéresser à la seule cohérence. (Guillaume Gustave, 1973).

2 Pour les termes Aristote distingue entre les généraux qui parcourent un ensemble générique comme «animal»,

«homme », etc. et les particuliers qui ont une certaine constance commune comme « Athènes », «Platon », etc.

3 Christian Retoré (2011), « Logique mathématique et linguistique formelle », In Leçon de mathématiques d’aujourd’hui, ed Cassini, p2

4 Ce sont des phrases particulières de quatre sortes : universelle affirmative : « tous les hommes sont mortels », particulière affirmative « certains hommes sont philosophes », universelle négative « aucun homme n’est immortel et enfin particulière négative « tous les hommes ne sont pas philosophes ».

5 Christian Retoré, op.cit.

6 Si on peut, dans chaque proposition, remplacer x par y en préservant la vérité, x = y. (mais cela n’est pas toujours possible car même s’ils sont égaux par rapport à une propriété ils peuvent différer dans d’autres.

(3)

185

connaissance. Elle devait s’inscrire dans un projet plus global de calcul logique universel (…), et devait, pour cela, avoir une forme mathématique.» 1

Les ambitions de Descartes et Leibniz se poursuivent avec l’avènement du langage mathématique qui a donné naissance à cette séparation radicale entre le langage scientifique et langage humain que Georges Steiner avait décrit comme une « déshumanisation et d’une incommunicabilité progressive »2 La géométrie analytique de Descartes, les spéculations différentielles de Leibniz et la mécanique de Newton constituent une période où le raisonnement scientifique a besoin d’une rigueur que le langage naturel ne peut satisfaire à cause de la spontanéité des gens qui l’utilisent. Les théories mathématiques et le langage artificiel se sont manifestés alors afin de renforcer les langues naturelles en générant leurs métalangages et en unifiant leurs codes sur le plan international poursuivant le mythe de la Tour de Babel.

1.2 Linguistique, mathématique et champs connexes

La linguistique mathématique entretient des relations étroites avec d’autres champs connexes dans l’étude de la langue et du langage humain comme la linguistique structurale distributionnelle ou transformationnelle, la linguistique algébrique, la linguistique informatique ou cybernétique, ou encore la linguistique appliquée avec la traduction automatique, l’apprentissage des langues artificielles, etc. Le développement de la linguistique structurale, avec Ferdinand de Saussure et l’Ecole de Prague, en Europe, avec E. Sapir, L.

Bloomfield, Z. Harris et d’autres, en Amérique, a préparé, à l’intérieur de la linguistique, la voie vers la mathématisation. En nous référant à Lyons (1970), la linguistique structurale, considère la langue comme « un système de relations ou (…) un ensemble de systèmes liés les uns aux autres dont les éléments (sons, mots, etc.) n’ont aucune valeur indépendamment des relations d’équivalence et d’opposition qui les relient. »3 Pour Mounin (1968) 4 il y a structure car il y a : des unités de formes différentes, des règles d’assemblage différentes, un ordre à respecter et un choix dans l’arrangement des unités selon leurs fonctions. C’est ce que Bloomfield (1933) appelle le physicalisme de la langue qui rejette tout mentalisme (position d’Aristote) et se rattache à ce qui est palpable au détriment de toute abstraction qui relève du travail du philosophe. Le premier modèle exhaustif de la syntaxe proprement structurale est sans doute le modèle bloomfieldien de distribution5. « Sa partie révolutionnaire est la définition positionnelle des parties du discours, qui ne sont donc pas définies par leur fonction syntaxique totale, mais par leur seule distribution. »6 Le second modèle de la syntaxe structurale est celui du modèle transformationnel. Il est apparu avec Harris et Chomsky afin de générer les imperfections de quelques cas de la syntaxe distributionnelle selon laquelle « deux phrases ayant la même structure distributionnelle (…) n’ont pas même structure syntaxique lorsqu’elles n’acceptent pas les mêmes transformations. »7 L’introduction de la mathématique dans l’étude des structures de la langue va donner naissance à la linguistique mathématique ou mathématique structurale qui acquiert un statut confus et appelle à une possibilité d’appliquer la rigueur mathématique à l’analyse des structures linguistiques. Elle regroupe les travaux sur

1 O’Connelle Anne Marie (2016), Enseignement des langues en immersion, L’Harmattan, Paris. p40

2 Steiner Georges (1967), Language and Silence, New York, Atheneum, (version française, Paris, Editions du Seuil, 1969) cité par Solomon Marcus, op.cit p7

3 Lyons Jean (1970), Linguistique générale : introduction à la linguistique théorique, Ed Larousse, Paris, p41.

4 Mounin Georges (1968), Clefs pour la linguistique, Seghers, Paris, p83

5 Voir également les modèles de Hockett, Fries, Tesnière, Ihm et Lecerf ou encore Chomsky.

6 Ibid. p113

7 Mounin Georges, op.cit. p119

(4)

186

les grammaires formelles ( ), les automates (Chomsky), la linguistique algébrique ( ), etc. Cette idée apparaît, selon Guillaume, dénuée de justesse vu que :

« La mathématique apparaît ainsi, en tant qu’activité consciente de l’esprit et mise en œuvre des facultés discussives, laisser derrière soi, dans l’inconscient, les opérations de mécanique intuitionnelle, issues de la seule mise en œuvre des facultés primordiales de représentation. (…) La mathématique sui generis qu’enclot la mécanique intuitionnelle est une mathématique enfantine, aussi profonde que subtile, qui dans la chronologie potentielle de l’esprit humain, devance les raisonnements des arithméticiens, des algébristes, des géomètres et des analystes, et qui bien loin d’être expliquée par ces raisonnements, serait plutôt dans leurs sources profondes, une explication. » 1

De ce fait, l’application de la mathématique à la linguistique serait conditionnée, selon Guillaume, par le fait que celle-ci soit refaite sous la forme d’une pré-mathématique « où l’on verrait les facultés de représentation susciter, par leur exercice achevé, les facultés discussives de raisonnement dont elles sont, dans l’homme pensant, le prodrome. »2 L’abstraction mathématique permet à l’homme de mieux concevoir les choses, par ailleurs la plus haute linguistique ne peut fournir à l’homme que des moyens qu’il dispose déjà dans son essence. Le nombre arithmétique (1, 2, 3, etc.) qu’on peut substituer au nombre linguistique (pluriel, … triel, duel, singulier) présente un premier exemple. « Le nombre arithmétique est un nombre de calcul ; le nombre de représentation siège, dans l’esprit, dans l’en-deçà de la faculté discussive par essence, de calcul. »3 Malgré ces critiques et recommandations, plusieurs chercheurs ont tenté l’aventure et proposer des modèles de traitement mathématiques des unités de la langue. Ce qui a donné l’essor d’autres domaines plus frucuants comme la cybernétique, la théorie de l’information et des ordinateurs (Belevitch, 1949, Apostel, 1957, Shannon, 1951, Cherry et Human 1957, etc.) apparues dans les années cinquante avec leurs aspects quantitative et probabiliste qui s’occupent du recensement des corpus, des calculs des probabilités et présentent des relations techniques et mathématiques de l’information et de communication.

On peut citer aussi l’essor de la linguistique automatique avec la traduction et la conception des langues artificielles en s'intéressant surtout aux applications de la linguistique aux langages de programmation.

2. Les modèles de traitement mathématique du langage 2.1 Qu’est-ce qu’un modèle ?

Le modèle ou la modalisation, en mathématique ou en théorie des jeux (Neumann, Morgenstern4), est une construction théorique qui simule un objet et exige une précision de ses composantes simples pour rendre un traitement mathématique possible. Il s’agit selon Descles et Fuchs, d’une construction abstraite :

« Ce n'est pas la réalité vécue mais une représentation de cette réalité ou, mieux, une simulation de la réalité, voulue par le constructeur du modèle. Il est

1 Guillaume Gustave (1973), Principes de l’linguistique théorique, Les presses de l’université de Laval, Klincksieck, Paris p256.

2 Ibid. p257

3Ibid.

4 Neumann John Von & Morgenstern Oskar (1944), Theory of Games and Economic Behaviour, Princeton University Press.

(5)

187

particulièrement difficile dans les sciences humaines de construire des modèles qui soient en accord avec ce que l'on cherche, car on ne dispose pas encore d'outils assez fins. »1

La notion de modèle a séduit plusieurs chercheurs de disciplines différentes y compris ceux de la linguistique. Ils l’ont appliqué à la grammaire, à la phonologie, à la sémantique, etc.

en utilisant plusieurs modèles de représentation afin de schématiser les structures des phrases, les rapports entre les phonèmes, le recensement des sens, etc. Le modèle mathématique est censé être un objet abstrait fait d’opérations de symboles et de formules. Dans le cas de la linguistique, il doit reproduire la langue tout en étant opératoire en acceptant des calculs et des opérations. En plus, le modèle devrait être reproductif c'est-à-dire n’importe qui doit le faire fonctionner s’il est bien défini et falsifiable en vérifiant s’il fait les bons calculs. Pour plus de fiabilité, le linguiste est censé concevoir son modèle de la manière la plus exhaustive et que seule les formules mathématiques sont capables de le traduire. Ce qui donne au modèle linguistique une singularité particulière c’est la diversité du langage qui diffère d’un homme à l’autre.

2.2 Exemples de modèles du traitement mathématique des langues naturelles

Nous proposons ci-dessous quelques exemples de modèles logiques et mathématiques qui ont tenté de générer les phrases des langues naturelles en nous focalisant sur les essais de modélisation du sens avant de passer à la modélisation syntaxique et élucider les difficultés de combiner entre les deux.

2.2.1 Modélisation du sens

a- Calculs des prédicats de Frege et Hilbert

Le modèle mathématique qu’on peut appliquer au syllogisme d’Aristote doit être capable de montrer avec l’usage de symboles et de formules que son raisonnement est valide. Pour ce faire on peut recourir au calcul des prédicats de Frege 1879 et de Hilbert 1930.

Exemple : 1

Tous les hommes sont mortels Or Socrate est un homme Donc Socrate est mortel

H(x) = x est un homme M(x) = x est mortel x = Socrate

H(x) et M(x) sont des prédicats

A partir du calcul des prédicats en peut avoir la formule suivante ∀ x (H(x) → M(x)) qui veut dire que quel que soit x, x un être humain alors x est mortel. On peut faire aussi la lecture formelle suivante : quel que soit x, H de x implique M de x. On peut donc nous interroger sur la validité de cette formule et son application au cas de Socrate c'est-à-dire est ce que ce dernier est mortel ? Puisque x peut être Socrate c'est-à-dire x = S on peut en déduire que S est mortel M(S).

∀ x (H(x) → M(x)) Particularisation H(s) H(s) → M(s) Modus ponens M(s)

Pour généraliser on peut dire que ∀x (A(x) → B(x)) alors tout A est B. Avec le lambda- calcul on peut avoir : λA λB ∀x (A(x) → B(x))

1 Descles Jean-Pierre, Fuchs Catherine (1969), « Linguistique et mathématique », In: L'Homme, tome 9 n°3. p94

(6)

188 Exemple : 2

Tout passé est irréversible Or les souvenirs c’est du passé Donc les souvenirs sont irréversibles

x= S (souvenirs) A=P (passé) B= I (Irréversible) P(S) → I(S))

On peut appliquer la formule ∀x (A(x) → B(x)) sur l’exemple 2 pour dire que tout souvenir est irréversible puisqu’il est du passé. Pour une phrase ordinaire qui échappe à la logique du syllogisme d’Aristote Kahane1 propose pour traiter un exemple comme « Paul veut parler à Ryan » la formule suivante : ∃e1 ∃e2 ‘vouloir’ (e1, a, e2), & ‘parler’ (e2, a, b). Il existe évènement 1, il existe évènement 2 tel que e1 c’est Paul veut et e2 c’est Paul parle à Ryan.

Exemple : 3

Paul veut parler à Ryan

a = Paul b = Ryan e= évènement

On peut présenter cette phrase sous forme de graphe. Les quatre éléments de sens c’est Paul, Ryan, vouloir et parler. Ils entretiennent des relations de sens entre les prédicats et leurs arguments. Vouloir a deux arguments c’est Paul et parler alors que Parler a deux arguments c’est Paul et Ryan. Ces rapports sont décrits par des liens logiques et symboles qui reflètent les liaisons (tous, alors, à, etc.). Le sens des autres mots n’est pas vraiment explicité à travers ces relations.

Figure 12 : présentation des liens sémantiques des éléments de la phrase

b. Calcul de sens selon Ploux, Victorri et Fuchs

Selon Fuchs et Victorri (1996)2, on peut calculer le sens en se servant d’un dictionnaire de synonyme comme celui de Larousse, le Robert, etc. On peut trouver alors 63 synonymes de l’adjectif « sec » et aucun d’eux n’a un sens direct de celui-ci mais susceptible de renvoyer à ce mot dans des contextes différents :

[nature, aride, stérile, desséché, tari, cuisine, égoutté, essuyé, épongé, séché, état physique, maigre, étique, décharné, squelettique, trait de caractère, brusque, cassant, raide, froid, glacial, dur, autoritaire, insensible, indifférent, déplaisant, désagréable, désobligeant, manière, rapide, vif, brusque, aigre, anhydre, austère, bref, cachectique, cave, débile, déshydraté, épuisé, étriqué, fluet,

1 Kahane Sylvain (2002), La modalisation mathématique des langues naturelles, conférence, https://www.canal- u.tv/video/universite_de_tous_les_savoirs/la_modelisation_mathematique_des_langues_naturelles.1315

2 Victorri B. et Fuchs C. (1996). La polysémie, construction dynamique du sens. Hermès.

(7)

189 grêle, gringalet, improductif, isolé, net, pauvre, phtisique, pincé, sérieux, seul, sévère, état,

sécheresse, etc.]1

Pour avoir une représentation de l’espace sémantique de « sec », Poux et Victorri (1998)2 ont développé le logiciel Visusyn qui utilise un algorithme basé sur l’analyse d’un graphe de synonymie. On peut avoir une représentation graphique selon les cliques qui sont des groupes de sens formés de synonymes qui partagent des propriétés communes dans un contexte déterminé : physique, psychologique, etc. On peut dire alors qu’un simple synonyme n’est pas suffisant pour définir le sens général d’une unité. Dans la représentation ci-dessous (Figure1), nous avons 4 cliques « Aride-décharné-maigre-sec », « Aride-maigre-stérile-sec », « Austère- rude-sec » et « Brusque-rude-sec ».

Figure 13 : Extrait de graphe du synonyme de sec3

Le logiciel Visusyn permet également de calculer les synonymes avec un nuage de points à 63 dimensions qui permet de voir les rapprochements des groupes de synonymes et contribue à désambiguïser le sens grâce aux zones de pertinence. Dans la représentation que nous avons ci-dessous (Figure2) nous constatons qu’au milieu par exemple il y a le premier sens de sec.

Ce sens élémentaire se trouve très restreint par rapport aux autres dérivations des autres sens plus nombreux et concentrés surtout aux extrémités du graphe. Cependant on peut dire que même s’il est difficile de gérer les modèles de sens avec les mathématiques, comme on l’a vu avec cet exemple, ces modèles resteront très représentatifs.

1 http://www.synonymes.com/synonyme.php?mot=fort

2 Ploux S. et Victorri B. (1998). Construction d’espaces sémantiques à l’aide de dictionnaires informatisés des synonymes. TAL, vol. (39/1) :161-182.

3 Fabienne Venant (2004), Polysémie et calcul du sens, JADT 2004 : 7es Journées internationales d’Analyse statistique des Données Textuelles, p1148.

(8)

190

Figure 14 : Espace sémantique de l’adjectif sec (63 synonymes et 94 cliques) 2.2.2 La modélisation syntaxique

La modélisation syntaxique s’occupe de la gestion des règles phrastiques des langues naturelles comme l’analyse de l’ordre des mots, les particularités de conjugaison de grammaire, etc. Une analyse syntaxique en linguistique sert à vérifier si la phrase est correcte en obéissant à ces règles. L’analyse algébrique d’une phrase représente des calculs qui permettent de générer les phrases, une idée qui remonte, pour la première fois, aux travaux d’Adjuckiewicz 1935, Bar Hillel 1953, Steedman 1985 avec l’essor de la grammaire catégorielle. Elle a disparu quelques moments dans le passé pour réapparaitre une seconde fois avec la traduction automatique et la linguistique algébrique des années 80.

a. Grammaire catégorielle avec calcul algébrique

Pour donner un exemple de calcul algébrique de la grammaire catégorielle nous prenons l’exemple de la phrase suivante : « L’homme travaille ». Cela consiste à associer un symbole pour chaque catégorie grammaticale pour entamer des calculs algébriques par la suite et vérifier la fiabilité de la phrase.

Exemple : 4

L’homme travaille Travaille = GN/p

Homme = D/GN L’ = D (déterminant)

Travaille = GN/p (qu’on peut lire comme « travaille » est un groupe nominal sous phrase ce qui veut dire que « travaille peut constituer une phrase à condition de rajouter un groupe nominal à sa gauche). Homme = D/GN (qui veut dire que garçon est un groupe nominal à condition d’ajouter un déterminant à sa gauche). On peut représenter la phrase « L’homme travaille » par la formule : « D. D/GN. GN/p ». Et à l’aide de ces catégories et symboles on peut vérifier que cet énoncé constitue bien une phrase correcte et logique en faisant appel à la formule mathématique « B. B/A= A » on va obtenir comme pour les fractions :

(9)

191

D. D/GN. GN/p

GN

P

Ce calcul algébrique montre que la phrase est bien correcte car on obtient le P vers la fin des opérations. Et si on ne respecte pas l’ordre des mots on ne va pas avoir de phrase correcte comme (travaille l’homme, travaille homme le, etc.) Et Si on a d’autres verbes comme

« mange », pour obtenir une phrase correcte sur le plan syntaxique et sémantique il faut que ce verbe soit précédé et suivi d’un groupe nominal c'est-à-dire : « mange = (GN/p) /GN » qui veut dire que quelqu’un mange quelque chose ou le cas du verbe donner « donne = (GN/p)/

(GP)/(GN) » qui veut dire quelqu’un donne quelques chose à quelqu’un.

b. Grammaire catégorielle avec calcul logique

L’idée du calcul logique de la grammaire catégorielle, qui stipule que l’analyse syntaxique relève de la logique, remonte à Lambek (1958) avec la logique non commutative et la logique linéaire qui ont donné même un nouvel éclairage à logique mathématique générale. Cela montre en effet qu’il y a un va et vient entre la linguistique et la logique dans le traitement du sens et de la syntaxe qui le génère. Le calcul logique procède comme dans le calcul algébrique sauf qu’on doit remplacer les barres à gauche et à droite par des flèches.

Exemple 5 :

Pierre écrit une lettre GN (GN→P)  GN D D→ GN

D→ GN se lit comme : D implique GN (si vous donnez un déterminant à gauche on obtiendra un groupe nominal). Et si on applique la règle modus ponens on va avoir la formule suivante :

Pierre écrit une lettre GN (GN→P)  GN D D→ GN

GN GN→P

P

Selon Lambek (1958), le calcul logique est non commutatif c'est-à-dire qui n’agit pas dans les deux sens de la phrase. Si nous avons, par exemple, une phrase comme : « lettre une : D→GN D », on ne peut pas avoir de GN, c'est-à-dire que « lettre une » n’est pas un groupe nominal et c’est pour cela qu’on l’appelle logique non commutative.

c . Structures syntaxiques selon Chomsky et Tesnière

En linguistique distributionnelle (Bloomfield, Hockett, Fries, Tesnière, Chomsky, Harris, etc.), issue de la linguistique structurale de Saussure, nous avons plusieurs types de modèles de distribution. Parmi ceux-ci, nous soulignons la structure syntagmatique de Chomsky 1957 et la structure de dépendance de Tesnière 1959 que nous allons appliquer sur l’exemple 5 : « Pierre écrit une lettre » pour mettre en lumière la logique de chaque structure et la démontrer par la suite de manière mathématique. En effet ces deux structures de modèle

(10)

192

peuvent nous permettre de vérifier qu’une phrase est correcte par le biais des liens grammaticaux pour Chomsky et sémantique pour Tesnière afin de penser également à la manière de les faire combiner et comment la grammaire peut-elle générer toutes les phrases des langues naturelles à travers des structures syntaxiques)

Figure 4 : Structure syntagmatique Chomsky (1957) Figure 5 : Structure de dépendance Tesnière (1959)

Dans les deux modèles on a combiné des structures pour avoir une phrase de deux manières différentes. Avec Chomsky, la structure syntagmatique commence avec le regroupement de « une » et « lettre » pour avoir un GN ensuite un GN et un V pour avoir un GV et un GV et un GN pour avoir une phrase P. Pour Tesnière on a étudié dans la structure de dépendance la relation entre les mots pour voir lequel a opéré sur l’autre ? « une » est venue remplir un ordre de « lettre » et « lettre » un ordre de « écrit » et « écrit » un ordre de pierre. Et en voit clairement que c’est le verbe qui construit la phrase car il demande un GN à sa gauche et à sa droite. En nous référant aux travaux de Richard Montague (1970) nous pouvons tenter de fusionner les deux structures susmentionnées, c’est à dire la grammaire catégorielle avec des morceaux de représentation sémantique en se servant des formules mathématiques.

Exemple 5 :

travaille : [GN/P : λx ‘travaille’(x)]

homme : [D/GN : λx ‘homme’(x)]

l’ : [D : λA λB ∃x (A(x) & B(x))]

l’: D homme: D/GN travaille GN/P λA λB ∃x (A(x) & B(x)) λx ‘homme’(x) λx ‘travaille’(x)

l’homme : GN λB ∃x (‘homme’(x) &B(x))

l’homme travaille : P ∃x (‘homme’(x) & ‘travaille’ (x))

Cette formule peut expliquer les liens sémantiques et syntaxiques des phrases de ce genre de structure mais elle présente des limites dans des phrases où il n y a pas de lien entre les mots et les unités sémantiques comme dans le cas des expressions figées comme « avoir la cerise sur le gâteau ». Dans cet énoncé le sens est indécomposable et on ne peut pas deviner le sens séparément. On peut donner également d’autres exemples difficiles à générer comme le cas des phrases relatives qui se présentent dans un ordre particulier. Dans la transformation relative de

(11)

193

la phrase « Paul veut parler à Ryan » par « la personne à laquelle Paul veut parler » nous pouvons bien illustrer cela avec les présentations des modèles sémantiques et syntaxique ci- dessous :

Figure 6 : Structure syntaxique Figure 7 : Structure sémantique

Dans la structure sémantique il y a double fonction de Paul (vouloir et parler) et dans la structure syntaxique Paul assume une seulement fonction c’est vouloir. Nous allons voir que cela va changer lorsqu’on commence la phrase par « personne » avec la phrase relative « la personne à laquelle Paul veut parler.

Figure 8 : Structure syntaxique Figure 9 : Structure sémantique La structure sémantique ne change pas mais celle syntaxique change beaucoup en plaçant personne en haut de l’arbre (elle entretient une fausse relation avec veut et Paul). Cette phrase est non calculable par la grammaire algébrique il faut recourir aux transformations de Chomsky une solution qui a attiré aussi plusieurs critiques en se disant pourquoi déplacer et transformer ? En plus on ne peut pas relativiser n’importe quelle position syntaxique sinon la phrase va être incorrecte « la personne à laquelle je regarde la télé en parlant ». Quelle position peut-on relativiser ? « la personne à laquelle Félix parle » « veut parler », « à l’intention de parler »,

« pense que Luce à l’intention de parler » « l’ami de jean avec la voiture de qui j’ai fait un accident », « la personne avec la voiture de l’ami de qui j’ai eu un accident ».

(12)

194

Afin de générer ces distorsions, Kahane Sylvain (2002) propose une représentation à bulles pour gérer les interrelations sémantiques et syntaxiques entre les composantes des phrases

Conclusion

L’application des mathématiques à la linguistique serait conditionnée par le fait que celles-ci soient refaites sous la forme d’une pré-mathématique où l’on verrait les facultés de représentation susciter, par leur exercice achevé, les facultés discussives de raisonnement dont elles sont, dans l’homme pensant, le prodrome.

L’abstraction mathématique permet à l’homme de mieux concevoir les choses, par ailleurs la plus haute linguistique ne peut fournir à l’homme que des moyens qu’il dispose déjà dans son essence. Pour cela, il faut aller au-delà de ces éléments naturels afin de fournir un modèle exhaustif de linguistique mathématique,

Bibliographie

DESCLES J. P. et FUCHS C. (1969), « Linguistique et mathématique », In: L'Homme, tome 9 n°3.

GUILLAUME G. (1973), Principes de l’linguistique théorique, Les presses de l’université de Laval, Klincksieck, Paris.

KAHANE S. (2002), La modalisation mathématique des langues naturelles, conférence.

LYONS J. (1970), Linguistique générale : introduction à la linguistique théorique, Ed Larousse, Paris,

MOUNIN G. (1968), Clefs pour la linguistique, Seghers, Paris,

NEUMANN J. V. & MORGENSTERN O. (1944), Theory of Games and Economic Behaviour, Princeton University Press.

O’CONNELLE A. M. (2016), Enseignement des langues en immersion, L’Harmattan, Paris.

POUX S. et VICTORRI B. (1998). Construction d’espaces sémantiques à l’aide de dictionnaires informatisés des synonymes. TAL, vol. (39/1) .

RETORE C. (2011), « Logique mathématique et linguistique formelle », In Leçon de mathématiques d’aujourd’hui, ed Cassini,

SOLOMON M. (1988), « Mathématique et linguistique », In Mathématiques et sciences humaines, tome 103, Ed Numdam,

STEINER G. (1967), Language and Silence, New York, Atheneum.

VENANT F. (2004), Polysémie et calcul du sens, JADT 2004 : 7es Journées internationales d’Analyse statistique des Données Textuelles.

VICTORRI B. et FUCHS C. (1996). La polysémie, construction dynamique du sens. Hermès.

Références

Documents relatifs

L'auteur montre comment la recherche basée sur des données vidéo permet d'étudier les processus d'apprentissage des connaissances et des pratiques professionnelles en tenant

Une fois les pointeaux refroidis, ils redeviennent, comme nous l'avons montré ci-dessus, des objets manipulables à main nue. Dans le dernier extrait, retranscrit ci-dessous,

Dans tous les cas, nous représenterons cette introduction d’une nouvelle forme par la création d’une as- sociation conceptuelle supplémentaire, unidirectionnelle (tous ces

a) Il est d’abord esthétique : le linguiste ne fait que rappeler le devoir de l’écrivain qui doit viser « la constitution d’une nouvelle langue, nouvelle beaucoup plus encore

• Objectif : Se servir du logiciel Unitex pour faire les dictionnaires électroniques des noms du persan. ● Caractéristiques d’Unitex :

Il n’est pas surprenant que le concept d’affixe inventé par Reuchlin pour un objet morphologique spécifique (des marques personnelles suffixées) ait ensuite

fine) : ce sont des applications ensemblistes; à tout morphisme-schéma correspond une application, bien définie, de l’ensemble de toutes les listes de type la source

La volonté de placer la LSF au même rang que les autres est donc bien réelle, le dossier qui lui est consacré le prouve encore, si besoin en était, mais cette volonté ne