• Aucun résultat trouvé

Des limites des grammaires formelles appliquées au TALH

3.3 Communication Humain Machine

3.3.1 Des limites des grammaires formelles appliquées au TALH

Grammaires formelles : quelques idéalisations Il n’y a rien de surprenant

dans l’omniprésence des grammaires formelles dans les jeunes années de l’intelli- gence artificielle. En effet, la prégnance des Grammaire générative (Chomsky 1959) Grammaire de Montague (Montague 1974) ou autre Grammaire Universelle Appli- cative (Shaumyan 1987) trouve une explication pragmatique relativement triviale dans le fait qu’elles partagent nombre des idéalisations du computationnalisme clas-

sique ou, pour emprunter l’expression à (Rastier 1991), «orthodoxe». Ainsi, si la cognition et, par extension, l’intelligence artificielle sont appréhendées comme des opérations syntaxiques réalisées sur des symboles comme cela est le cas dans ce pa- radigme, il semblait a priori à la fois consistant et prudent d’explorer les hypothèses linguistiques qui appréhendent la production d’énoncés comme des opérations sur des chaînes de symboles d’un alphabet. 48 En dépit de la diversité de leurs logiques

sous-jacentes – Logique du Premier Ordre (L1) chez Chomsky, Lambda calcul chez

Montague et Logique combinatoire typée de (Curry, Hindley et Seldin 1972) chez Shaumyan – et de l’absence de consensus sur la question du nativisme, ces trois influentes grammaires formelles partagent des conceptions similaires sur les relations entretenues par la langue, le système qui la sous-tendrait ainsi que les propriétés al- gébriques nécessaires à son implémentation.

Figure 3.4 – Arbre syntaxique d’un énoncé exotique : PN = nom propre N = nom V = verbe NP = syntagme no- minal RC = proposition relative VP = syntagme verbal S = phrase

Pour en citer quelques unes, la validité d’un énoncé ne dépend pas de la possibilité de son occurrence chez des locuteurs natifs mais de la possibilité de sa production par la grammaire – e.g. en raison de la difficile compréhension de cet énoncé introduit par (Borgmann 1967), aucun locuteur natif ne dirait «Buffalo buffalo Buffalo buffalo buf-

falo buffalo Buffalo buffalo» 49 alors même

que cet énoncé est syntaxiquement correct (Cf fig.3.4). Le fait que nous, locuteurs, ne produisons ni ne comprenons de tels énon-

cés, problème de performance, ne remet pas en cause chez Chomsky le fait que nous en possédions la compétence. En outre, les variations langagières et entorses à la grammaire sont généralement expliquées par la distance entre les grammaires super- ficielles et la grammaire profonde, universelle, qui sous-tendrait toute langue, voire la pensée humaine elle-même. Cet universalisme adopté au cœur des grammaires formelles s’inscrit à cette égard dans une longue tradition d’approches formelles sur la langue que Rastier n’hésite pas à faire remonter aux Modistes de la fin du 48Rastier fait en outre remarquer l’influence réciproque, à savoir que «[s]i les cognitivistes or-

thodoxes ont choisi le langage comme terrain de combat, c’est qu’ils l’estime dangereux pour leurs adversaires» (Rastier 1991, p. 60)

49En français, «Les bisons de Buffalo que des bisons de Buffalo intimident intimident des bisons

XIIIème en passant par Roger Bacon, 50Leibniz et, plus généralement, même en de-

hors des grammaires formelles, toute perspective d’inspiration logique sur les langues humaines qui postuleraient, à l’instar de la théories des universaux sémantiques dé- fendue notamment en (Wierzbicka 1989), l’existence d’un ensemble de concepts primitifs possédés par l’ensemble de l’espèce humaine. 51 Ces traits de la pensée

formelle grammaticale tiennent, toujours selon Rastier, aux deux postulats suivant

L’identité à soi du langage seule une langue unique et homogène peut être im-

plémentée dans un calcul, donc la langue est unique et homogène

L’autonomie «Nous avons dit qu’une langue naturelle est un système de repré-

sentations autonome. Cela implique donc qu’une langue, en tant que système symbolique, peut être séparée de son environnement socio-culturel et anthropo- logique.» (Desclés 1980, p. 82) et, ajouterions nous, de l’évolution des langues

dans le temps.

Quelques phénomènes syntaxiquement inexplicables La domination des gram-

maires formelles sur le TALH s’est vue nuancée par leur incapacité à traiter un cer- tain nombre de phénomènes linguistiques pourtant pertinents. Le premier, et non des moindres bien qu’il n’intervienne pas dans le contexte des systèmes experts, n’est autre que l’oralité. Tant en raison du postulat d’identité à soi du langage que par manque de récepteurs suffisamment plastiques pour capturer les morphèmes lexi- caux en dépit de la variabilité phonétique,52les systèmes computationnels classiques

ne peuvent, par essence, traiter de ce que la phonétique apporte proprement à la langue : la possibilité de questions formulées avec une syntaxe affirmative – e.g. «tu

pars demain» «tu pars demain ?» – celle de l’ironie ou encore le rôle de la prosodie.

50«Quant à sa substance, la grammaire est unique et identique dans toutes les langues, bien

qu’elle varie accidentellement» (Bacon 2012, p. 278)

51La théorie des Primitives Sémantiques (Semantic primes), popularisée par Wierzbicka dans

le courant des années 90, postulait l’existence d’un ensemble de concepts proto-linguistiques à la fois innés et primitifs dont dériveraient les autres concepts acquis avec l’apprentissage du langages comme autant de nuances autours des mêmes significations primitives. A titre de liste non exhaus- tive ce ces primitives que l’on peut trouver en (Goddard 2002), nous citerions : Grand, Petit, Bon, Mauvais, Quelque chose, Genre, Partie, Quand, Avant, Après.

52Historiquement parlant, la modélisation de cette faculté de perception des signes linguistiques

à une échelle sub-symbolique constitue l’apport nouveau du Connexionnisme au TALH. L’un des exemples classiques et célèbres de cette capacité des réseaux de neurones abstraits à traiter la variabilité phonétique d’énoncés linguistique, NETtalk (Sejnowski et Rosenberg 1987), pouvait ainsi prononcer des textes écrits en anglais et comparer le résultat à une transcription phonétique humaine.

53

Pour des raisons totalement indépendantes de la phonétique et davantage consé- quence du postulat d’autonomie, il est impossible de capturer les nuances lexicales sociologiquement déterminées si ces dernières ne s’accompagnent d’une contre-partie syntaxique. Ainsi, alors même que rien ne peut syntaxiquement distinguer «Pierre

se soigne à l’hôpital» de «Pierre se soigne à la maison» – Sujet, pronom réfléchi

verbe et complément d’objet indirect – tout locuteur comprend que Pierre est soigné par quelqu’un d’autre que lui dans le premier cas mais se soigne lui-même dans le second. Enfin, la perspective ensembliste qui sous-tend ces approches logiques ne laisse aucune place à la notion de proximité sémantique ainsi que la manière dont celle-ci intervient dans la résolution d’ambiguïtés. Ainsi, dans «Paul first saw the

river, then went to the bank», 54 rien ne permet de comprendre que Paul se rend au

bord de l’eau plutôt qu’à la banque sur la seule base de la syntaxe : la présence de «river» est ce qui contraint l’interprétation de «bank».