• Aucun résultat trouvé

Réflexion théorique autour de la notion de discours

Chapitre 2 Vers une Sémantique Discursive cognitive

2.1. Frames et sémantique des frames

2.1.1. La structure interne d’un frame

2.1.1.1. Les frames linguistiques

En repartant des travaux de la grammaire des cas de Fillmore78, von Polenz (2008) déploie une théorie sémantique de la syntaxe sur le fondement original d’un cadre référentiel abstrayant l’inventaire d’arguments sémantiques possibles pour un prédicat déployé dans une proposition (sémantique). Von Polenz reprend effectivement la liste de Manzotti et ses collègues (1975) de prédicats sémantiques et conçoit une liste d’arguments génériques (cf. [4.3.2]).

La structure d’une proposition au niveau sémantique s’articule autour d’un prédicat P et d’un ensemble d’arguments (argn) qui se rapporte à lui de telle manière qu’une proposition peut être ramenée à la formule abstraite suivante : P(arg1, arg2,… argn) (von Polenz 2008 : 101). Autrement dit, le prédicat est la référence sémantique structurelle qui organise les slots référentiels et donc les objets référentiels de l’ensemble de la proposition (von Polenz 2008 : 101). Cette évolution terminologique se couple à une révolution paradigmatique : en s’extrayant de la notion classique de prédicat, von Polenz ouvre la porte à une grammaire du contenu (cf. [4.3.2.1]) qui s’intéresse au sens plutôt qu’à la forme, le corrélat étant qu’un prédicat n’est pas forcément un verbe – il l’est le plus souvent, mais ce n’est pas une obligation – (von Polenz 2008 : 105–116). Une rapide recherche sur Google permet d’isoler une prédication régulièrement instanciée pour les titres de d’articles de

78 Pour un retour sur l’évolution de la sémantique des frames dans la perspective de Fillmore : Andor/Fillmore 2010 ; Petruck 2013 ; et bien sûr : Busse 2012 en particulier §2).

presse relevant de la construction de bâtiment, en particulier d’ouvrages routiers tels que les ponts : CONSTRUCTION(pont, lieu) :

(1) « Pont sur la Loire. Restauration du pont et construction d’une passerelle »79 (2) « Gênes : le nouveau pont prend forme »80

(3) « Un pont autoroutier en construction à Jingdong, dans le Yunnan »81

On extrait de ces exemples les catégories prédicatives (von Polenz 2008 : 159) et les catégories argumentales (von Polenz 2008 : 170–172) pour aboutir au cadre prédicatif générique suivant : ACTION(OB, LOC). Ce cadre sert à produire et réceptionner d’autres exemples similaires si bien que la forme (pont/passerelle ; construction/rénovation) et l’agencement de la prédication peuvent varier tout en transmettant une information globalement identique au moyen des mêmes concepts. La prédication est donc la réalisation particulière d’un cadre prédicatif par l’articulation sémantique conceptuelle du prédicat (von Polenz 2008 : 104–105) et est en tant que tel le format dans lequel est stocké l’expression linguistique des connaissances humaines (Busse 2008b : 42). L’architecture du cadre prédicatif est imposée par la valence du prédicat (von Polenz 2008 : 102–103 ; cf. Welke 2011) : i. e. le nombre de slots référentiels autorisés par le prédicat. En effet, un prédicat peut autoriser un, deux, ou plusieurs slots :

(4) Ich fahre.

(5) Ich fahre Fahrrad.

(6) Ich fahre Fahrrad im Burgund.

(7) Ich fahre Fahrrad im Burgund am Wochenende.

(8) Ich fahre Fahrrad im Burgund am Wochenende mit dem Team.

L’ensemble de ces réalisations du verbe « fahren » sont liées par le sens (et la forme) (cf. von Polenz 2008 : 135, 256), mais en même temps, les distinctions sémantiques sont évidentes. Si un lien entre (7) et (8) peut être trouvé sur la base d’un éventuel contexte ; (4) et (8) sont tout à fait différents au niveau de la sémantique propositionnelle que déploient ces deux énoncés. Toutefois, dans un certain contexte (8) peut contenir l’ensemble des informations de (7). Deux aspects découlent de ces observations : 79 http://ateliercairn.fr/restauration-construction-passerelle-pont-charite-loire.php (13 juin 2020). 80 https://www.constructioncayola.com/infrastructures/article/2019/11/12/126647/genes-nouveau-pont-prend-forme (13 juin 2020). 81 http://french.china.org.cn/china/txt/2020-04/13/content_75925257.htm (13 juin 2020).

(i) Un même prédicat (ici, un verbe prédicatif) peut développer des structures linguistiques plus ou moins complexes ayant des sens variables : dans le premier exemple ci-dessus, il n’est pas obligatoire que l’action se fasse à vélo, ce pourrait aussi être en voiture. Donc la forme est une précision sémantique qui renvoie à un ensemble plus vaste de possibles, car à un niveau d’abstraction supérieur dans les deux cas, il s’agit d’un moyen de transport, et à un niveau supérieur encore, il s’agit d’un INSTRUMENT (cf. Annexe 3). En montant en abstraction, on se rend bien compte que les différences matérielles s’effacent au niveau conceptuel et qu’il s’agit d’une information identique spécifiée dans l’énoncé.

(ii) Le niveau de compression de l’information est variable dans l’interaction et certains éléments n’ont pas besoin d’être actualisés dans l’énoncé pour être transférés globalement (cf. pour un exemple récent Kleiber 2020) : cela signifie donc qu’il existe une structure intermédiaire permettant le passage de ces informations et qui n’est ni le texte ni l’énoncé.

La structure en question qui autorise ces deux aspects est le Bezugsrahmen (von Polenz 2008 : 103, §2.12.6 ; chez Fillmore (1968b,) 1971, 1976, il s’agit déjà d’un frame, cf. 2003). Cette structure se veut être une structure sémantique qui renvoie à des informations conceptuello-linguistiques (et non aux concepts comme chez Barsalou (1992) cf. [2.1.1.2] ; von Polenz est avant tout un linguiste, qui part du texte pour identifier et reconstruire ce qui est dit) :

Chaque fois que l’on produit une prédiction/déclaration, il doit y avoir quelque chose qui dépasse le prédicat. Ce quelque chose ne doit cependant pas être constitué phrase par phrase dans la réalité extralinguistique avec son énoncé dès le départ, mais fait l’objet d’une partie [j’anticipe dans ma traduction avec la remarque terminologique p. 117 de l’auteur qui souligne qu’un prédicat n’est pas forcément qu’un prédicat ACTION, MB] sous-jacente du contenu de la phrase. Il est très rare que cette partie constitutive d’un objet soit nommée de manière métacommunicative expressément [...].82 (von Polenz 2008 : 116)

Ainsi, le cadre prédicatif contient l’ensemble des informations nécessaires à une production et une réception adéquate d’un énoncé (i. e. tout ce à quoi la prédication fait référence83 : von Polenz 2008 : 117) : au niveau lexical, syntaxique et sémantique pour ce qui est de la génération de l’énoncé en utilisant les structures matérielles attendues ; au niveau textuel, pour respecter la linéarisation de l’information et permettre une bonne intégration dans le cotexte ; au niveau énonciatif, dans le but

82 Immer wenn man eine Prädikation/Aussage macht, muß es etwas geben, w orüber man das Prädikat aussagt. Dieses Etwas ist aber nicht von vornherein in der außersprachlichen Wirklichkeit mit seiner Aussage satzsemantisch konstituiert werden, ist Objekt einer Teilhandlung des Satzinhalts. Es ist sehr selten, daß diese gegenstandskonstituierende Handlung metakommunikativ so ausdrücklich benannt wird […].

de s’adapter à l’énoncé (en particulier lorsqu’il est multimodal) ; et enfin au niveau communicationnel pour respecter les contraintes normatives de la situation de communication (en Fig. 6 : les informations énonciatives). Une fois l’ensemble de ces informations pris en compte, un prédicat est sélectionné. Selon les contraintes prédicatives liées à sa valence, une prédication est générée. Celle-ci est amendée au regard des contraintes des niveaux énonciatif et communicationnel, puis la réalisation prédicative telle qu’on la trouve dans l’énoncé est produite. La Fig. 6 résume ce processus :

Fig. 6 : Déploiement prédicatif et production énonciative

Le cadre prédicatif donne à comprendre ce qui n’est pas explicite ; il contient l’ensemble des particules de sens conventionnalisées et internalisées socio-culturellement (et discursivement) par l’expérience humaine du langage qui n’est dans l’instantanéité diachronique plus nécessairement explicite, car contenu dans le contexte et donc partagé par les locuteurs :

Les locuteurs/auteurs utilisent une expression de référence (mot, groupe de mots, phrase) pour se référer à un objet de référence (ou plusieurs), ou les auditeurs/lecteurs, lorsqu’ils comprennent un énoncé, renvoient les expressions de référence exprimées aux objets de référence signifiés par le locuteur/l’auteur et, si nécessaire, révèlent les objets de référence signifiés par le locuteur/l’auteur ou ceux qu’il co-signifie [mitmeint] ou qu’il co-comprend [mitversteht]. [...] Il n’y a pas de limite aux objets de référence auxquels on peut se référer.84 (von Polenz 2008 : 118 ; emphases supprimées dans la traduction, MB)

Précisément, dans cet implicite se retrouve une structure organisée et hiérarchisée qui d’abord distingue ce qui doit être dit, de ce qui peut être dit et de ce qui n’est pas nécessaire d’être dit, puis qui affine dans la profondeur le degré de spécification de ce qui est ou non à dire, comme ce fut le cas pour l’exemple du verbe « fahren » et la nécessité ou non d’expliciter le type de véhicule utilisé. Se développe dès lors à l’intérieur du cadre prédicatif un réseau sémantique structurant ses constituants ; ladite structure est elle-même sémantiquement compétente en ce sens qu’elle contient les informations nécessaires à l’activation et au déploiement (ou non) des informations qu’elle

84 Sprecher/Verfasser NEHMEN BEZUG mit einem Bezugsausdruck (Wort, Wortgruppe, Satzglied) auf ein Bezugsobjekt (oder mehrere), bzw. Hörer/Leser BEZIEHEN beim Verstehen einer Äußerung die geäußerten Bezugsausdrücke auf die vom Sprecher/Verfasser gemeinten Bezugsobjekte und erschließen gegebenfalls die von Sprecher/Verfasser mitgemeinten oder außerdem noch mitzuverstehenden Bezugsobjekte. […] Auf was für B e z u g s o b j e k t e man BEZUGNEHMEN kann, ist unbegrenzt.

Informations énonciatives Sélection prédicat > prédication (info. redondantes : IN ; info. connues : CAG) Génération Prédication : <HANDLUNG(TE, LOC)> Ich fahre Morgen im Burgund

organise, i. e. les spécifications conceptuelles du script cognitif (Fillmore 1977b ; von Polenz 2008 : 158–159).

Von Polenz (2008 : §4) détaille ce qu’il entend par comprendre (i. e.la mobilisation des connaissances pour le traitement de l’information sociolinguistique) et prépare alors le frame discursif85. La compréhension s’effectue par (von Polenz 2008 : 303) :

(i) la manipulation active des connaissances linguistiques – ce qui se justifie par l’axiome fonctionnel-cognitif « les connaissances émergent de l’expérience » – en se basant sur le sens lexico-sémantique explicite et sur le sens sémantico-pragmatique profond implicite ;

(ii) le suivi d’hypothèses sémantiques postulées au regard de la reconnaissance de situations de communication prototypiques en se basant sur ce qui est dit explicitement, ce qui est dit implicitement et sur ce qui est à comprendre.

Finalement, c’est cet ensemble cognitif qui permet aux individus de « lire entre les lignes » d’un texte et de décompresser l’information compactée transférée par des énoncés (von Polenz 2008 : 307).

Faisant sienne l’idée que le sens émane de ce qui n’est pas dit mais tout de même convoyé dans l’artefact social, Minsky (1974), dans sa note de recherche fondatrice86, élargit théoriquement les éléments exposés par von Polenz (2008)87, développe et systématise les réflexions de Fillmore au niveau sémantique, dans une perspective textuelle, avec une dimension psychologique et d’une certaine manière ontogénique, pour développer une théorie systématisable. Pour ce faire, il raisonne

85 Von Polenz (2008 : 119) fait remarquer que les références déployées dans le cadre référentiel (cf. [2.1.1.1]) sont stockées dans un monde de références (Referenzwelt) ou un univers discursif (Diskursuniversum) en suivant les théories classiques de linguistique textuelle et de sémantique référentielle. Cela invite à postuler que si les objets référentiels d’une prédication sont stockés dans un cadre prédicatif/référentiel, l’ensemble des cadres prédicatifs et les objets référentiels auxquels ces cadres font eux-mêmes référence, suivant le principe d’itérativité de Barsalou (1993), doivent être stockés, organisés, hiérarchisés et coordonnés dans une structure d’ordre supérieure. C’est pourquoi l’hypothèse est faite de l’existence d’un frame discursif qui gère l’ensemble de ces objets-références, i. e. l’ensemble des connaissances relatives à un domaine socio-économique spécifique (cf. d’ailleurs l’anticipation de von Polenz (2008 : 120–126) à ce sujet).

86 Son influence ne s’est d’ailleurs pas amoindrie avec les années puisque ce papier est toujours cité dans les travaux les plus récents d’apprentissage profond (i. e. deep learning) (cf. Mouakher et al. 2019 ; Bloch et al. 2020 ; Lipizzi et

al. 2020), en particulier pour les travaux relevant des ontologies, qui peuvent être définies ainsi : « The ontologies

in computer science are knowledge bases that represent entities and relations between them. » (Navarro-Almanza 2020 : 727) Or, on remarque bien la similarité qu’il existe entre un frame et une ontologie.

87 Plus précisément : il se base sur les travaux de Fillmore, car Minsky n’a certainement pas à cette époque connaissance de la sémantique référentielle européenne de von Polenz. Mais dans la mesure où von Polenz s’appuie sur les articles de Fillmore et qu’il systématise la grammaire des cas de ce dernier, on peut se permettre se raccourci.

à partir de la triade langage, mémoire, perception (Minsky 1974 : 1) et s’attache à observer l’intelligence humaine par le biais de la phénoménologie en prenant comme point de départ la perception visuelle (Minsky 1974 : 4–21).

Minsky (1974 : 1) pose la définition de ce qu’il entend par frame dès la première page de sa note. Cette définition est, au regard des travaux de Fillmore et de l’époque de rédaction, hautement innovante, et toujours d’actualité, puisqu’elle est la pierre angulaire de la définition portée dans le présent travail :

Un frame est une structure de données permettant de représenter une situation stéréotypée, comme le fait d’être dans un certain type de salon ou d’aller à l’anniversaire d’un enfant. Plusieurs types d’informations sont attachés à chaque frame. Certaines de ces informations concernent l’utilisation du frame. Certaines concernent ce que l’on peut s’attendre à voir se produire ensuite. Certaines sont à propos de ce qu’il faut faire si ces attentes ne sont pas confirmées.88

Il convient de retenir trois éléments de cette définition :

(i) Un frame est instancié à une catégorie de situations de communication et se structure autour des informations relatives à cette catégorie de telle sorte que les informations sont par nature multimodales. Le frame est sui generis une structure multidimensionnelle émergeant de la réalité sociolinguistique d’un individu.

(ii) Un frame est une structure prototypique correspondant à une catégorie prototypique de situations de communication contenant des informations prototypiques qui sont déclenchables selon une liste de conditions prototypiques.

(iii) Un frame est une instance cognitive individuelle socioformée et socionormée permettant à l’individu de s’intégrer dans une communauté d’individus qui partage prototypiquement les mêmes frames par la maîtrise d’informations et de connaissances communes déployées à des instants similaires pour des stimuli similaires.

En effet, Minsky théorise le fait que la perception d’un objet du monde déclenche un frame qui active un segment de la mémoire afin, précisément, de comprendre ce qui est perçu. Cette procédure est néanmoins continue dans la vie de l’individu et adaptative89.

88 A frame is a data-structure for representing a stereotyped situation, like being in a certain kind of living room, or going to a child’s birthday party. Attached to each frame are several kinds of information. Some of this information is about how to use the frame. Some is about what one can expect to happen next. Some is about what to do if these expectations are not confirmed.

89 C’est justement ce dernier élément qui fait toute la force théorique du modèle théorique et qui permet d’utiliser son modèle pour les systèmes informatiques d’apprentissage encadré (machine learning) et d’apprentissage

Soit l’exemple suivant : « Manon schlägt den Ball ». Par le stimulus oral, qui devient un stimulus cognitif visuel (l’individu joue la scène dans son espace mental), l’information acquise est processuellement scindée en unités de sens basales pour activer les connaissances nécessaires et reformer le sens total et global en déployant la structure de connaissances adéquate (Minsky 1974 : 6). Pour l’exemple, l’individu qui entend l’énoncé mobilise un frame pour le mot « Ball », correspondant au prototype de la catégorie, qui s’actualise en une valeur par défaut (pour un Européen, il s’agirait certainement d’un ballon de football possédant certaines formes et couleurs classiques) et qui selon le contexte sera validée ou remplacée par une autre valeur.

Chaque terminal du frame est prérempli par une valeur par défaut prévue par le frame en accord avec les spécificités du prototype ; cependant, cette valeur n’est pas figée et est susceptible d’être remplacée par une autre valeur.

On peut considérer un frame comme un réseau de nœuds et de relations. Les ‘niveaux supérieurs’ d’un frame sont fixes et représentent des choses qui sont toujours vraies dans la situation supposée. Les niveaux inférieurs comportent de nombreux terminaux – des ‘slots’ qui doivent être remplis par des instances ou des données spécifiques. Chaque terminal peut préciser les conditions auxquelles ses affectations doivent répondre. (Les affectations elles-mêmes sont généralement des ‘sous-frames’ plus petits).90 (Minsky 1974 : 1)

Une fois la bonne valeur sélectionnée, il s’agit d’une valeur instanciée (i. e.valeur de remplissage) : Frame

Structure de surface adaptée à une situation de communication prototypique (terminologie, reconnaissance des sons spécifiques, connaissances, etc.)

Information1 Information2 Information3

Terminal Terminal Terminal Terminal [Valeur par défaut] [Valeur par défaut] [Valeur par défaut] [Valeur par défaut] [Valeur instanciée] [Valeur instanciée] [Valeur instanciée] [Valeur instanciée] Fig. 7 : Représentation d’un frame chez Minsky

profond (deep learning). Dans ce dernier cas, il est d’une certaine manière à l’origine des réseaux de neurones circonvolutionnaires (CNN) qui par une matrice adaptative (backpropagation) permet à un réseau de neurones d’apprendre sur un corpus test à s’approcher des souhaits de l’informaticien et à réaliser les procédures adéquates (active learning pipeline) (Rummelhart et al. 1986). En ce sens, un réseau de neurones s’approcherait d’un raisonnement intelligent humain (cf. Chollet 2019) ; néanmoins, il ne s’agit pas de penser qu’une machine est à ce jour capable d’effectuer une activité identique à un humain moyen (cf. LeCun 2019) : il suffit de comparer un individu humain apprenant à conduire une voiture (entraînement théorique puis une vingtaine d’heures de conduite) et un système artificiel (des milliers d’heures de recherche et de tests pour faire apprendre au système à réagir à une situation). Pour apprendre à tourner dans un virage, l’humain sait faire les bons choix (parfois il faut les adapter, les améliorer) à la première occurrence ; un système artificiel doit faire un nombre très élevé d’erreurs pour arriver à réaliser le bon choix dans cette situation. Bien sûr les systèmes artificiels sont améliorés constamment et deviennent de plus en plus performants, mais sont encore loin des capacités de l’humain.

90 We can think of a frame as a network of nodes and relations. The ‘top levels’ of a frame are fixed, and represent things that are always true about the supposed situation. The lower levels have many terminals – ‘slots’ that must be filled by specific instances or data. Each terminal can specify conditions its assignments must meet. (The assignments themselves are usually smaller ‘sub-frames’.)

La sélection du frame par rapport à la situation de communication et le choix de la valeur instanciée sont contrôlés par un système de correspondances et par les connaissances générales pour répondre

au mieux à la situation à laquelle le locuteur fait face (Minsky 1974 : 2).

Les conditions simples sont des marqueurs spécifiés qui peuvent exiger que l’affectation d’un terminal soit une personne, un objet de valeur suffisante ou un pointeur vers un sous-frame d’un certain type. Des conditions plus complexes peuvent préciser les relations entre les éléments affectés à plusieurs terminaux.91 (Minsky 1974 : 1)

Minsky (1974 : 4) pose que les frames encapsulent les connaissances d’un individu et que chaque frame corresponde à la catégorie d’une situation avec un prototype et des variantes. Pour un texte, plusieurs frames peuvent être déployés et mis en concurrence : un seul est pourtant effectivement instancié ; ceci dépend de la situation et du degré de correspondance entre les caractéristiques du frame et les caractéristiques de la situation de communication. Donc les connaissances stockées dans ces frames sont des connaissances prototypiques qui sont gérées selon des règles et des conventions sociales en répondant aux attentes d’une communauté (Minsky 1974 : 34). Les expériences de la vie courante sont des scènes de vie également conventionnalisées : un individu se réveille, elle se lève (elle prend un petit-déjeuner), elle se lave, elle s’habille, elle va travailler (cf. Minsky 1974 : 38). Si un élément manque ou si l’individu va travailler avant de s’être réveillée, le lecteur est perturbé par l’information qui perd de sa cohérence, car le texte ne répond pas aux attentes correspondant à l’information socialement normée acquise. Il en va de même pour des structures linguistiques (Minsky 1974 : 44–45).

Si la proposition de Minsky (1974 : 25) repose sur l’emprunt d’un large éventail de travaux et de disciplines très variées, il reprend aussi la proposition de la grammaire de cas de Fillmore (1968a). En effet, il développe l’idée de l’approche verbo-centrée et d’éléments sémantiques dépendants du verbe. L’actualisation de ces éléments sémantiques et la nature de cette actualisation sont soumises à un caractère prototypique. Ainsi, en reprenant un exemple de Chomsky, il concède que « dormir furieusement » semble étrange, cela n’en est pas moins imaginable, cela ne va pas à l’encontre de processus cognitifs, et c’est pourquoi on pourra trouver cette occurrence dans la réalité langagière, par exemple dans un roman. Néanmoins, l’adverbe n’est certainement pas un adverbe prototypique