• Aucun résultat trouvé

Cadre théorique et méthodologique pour la caractérisation des discours de visites médiées

Chapitre 3 : Corpus et cadre méthodologique

3.3. De la segmentation qualitative à la fusion quantitative

Une des fonctions majeures du langage est de créer du sens : les corpus introduits sont ainsi représentatifs de situations de communication spécifiques dans lesquelles du sens a été produit au travers de la sélection de mots et de structures particulières dont l’analyse grâce aux corpus

précédemment définis constitue un des piliers de la linguistique de corpus. En effet, nous avons établi que nos corpus sont des objets d’étude que nous avons structurés et organisés afin de présenter les phénomènes langagiers associés à une situation de communication précise105. Cette approche s’inscrit dans la lignée anglo-saxonne (Tognini-Bonelli, 2001 ; Aijmer / Altenberg 2002 ; Biber, 2009) ou française (Habert et al., 1997 ; Rastier, 2001, 2005c, 2005d) de la linguistique de corpus, et non linguistique sur corpus (Williams, 2005 : 13), s’affirmant comme une discipline à part entière de description interprétative et inductive du texte. Elle situe le corpus comme le point de départ essentiel pour développer des théories sur le langage en s’appuyant sur la thèse de Guiraud (1960 : 19) qui postule qu’un mot « se définit finalement par la somme de ses emplois ». Ce postulat s’appuie lui-même sur le troisième aphorisme développé par Wittgenstein ([1921] 1993 : 41) : « L’image logique des faits est la pensée106 » dans lequel il définit le signe propositionnel et la proposition illustrant ainsi la différence entre signification et sens :

3.12 – Le signe par lequel nous exprimons la pensée, je le nomme signe propositionnel. Et la proposition est le signe propositionnel dans sa relation projective au monde. […]

3.14 – Le signe propositionnel consiste en ceci, qu’en lui ses éléments, les mots, sont entre eux dans un rapport déterminé. Le signe propositionnel est un fait.

3.141 – La proposition n’est pas un mélange de mots. (De même que le thème musical n’est pas un mélange de notes.) La proposition est articulée. […]

3.144 – Les situations peuvent être décrites, non nommées. (Les noms sont comme des points, les propositions comme des flèches, elles ont un sens.) […]

3.3 – Seule la proposition a un sens ; ce n’est que lié dans une proposition que le nom a une signification. […]

3.326 – Pour reconnaître le symbole sous le signe, il faut prendre garde à son usage pourvu de sens. […]

3.328 – Si un signe n’a pas d’usage, il n’a pas de signification. (Wittgenstein, [1921] 1993 : 42-45)

Le signe propositionnel, ensemble ordonné de mots, ne fait sens que s’il est contextualisé dans une réalité partagée entre les locuteurs, il devient alors proposition. Il est alors possible de faire un parallèle avec une contribution qui serait triadique au sens peircien, dont le representamen serait le signe propositionnel et dont l’objet serait la proposition, tous deux, representamen et

105Cf. § 3.1.1 Présentation et typologie des corpus d’étude.

124

objet, liés par la présence indispensable de l’interprétant107. La réflexion que Wittgenstein offre sur le nom peut aussi s’appliquer au verbe, à l’adverbe, à l’adjectif, voire aux syntagmes – nominaux et/ou verbaux – qui ont une signification propre, mais qui ne reconstruisent un sens que s’ils sont instanciés dans une micro-contribution. En linguistique de corpus, l’analyste peut proposer son interprétation du sens des mots ainsi défini grâce notamment aux concordances des phénomènes qu’il observe. Ce lien étroit entre les phénomènes, dont la récurrence est remarquable, et leurs usages contextualisés inscrit la linguistique de corpus dans le courant d’une linguistique pragmatique faisant ainsi écho à l’adage wittgensteinien : ne cherchez pas la signification, cherchez l’usage. Le développement des outils informatiques a ainsi permis de chercher l’usage dans la compilation de corpus homogènes et représentatifs. Il est donc possible d’interroger les corpus grâce aux rigueurs de l’analyse de données textuelles (ADT) assistée par ordinateur sur la fréquence des mots ‘tokens’, leurs concordances, leurs collocations ou colligation, de leurs natures – espèce de mot –, sur la fréquence des associations de plusieurs mots ‘N-grams’ (Cheng et al., 2006 ; Cheng et al., 2009) ou encore créer des listes de mots spécifiques ‘Keywords’ (Bondi / Scott, 2010). Tout au long de l’étude, ces requêtes sont réalisées à l’aide de programmes informatiques tels que AntConc élaboré par Anthony108 (2014), TXM109 ou Sketch Engine110. La collecte de ces informations éclaire le chercheur sur les structures microsémantiques des textes considérés à partir des données issues des corpus suivant une dimension heuristique de va-et-vient entre empirie et théorie appelée approche « bottom-up / top-down » (Brown / Yule, 1983 : 234–235). Alternance indispensable afin de valider le travail de recherche, car « une théorie ne vaudra jamais plus que les observations qui la fondent, l’inverse étant tout aussi vrai. » (Némo, 2001)

Dans un premier temps, chaque corpus est étudié dans son ensemble afin de définir les paramètres des niveaux macro- et méso-contributionnels, ensuite chaque type de relation détermine un sous-corpus artificiel dont l’analyse quantitative révèle la structure microsémantique. Cette seconde analyse permet de fusionner la segmentation qualitative à l’origine des micro-contributions avec une approche quantitative attestée.

107 Nous avions jusqu’ici proposé une définition épistémologique de la contribution grâce aux contraintes de complétude et de pertinence (Cf. 2.3 Modèle théorique du processus d’interprétation, p. 69) ; le concept de Wittgenstein nous permet d’avancer une définition plus ontologique de la contribution.

108 http://www.laurenceanthony.net/

109 http://textometrie.ens-lyon.fr/?lang=fr

3.3.1 Analyse macro- et méso-contributionnelle

Dans le paragraphe « 3.1.1. Présentation et typologie des corpus d’étude », nous avons défini le type de corpus comme étant des corpus spécialisés professionnels selon les propositions de Petit (2010) sur le langage spécialisé. Nous faisons ici l’hypothèse que l’analyse macro-, méso- et micro-contributionnelle globale, selon la démarche inductive du traitement statistique, permet la caractérisation des genres par comparaison des discours compilés dans nos corpus. En effet, les régularités ou constantes et irrégularités ou différences observées pour un certain nombre de caractéristiques linguistiques ou extra-linguistiques peuvent être des paramètres liés aux genres des textes constitutifs du corpus et par extension de leur représentativité, aux genres de discours produit dans les situations de communication dont ils sont issus. Mais la vérification de cette hypothèse ne peut se faire sans une description préliminaire de la notion de genre textuel, composante probablement indispensable à toute théorie du texte. À titre d’exemple, dans ses études sur l’utilisation de l’oral et de l’écrit au travail, Koester (2004 : 2) présente la notion de « parlers institutionnels »111 qui se démarque de la conversation ordinaire par la finalité des communications liée aux objectifs professionnels ; par le statut des locuteurs de certains contextes professionnels qui influence les règles communément admises du tour de parole ainsi que la légitimité des contributions ; par l’existence d’un lexique spécialisé et d’un discours institutionnel qui influencent la production discursive des locuteurs. Dans la continuité des travaux de Swales (1990), elle identifie ces divers « parlers institutionnels » comme étant autant de genres représentatifs des situations de communication particulières au monde professionnel. Boutet ([2001] 2005a, 2005b) associe la notion de genre à « un niveau intermédiaire entre langue et discours » (Boutet, 2005b : 20) qui représente les activités langagières en situation de travail : « il s’agit de formats reconnaissables qui vont permettre d’articuler au mieux les échanges, [… et générer] un ensemble de propriétés des genres professionnels » (Boutet, 2005b : 21). Même si ces exemples s’inscrivent dans une tradition du genre discursif en partie française (Adam, 1997, [1984] 1999 ; Bronckart, 1985, 1997 ; Izquierdo, 2007 ; Petitjean, 1987 ; Maingueneau, 2004), en partie anglo-saxonne (Bhatia, 1993 ; Hyland, 2004 ; Swales, 1990, 2004), cette notion de format n’est pas sans rappeler le concept de moule discursif de tradition germanique (Adamzik, 1995 ; Fix, 1990, 1999 ; Gautier, 2009) dans laquelle l’activité exercée, le contexte et le discours influent réciproquement l’un sur l’autre afin d’esquisser la représentation d’un prototype, qui par le biais d’une relation

126

d’équivalence peut représenter les textes produits dans des situations de communication analogues. L’intérêt de l’existence d’un prototype réside dans la normalisation socioculturelle qui autorise une égalité des possibilités de représentation parmi les interprétants, le prototype étant un représentant personnel, idéal et symbolique du groupe d’interprétation et non un des éléments du groupe. Le moule discursif est, quant à lui, une jauge textuelle idéale et abstraite facilitant l’étalonnage des contributions textuelles, il est commun aux prototypes que peuvent avoir les interprétants. Si un groupe de personnes dessine un arbre, chaque dessin est particulier, il illustre le prototype du concept « arbre » que le participant possède, mais chaque arbre dessiné présente des caractéristiques communes : un tronc, des branches, un feuillage ; ce sont les paramètres qui définissent la représentation du concept. De la même manière, chaque genre, ici professionnel, possède sa jauge textuelle qui calibre les textes et leurs représentations prototypiques par comparaison et les trie. Chaque genre représente des classes de discours liées aux différentes activités contextualisées professionnelles dont les caractéristiques sont déterminées par un ensemble de critères linguistiques et extra-linguistiques :

Si on admet que les genres professionnels se caractérisent par un ensemble de propriétés, ce n’est certainement pas chaque propriété prise isolément qui permet de le montrer, mais bien une combinatoire. Cette combinatoire est assurément variable selon les métiers, selon les activités, selon les tâches en cours. (Boutet, 2005b : 33)

La variabilité de cette combinatoire assure l’existence de prototypes idéaux accompagnés de leur moule discursif autour desquels les textes s’organisent en genres professionnels au moyen d’une relation d’équivalence. Les similitudes existant entre les situations de communications d’une même classe de discours prennent en compte trois axes de critères pour les besoins de la classification : l’aspect communicatif, l’aspect formel, et l’aspect cognitif (Méric / Gautier : 2013).

Au sein de la composante communicative, la nature des participants est considérée tel que Petit (2010 : 9) les présente dans sa définition des discours spécialisés : experts, professionnels, et profanes ; ensuite, la finalité de la communication est aussi prise en compte : informer, distraire, vendre, etc., avant de prendre en compte les différentes praxis professionnelles mises en œuvre pour transmettre le message ; c’est la dimension sociolinguistique du discours dont sont issus a priori les critères définitoires des genres textuels pour la classification des textes du corpus. L’aspect formel du genre textuel concerne l’organisation structurelle aussi bien au niveau macrosémantique, mésosémantique que microsémantique, c’est la dimension

pragma-sémantique du discours qui nourrit l’analyse de cette étude pour une vérification a posteriori de l’appartenance d’un texte aux genres textuels. Quant à l’aspect cognitif, il s’identifie plus facilement à ce qui rend le texte intelligible : sa complétude et sa pertinence. Bien que ces contraintes conditionnent le processus de construction du texte, en définissant comment peut ou ne peut pas se construire une contribution, elles semblent être d’ordre plus épistémologique qu’ontologique.

Par analogie avec l’arithmétique modulaire de Gauss (1801), pour étalonner les contributions selon leur dimension pragma-sémantique, nous proposons que la relation d’équivalence qui statue de l’appartenance d’un texte à un genre textuel soit appelée la congruence discursive (Méric / Gautier, 2014). Cette relation entre un texte et les catégories génériques instanciatrices s’inscrit parfaitement dans la notion « d’architextualité » (Genette, 1979 : 87–88 ; Herbert, 2009) qui garantit la notion de stabilité normative des genres (Adam, 2001). Selon Portuguès (2011 : 137-138), le genre textuel est un cadre pragmatique qui se cristallise autour des contraintes de complétude textuelle dont l’occurrence devient systématique. La variété des approches de la notion de genre chez les chercheurs adeptes ou non de génologie112 rend difficile un consensus autour d’une définition générique du genre textuel d’autant plus que cette notion reste traditionnellement utilisée pour la classification des textes littéraires. En contrepartie, nombreux sont les chercheurs qui reconnaissent l’existence d’une compétence générique indispensable à l’interaction :

Si les genres de discours n’existaient pas et si nous n’en avions pas la maîtrise, et qu’il nous faille les créer pour la première fois dans le processus de la parole, qu’il nous faille construire chacun de nos énoncés, l’échange verbal serait impossible. (Bakthine, [1952] 1984 : 285)

Van Dijk reconnaît aussi cette maîtrise du genre comme un élément constitutif de la compétence linguistique :

112 Terme attribué à Philippe Van Tieghem lors d’une communication présentée au troisième congrès international d’histoire littéraire à Lyon, consacrée aux genres littéraires. Cette communication a donnée lieu à une publication dans la revue Hélicon, 2, 2–3, éditée à Amsterdam par la Commission internationnale d’histoire litérraire moderne en 1939.

128

Chaque locuteur natif […] a l’aptitude initiale de […] reconnaître différents types de textes. Nous devrions postuler que cette aptitude fondamentale fait partie de la compétence linguistique.113 (Van Dijk, cité par Adam, 1992 : 5)

Ceci dit, nous pouvons supposer qu’une des fonctions du genre est de prédisposer le destinataire à recevoir les contributions à venir (Portuguès, 2011 : 138), il serait même intéressant d’étudier à quel niveau la notion de genre interfère avec les hypothèses anticipatoires.

Dans cette étude, inscrite dans un cadre professionnel et reposant sur l’analyse de corpus spécialisés professionnels, nous présentons une classification hiérarchisée qui respecte les trois axes orientés par les aspects précédemment introduits ainsi que la relation architextuelle de congruence discursive. Au vu des critères retenus pour la classification, cette proposition respecte notre approche pragmatique, car la taxonomie choisie s’inscrit dans la conceptualisation de Rastier (2001 : 230–231) qui établit un parallélisme entre linguistique et praxéologie permettant ainsi de définir les critères en fonction des praxis professionnelles mises en œuvre :

- Le domaine d’activité est le critère principal retenu pour les familles de genres. Associé à la nature des participants et à la finalité des communications développées dans l’aspect communicatif, il limite la pratique sociale à un domaine sémantique spécifique et au discours qui le représente. Selon Calvi (2010 : 22) la famille de genres se définit par la communauté professionnelle en interaction et par ses objectifs principaux. Nous établissons donc la famille de genres Médiation culturelle qui réunit les discours correspondant à une situation de communication entre des professionnels (les médiateurs) et des profanes (les visiteurs), ce qui correspond au spécialisé professionnel (Petit, 2010 : 9), dont les objectifs principaux sont de divertir, de satisfaire et d’informer le profane.

- Le champ pratique est une division du domaine d’activité, il détermine une indexation référentielle liée à un mode opératoire propre au domaine à partir de caractéristiques tout aussi externes que celles listées pour le critère du domaine d’activité, « c’est-à-dire situationnels (nature et destination du site, nature du format participatif, nature du canal, but de l’interaction, degré de formalité et de planification de l’échange, degré d’interactivité, etc.) » (Kerbat-Orecchioni / Traverso, 2004 : 43). La catégorie

113 « Any native speaker […] has the initial ability to […] recognize different types of texts. We shall claim that this fundamental ability is part of linguistic competence. »

macro-genre identifie la praxis et ses objectifs spécifiques ce qui, dans cette étude, correspond au macro-genre visite médiée. D’autres macro-genres de la famille médiation culturelle peuvent être identifiés : atelier-découverte, débat-spectacle, exposition temporaire, etc. qui constituent autant d’activités de l’aspect communicatif présentant des praxis et des objectifs différents.

- Les situations de communication représentent le critère que nous considérons comme propre au genre, c’est le dernier critère externe spécifique à tel ou tel type d’interaction, car « c’est au niveau du genre que commencent à se distinguer les différents traits linguistiques114 » (Calvi, 2010 : 24–25). Nous retrouvons ici la dimension sociolinguistique de l’aspect communicatif due aux modalités des situations de communication au sein d’une communauté discursive établie : les textes peuvent être plus ou moins institutionnalisés (Kerbat-Orecchioni / Traverso, 2004 : 42). Nous faisons alors l’hypothèse que la détermination des genres visite-conférence et visite assistée, a priori intuitive, se justifie a posteriori par l’organisation macro-, méso- ou micro-contributionnelle des textes compilés, et par les occurrences des phénomènes pragma-sémantiques, appelés types de discours, ou mieux, « activités discursives » (Kerbat-Orecchioni / Traverso, 2004 : 43) qui représente les critères internes liés aux aspects formels et cognitifs.

- Selon l’importance que l’analyste va accorder à certains critères externes, il pourra instaurer des sous-classes comme nous l’avons fait autour du caractère monologal et dialogal des textes du corpus CVAf. En effet, le genre visite assisté présente une variation communicative suffisamment significative autour de ce critère pour justifier une subdivision sans toutefois remettre en cause l’unité du genre choisi, il est donc pertinent de parler de deux sous-genres issus de cette variation : visite assistée monologale et visite assistée théâtralisée.

Ces critères de catégorisation sont en accord avec la proposition de classification des genres discursifs de la langue du tourisme (Calvi, 2010) à laquelle nous ajoutons donc la famille de genres médiation culturelle (Méric / Gautier : 2013) qui reste absente du modèle de l’auteur, ce à quoi il nous autorise en stipulant que sa proposition reste ouverte aux modifications :

Ces catégories, bien sûr, ne sont pas exclusives, mais ouvertes aux modifications pour être complétées ; étant entendu que, par exemple, restent en marge les genres oraux qui peuvent

130

s’inscrire dans des secteurs comme ceux des agences, des hôtels ou des contacts entre professionnels (interactions entres pairs, ou entre agences et le public), mais qui peuvent présenter une forme d’autonomie comme c’est le cas avec les activités des guides de tourisme.115 (Calvi, 2010 : 23)

Le Tableau 17 résume donc la taxonomie que nous avons choisi de suivre pour la classification des genres des textes constitutifs de nos corpus. La distinction Français / Espagnol se faisant au niveau de la langue spécialisée du tourisme, les mêmes critères définitoires s’appliquent aux deux langues pour établir la classification avec la particularité dans le cas des textes en espagnol d’un seul sous-genre, car les visites théâtralisées ne sont pas représentées dans le corpus correspondant.

Langue spécialisée du tourisme

Catégories Noms Critères

Famille de genres - Médiation culturelle Domaine d’activité

Macro-genre de

discours - Visite médiée Champ pratique

Genres de discours

- Visite-conférence (CVC) - Visite assistée (CVA)

Situations de communication Sous-genres de

discours

- Visite assistée monologale (CVAm) - Visite assistée théâtralisée (CVAt)

Pratiques Spécifiques au genre

Tableau 17: Genre, type et sous-types de discours

Cette classification verticale a priori pose les bases nécessaires à la vérification a posteriori de l’hypothèse émise : l’analyse discursive globale des critères internes permet la caractérisation par comparaison des genres et sous-genres des discours compilés dans les corpus en accord avec la démarche inductive du traitement statistique. Les critères externes ont autorisé la classification a priori des textes sans interférer dans l’analyse de ces mêmes textes. L’étude ainsi conduite permet d’éventuelles corrélations entre les résultats, a posteriori, de l’analyse des critères internes et la classification, a priori, basée sur des critères externes. Par conséquent, la caractérisation détaillée des textes compilés repose sur des dimensions horizontales liées aux critères internes aux niveaux macro-, méso- et microsémantiques, dans lesquels s’expriment

115 « Estas categorías, por supuesto, no son excluyentes sino abiertas para cambios y adiciones; quedan al margen, por ejemplo, los géneros orales, que se pueden inscribir dentro de sectores como las agencias, la hostelería o los encuentros profesionales (interacciones entre pares, o entre los operadores y el público), pero pueden presentarse de forma autónoma, como ocurre con las actuaciones de los guías de turismo. »

leurs différences. L’étude inter-contributionnelle des relations définies par la RST nous informe sur les niveaux méso- et macro-contributionnels. L’étude intra-contributionnelle, grâce à la comparaison des occurrences obtenues dans l’analyse de données textuelles, et à la détermination des mots spécifiques à un genre, offre autant d’informations quantitatives microsémantiques qui recouvrent chaque niveau contributionnel. L’ensemble de ces informations permet de valider ou non notre hypothèse par la caractérisation des paramètres du script (Schank / Abelson, 1977) associé à l’étalonnage du genre textuel.

Avant de réaliser cette analyse et de présenter les résultats dans la Deuxième partie116, il nous reste à préciser la méthode suivie pour l’analyse microsémantique dans une approche intra-contributionnelle.

3.3.2 Analyse microsémantique globale et segmentée

Les contraintes de macro- et méso-complétude possèdent leurs propres marqueurs pragmatiques afin d’organiser le texte comme l’illustre Portuguès :

le texte doit in fine répondre non à une unique contrainte de complétude, mais à un