• Aucun résultat trouvé

linguistique générale, qu'est-ce qu'un corpus ?

I. 2.3.1.2- Dans le domaine de l'apprentissage des langues étrangères

Le corpus est également un outil qui peut revêtir une grande utilité dans le domaine de l'apprentissage des langues. D'une part, dans la mesure où des innovations technologiques ont eu entre autres conséquences à la fin du dix neuvième siècle et au début du vingtième siècle une vague de réformes dans la didactique des langues (Véronique 1992:172), les corpus peuvent également influencer grandement les pratiques dans ce domaine en ce début de vingt et unième siècle. Henri Sweet insistait notamment lors du mouvement de réforme à la fin du dix neuvième siècle sur le fait que toute étude, tout apprentissage d'une langue nouvelle devait se fonder sur des textes authentiques (Véronique 1992:179-180). Harold Palmer préconisait également une utilisation essentielle de textes authentiques dans une situation d'apprentissage d'une langue nouvelle (Crystal 1985:142). Ce besoin se fait toujours sentir à notre époque et l'accès à ces textes a été grandement facilité par la création de plus en plus importante de corpus dans de multiples langues (Kennedy 1998). L'intérêt d'utiliser des texte authentiques réside également dans le fait que c'est à cette langue que l'apprenant va se confronter, et qu'elle diffère bien souvent de la langue enseignée ou présente dans les manuels d'apprentissage, ces différences s'expliquant notamment par des procédures de découverte du fonctionnement de la langue largement introspective et ne se basant que trop peu sur des faits de langue réels (Tognini-Bonelli 2001:15).

L'utilisation de corpus dans une salle de cours est par ailleurs plutôt agréable pour les apprenants, elle permet la mise en place d'un apprentissage actif de l'étudiant, de type bottom-up (Ibid:14), l'étudiant n'a pas besoin d'une grande expertise dans la langue étudiée avant de pouvoir se confronter à des faits de langues authentiques. Cette plus grande participation de l'étudiant à son apprentissage contribue ainsi à faciliter l'acquisition de la langue étudiée, et contribue à lui donner une plus grande autonomie pour d'autres apprentissages à venir (Holec 1990).

L'analyse de corpus peut aussi permettre la création d'un matériau pédagogique plus adapté. Par exemple, dans le cadre de l'acquisition du vocabulaire d'une langue, Tognini-Bonelli (2001:40) note que l'utilisation du corpus, en ce qu'elle s'intéresse aux fréquences des

mots utilisés de façon naturelle, peut aider le linguiste à élaborer des syllabus beaucoup plus efficaces pour les apprenants. Sinclair et Renouf (1988) notent ainsi que ces nouveaux syllabus doivent effectivement prendre en compte les mots avec un fort usage, et les façons les plus communes de les utiliser.

En outre, l'usage du corpus permet de sensibiliser l'apprenant à la variation de la langue (Tognini-Bonelli 2001), il existe, comme nous l'avons précisé dans la partie précédente différents types de corpus, on peut noter parmi ceux-ci la présence de corpus de langue de spécialité qui permettent aux étudiants souhaitant apprendre un sous langage particulier de le faire avec une plus grande acuité :

« In the field of LSP, many corpora of restricted varieties are being assembled for teaching purposes very much in line with a shift towards vocational language training where students of economics, for example, are exposed preferentially to the type of language they will be using, i.e. The language of economic texts, journals and/or spoken negotiations. » (Tognini-Bonelli 2001:8)39

L'utilisation du corpus compte ainsi de nombreux avantages dans divers domaines de la linguistique appliquée, qu'il s'agisse de traduction ou de lexicographie. Son emploi dans le domaine de la didactique des langues semble poser de nombreux atouts. Néanmoins, cet outil n'a rien d'un remède miracle à administrer en toute occasion sans sens critique, il connaît certaines limites que nous allons maintenant aborder de façon plus détaillée.

I.3- Conclusion.

La linguistique de corpus, bien qu'étant une discipline récente dispose d'une littérature abondante et diverse. Nous avons précisé dans ce premier chapitre ce que nous entendions par cette locution, en retraçant le cadre historique de la linguistique générale, et en remettant en perspective la tradition linguistique depuis Saussure, nous avons vu que la linguistique de corpus réunissait deux linguistiques qui avaient coexisté l'une à côté de l'autre

39 « Dans le domaine des langues de spécialité, beaucoup de corpus de variétés restreintes de langue sont rassemblés dans un but pédagogique plus en phase avec les besoins d'une formation professionnelle où par exemple, les étudiants en sciences économiques sont confrontés davantage aux types de langages qu'ils devront utiliser, c'est à dire le langage des textes économiques, des journaux, et/ou de négociations orales » (ma traduction).

tout au long du vingtième siècle : langue et parole se rejoignent sans s'exclure au sein de ce paradigme (Tognini-Bonelli 2001).

Savoir ce que l'on entend par corpus, ce qu'est cette entité dès lors que l'on se situe dans la discipline de linguistique de corpus est important pour pouvoir concevoir plus clairement ce sur quoi la recherche menée se fonde. Nous avons ainsi également éclairci ce point en notant que le corpus dans cette discipline est avant tout électronique, et que si différentes formes en existent, le corpus IntUne peut être considéré comme un corpus comparable. Nous reviendrons dans le troisième chapitre sur les détails de la conception de ce corpus.

Comme nous l'avons vu, diverses méthodologies sont envisageables lorsque l'on se situe dans le paradigme de la linguistique de corpus, si l'usage d'une approche corpus-driven a déjà été explicitée dans le cadre de notre étude (cf. partie 2.1.2.4), le chapitre suivant va aborder de façon plus détaillée et précise le cadre théorique et méthodologique dans lequel les recherches de cette thèse ont été menées, ainsi que les procédures d'analyse et d'étude qui y ont été mises au point.

2- Cadre théorique, méthodologie

employée.

II.0- Introduction.

Le projet du groupe média IntUne est de voir comment l'Europe est représentée linguistiquement dans la presse de quatre pays : le Royaume-Uni, la Pologne, la France et l'Italie. Le choix de la presse, comme cela a déjà été expliqué dans l'introduction se justifie par l'influence que ce type de discours peut avoir sur la construction d'une identité pour des citoyens. Lors des chapitres précédents, nous avons vu quels étaient les rapports entre linguistique générale et linguistique de corpus, et ce que l'on entendait dans cette thèse par linguistique de corpus. Nous avons également précisé ce que l'on entendait par corpus. Mais à partir du moment où l'on dispose d'un corpus, il s'agit de s'interroger sur la méthodologie à suivre et les processus à mettre en place pour l'analyser.

Dans le cadre de cette étude, la méthode choisie pour analyser la représentation lexicographique et sociolinguistique de l'Europe dans la presse est d'étudier le ou les sens dont différents mots associés de façon thématique au concept d'Europe pourraient être affectés. En effet, Wierzbicka note que l'étude des mots permet d'appréhender les valeurs données par une culture à tels et tels concepts (tels l'Europe) :

« Words are society's most basic cultural artefacts, and -properly understood- they provide the best key

to a culture's values and assumptions »40 (Wierzbicka 1996:237)

Notre approche, se basant sur le sens d'un mot, son association à un ou plusieurs concepts, est largement lexicographique. En cela, il est nécessaire d'expliciter une tradition longue de plusieurs siècles dans ce domaine qui pourrait influencer les méthodes, techniques, et concepts-outils utilisés lors de l'analyse.

Dans ce chapitre, nous aborderons donc le cadre théorique sur lequel la méthodologie employée dans cette étude se fonde. Tout d'abord, nous partirons de la théorie aristotélicienne des conditions nécessaires et suffisantes qui demeure une influence majeure dans le domaine de la lexicographie, mais qui pose également de nombreux problèmes. Nous verrons ensuite les réponses, à travers l'élaboration d'une théorie du prototype, qui ont pu être proposées à ces problèmes par la philosophie (via les travaux de Wittgenstein), la psychologie (via les travaux de Rosch), et la synthèse qui a été proposée pour cette théorie. Puis, nous aborderons dans une troisième partie une adaptation des prototypes par Patrick Hanks qui a proposé de les appliquer dans le domaine de la lexicographie. Enfin, nous construirons un premier prototype à l'aide d'une matière lexicographique pour le mot clef que nous étudions dans cette thèse « Europe » (Williams 2009) qui pourra être complété ou modifié à la lumière d'une analyse de corpus dans les chapitres suivants.

Tout d'abord, nous allons voir comment, depuis des années, des concepts ont été associés à une unité sémantique largement utilisée, le mot. Cette unité, bien que très répandue dans les approches lexicographiques (les mots sont les unités d'entrée de la plupart des dictionnaires), présente de nombreuses failles que nous allons explorer.

II.1- Le mot, une unité problématique.

Le mot est une des unités sur lesquelles se fonde notre acquisition du langage et des concepts qu'il permet d'appréhender41. Si quelqu'un cherche à comprendre ce que c'est que

40 « Les mots sont les artefacts culturels les plus basiques d'une société, et, correctement compris, ils fournissent la meilleure clef qu'il soit pour comprendre les valeurs et les positions d'une culture » (ma traduction).

41 Cf. les programmes de l'école maternelle, p. 165, l'enfant doit être capable de « identifier immédiatement les mots usuels des activités de la classe et du vocabulaire acquis dans le cadre d'autres enseignements (date, nom d'exercices ou d'activités (…) vocabulaire mémorisé dans les autres domaines » dans le cadre de son acquisition du langage. Les programmes de l'école primaire peuvent se consulter sur le site suivant :

l'Europe, un des premiers réflexes sera probablement de rechercher une définition pour ce mot. Le langage qui permet d'élaborer des concepts, d'en rendre compte, de leur conférer telle ou telle signification se constitue de mots. Mais cette unité, si elle est très répandue et populaire, pose un réel problème de définition. En effet, comment circonscrire aussi bien au niveau graphique, phonétique que sémantique un objet dont la réalité ne peut s'approcher de façon empirique et systématique ?

Si la tradition populaire définit le mot comme étant grosso modo une unité de sens que l'on distinguerait par une séparation dans la chaîne langagière (une pause à l'oral, ou un blanc au niveau typographique), la réalité de ce concept apparaît, dès lors qu'on l'interroge plus avant, beaucoup plus complexe à circonscrire (Crystal 1985:185-9). En effet, de nombreuses langues n'utilisent aucun signe typographique pour séparer les mots les uns des autres, quand bien même ce blanc typographique existe, des situations mixtes peuvent surgir telles que l'emploi de l'apostrophe dans les langues latines. Au niveau phonétique, il est quasiment impossible de distinguer les différents mots d'un énoncé que l'on entendrait dans une langue inconnue, alors que d'autres unités, comme le phonème, semblent pouvoir être analysées beaucoup plus facilement. Au niveau sémantique, enfin, il semble complexe d'attribuer un voire plusieurs sens bien circonscrits à un mot en particulier, que ce soit parce que cette tache demande un long travail de recherche (Wierzbicka 1996:256) ou parce que la nature de la signification rend tout simplement cette recherche impossible (Hanks 2000:205). Cette unité pose donc de nombreux problèmes d'identification et de définition. Une longue tradition linguistique s'est formée pour tenter de répondre à ces difficultés. Il est intéressant de passer en revue certaines des solutions qui ont pu être proposées pour expliquer les mots dès lors que l'on souhaite étudier la représentation de l'Europe dans la presse française. Dans la mesure où l'étude porte sur un concept représenté dans la langue par un mot, il est essentiel d'avoir présent à l'esprit les diverses méthodes d'analyse de ces unités, les mots, qui ont été élaborées. Si la réflexion sur le mot est probablement aussi ancienne que celle sur le langage, nous partirons dans cette partie d'une théorie encore largement répandue aujourd'hui, le modèle aristotélicien des conditions nécessaires et suffisantes, nous verrons quels sont ses avantages pour rendre compte de la façon dont un concept est présenté sous une forme linguistique, mais également les limites dont cette théorie peut souffrir.