• Aucun résultat trouvé

Chapitre 4 : Études de corpus

A. Analyse électronique de corpus

1. Méthodologie autour du Petit Prince, de Balzac et des Beatles

Nous avons tout d’abord été sensibilisé à l’analyse électronique de corpus dans le cadre de notre maîtrise d’anglais à l’ancien Centre de Télé-enseignement Universitaire de Nancy 2, aujourd’hui ERUDI, grâce à une UV enseignée par Alex Boulton, un maître de conférences d’origine britannique. Ce dernier demandait à ses étudiants de lui soumettre un travail d’études et de recherches faisant usage de l’outil informatique dans l’analyse de corpus. Nous n’avions pas eu

450 Svenja ADOLPHS. Introducing Electronic Text Analysis. A practical Guide for Language and Literary Studies. London and New York :

Routledge, 2006.

451

“Corpus: A collection of linguistic data, such as written texts or transcribed speech, that has been designed to be representative of a particular language domain or variety, with its size and content having carefully taken into account.” Ibid. p. 138.

452

Douglas BIBER, Susan CONRAD et Randi REPPEN. Corpus Linguistics. Investigating Language Structure and Use. Cambridge : Cambridge University Press, 1998. p. 9.

453 Cf. Alex BOULTON. « Esprit de corpus : Promouvoir l’exploitation de corpus en apprentissage des langues », revue électronique

alors l’idée de le faire coïncider avec notre sujet de TER qui portait déjà sur Iron Maiden. Ainsi nous avons réalisé une petite étude sur Le petit prince de Saint-Exupéry et sa traduction anglaise.454 Ce n’est qu’en consultant en ligne quelques années plus tard les travaux d’autres étudiants sur le discours de groupes ou d’artistes comme Sting et The Police,455 Nick Cave,456 et U2457 que nous avons pleinement mesuré les possibilités et la puissance offertes par une telle analyse.

Par la suite, nous avons été conforté dans le choix de ce type d’analyse par les travaux similaires de passionnés.

1.1. Le dictionnaire des Beatles458

Dans les années 1990, François Jouffa – surnommé le « cinquième Beatles français » – et Jean- Louis Polard, professeur d’anglais devenu enseignant de langues grâce aux Beatles, ont eu l’idée de réaliser un dictionnaire anglais-français constitué des 1,802 mots employés dans tout le corpus des Fab Four.459

Au cours d’une correspondance par courriel avec Jean-Louis Polard, ce dernier nous a confirmé que l’ouvrage coécrit avec François Jouffa était au départ basé sur un premier essai de répertorisation et d’indexation réalisé par Colin Campbell et Allan Murphy publié en 1980 sous le titre Things We Said Today: the Complete Lyrics and a Concordance to the Beatles’Songs, 1962- 1970.460

Sans ordinateur ni Internet à l’époque, Jean-Louis Polard avait procédé sans le savoir à une lemmatisation en faisant des regroupements logiques et nécessaires pour épurer la première liste de Campbell et Murphy.461 Jean-Louis Polard avait également inclus au répertoire deux morceaux inédits « Révolution 9 » et « I’ll Be on My Way », alors tout juste sortis officiellement en CD, ainsi que les titres des albums du groupe. Cette mouture revue et corrigée avait abouti à l’ouvrage à grand succès qu’est devenu ce dictionnaire.

1.2. Le « Vocabulaire de Balzac »

Un autre travail qui nous a extrêmement impressionné est celui d’un universitaire japonais francophile : le professeur Kazuo Kiriu qui a consacré des années de sa vie au « vocabulaire de Balzac ». Cet enseignant-chercheur a en effet entrepris de numériser l’intégralité de la Comédie humaine (incluant les préfaces et les postfaces), Les Cent Contes drolatiques, la Correspondance et les Lettres à Madame Hanska, les Premiers romans, les Œuvres diverses et le Théâtre de l’auteur français.462 Ensuite, il a créé un dictionnaire balzacien.

454

Jean-Philippe PETESCH. The Initiatory Book. Case Study: The Little Prince. Travail de recherche de maîtrise : Anglais. Centre de Télé-enseignement Universitaire Nancy 2, 2002.

455 Bilge TORUN. Analyzing STING & THE POLICE Lyrics using a corpus-based approach. Travail de recherche de maîtrise : Anglais.

Centre de Télé-enseignement Universitaire Nancy 2, 2005.

456

Christine CHAILLOUX. Building a Lexical map of Nick Cave’s lyrics: From the Boys Next Door to the Bad Seeds. Travail de recherche de maîtrise : Anglais. Centre de Télé-enseignement Universitaire Nancy 2, 2004.

457

Jean-Yves PETIT. The Religious Vocabulary in U2's Lyrics. From "Boy" to "Rattle and Hum" and from "Achtung Baby" to "How to Dismantle an Atomic Bomb". Travail de recherche de maîtrise : Anglais. Centre de Télé-enseignement Universitaire Nancy 2, 2005.

458

François JOUFFA et Jean-Louis POLARD. Le dictionnaire des Beatles. Bordeaux : Le Castor Astral, 2000.

459

Surnom très souvent utilisé pour désigner les quatre (« four ») garçons fabuleux (« FABulous ») de Liverpool.

460

Colin CAMPBELL et Allan MURPHY. Things We Said Today: the Complete Lyrics and a Concordance to the Beatles’Songs, 1962- 1970. Ann Arbor, Michigan : Pieran Press, 1980.

461

Voir notre section 3.2. de ce chapitre pour plus de détails.

462 Notes de M. Kazuo KIRIU : « La première version de ce Vocabulaire de Balzac date de 1989. Elle consiste en un simple classement

par ordre alphabétique des noms contenus dans La Comédie humaine. Codée en ASCII, elle occupe plus de 250 disquettes. La deuxième version remonte à 1995. Elle comprend non seulement La Comédie humaine mais aussi Les Cent Contes drolatiques, la Correspondance et les Lettres à Madame Hanska. Les noms sont classés avec précision. En effet, les homonymes font l'objet d'entrées distinctes : le livre (ouvrage) par exemple et distingué de la livre (monnaie). Codée en html, cette version est gravée sur un cédérom. La troisième version, que nous vous proposons ici, a été augmentée une fois encore. Elle inclut désormais les Premiers romans, les Œuvres diverses et le Théâtre. Les préfaces et les postfaces de La Comédie humaine ont également été ajoutées, ainsi que les œuvres ébauchées. Le format utilisé est le PDF. »

Le professeur Kazuo Kiriu n’a pas souhaité commercialiser ce travail et il en fait don au site de La Maison de Balzac à Paris.463 Cette entreprise titanesque lui a cependant valu en 2005 l’invitation de Bernard Pivot dans son émission sur la francophonie et la francophilie « Double-je ».464

La mention faite à ces travaux tend à mettre en évidence certaines difficultés techniques et méthodologiques liées à cette approche. Cela nous a amené à une réflexion sur la production des corpus soumis à l’analyse électronique.