• Aucun résultat trouvé

79 Nous avons argumenté plus haut que l'acquisition de structures générales pouvait se faire à partir de la langue de spécialité. L'exemple suivant montre que le corpus spécialisé permet aussi de traiter des questions de grammaire et qu'il est possible de le faire sur des corpus spécialisés, même avec des apprenants de faible niveau.

80 Une connaissance de base des expressions régulières est alors nécessaire aux enseignants, car elle permet de lancer des requêtes plus complexes afin de préparer du matériel pédagogique portant sur des questions simples ou complexes. Les apprenants de faible niveau ont par exemple tendance à confondre les formes en –ed et en –ing. Une recherche à l'aide d'expressions régulières sur des formes passives et des formes continues dans un corpus spécialisé (en Tableau 26, le corpus de sciences de la terre) permet à la fois de

présenter des exemples de leur utilisation, mais aussi de préparer des exercices lacunaires par exemple, dans lesquels l'apprenant doit rétablir le verbe à la forme correcte.

Tableau 26 – Exemples de recherche de structures en –ed ou –ing.

Expression régulière simple : ha(s|ve|d) been \w+(ed|ing)

2008 Wenchuan earthquake had been accumulating for a much longer time.

a deeper silicic magma chamber that had been cooling slowly.

the lava dome,which had been growing since 1995, had not resumed growth lava dome had been growing since the large

a pre-event had been observed about 2.8 s before the main rupture Such branching had been studied earlier on the basis of static crac

This regional amplification had been suggested by the analysis of the very few records

81 Nous ne donnons ici qu'un exemple du type de travail ou d'exercices pouvant être réalisés à l'aide de corpus. Cet exemple est issu de l'outil Wall, qui permet non seulement de générer des concordances à partir d'expressions régulières, mais aussi de générer automatiquement des exercices lacunaires à partir des concordances, comme l'illustre le Tableau 27.

Tableau 27 – Exemples de génération de texte lacunaire sur some et any.

82 Il ressort clairement de ces exemples que les enseignants doivent apprendre à maîtriser la syntaxe des expressions régulières.

Conclusion

83 Nous avons montré comment amener les enseignants à traiter par le corpus des questions lexicales, dans une approche lexico-grammaticale, des questions de grammaire et des questions de contenu. Cependant, pour arriver à un tel traitement, il est nécessaire de former les enseignants à des compétences relativement avancées en linguistique de

corpus, tant sur les plans théorique et méthodologique, que sur le plan technique. Nous argumentons en faveur d'une approche corpus qui commence par un travail sur les collocats, avant de montrer des lignes de concordances. La décision de former les enseignants à cette approche ne relève pas seulement de la didactique, mais avant tout de choix politiques. Les étudiants qui se destinent à l'enseignement des langues pourraient être formés à la linguistique de corpus dans leur cursus universitaire. Cela peut paraître un point de vue partisan, car pourquoi cette approche plutôt qu'une autre ? La réponse réside dans les fondements de la linguistique de corpus, à savoir que l'on découvre et comprend la manière de communiquer dans une langue à partir du corpus, le corpus étant un réservoir inépuisable de découvertes, d'exemples et d'activités. L'exploitation de corpus représente l'une des approches possibles, parmi les nombreuses approches à mettre en œuvre dans la formation en langues. C'est en fait une question beaucoup plus vaste sur la formation des enseignants qui se pose ici.

BIBLIOGRAPHIE

Aarts, B. 2001. "Corpus linguistics, Chomsky and fuzzy tree fragments". In Mair, C. & Hundt, M.

(dir.). Corpus linguistics and linguistic theory. Amsterdam: Rodopi. pp. 5-13.

Anthony, L. (2005). "AntConc : design and development of a freeware corpus analysis toolkit for the technical writing classroom". In Professional Communication Conference Proceedings. pp. 729-737.

Disponible en ligne. http://ieeexplore.ieee.org/xpl/login.jsp?tp=&arnumber=1494244&url=http%

3A%2F%2Fieeexplore.ieee.org%2Fstamp%2Fstamp.jsp%3Ftp%3D%26arnumber%3D1494244 Anthony, L. (2011). AntConc, version 3.2.4. Tokyo: Waseda University. Disponible en ligne. http://

www.antlab.sci.waseda.ac.jp/

Antoniadis, G., Ponton, C. & Zampa, V. (2010). "Exxelant et Mirto : deux exemples

d'environnement d'ALAO intégrant des outils TAL". In Biskri, I. & Jebali, A. (dir.). Multilinguisme et traitement des langues naturelles. Montréal : Presses de l'Université du Québec. pp. 165-179.

Aston, G. 1997. "Enriching the learning environment : corpora in ELT". In Wichmann, A., Fligelstone, S., McEnery, T. & Knowles, G. (dir.). Teaching and language corpora. Harlow: Addison Wesley Longman. pp. 255-266.

Aston, G. 1999. "Corpus use and learning to translate". Textus, vol. 12. pp. 289-313.

Baroni, M., Kilgarriff, A., Pomikálek, J. & Rychlý, P. (2006). "WebBootCaT : instant domain-specific corpora to support human translators". In Proceedings of EAMT 2006: 11th Annual Conference of the European Association for Machine Translation. Oslo. pp. 247-252.

Bernardini, S. (2004). "Corpora in the classroom: an overview and some reflections on future developments". In Sinclair, J. M. (dir.). How to use corpora in language teaching. Amsterdam: John Benjamins. pp. 15-36.

Biemann, C., Bordag, S., Heyer, G., Quasthoff, U. & Wolff, C. (2004). "Language-independent methods for compiling monolingual lexical data". In Computational linguistics and intelligent text processing. Berlin/Heidelberg: Springer. pp. 217-228.

Biemann, C., Heyer, G., Quasthoff, U., & Richter, M. (2007). "The Leipzig corpora collection:

monolingual corpora of standard size". In Proceedings of Corpus Linguistics 2007. Disponible en ligne. http://ucrel.lancs.ac.uk/publications/CL2007

Boulton, A. (2008). "Esprit de corpus : promouvoir l'exploitation de corpus en apprentissage des langues. Texte et Corpus, vol. 3. pp. 37-46.

Boulton, A. (2010). "Data-driven learning : taking the computer out of the equation". Language Learning, vol. 60, n° 3. pp. 534-572.

Boulton, A. & Tyne, H. (2014). Des documents authentiques aux corpus : démarches pour l'apprentissage des langues. Paris : Didier.

Bourigault, D. (2002). "Upery : un outil d'analyse distributionnelle étendue pour la construction d'ontologies à partir de corpus". In Actes de la 9ème conférence annuelle sur le Traitement

Automatique des Langues (TALN 2002). pp. 75-84. Disponible en ligne. http://www.loria.fr/projets/

JEP-TALN/TALN

Bowker, L. & Pearson, J. (2002). Working with specialised language: a guide to using corpora. Londres : Routledge.

Christ, O., Schulze, B. M., Hofmann, A. & König, E. (1999). The IMS Corpus Workbench Corpus Query Processor (CQP): user's manual. Stuttgart: University of Stuttgart.

Davies, M. (2002). Corpus del Español : 100 million words, 1200s-1900s. Disponible en ligne. http://

www.corpusdelespanol.org

Davies, M. (2004). BYU-BNC. Disponible en ligne. http://corpus.byu.edu/bnc/

Davies, M. (2008-). The Corpus of Contemporary American English: 450 million words, 1990-present.

Disponible en ligne. http://corpus.byu.edu/coca/

Davies, M. & Ferreira, M. (2006). Corpus do Português : 45 million words, 1300s-1900s. Disponible en ligne. http://www.corpusdoportugues.org

Eensoo-Ramdani, E., Bourion, E., Slodzian, M. & Valette, M. (2011). "De la fouille de données à la fabrique de l'opinion : enjeux épistémologiques et propositions". Les Cahiers du Numérique, vol. 7, n°2. pp. 15-39.

Fligelstone, S. (1993). "Some reflections on the question of teaching, from a corpus linguistics perspective". ICAME Journal, vol. 17. pp. 97-109.

Foucou, P.-Y. & Kübler, N. (2000). "A web-based environment for teaching technical English". In Burnard, L. & McEnery, T. (dir.). Rethinking language pedagogy from a corpus perspective.

Francfort : Peter Lang. pp 65-74.

Frankenberg-Garcia, A. (2012). "Raising teachers' awareness of corpora". Language Teaching, vol.

45, n° 4. pp. 475-489.

Gavioli, L. (1997) "Exploring texts through the concordancer : guiding the learner". In Wichmann, A., Fligelstone, S., McEnery, T. & Knowles, G. (dir.). Teaching and language corpora. Harlow: Addison Wesley Longman. pp. 83-99.

Gavioli, L. (2005). Exploring corpora for ESP learning. Amsterdam: John Benjamins.

Johns, T. (1990). "From printout to handout: grammar and vocabulary teaching in the context of data-driven learning". CALL Austria, vol. 10. pp. 14-34.

Johns, T. (1997). "Contexts: the background, development and trialling of a concordance-based CALL program". In Wichmann, A., Fligelstone, S., McEnery, T. & Knowles, G. (dir.). Teaching and language corpora. Harlow: Addison Wesley Longman. pp. 100-115.

Kübler, N. (2011). "Working with different corpora in translation teaching". In Frankenberg-Garcia, A., Flowerdew, L. & Aston, G. (dir.). New trends in corpora and language learning.

Londres : Continuum. pp. 62-80.

Kübler, N. & Foucou, P.-Y. (1999). "A web-based language learning environment: general architecture". In Schulze, M., Hamel, M.-J. & Thompson, J. (dir.). Language processing in CALL.

ReCALL. pp 31-39.

Landure, C. & Boulton, A. (2010). "Corpus et autocorrection pour l'apprentissage des langues".

ASp, vol. 57. pp. 11-30.

Léon, J. (2007). "Meaning by collocation: the Firthian filiation of corpus linguistics". In Kibbee, D.

(dir.). Proceedings of ICHoLS X, 10th International Conference on the History of Language Sciences.

Amsterdam: John Benjamins. pp. 404-415.

Maekawa, K., Yamazaki, M., Ogiso, T., Maruyama, T., Ogura, H., Kashino, W., Koiso, H.,

Yamaguchi, M., Tanaka, M. & Den, Y. (2014). Balanced Corpus of Contemporary Written Japanese.

Language Resources and Evaluation, vol. 48, n° 2. pp 345-371.

McEnery, A. & Xiao, Z. (2004). "The Lancaster Corpus of Mandarin Chinese: a corpus for

monolingual and contrastive language study". Communication présentée à LREC 2004. Lisbonne.

Minugh, D. (1997). "All the language that's fit to print: using British and American newspaper CD-ROMs as corpora". In Wichmann, A., Fligelstone, S., McEnery, T. & Knowles, G. (dir.). Teaching and language corpora. Harlow: Addison Wesley Longman. pp. 255-266.

Pearson, J. (1998) Terms in context. Amsterdam : John Benjamins.

Péraldi, S. (2011). Indétermination terminologique et multidimensionnalité dans le domaine de la chimie organique. Thèse de doctorat, Université Paris Diderot.

Renouf, A. (1997). "Teaching corpus linguistics to teachers of English". In Wichmann, A., Fligelstone, S., McEnery, T. & Knowles, G. (dir.). Teaching and language corpora. Harlow: Addison Wesley Longman. pp. 255-266.

Renouf, A. (2003). "WebCorp : providing a renewable data source for corpus linguists". Language and Computers, vol. 48, n° 1. pp. 39-58.

Römer, U. (2006). "Pedagogical applications of corpora: some reflections on the current scope and a wish list for future developments". Zeitschrift für Anglistik und Amerikanistik, vol. 54, n° 2. pp.

121-134.

Scott, M. (2008). WordSmith Tools, version 5. Liverpool: Lexical Analysis Software. Disponible en ligne. http://www.lexically.net/publications/citing_wordsmith.htm

Sinclair, J. (1991). Corpus, concordance, collocation. Oxford: Oxford University Press.

Tadić, M. (2009). New version of the Croatian National Corpus. In Hlaváčková, D., Horák, A., Osolsobě, K. & Rychlý, P. (dir.). After half a century of Slavonic natural language processing. Brno:

Masaryk University Press. pp. 199-205.

Teubert, W. (1999). "Corpus linguistics : a partisan view". TELRI Newsletter, vol. 8. Disponible en ligne. http://telri.nytud.hu/telri2/newsletter/newsl8.html

Tognini-Bonelli, E. (2001). Corpus linguistics at work. Amsterdam: John Benjamins.

Tono, Y. (2011). "TaLC in action: recent innovations in corpus-based English language instruction in Japan". In Frankenberg-Garcia, A., Flowerdew, L. & Aston, G. (dir.). New trends in corpora and language learning. Londres: Continuum. pp. 3-25.

Tyne, H. (2012). "Corpus work with ordinary teachers: data-driven learning activities". In Thomas, J. & Boulton, A. (dir.). Input, process and product: developments in teaching and language corpora. Brno: Masaryk University Press. pp. 114-129.

Zanettin, F. (2002). "Corpora for translation practice". In Yuste-Rodrigo, E. (ed.). Language resources for translation work and research, LREC 2002 Workshop Proceedings. Las Palmas de Gran Canaria. pp. 10-14.

Corpus et outils

AntConc : http://www.antlab.sci.waseda.ac.jp/software.html

Balanced Corpus of Contemporary Written Japanese : http://www.ninjal.ac.jp/english/products/bccwj BNC, Coca, Corpus del Español, Corpus do Portugês : http://corpus.byu.edu/

Business Letter Corpus : http://www.someya-net.com/concordancer COMPARA : http://193.136.2.104/COMPARA/psimples.php?language=en Croatian National Corpus : http://www.hnk.ffzg.hr

Europarl : http://opus.lingfil.uu.se/cwb/Europarl7/frames-cqp.html

IMS Corpus Workbench P7 : https://cwb-test.eila.univ-paris-diderot.fr/ims/index.php

Lancaster Corpus of Mandarin Chinese : http://www.lancaster.ac.uk/fass/projects/corpus/LCMC Leipzig Corpora Collection : http://corpora.uni-leipzig.de

Les Voisins de Le Monde : http://redac.univ-tlse2.fr/voisinsdelemonde SketchEngine : http://www.sketchengine.co.uk

Wall : http://wall.eila.univ-paris-diderot.fr/dyn/Context2 Web as Corpus : http://webascorpus.org

WebBootCaT : http://www.sketchengine.co.uk/documentation/wiki/SkE/Help/WebBootCat WebCorp : http://www.webcorp.org.uk/live

NOTES

1. Langues pour spécialistes d'autres disciplines.

2. La traduction pragmatique, évoquée par Newmark (1988 : 133) se concentre sur l'effet perlocutoire qu'elle a sur le lecteur. La manière dont un texte est traduit dépend du type de lecteur à qui elle s'adresse, ainsi que des objectifs du texte source (Kübler & Aston, 2012).

3. Ce pourcentage est tiré des tests de niveau obligatoire que tous les étudiants de L1 (sauf les étudiants en anglais et LEA) doivent passer en entrant à l'Université Paris Diderot.

4. "Enseigner sur", c'est-à-dire, enseigner la théorie et les principes fondamentaux de la linguistique de corpus.

"Enseigner l'utilisation", à savoir enseigner les aspects concrets, les outils de la linguistique de corpus.

"Utiliser pour enseigner", à savoir créer du matériau pédagogique à partir des corpus.

"Enseigner pour créer des ressources", c'est-à-dire, apprendre à créer des corpus. (notre traduction)

5. Les enseignants ont sans doute besoin d'aide sur la manière d'interpréter les résultats de l'interrogation de corpus.

6. Prenons deux mots, A, B apparaissant chacun un nombre de fois a, b, dans les phrases du corpus et k fois ensemble. Nous calculons la signifiance sig (A, B) de leurs occurrences dans une phrase de la manière suivante. Deux types de collocations sont générés : les collocations basées sur le fait d'apparaître dans la même phrase et celles qui comporte le voisin droit immédiat et le voisin gauche immédiat du mot recherché.

7. Comprendre le sens à partir de la collocation représente une abstraction au niveau syntagmatique. Ça n'est pas directement lié à l'approche conceptuelle ou "idéale" du sens du mot. L'un des sens de night (nuit) est le fait que ce mot a pour collocation idarki (noire); de même pour dark, le fait qu'il peut avoir pour collocat night.

8. La collocation concerne l'occurrence de deux ou plusieurs mots à proximité dans un texte.

9. http://wall.eila.univ-paris-diderot.fr

10. Par ailleurs, ces deux occurrences se retrouvent dans le même article, comme le montre le contexte élargi suivant :(...) écologistes l'" Initiative des Alpes " était soutenue (...) C'est (...) dans le Tessin de langue italienne que l'Initiative a enregistré ses meilleurs scores, avec respectivement 87,6 % et 63,8 % de " oui ".

RÉSUMÉS

Natalie Kübler est Professeur des Universités à l'Université Paris Diderot Paris 7. Ses recherches portent sur la linguistique de corpus, les langues de spécialité, l'apprentissage sur corpus et la traduction spécialisée ; elle s'intéresse particulièrement à la phraséologie en anglais et en français, ainsi qu'à la prosodie sémantique en langues de spécialité. Il y a 20 ans, elle a introduit la linguistique de corpus dans l'enseignement de l'anglais de spécialité à l'Université Paris 13. Par la suite, elle a été la première à introduire la linguistique de corpus dans une formation en traduction spécialisée, il y a presque 15 ans. Aujourd'hui, elle enseigne la linguistique de corpus appliquée à la terminologie et à la traduction spécialisée. Elle dirige par ailleurs le laboratoire CLILLAC-ARP et le Centre de Ressources Informatiques en Langue de l'Université Paris Diderot.

Courriel : nkubler@eila.univ-paris-diderot.fr.

Toile : http://www.eila.univ-paris-diderot.fr/user/natalie_kuebler.

Adresse : Laboratoire CLILLAC-ARP, case 7002, Université Paris Diderot, 8 Place Paul Ricoeur, 75205 Paris cedex 13, France.

Dans cet article, nous posons la question de la formation des enseignants de langues aux spécialistes d'autres disciplines à l'université, à la linguistique de corpus. L'objectif est d'amener les enseignants à adopter une approche lexico-grammaticale pour aborder les questions de lexique, de grammaire, de contenu et de phraséologie dans la langue générale et les langues de spécialité. Nous cherchons à démontrer la nécessité de former les enseignants à l'approche théorique et méthodologique de la linguistique de corpus, afin qu'ils acquièrent des compétences relativement avancées, tant sur les plans théorique, que méthodologique et technique. Cela leur permet ensuite d'utiliser les corpus dans leurs enseignements, soit dans une approche inductive directe avec les étudiants, soit dans une approche indirecte pour préparer du matériau pédagogique.

This paper deals with the issue of training language teachers at university level into adopting a corpus linguistics approach in their teaching. The aim is to help them use a lexcio-grammatical approach in dealing with lexicon, grammar, phraseology, content in general language and in languages for specific purposes. This paper tackles the issue of training language teachers to relatively advanced levels of skills and competences in theoretical, methodological and technical aspects of corpus linguistics. It will be shown that this is needed in order to allow them to use corpora in the classroom, either in a direct inductive approach, or in an indirect approach for preparing teaching materials.

INDEX

Mots-clés : linguistique de corpus, formation des enseignants, acquisition des langues, langues de spécialité

Keywords : corpus linguistics, teacher training, language acquisition, languages for specific purposes

Documents relatifs