• Aucun résultat trouvé

konsé i  na fans‐us 3 2 asymétrique 

2.3 Annotation et repérage des phénomènes remarquables

Après avoir recueilli mes données, je les ai transcrites et annotées. Pour ce faire, j'ai utilisé un éditeur xml69 (c'est-à-dire un format permettant de baliser des textes informatisés) nommé jaxe tel qu’il a été adapté pour le traitement de données plurilingues en situation d'hétérogénéité linguistique et développé dans le cadre du programme ANR CLAPOTY (cf. Vaillant & Léglise (2014) pour le schéma de document « Corpus contact »). J'ai ainsi balisé mes données sous xml grâce à cet éditeur, qui, dans un énoncé où plusieurs langues apparaissent permet d'identifier chacune de ces langues en utilisant des étiquettes pour catégoriser chaque item et préciser à quelle langue il appartient. Quand un même item existe dans au moins deux des langues en contact, il est catégorisé sous jaxe au moyen de l'étiquette « mul », qui indique qu'il peut appartenir à deux ou plusieurs langues (cf. exemples 7 et 8). En 7, je présente un extrait de mon corpus balisé sous XML et en 8 je fournis la visualisation de cet extrait sur le serveur CLAPOTY. Chacune des langues auxquelles les items appartiennent a été précisée dans l'exemple 7 par "fra" (français) et par "pov"70 (créole de Casamance) selon le code-langue ISO (classification proposée par Ethnologue). Ici, les items pouvant appartenir à plusieurs langues sont boŋ/bon et ki/qui comme on peut le voir dans l'exemple 8.

69 Extensible Markup Language ou Langage Extensible de Balisage.

70 Etnologue regroupe sous la même étiquette le créole de Casamance et celui de Guinée-Bissau.

J'utiliserai l'abréviation casa (cf. liste des sigles et abréviations) pour renvoyer au créole de Casamance. Ce choix s'explique par une volonté de faire le distingo entre ces deux créoles qui sont différents.

67

Dès lors, des transcriptions alternatives (précisant à chaque fois la langue à laquelle cet item peut appartenir) sont données (cf. d'autres exemples à propos du génitif et des déterminants en 4.2.2 et 5.2.2.2). Dans le cas de mots mixtes (cf. chapitres 4 et 5), c’est-à-dire constitués d’au moins deux morphèmes de deux langues différentes, la langue d’appartenance de chaque segment composant ces mots mixtes est indiquée grâce aux balises xml.

Certaines occurrences de mon corpus sont donc « flottantes » (Ledegen 2012) entre au moins deux langues. La figure 7 ci-dessous, extraite de la plateforme CLAPOTY, montre que, dans l'ensemble de mon corpus, près de 4% des occurrences du corpus ont été catégorisées comme « mul », c’est-à-dire susceptible d’appartenir à plusieurs langues, ce qui est une proportion très importante.

71 Les gloses et les annotations des exemples de mon corpus sont celles adoptées dans Clapoty. Elles sont

une adaptation des Leipzig glossing rules (cf. liste des sigles et abbréviations).

7.

68

Figure 7. Proportion d’occurrences « mul » dans mon corpus

La figure 8 (cf. ci-dessous), extraite de la plateforme CLAPOTY, représente les occurrences du corpus en fonction de la langue. À côté des trois ensembles (casamançais en rouge, français en bleu, wolof en jaune), on observe quatre cas d’intersections : des mots pouvant être du casamançais ou du wolof (1,16%), du français ou du wolof (0,81%), du français, du casamançais ou du wolof (0,70%) et, enfin, du français ou du casamançais (1,24%). Notons que les occurrences pouvant être du français ou du casamançais sont les plus nombreuses, ce qui est vraisemblablement dû au fait que ces deux langues ont un lexique en grande partie dérivé du latin (cf. plus haut le cas de boŋ/bon dans les exemples 7 et 8).

69

Figure 8. Visualisation des intersections entre langues dans mon corpus

J’'ai également repéré, dans l’ensemble de mon corpus, tous les phénomènes dus au contact de langues ou qui ont suscité mon attention de par leur intérêt linguistique et j’ai annoté sous jaxe ces divers « phénomènes remarquables ». Par « phénomène remarquable », j'entends tous les phénomènes que le chercheur juge intéressants (ou dignes d’un intérêt particulier) – et sur lesquels il souhaiterait travailler. Dans cette perspective, ainsi que l’ont mentionné Léglise & Alby, l’adjectif « remarquable » est pris dans ses deux sens :

Nous utilisons « remarquable » dans les deux sens de l’adjectif : soit les phénomènes observés sortent de l’ordinaire (de la langue ordinaire) – et nous partons d’un sentiment d’écart par rapport à la forme attendue ou de référence (Léglise, 2012) pour qualifier la forme observée de « remarquable », c'est-à-dire digne d’un intérêt particulier, soit les phénomènes observés nous paraissent exemplaires de phénomènes connus et bien décrits dans la

70

littérature sur le contact de langues – et nous partons d’un sentiment de fréquence ou d’exemplarité (Léglise & Alby 2013, 106).

L’intérêt de ce type d'approche est qu’il permet d’éviter

ainsi tous les termes particulièrement foisonnants dans le domaine du contact de langues et très souvent contradictoires (d’un auteur à l’autre ou d’un cadre à l’autre).

Il permet de ne pas entrer dans des débats terminologiques comme ceux qui existent sur la distinction entre emprunt et codeswitching par exemple ou encore calque, interférence ou transfert, etc. (Mackey 1976 ; Sankoff, Poplack & Vanniarajan 1991; Zentella 1997) (Léglise & Alby 2013, 106‑107).

Dès lors,

La position retenue est d’employer des termes les plus « neutres » possibles en regroupant les phénomènes intéressants à observer en méta-catégories regroupées selon leur comportement ou leurs caractéristiques (…) (Léglise & Alby 2013, 107).

C’est ainsi que trois grandes catégories sont retenues : les phénomènes liés à la morphosyntaxe72, les phénomènes liés à l’interaction et ceux qui relèvent du discours.

Les phénomènes liés à la morphosyntaxe, ou Phénomènes Remarquables Morphosyntaxiques (PREMS), constituent le premier niveau de classification des phénomènes remarquables. Une fois qu'on a repéré ces phénomènes, il convient alors d’expliquer ce qui les rend intéressants et de renvoyer aux publications scientifiques qui en font éventuellement état (Léglise & Alby 2013, 108). Les

71

PREMS sont eux-mêmes classés selon les types de constituants de la phrase sur lesquels ils portent : groupe verbal, groupe nominal, ou groupe adpositionnel.

Après cette première classification, on décrit, analyse et explique alors les différents « phénomènes remarquables » observés en fonction des différentes catégories établies. Pour ce faire, une « méthode d’analyse multi-niveaux a été proposée » (Léglise & Alby 2013, 112) pour chacune des différentes catégories de phénomènes remarquables proposées. Dans ce type de démarche, qui se veut être du « pas à pas », il s’agit de montrer que les phénomènes observés dépassent la seule explication de transfert. L’hypothèse est que plusieurs facteurs interviennent dans les formes linguistiques observées et on s'emploiera donc à mettre en lumière le fait que ces niveaux interagissent et la façon dont ils le font, en focalisant l’analyse sur la sphère du « micro du micro » (Léglise & Alby 2013, 116) c’est-à-dire sur les détails des constructions linguistiques observées. Tous ces modes descriptifs, qui ne sont en réalité réalisés qu’à minima, permettent de montrer qu’une transcription pouvait être alternative (cf. figure 7 pour la proportion de ces éléments dans mon corpus), suscitant ainsi certaines interrogations chez le linguiste.

Une fois que j'ai effectué le repérage des phénomènes remarquables et que j'ai annoté mon corpus sous jaxe, je l'ai passé sous un outil qui permet de le visualiser et de faire des recherches à différents niveaux (parties du discours, traduction juxtalinéaire, etc.). C'est ainsi que j'ai pu avoir une vision générale de tous les « phénomènes remarquables » que j'avais annotés. Dès lors, il ne me restait plus qu'à prendre du recul par rapport à mon corpus afin de passer en revue lesdits « phénomènes remarquables ». Au fur et à mesure que je repérais un phénomène de contact que je jugeais intéressant, je revenais vers mon corpus en faisant un zoom sur ce phénomène, c'est-à-dire que je faisais une recherche automatique sur ledit phénomène afin de voir de plus près son comportement dans mon corpus et de l'étudier éventuellement. Une fois ce travail terminé, j'ai utilisé un concordancier multilingue sur la plateforme CLAPOTY (cf. Vaillant &

72

Léglise 2014) pour effectuer une recherche des différents « phénomènes remarquables » déjà annotés dans leur contexte et dans l'ensemble des textes qui constituent mon corpus afin de voir si leur usage était fréquent. Dans le cadre de cette thèse, je n’ai ainsi pas exploité tous les « phénomènes remarquables » observés dans mon corpus. En effet, certains « phénomènes remarquables » qui avaient attiré mon attention lors de l'annotation de mon corpus, se sont révélés moins intéressants que prévu du point de vue scientifique tandis que d’autres étaient trop peu fréquents pour justifier un traitement statistique global.