c) Données relatives à des thèmes ciblés
2.4.2.3 Synthèse quantitative des données
Tous types de données confondus, cette grammaire se base ainsi sur 2835 entrées (phrases) non enregistrées, 2h33 d’enregistrements, ainsi que deux lexiques totalisant chacun 1270 et 2360 entrées (mots).
2.4.2.4 Discussion à propos des données
Lors des premières semaines passées au village de TD, une des difficultés fut de rencontrer des locuteurs disponibles et suffisamment à l’aise pour accepter d’enregistrer des textes spontanés. Certains textes très courts, n’atteignant guère une minute, ont pu être enregistrés dans un premier temps. Puis, la famille d’accueil a initié une rencontre avec Mign Kewec (voir son portrait en section 2.3.4.2-d), réputée pour ses qualités d’oratrice. Plusieurs textes ont ainsi été enregistrés avec cette locutrice. Cependant, ses récits étaient déclamés dans un registre de langue particulier propre aux conteurs, très stylisé, mobilisant un vocabulaire peu connu des autres locuteurs. Cette locutrice n’ayant pas de temps à consacrer à des sessions de transcription et de traduction, la plupart de ses textes ont été très difficiles à transcrire, à traduire et à analyser, c’est pourquoi ils sont peu exploités dans cette thèse.
Ce n’est qu’en fin de troisième et dernier séjour que des locuteurs se sont présentés spontanément avec la volonté d’être enregistrés. Cependant, le temps restant n’a pas permis de les transcrire et de les traduire sur place.
Des difficultés de transcription sur des textes moins stylisés ont également été rencontrées. Ces difficultés sont vraisemblablement internes à la langue, celle-ci étant très sensible au contexte discursif. La compréhension et l’interprétation de l’information est fréquemment basée sur des inférences relatives au contexte d’énonciation, notamment en
I - Chapitre 2 | Terrains et méthodologie
61
raison de l’omniprésence d’ellipses. Ainsi, hors contexte d’énonciation, les informatrices principales ont parfois manifesté leur difficulté à répéter certaines phrases ou à les comprendre.
Un premier travail basé sur l’histoire de la grenouille (Frog where are you ?), a révélé l’efficacité de cette méthode d’élicitation : ce type de matériels, plus confortable pour les informatrices principales, favorisait une meilleure qualité de transcription et de traduction. Les textes issus d’élicitations basées sur stimuli visuels ont ainsi pu être travaillés plus en profondeur que les textes spontanés. C’est pourquoi ils sont les plus représentés dans cette thèse. Les résultats d’analyses, notamment en termes de nombre d’occurrences de certaines structures ou items au sein du corpus, sont donc certainement influencés par la prédominance de ce type de données.
Pour ce qui est des élicitations directes, un corpus basé sur les cours de khmer102 a été assemblé lors du premier terrain. Au cours de cette collecte, la méthode d’élicitation à partir du khmer a révélé son inefficacité : les données ainsi obtenues s’avéraient peu fiables, en raison de la tendance des informatrices à formuler des traductions mot à mot du khmer vers le stieng. Par conséquent, lorsque notre maîtrise de la langue stieng fut suffisante, les élicitations directes ont été formulées directement en stieng, sur la base de traductions préalablement préparées, à partir du khmer ou d’autres langues.
2.4.3 Saisie et traitement des données
La plupart des textes ont été transcrits et traduits sur place avec l’aide d’une des deux informatrices principales et d’un interprète.
Les transcriptions des premiers textes ont été réalisées avec l’aide des informatrices principales : au moyen d’un lecteur audio doté d’un haut-parleur, chaque texte a été écouté en deux étapes, d’abord dans son ensemble, puis phrase par phrase, chacune de ces phrases étant répétée mot à mot par l’informatrice afin de faciliter la transcription.
Une traduction mot à mot du stieng au khmer a été réalisée, suivie d’une traduction d’ensemble pour chaque phrase. Les traductions du khmer au français, quant à elles, ont été effectuées avec l’interprète et vérifiées avec l’aide de Lim Im, traducteur-interprète professionnel à Phnom Penh.
Une grammaire de la langue stieng
62
Lors du dernier terrain, notre maîtrise de la langue le permettant, les transcriptions et certaines traductions ont été effectuées en ville de façon individuelle, puis vérifiées avec les informatrices.
La saisie des données a été réalisée au moyen de différents outils, selon le type de données collectées. Les textes spontanés et descriptifs, ainsi que les données issues des matériels Put and Take et Trajectoire ont été saisie dans le logiciels Flex. Les élicitations ont été saisies sous Word et seront transférées dans Flex ultérieurement. Certains échantillons de données spécifiques tels que le lexique, les données Trajectoire, Put and Take, ou le corpus ciblé sur les classificateurs et les mots composés ont par ailleurs été saisis sous Excel afin de permettre un tri et une analyse quantitative.
2.5 Travail de terrain et données : synthèse
Les travaux de terrain et le traitement des données ont été menés dans un contexte de double encadrement par les axes DTV et LED-TDR du laboratoire DDL.
L’équipe DTV préconise un travail basé sur des données naturelles de différents types, aussi fiables que possible. Elle encourage l’utilisation de matériels d’élicitation basés sur des stimuli, dans une perspective translinguistique afin de favoriser les discussions typologiques. Elle offre un cadre pour l’utilisation des logiciels de traitement de données et l’analyse des données.
L’équipe LED-TDR, quant à elle, reconnait l’extrême difficulté du terrain103
. Elle offre ainsi un espace de discussion permettant de mettre au jour de nouvelles alternatives et de nouvelles solutions pour optimiser les conditions de terrain, surtout lorsqu’il est question de langues en danger. Dans ce contexte, elle propose l’accompagnement et le soutien nécessaires pour la préparation des séjours de collectes de données.
Dans ce cadre, ce travail s’est effectué sur la base d’une évaluation réaliste du degré de vitalité de la langue, fondée sur des observations de terrain et des enquêtes effectuées auprès des locuteurs. Le chapitre suivant traite précisément du degré de vitalité de la langue stieng et de son évaluation en tant que langue en danger.