• Aucun résultat trouvé

4 Langues et données :

4.3 Présentation des données exploitées

Pour cette recherche, nous nous sommes efforcée de construire un corpus parallèle de données dans les deux langues étudiées, afin de pouvoir comparer les différents phénomènes syntaxiques.

Pour le salar, nous avons suivi le système de transcription phonologique proposé par Dwyer (2007), basé sur l’alphabet phonétique international. Pour le tibétain, nous avons choisi de privilégier, dans un premier temps, une transcription orthographique, basée sur l’étymologie des formes. Bien que jugées peu orthodoxe par les personnes lettrées qui préfèrent la langue littéraire proprement dite, il existe en effet des pratiques de mise par écrit de la langue parlée, en particulier dans les nouvelles technologies. Dans cette transcription orthographique, nous avons cherché à rester aussi proche que possible des formes parlées, tout en respectant l’orthographe littéraire chaque fois que cela était possible. Nous l’avons ensuite complétée par une transcription phonologique, seule à même de rendre compte des phénomènes morpho-phonologiques de la langue, tels que la fusion phonologique de plusieurs morphèmes, devenus non-segmentables en synchronie ou les homophonies, etc.

Le corpus analysé est composé d’une première partie d’énoncés isolés ou de suites de moins de dix énoncés, recueillis par élicitation ciblée sur des points grammaticaux précis. Une seconde partie rassemble des transcriptions de récits plus longs, recueillis sur la base de récits en images, et enfin d’explications et de récits libres. Lors de la transcription, les propositions formant des énoncés complexes ont été isolées, c’est pourquoi le volume de chaque sous-partie du corpus sera indiqué en termes de nombre de propositions175. Les métadonnées concernant les locuteurs de salar et de tibétain seront présentées dans deux tableaux en fin de chapitres, et reproduits en annexe 2.

4.3.1 Élicitation d’énoncés simples

Tout d’abord, le corpus nommé « constructions syntaxiques simples A » rassemble des énoncés, recueillis à l’aide d’un ensemble de cinquante-six images (photos et dessins, en couleurs pour la plupart), présentés aux locuteurs sur écran (diaporama) ou sur papier, en fonction de l’aisance des locuteurs interrogés face à un écran. La plupart du temps, une image correspond à un ou deux énoncé(s), rarement davantage. Cet ensemble d’images visait à éliciter des constructions syntaxiques simples (sans marque de diathèse ou voix), afin de faire ressortir les classes actancielles des verbes. Les images présentées ont donc été choisies pour

175

illustrer les diverses catégories sémantiques d’évènements. Pour ce choix, nous nous sommes basée sur la liste de verbes définis par le projet de Leipzig sur les classes actancielles (Leipzig Valency Classes Project, Comrie & Malchukov 2010), ainsi que sur les classes de verbes déterminées pour les langues tibétiques. Les images proposées représentent donc des évènements :

- plus ou moins contrôlables et contrôlés, - impliquant un nombre variable de participants,

- impliquant des participants plus ou moins affectés par l’évènement, - réciproques, réfléchis, causatifs etc.

- d’une manière générale comportant des participants qui jouent différents rôles sémantiques susceptibles d’être grammaticalisés de façon diverse selon les langues. Ce diaporama a été soumis à treize locuteurs salarophones et treize locuteurs tibétophones, hommes et femmes, âgés de neuf à quatre-vingt-six ans au moment des enregistrements, et vivant à Hualong (Chumar, Ashnu/Ahngön et Kando) et à Xunhua (Dowi). Les images de ce diaporama sont reproduites en annexe 3.

Le corpus nommé « constructions syntaxiques simples B » a été élicité à l’aide de vingt-cinq séries de dessins en noir et blanc, sous forme de bande dessinée sans texte représentant un court récit, et présentées sur papier. Il s’agit principalement d’images initialement élaborées pour la rééducation des personnes atteintes d’aphasie176. Ces images ont été retenues car elles représentent de façon simplifiée mais réaliste des actions quotidiennes en décomposant précisément les sous-évènements, ce qui rend leur interprétation relativement simple, même pour des personnes peu familiarisées avec la lecture d’images. Un tri a dû être opéré pour ne conserver que des séquences culturellement les moins marquées, et qui pouvaient donc être interprétées sans trop de difficulté par les locuteurs. La sélection des séquences d’images a également visé à illustrer des types sémantiques d’évènements variés. Nous avons donc sélectionné neuf séries de trois images, et onze séries de six images, que nous avons complétées par cinq séries de deux images, issues d’autres sources. L’ensemble de séquences d’images utilisées est également reproduit en annexe 3.

Des difficultés ont été rencontrées avec les locuteurs analphabètes, ou alphabétisés uniquement en arabe. Certaines personnes analphabètes ne comprenaient pas que les images étaient logiquement liées entre elles et que leur alignement sur la page représentait le déroulement temporel du récit. De même, certaines personnes alphabétisées uniquement en

176 Ces bandes dessinées sont en libre accès sur le site Internet suivant (dernier accès le 23/07/2015) : http ://www.orthoedition.com/temporel2.php.

arabe lisaient les séquences d’images de droite à gauche, et non de gauche à droite. Elles ne pouvaient donc pas établir de lien logique entre les images. Pour cette raison, les données enregistrées pour certains locuteurs n’ont pas pu être exploitées et ont été écartées du corpus.

Nous avons enregistré dix locuteurs salarophones et sept locuteurs tibétophones, parmi ceux enregistrés pour le corpus « constructions simples A ». Pour les raisons détaillées précédemment, nous n’avons pas systématiquement présenté l’ensemble des bandes dessinées aux locuteurs, mais parfois restreint l’enregistrement aux séries plus courtes, ou à celles qui leur semblaient les plus « parlantes ».

Dans cette étude, les énoncés utilisés comme exemples qui proviennent de l’un ou l’autre de ces deux corpus sont nommés CONSTR SIMPLES, suivi du numéro attribué au locuteur, et du numéro d’énoncé dans le corpus. Ainsi, la mention SAL CONSTR SIMPLE 6/754 signifie que l’énoncé est le 754ème énoncé du corpus « Constructions Simples » en salar, et qu’il a été prononcé par le locuteur 6. Un tableau récapitulant les informations sociolinguistiques détaillées pour chaque locuteur, ainsi que le lieu et la date d’enregistrement est fourni en 4.3.4. Au total, ce corpus est composé d’un peu plus de deux-mille propositions en salar, et d’environ mille-huit-cent propositions en tibétain.

Nous avons également cherché à éliciter spécifiquement les voix réciproque et applicative. Pour cela, nous avons soumis le questionnaire sur les constructions réciproques, élaboré par le Max Planck Institut177 à deux locuteurs salarophones de Jishi, et trois locuteurs tibétophones de Dowi, dans le district de Xunhua. Ce questionnaire se compose de soixante-quatre vidéos visant à explorer les sous-domaines sémantiques de la vaste catégorie des évènements réciproques. Pour la voix applicative (bénéfactive), nous nous sommes basée sur une série de six photographies (reproduite en annexe 3) illustrant des évènements où un participant agit pour un autre. Ce document a été utilisé comme aide pour l’élicitation d’exemples après d’un locuteur de chacune des deux langues étudiées, mais n’a pas fait l’objet d’enregistrements audio systématiques.

En salar, nous avons élicité de façon plus précise la morphologie des marques casuelles et des marques de coordination des proposition en utilisant un ensemble de cartes représentant des personnages, des objets et des actions, qui peuvent être disposés par le chercheur ou par le locuteur pour représenter un évènement ou une suite d’évènements exprimés verbalement :

177 Téléchargeable sur le site suivant : http ://fieldmanuals.mpi.nl/volumes/2004/reciprocals/ (dernier accès le 23/07/2015).

Fig. 4.2 Zenebe a peur des serpents

‘Zenebe a peur du/des serpent(s)’

Fig. 4.3 Abudu achète un chapeau

‘Abudu achète un chapeau et le donne à Junus.’

A l’origine, ce matériel a été élaboré par K. Sardinha à l’Université de Colombie Britannique sous le nom de « Story-builder Picture Cards »178. Nous avons adapté et complété ces cartes : des cartes « objet » ont été élaborées sur une base phonologique. Ainsi, le nom en salar des objets représentés tente d’épuiser les possibilités de rime et de coda dans la langue (d’après Dwyer 2007). De la même façon, à chacun des personnages des cartes a été attribué un nom propre ou un nom de fonction visant à représenter le maximum de diversité des possibilités phonologiques de la langue. Cela, dans le but de repérer les éventuelles allomorphies déclenchées phonologiquement.

178 Sous licence Creative Commons, autorisant l’utilisation et l’adaptation libre dans un cadre non-commercial : http ://www.story-builder.ca/ (dernier accès le 23/07/2015).

Tableau 4.2 Mots salars testés en fonction de la coda de leur dernière syllabe

CODA salar traduction179

bojə

naŋ-dər-mə

araignée quelque-chose -a

ja

ʈa

Marija

arc thé NP (f) -e

yiɣne

Zenebe

Documents relatifs