Enregistrements et transcriptions - Collecte des données

4. M ÉTHODOLOGIE ET DESCRIPTION DU TERRAIN

4.2 Collecte des données

4.2.1 Enregistrements et transcriptions

Le cœur de la collecte de données pour cette recherche correspond aux enregistrements des séances de médiation, suivant les méthodes préconisées par Sacks (1995). En effet, l’analyse de conversation, telle que Sacks l’a conçue avec d’autres, comme Gail Jefferson (Sacks, Schegloff et Jefferson, 1974 ; Lerner, 2004) et Emanuel Schegloff, repose sur l’enregistrement audio de conversations. Depuis, d’autres chercheurs ont enrichi ce mode de collecte de données en réalisant des enregistrements d’images et de sons. Candy et Charles Goodwin, au début des années 70, ont filmé des repas de famille, données qui ont été utilisées par la suite par Jefferson,

Sacks et Schegloff pour leurs propres recherches (Mondada, 2012). Avec l’évolution de la technologie, les moyens techniques se sont miniaturisés, rendant plus facile ce type de collecte de données. Il n’en reste pas moins que la présence non cachée d’une caméra peut évidemment modifier le comportement des sujets (Lindlof et Taylor, 2010). On peut arguer cependant que la prolifération d’enregistrements au quotidien rend les individus moins surpris par la présence de ce type de procédé.

La collecte des données en analyse de conversation se fait en deux temps : il s’agit d’abord de recueillir les données en les enregistrant sous format audio ou vidéo et ensuite de retranscrire les interactions verbales par écrit, selon un protocole précis (Hepburn et Bolden, 2013). En ce qui concerne la présente étude, les séances de médiation ont été enregistrées en format vidéo, grâce à deux caméras posées (plus ou moins dos à dos) sur la table de réunion. Chaque caméra était placée dans la direction du médiateur et d’une des deux parties tandis qu’une seconde enregistrait l’autre partie. Les deux caméras étaient placées à hauteur du buste des individus filmés. Les caméras étaient statiques.

Au montage, les deux images ont été placées sur un même écran afin de permettre l’observation simultanée et mieux discerner les interactions (voir figure 5, ci-dessous).

Figure 5 Vidéogramme d’une session de médiation.

Note : De gauche à droite la mère du citoyen, le citoyen, son avocate, la médiatrice et la représentante de l’institution. Les deux images vidéo sont montées (identifiées par un carré en tirets rouge ou bleu) côte à côte.

Cette démarche a permis une analyse des gestes et prises de paroles de chacun, dont l’objectif était de révéler les dynamiques interactionnelles liées à l’écoute. Il est toutefois essentiel de noter combien des éléments hors champ ont pu parfois jouer sur les données recueillies. La prise de notes d’observation a pu ainsi pallier ces « trous » d’information. Par exemple, pendant la captation de la médiation de Doug1, un employé du tribunal a frappé à la porte et apporté des verres et une carafe d’eau qu’avait réclamés la médiatrice. Ce moment ne dure que quelques secondes, mais l’interruption déstabilise le citoyen qui oublie ainsi de mentionner un élément de son dossier. Cette omission va resurgir en fin de séance, l’écoute de la séance aura donc été bousculée par un petit moment hors champ (visuel).

L’angle et la hauteur des caméras jouent également sur notre manière d’aborder les médiations, tout comme le volume sonore des enregistrements. Il y a des paroles qui nous échappent, des participants qui marmonnent ou bien se trouvent dos aux caméras. Les moments inaudibles (notés par des XXXXX) sont également dus à des chevauchements de paroles, des bruits de mobilier, etc. La captation a et aura toujours ses limites et un parti-pris, pas toujours choisi ou conscient, du chercheur.

Une fois les images montées, j’ai ainsi pu retranscrire les enregistrements selon les conventions mises en place par Jefferson (Lerner, 2004), des conventions permettant de signaler des dimensions de la conversation que les codes habituels de l’écriture n’expriment pas. De nombreuses informations sont ainsi rendues lisibles, tels que la durée des silences entre deux prises de parole, les chevauchements de paroles, jusqu’à l’inflexion des voix ou les sons non verbaux. Ces conventions de transcription donnent du relief aux données sans qu’on ait besoin de nécessairement retourner aux enregistrements (Hepburn et Bolden, 2013). Par ailleurs, elles permettent aussi de préciser les gestes ou activités des participants dans le contexte de ces médiations (par exemple, lorsqu’ils se mettent à chercher un document dans la pile de papiers qu’ils ont devant eux ou lorsqu’ils se tournent vers quelqu’un). Dans la mesure où tout peut être signifiant, ces aspects non verbaux peuvent éventuellement avoir un rôle non négligeable par rapport à la question des marqueurs d’écoute.

En analyse de conversation, de nombreuses manières d’expliciter les actions visibles des participants sont employés : les commentaires dans les transcriptions qui sont signalées par des

Certains ont même recours à des partitions de musique (Erickson dans Tannen, Hamilton et Schiffrin, 2015). Tout ceci dépend de l’objet de recherche et de la perspective théorique choisie. Dans la présente recherche, l’essentiel des explicitations des gestes a été indiqué en les annotant dans la transcription à l’intérieur de doubles parenthèses.

Certains vidéogrammes sont insérés dans les transcriptions comme complément à la description et servent comme pense-bête pour les analyses, sans y être reproduits. Ils sont utiles pour situer des objets, mais aussi comprendre des émotions (Ruusuvuori, 2013 ; Kaukomaa, Peräkylä, Ruusuvuori, 2015) autant que les positionnements, regards et gestes de participants. Ils ne figurent pas dans la thèse elle-même, mais ont fait partie des outils employés dans le processus d’analyse, comme complément aux descriptions des gestes.

Pour Ten Have (2007), l’apport de la vidéo est superflu et les annotations issues d’enregistrements sonores suffisent. La perspective logocentrée de Ten Have minimise l’effet d’un roulement d’yeux ou d’un haussement d’épaules sur les interactions dans un contexte tendu comme peut l’être une séance de médiation, ou encore l’importance des interactions des participants avec des objets (documents). Un second contre-argument à Ten Have (2007) se trouve dans les travaux du couple de médiateurs Haynes et Haynes (1989) qui annotent systématiquement la manière dont se tiennent les médiés, ainsi que leurs propres gestes de médiateur ou même la part des objets dans les interactions tels que l’usage d’un tableau. Leurs transcriptions sont agrémentées de notes de bas de page où se trouvent les commentaires sur les gestes sous l’acronyme BL (« body language »). Ces éléments font parfois basculer les interactions. Ces raisons me convainquent de l’apport de l’enregistrement vidéo pour analyser les données.

En défense ultime de l’utilisation de la vidéo, je reviens à la première page de cette thèse où j’ai évoqué le passage du scénario à l’image filmée lors du montage d’un long métrage de fiction. Je pense que cette remarque s’applique ici. Le « trou » d’information sur l’écoute entre le scénario/la transcription et l’image filmée n’est pas négligeable. La transcription ne laisse que peu filtrer la dimension auditive de la session. Une dimension clef de la communication— l’écoute—est ainsi aplatie par cette transposition sur papier des interactions. Il n’en reste pas moins que la transcription sert de « lingua franca » pour le travail de recherche.

Dans le document D’autres voix que la sienne ; Manières de se faire écouter, modes d’écoute : une étude des marqueurs d’écoute en séances de médiation (Page 83-87)