• Aucun résultat trouvé

La constitution d'un corpus vidéo-enregistré de réunions professionnelles. Carnet de recherche

N/A
N/A
Protected

Academic year: 2021

Partager "La constitution d'un corpus vidéo-enregistré de réunions professionnelles. Carnet de recherche"

Copied!
18
0
0

Texte intégral

(1)

La constitution d'un corpus vidéo-enregistré de

réunions professionnelles. Carnet de

recherche

Jérôme JACQUIN & Sabrina ROH Université de Lausanne

The paper documents the constitution of a video-recorded corpus of work meetings, accumulating 19 events, 23h of recording and 45 participants. This research log is not intended to be a manual or a model, but rather an account of the challenges, problems, and solutions that have been found, with the aim of drawing attention to some aspects and dimensions where particular vigilance is required, whether being the quality of the data to be gathered, the efficiency of the adopted procedures, or the respect of ethical and legal standards. After general considerations on the research project and its theoretical underpinnings regarding the data to be considered, the paper describes the different stages in the constitution of the corpus: prospecting, recording, assembling, transcribing, and sharing.

1. Introduction

La présente contribution se présente comme un carnet de recherche visant à documenter la constitution d'un corpus de réunions professionnelles vidéo-enregistrées, pour un total de 19 événements, 23 heures d'enregistrement et 45 participant·e·s. Il ne s'agit pas ici de proposer un manuel ou un modèle, avec des recettes toutes faites à appliquer, mais plutôt de décrire les défis, problèmes et solutions trouvées, dans l'idée d'attirer l'attention des personnes intéressées sur certains points et aspects où une vigilance nous semble de mise, qu'il s'agisse de la qualité des données visée, de l'efficacité des procédures mises en œuvre ou du respect des normes éthiques et légales.

Le corpus dont il est question participe d'un projet de recherche financé par le Fonds National Suisse de la recherche [PZ00P1_168033] et portant sur l'étude multimodale de marqueurs épistémiques du français (p. ex. JE PENSE, JE SAIS, PEUT-ÊTRE) et de leur relation aux positions épistémiques (savoir, ne pas savoir, douter) prises par les participant·e·s dans des interactions institutionnelles se déroulant dans des contextes associatifs ou professionnels. Débuté en été 2017, le projet a notamment pour objectif de constituer un corpus de réunions d'entreprise à contraster avec des données documentant des débats publics et télévisés (n=10, env. 11h d'enregistrements). La base de données CLAPI (Corpus de LAngue Parlée en Interaction1) hébergée à

l'ENS-1 Selon son propre descriptif, "CLAPI […] est une banque de données multimédia de corpus

(2)

Lyon au sein du laboratoire ICAR (Interactions, Corpus, Apprentissages, Représentations) est la seule qui à notre connaissance contient des données disponibles et analogues à celles visées dans le cadre du présent projet. Les réunions professionnelles filmées sont toutefois très minoritaires (environ 3h sur les 63h interrogeables). Notons finalement que si le projet dont il est question ici a débuté en 2017, il a été soumis et accordé en 2016, donc préalablement à la mise en œuvre des nouvelles réglementations du Fonds National Suisse de la recherche en matière de constitution, gestion et partage des données de recherche2. Ces questions ont toutefois été anticipées et elles sont discutées à

la fin du présent texte.

La Section 2 revient sur les spécificités du recueil de données naturelles en comparaison d'autres approches théoriques et méthodologiques. La Section 3 retrace la constitution du corpus, allant du démarchage aux questions de partage et de distribution. La Section 4 conclut la contribution en la résumant à grands traits et en remettant le propos en perspective.

2. Données naturelles et corpus multimodaux

Avant d'en venir aux étapes de constitution du corpus, il n'est pas inutile de rappeler brièvement les raisons qui justifient d'entamer un tel processus, coûteux à plusieurs égards, notamment en temps et en énergie: pourquoi recueille-t-on des données naturelles, et de surcroît multimodales ?

Une première façon de répondre est d'avancer qu'il s'agit de la manière la moins réductrice d'accéder au langage tel qu'il émerge naturellement dans sa complexité, tel qu'il est utilisé et structuré effectivement dans la vie de tous les jours. Grossièrement résumé à partir des réflexions de Mondada (2010, 2013), les enregistrements dont on parle ici s'écartent

de l'introspection, où le·la chercheur·se se fonde sur ses connaissances, parfois même ses souvenirs, pour imaginer le langage tel qu'il est pratiqué; • des notes de terrains, où le·la chercheur·se reconstruit, à partir d'une

sélection d'informations consignées, le langage tel qu'il est pratiqué;

des interviews, où le·la chercheur·se fonde sa description sur les pratiques déclarées et donc rationalisées a posteriori par des informateur·rice·s (donc sur des représentations);

des expériences, où le·la chercheur·se place ses informateur·rice·s dans un contexte particulier, artificiel ou du moins extrêmement contrôlé.

institutionnelles ou privées, commerciales, didactiques, médicales [...] et un ensemble d'outils de requêtes" http://clapi.ish-lyon.cnrs.fr, consulté le 26 mars 2018.

2 http://www.snf.ch/fr/leFNS/points-de-vue-politique-de-recherche/open_research_data/Pages/

data-management-plan-dmp-directives-pour-les-chercheuses-et-chercheurs.aspx (consulté le 22 mars 2018).

(3)

Ces différentes pratiques, qui peuvent s'avérer adéquates selon l'objectif poursuivi, trouvent rapidement leurs limites à partir du moment où l'on cherche à accéder au langage tel que les gens l'expérimentent eux-mêmes dans des contextes naturels, notamment dans leurs dimensions spatiale et temporelle. Les pratiques listées ci-dessus assument en effet une simplification radicale, qu'il s'agisse de simplifier le langage observé, le contexte ou les deux.

Enregistrer des données "naturelles" au travers d'un travail de terrain revient donc à chercher à se donner les moyens de saisir les formes et processus linguistiques de manière précise, dans le détail qui les caractérise et dans leur indexicalité, c'est-à-dire leur articulation dynamique avec les circonstances, linguistiques ou plus généralement multimodales, de leur énonciation (Duranti & Goodwin 1992; Heritage 1984). Dans cette perspective et suivant Mondada (2013), les enregistrements dont on parle ici visent à préserver à la fois:

a. l'écologie de l'interaction, c'est-à-dire son caractère toujours dynamique et temporellement et spatialement reconfigurable;

b. la séquentialité des actions, c'est-à-dire leur déploiement temporel à la fois dans leur émergence propre et relativement à ce qui précède et ce qui suit; c. le cadre de participation, c'est-à-dire en abordant les actions comme des contributions à l'interaction interpersonnelle (qui parle à qui et possiblement devant qui ?).

Cette idée de préservation, avec tout ce qu'un tel mot présuppose, n'est pas une exagération et les enregistrements dont il est question ici visent bien à perdre le moins d'informations possible. Et si ces enregistrements multimodaux se généralisent actuellement (e.g. Adolphs & Carter 2013; Allwood 2008; Mondada 2006, 2013), c'est bien parce qu'ils permettent cette appréhension plus naturelle, plus complète de la manière dont les phénomènes, linguistiques ou non, émergent, sont produits et interprétés3. De tels corpus intègrent ainsi

un objectif de vérification ou de mise à l'épreuve de la littérature à l'aune de l'usage effectif (voir p. ex. Auer & Pfänder 2011; Jacquin 2017; Pekarek Doehler, De Stefani & Horlacher 2015).

Il serait toutefois naïf d'appréhender les données ainsi construites comme étant transparentes et les corpus ainsi constitués comme relevant de simples "réservoirs d'attestations", selon les mots de Rastier (2004). Suivant une perspective praxéologique, que nous adoptons ici, les corpus sont des outils d'exploration au sein desquels les données sont activement élaborées de manière à leur assurer une certaine homogénéité et représentativité (pour une discussion sur ce point, voir Jacquin 2013). En facilitant la constitution de collections de phénomènes émergeant dans des contextes analogues

3 Il s'agit donc de procéder à un "recueil de données en situation d'activité non orchestrée par le chercheur et non provoquée par ses consignes. Il s'agit d'activités telles qu'elles ont lieu de manière ordinaire, même en l'absence du chercheur" (Baude et al. 2006: 50).

(4)

soigneusement documentés (par exemple tous les "je pense" apparaissant en fin de tour de parole), on cherche à dégager des régularités et ainsi à dépasser la critique, souvent entendue, que donner une importance théorique et méthodologique capitale aux environnements séquentiels et multimodaux au sein desquels les occurrences étudiées émergent, multiplie les variables, entraîne trop de complexité et conduit in fine à un réductionnisme contextuel et des analyses paraphrastiques. Il s'agit précisément de se donner les moyens de décrire les ressources linguistiques en tant qu'elles ne constituent pas des formes abstraites et décontextualisées, mais des pratiques dont la dimension située (séquentielle, interactionnelle, potentiellement multimodale) est essentielle (Mondada 1995).

3. Étapes de constitution et solutions/stratégies trouvées

Les pages qui suivent présentent et détaillent les choix et procédures ayant présidé et accompagné la constitution d'un corpus de réunions professionnelles francophones. Le travail réalisé tout comme la restitution qui en est faite ici s'inspirent des mines d'informations que sont la plate-forme web CORINTE4

(élaborée par le groupe ICOR du laboratoire ICAR; voir note 1) et le document collectif librement accessible Corpus oraux, guide des bonnes pratiques 2006 (Baude et al., 2006). On passera donc en revue les thématiques que sont le pré-démarchage (3.1), le démarchage (3.2), l'enregistrement (3.3), la confection (3.4), la transcription (3.5), le partage et la diffusion (3.6), en cherchant à chaque fois à mettre en relation les choix et stratégies adoptés avec les objectifs du projet ainsi qu'avec les enjeux plus généraux relatifs au type de démarche exemplifié ici.

3.1 Pré-démarchage

3.1.1 Définition du champ d'investigation

La démarche présentée ici contribue à l'analyse du langage au travail, champ de recherche qui s'est progressivement consolidé dès les années 1990 (voir notamment Arminen 2005; Borzeix & Fraenkel 2001; Drew & Heritage 1992; Filliettaz & Bronckart 2005; Sarangi & Roberts 1999). La phase de constitution du corpus n'est pas épargnée par les spécificités du domaine professionnel, que l'on peut résumer en différents paramètres qui vont tous jouer un rôle déterminant pour l'accessibilité du terrain par l'équipe de recherche: l'activité laborieuse; le statut professionnel, les types de professions et le rapport à l'entreprise; le temps de travail et la rémunération; l'espace de travail (De Coster 1998: 34‑37).

Concrètement, nous pouvions anticiper, avant même de nous engager dans le démarchage à proprement parler, le fait que nous allions devoir négocier avec

(5)

des organismes privés caractérisés (1) par la recherche d'une viabilité ou d'une rentabilité économiques, voire d'un véritable retour sur investissement, (2) par des structures décisionnelles et plus généralement organisationnelles relativement rigides, et (3) par un fonctionnement en partie opaque, notamment pour des raisons de confidentialité industrielle et commerciale.

Ce faisant, et en raison d'échecs répétés lors de projets précédents, nous avons très rapidement tiré un trait sur les grandes entreprises et multinationales disposant de services RH, juridiques ou de communication rompus à la pratique de faire barrage à toute initiative relevant, dans leur perspective, d'une intrusion superflue dans l'entreprise. Il nous fallait donc des entreprises où il semblait réaliste d'entrer en contact avec la direction. Nous nous sommes donc concentré·e·s sur les Petites et Moyennes Entreprises (PME) jusqu'à 100 employé·e·s et actives dans le canton de Vaud.

3.1.2 Matériel élaboré en amont

Par ailleurs, de manière à assurer une bonne réactivité et à s'adapter autant que possible au rythme des entreprises, nous avons confectionné le maximum de matériel préalablement au démarchage en tant que tel. Nous avons ainsi préparé:

• une lettre à publiposter de deux pages donnant les informations essentielles sur les objectifs du projet et insistant sur l'importance du corpus et de la collaboration de l'entreprise contactée ainsi que sur les garanties d'une procédure éprouvée en termes éthiques et juridiques. Cette lettre se terminait par une invitation à prendre contact avec nous pour obtenir de plus amples informations et discuter concrètement de la collaboration proposée.

• un document d' "informations relatives à l'enregistrement et à l'exploitation des données enregistrées", entrant davantage dans les détails de l'enregistrement, de la procédure de collecte et d'anonymisation des données et assurant ainsi le caractère éclairé du consentement des participant·e·s. À noter que l'anonymisation ne s'est pas limitée aux seuls noms des participant·e·s et des entreprises faisant partie du projet, mais qu'elle a également porté sur les noms des entreprises partenaires, des clients ou encore de certains noms de localités.

• un document d' "autorisation pour l'enregistrement et l'exploitation des données enregistrées", à remplir et signer par les participant·e·s. Le texte présente plusieurs options en termes d'utilisation des données (par ex. dans le cadre de l'enseignement, dans le cadre de la recherche) sur lesquelles les participant·e·s peuvent se prononcer, ainsi qu'un choix entre une anonymisation partielle ou totale (c'est-à-dire avec floutage des visages et de la voix en plus de l'anonymisation des transcriptions).

(6)

Les deux derniers documents n'ont pas été joints à la lettre, mais présentés et distribués lors des entretiens obtenus avec les entreprises intéressées.

3.2. Démarchage

Nous avons élaboré une liste de 80 PME sur la base de registres du commerce disponibles sur Internet (e.g. SwissFirms) ou en consultant les espaces dédiés aux start-ups sur le site de l'Université de Lausanne. Ces entreprises, appartenant à des secteurs d'activités très diversifiés (architecture, bâtiments et travaux publiques, communication et web-design, nouvelles technologies, etc.) ont été contactées en deux temps, c'est-à-dire sur la base de la lettre susmentionnée puis d'une relance téléphonique. La stratégie d'adresser directement la lettre à des personnes identifiées comme cadres-dirigeant·e·s a été globalement payante, dans la mesure où les relances téléphoniques ont permis de s'assurer auprès des secrétariats que la lettre avait trouvé non pas un·e destinataire générique, mais bien le·la destinataire prévu·e. Ces contacts téléphoniques ont aussi permis de rayer rapidement de la liste les entreprises ne voulant pas entrer en matière. A cet égard, nous avons constaté que même les secrétariats de petites structures (une dizaine d'employé·e·s) agissaient à la manière des services dédiés qui caractérisent les grandes entreprises: ils font office de filtres qui configurent activement les types de contact que l'entreprise accepte ou non d'entretenir ou même d'envisager. Un bon nombre de relances téléphoniques se sont en outre épuisées d'elles-mêmes dans la mesure où il s'est avéré clair a posteriori que l'entreprise n'était pas intéressée.

Six entretiens ont en revanche pu être décrochés, en prévision desquels nous avions préparé une mini-présentation du projet. Ces entretiens nous ont permis de discuter, d'une part, des enjeux éthiques et légaux de la procédure et, d'autre part, des tenants et des aboutissants de la collaboration. Nous avons également commenté et mis à disposition les deux documents susmentionnés (information et autorisation). Les entretiens ont aussi été l'occasion d'évaluer le type de retour sur investissement recherché par les entreprises. Dans tous les cas, notre disponibilité pour répondre aux questions ainsi que notre proposition d'organiser une courte séance de feedback à l'issue du projet ont paru suffisantes.

Grâce aux documents distribués et à nos questions sur le fonctionnement de l'entreprise en termes de types de réunion, nous avons amené l'entreprise à envisager la concrétude de la démarche, à se projeter dans sa réalisation, et ce de manière à ne pas en rester à une discussion trop générale et à "battre le fer tant qu'il était chaud". Nous souhaitions arriver à la fin de l'entretien avec un engagement plus ou moins précis de la direction autour de la possibilité d'enregistrer quelques réunions typiques du fonctionnement de l'entreprise. Des relances ont ensuite été nécessaires pour valider les collaborations. Dans le cas de certaines entreprises sont apparus des obstacles et réticences au

(7)

niveau de la confidentialité et du rapport au personnel de l'entreprise. Sur ces 6 entreprises, 3 nous ont finalement autorisés à procéder à des enregistrements, ce qui porte le démarchage à un taux de succès d'un peu moins de 4%.

3.3 Enregistrement

Le recueil des données en tant que tel constitue également une étape essentielle dans le sens où la qualité d'un enregistrement se répercute sur toutes les étapes caractéristiques du travail de terrain. Elle a donc une influence sur la qualité du corpus enregistré, sur celle des transcriptions et, par là même, sur l'analyse. Un enregistrement soigné facilite de surcroît la transmission et le partage des données recueillies.

Un travail sur le terrain exige une grande préparation en amont ainsi qu'une bonne gestion de la présence du dispositif d'enregistrement et des chercheur·se·s sur le lieu d'étude. En effet, et comme mentionné plus haut, partir à "la recherche de données en situation naturelle […] suppose […] une méthodologie s'efforçant de minimiser les effets produits par les dispositifs d'enregistrement (Heath 1997; Jordan & Henderson 1995)" (Baude et al. 2006: 50). Nombreux sont cependant les obstacles à cette naturalité fantasmée. Sur le terrain, il faut compter avec un certain nombre de contraintes éthiques et techniques et les pages qui suivent résument les solutions adoptées pour garantir le bon déroulement de la période d'enregistrement.

3.3.1 Les entreprises et l'organisation avec ces dernières

Les entreprises ayant accepté de participer au projet E-STAMP sont au nombre de trois. Alors qu'ABSTRACT est spécialisée dans la communication d'entreprise (7 employé·e·s), BTBA est un bureau d'architectes (114 employé·e·s) et CREDO, un bureau d'ingénieurs (47 employé·e·s)5. Les

enregistrements ont eu lieu entre octobre 2017 et février 2018. Une période de cinq mois durant laquelle il a fallu planifier notre venue dans les entreprises et, par là même, s'adapter au fonctionnement de chacune. Le Tableau 1 renseigne le nombre de réunions, de participant·e·s et d'heures recueillies.

Réunions Participant·e·s Heures

ABSTRACT 6 7 5h07

BTBA 8 29 8h18

CREDO 5 9 9h33

Total 19 45 22h58

Tableau 1: Aperçu des données récoltées dans le cadre du projet E-STAMP.

(8)

Lors d'un travail de terrain, le choix du moment à enregistrer est crucial. Cependant, lorsqu'il s'agit de collaborer avec une entreprise, le·la chercheur·se est obligé·e de se plier aux exigences et à l'emploi du temps de cette dernière. Dans le cas du projet E-STAMP, il a fallu s'adapter à trois entreprises différentes, qui ont chacune imposé un mode de fonctionnement propre. Les employé·e·s d'ABSTRACT nous ont proposé de nous greffer sur leur calendrier habituel. La collaboration a duré trois semaines. Le bureau d'architectes BTBA a réservé trois jours d'une semaine au projet E-STAMP tandis que CREDO nous a accueilli·e·s trois lundis de suite. Chez BTBA et CREDO, les séances ont eu lieu dans une seule et même salle, afin de nous faciliter la tâche. Ce parti pris, logistiquement intéressant, peut toutefois influencer le comportement des participant·e·s, dont le programme a dû être adapté.

Le fait d'être trois chercheur·se·s affilié·e·s au projet nous a en outre permis de nous répartir le travail. En règle générale, deux d'entre nous se chargeaient de la mise en place du matériel, et seule une personne patientait le temps de l'enregistrement, afin de ranger le matériel à l'issue de la réunion. Si le recueil de données devait durer toute une journée, nous procédions à des rocades. Deux des trois entreprises ont pu en outre nous mettre à disposition une place de travail dans leurs locaux.

Même si le planning était fixé à l'avance pour chaque entreprise, nous avons également dû composer avec des changements de dernière minute: réunions écourtées, annulations ou changement du nombre de participant·e·s. Malgré ces désagréments, notre objectif d'atteindre au moins une dizaine d'heures d'enregistrement documentant différentes entreprises et différents types de réunions a finalement été dépassé.

Au sein de ces trois entreprises, 45 personnes ont été enregistrées. Bien sûr, nous ne sommes pas entré·e·s directement en contact avec chacune d'elles. La majorité a approuvé sa participation au projet E-STAMP en signant l'autorisation et en indiquant si elles souhaitaient y participer de manière totalement anonyme (floutage de la voix et du visage) ou non, mais sans s'entretenir directement avec nous. Ainsi, nous pouvons qualifier la relation avec les participant·e·s d'impersonnelle et distante. Des personnes enregistrées, nous ne connaissons que le nom et la position hiérarchique au sein de l'entreprise. Nous avons par ailleurs opté pour la dénomination "participant·e·s", car elle accorde une importance prépondérante aux activités en cours – la réunion de travail et l'acte de la parole – plutôt qu'à la personne en tant que telle. En effet, on la décrit ainsi comme "participant" à une certaine activité, et non pas comme étant le sujet principal de la recherche, comme pourraient le faire les catégories d'enquêté·e·s ou d'acteur·rice·s sociaux par exemple (Baude et al. 2006: 52). Cette distance reflète les objectifs du projet de recherche E-STAMP, qui traite avant tout de ressources mobilisées dans certains types d'activité.

(9)

3.3.2 Matériel, types de prise de vue et choix du cadrage

Bien que plus invasif que l'enregistrement audio, nous avons opté pour un "dispositif d'enregistrement multivues" (CORINTE6), assurant ainsi la prise en

compte des "détails pertinents de l'interaction" (ibidem), notamment au niveau multimodal. Le matériel utilisé est le suivant: deux caméras Canon LEGRIA HF G40 sur trépieds, une petite caméra grand angle Canon LEGRIA mini X, un dictaphone Olympus WS-811 de secours, cinq cartes mémoires Sandisk ExtremePro SDXC de 64Go, une rallonge électrique ainsi qu'une multiprise7. Il

s'agit d'un matériel assez léger et facile d'utilisation, mais dont le transport nécessite tout de même un peu d'organisation. Nous avons jeté notre dévolu sur une grande valise à roulettes, permettant à une seule personne de transporter le tout facilement.

Toutes les réunions se présentent selon le même format: les participant·e·s sont assis autour d'une table et interagissent (voir les figures qui suivent). Dans certains cas, une personne se tient debout et présente des éléments au reste de l'assemblée. Nous avons donc opté pour une prise de vue statique et avons pris en charge la mise en place du matériel et l'enregistrement, allumant les appareils préalablement aux réunions, juste avant de quitter la salle.

Afin d'élargir au mieux le champ, les deux caméras sur trépied ont été orientées de manière complémentaire, la caméra grand-angle disposée à une extrémité de la table et le dictaphone juste à côté de cette dernière. Notons que les lieux dans lesquels nous avons été amenés à collecter nos données ne nous auraient pas permis de camoufler le dispositif d'enregistrement. Nous avons donc opté pour un dispositif voyant, acceptant le fait qu'il pouvait être impressionnant, voire gênant pour les participant·e·s, et nécessitait donc un moment d'adaptation de leur part.

L'enregistrement multivues a en outre été configuré en prenant en compte les différents facteurs listés ci-dessous. Si certains d'entre eux ont pu être anticipés, il a aussi fallu faire preuve de réactivité sur place.

Temporalité

La durée des réunions variant de manière considérable, nous n'avons pas pu compter sur l'autonomie de la batterie des caméras. Il a donc fallu brancher chacune d'elles sur une prise de courant, afin de ne pas avoir à intervenir durant les réunions. À noter qu'à deux reprises, à cause d'un problème de contact, une

6 http://icar.univ-lyon2.fr/projets/corinte/recueil/enregistrement.htm, consulté le 2 mai 2018.

7 Les caméras ont été réglées pour générer des fichiers compressés (MPEG) de très haute

qualité. Les autres paramètres ont été fixés en mode automatique. Pour la balance des blancs, si cela a pu générer des images relativement jaunes dans certains cas, le mode automatique a été la meilleure solution dans les cas fréquents où la luminosité changeait du tout au tout entre le début et la fin de l'enregistrement (lever et coucher du soleil, allumage et extinction de lumières artificielles de natures différentes).

(10)

caméra s'est éteinte au milieu d'une séance. Par chance, les deux autres ont continué de fonctionner, d'où l'importance d'avoir plusieurs angles de vue. Spatialité

Les différentes pièces dans lesquelles ont eu lieu les réunions ne permettaient pas d'avoir beaucoup de recul. Il a donc fallu jouer sur l'inclinaison des caméras et sur les différents angles de vue afin d'intégrer toutes les personnes dans le champ. Pour cela, la caméra grand-angle a été d'une aide précieuse. À noter cependant qu'elle fausse la direction des gestes et des regards et doit donc être complétée.

Décrite plus haut, la disposition dans l'espace du mobilier et des participant·e·s était telle que l'on pouvait s'y attendre. Seules les séances créatives chez ABSTRACT présentaient une configuration quelque peu différente: les participant·e·s – entre quatre et six – se réunissaient autour d'une table basse, et s'installaient sur des fauteuils, rajoutant des chaises si besoin. Cela donne une vision d'en bas – la caméra grand-angle étant posée sur la table basse – faussant de manière importante notre perception de la composante multimodale des interactions (Figure 1).

Figure 1: Comparaison du champ de vision de la caméra grand-angle avec les autres prises de vue. Participant·e·s

En règle générale, nous connaissions le nombre de participant·e·s aux réunions à l'avance. Il est cependant arrivé que l'entreprise fasse des rocades ou que le nombre de participant·e·s change, nous obligeant alors à adapter quelque peu l'angle des prises de vue. Chez CREDO, par exemple, nous avions installé le matériel en pensant que les participant·e·s seraient au nombre de six. Mais

(11)

alors que nous avions terminé de mettre en place le dispositif d'enregistrement, la salle a commencé à se remplir, jusqu'à ce que toutes les chaises disposées autour de la table soient prises. Sans être un problème en soi, le nombre élevé de participant·e·s a eu pour conséquence que l'un d'entre eux s'est retrouvé en bout de table, derrière la caméra grand angle, échappant alors au champ de cette dernière. La présence des deux autres caméras a permis d'intégrer ledit participant dans le montage final, ce qui témoigne une nouvelle fois de la pertinence d'un enregistrement multivues.

Objets

Un tableau sur lequel on écrit, un écran que l'on pointe ou une maquette que l'on observe sont autant d'objets faisant partie intégrante de l'interaction et doivent être pris en compte par les caméras. Jamais signalée à l'avance, la présence de l'un de ces éléments nous a obligé·e·s à procéder à quelques ajustements sur place et, si nécessaire, à le photographier.

En outre, certains objets (ordinateurs portables, bouteilles d'eau, etc.), cachant le visage de certain·e·s participant·e·s, se sont avérés être des obstacles (Figure 2). L'enregistrement multivues nous a cependant permis d'intégrer les acteur·rice·s concerné·e·s dans le champ.

Figure 2: Exemples de cas où des objets (écrans d'ordinateur, bouteilles d'eau) obstruent le champ de vision. Il a aussi fallu rester attentifs à d'éventuels éléments pouvant dévoiler l'identité de l'entreprise partenaire. Dans la mesure du possible, nous ne les avons pas intégrés dans le champ, ou les avons floutés au montage.

(12)

La présence des chercheur·se·s

N'intervenant ni n'apparaissant pas – volontairement du moins – dans les enregistrements, notre rôle en tant que chercheur·se·s s'apparentait plutôt à celui d' "observateur extérieur" (Baude et al. 2006: 53). En effet, une fois l'enregistrement lancé, nous quittions la salle de réunion, n'y revenant que pour éteindre et ranger le matériel à l'issue de la séance. Cependant, bien que discrète, notre présence a pu être intrusive. En effet, en charge de la mise en place du matériel et de la bonne marche de celui-ci, nous avons dû pénétrer dans l'intimité des entreprises, contrairement à un enregistrement en studio, où l'enquêteur·rice accueille les participant·e·s. Ayant pris le parti d'allumer les caméras juste avant le début de chaque réunion, il nous est arrivé de nous retrouver dans la salle alors que les premier·ère·s participant·e·s prenaient place. Une courte interaction entre les participant·e·s et l'équipe de recherche pouvait alors avoir lieu, retardant le début de la séance à proprement parler (voir la discussion dans Baude et al., 2006, p. 59). En outre, il est arrivé à deux reprises que l'un·e d'entre nous se retrouve dans le champ durant la réunion, à cause d'une sollicitation par l'un·e des participant·e·s. Soulignons que ces deux cas de figure questionnent la délimitation des réunions (voir infra).

3.4 Confection: numérisation, assemblage et synchronisation

À l'issue de chaque journée d'enregistrement, les fichiers numériques stockés dans les trois caméras ont été importés, renommés et archivés sur un serveur privé de l'Université de Lausanne. Cette solution a été choisie pour plusieurs raisons:

• La confidentialité des données est davantage assurée, en comparaison de solutions commerciales, notamment américaines, telles que Dropbox ou Amazon Web Services.

• La sécurité et la conservation des données sont garanties, dans la mesure où les données sont répliquées deux fois sur deux lieux géographiques différents et les versions antérieures des fichiers sont conservées pendant 1 mois. Une sauvegarde incrémentale locale sur un disque dur externe supplémentaire a en outre été mise en place.

• Les performances en lecture et écriture sont bonnes, y compris en accès externe via le VPN robuste fourni par l'Université.

• L'espace mis à disposition est confortable (2TB disponibles, 1.5 utilisés à l'heure où ces lignes sont écrites) et expansible en justifiant un changement des besoins.

Lors de l'importation des données, deux tableaux ont été alimentés. Le premier tableau, hautement confidentiel, met en correspondance les données sur les entreprises et les employé·e·s enregistré·e·s (notamment leurs noms et leurs fonctions) avec les pseudonymes utilisés au sein du corpus et la convention

(13)

d'utilisation signée en nom propre. Une capture d'écran des données enregistrées, au format de photo passeport, facilite en outre l'identification. Le second tableau liste les réunions enregistrées en renseignant l'entreprise par son pseudonyme, la durée de la réunion (voir infra), les participant·e·s présent·e·s, quelques informations contextuelles, l'état de la transcription et l'éventuelle présence de participant·e·s ayant exigé une anonymisation complète (visage et voix).

Une étape importante du processus de confection a été la segmentation des données, en choisissant à quel moment les réunions commençaient et se terminaient. Le choix qui a été fait est le suivant: nous sommes parti·e·s de la caméra grand-angle, dont le but est précisément de fournir une vue d'ensemble de la réunion, et avons décidé que les réunions commençaient lorsqu'au moins deux participant·e·s apparaissaient à l'écran (p. ex. franchissement de la porte de la salle) et se terminaient lors de la dissolution définitive du groupe et/ou l'arrivée de l'équipe d'enregistrement. Il est fréquent en effet que les réunions commencent avant que toutes les personnes soient présentes et installées, respectivement qu'elles se terminent après la dissolution du groupe et de la configuration initiale. Une fois les bornes amont et aval ainsi fixées, un fichier de référence a été extrait grâce à QuickTime 7 Pro et intitulé en conséquence. Il s'est agi ensuite de confectionner une vidéo unique à partir d'une synchronisation des trois prises de vues et sur la base du fichier de référence. Pour des raisons d'interopérabilité, le logiciel Adobe Premiere Pro a été choisi. Entre autres fonctions, il permet très facilement de synchroniser automatiquement les trois prises de vue, qu'il s'agit ensuite de recadrer et redimensionner pour remplir l'espace disponible, telle une mosaïque (Figure 3).

(14)

Les paramètres d'export ont été sélectionnés de manière à obtenir la meilleure qualité possible en 1080p tout en restant dans un ordre de grandeur de 4Go par heure d'enregistrement, pour éviter une surcharge non seulement du serveur de stockage, mais aussi des ordinateurs (risques de latence lors de la lecture et de la transcription)8. Les paramètres, sauvegardés en tant que

préconfiguration pour une réutilisation facilitée, sont les suivants:

Format et multiplexeur H.264, MP4

Résolution 1920x1080 (1080p)

Paramètres vidéo VBR, 2 passages; débit cible minimum = 8 Mbits/s; débit cible maximum = 14 Mbits/s, 25 i/s

Paramètres audio Format MPEG, codec audio AAC; taux de 44.1 kHz; qualité supérieure; débit de 320 Kbits/s

Options supplémentaires Utilisation de la qualité de rendu maximale; plage source: Entrée/Sortie de séquence (fixées sur le début et la fin de la vidéo de référence)

Tableau 2: Paramètres d'exportation des vidéos-mosaïque.

Sur notre machine9, de tels paramètres exigent 10h d'encodage pour 1h

d'enregistrement. Pour gagner en efficacité, nous avons, d'une part, utilisé l'utilitaire Adobe Media Encoder qui permet de mettre en file d'attente (ou batcher) plusieurs exports et, d'autre part, configuré l'ordinateur de manière à ce que l'on puisse le contrôler à distance et ainsi identifier et régler les éventuels problèmes. De ces fichiers HD 1080p ont été extraits les pistes sonores pour l'utilisation des fonctions de spectrogramme dans ELAN ou Praat ainsi que des versions SD (480p) via la fonction d'export de QuickTime.

3.5 Transcription alignée

Notre choix s'est porté sur l'outil de transcription et d'annotation ELAN10, avec

lequel il est possible de charger à la fois une ou plusieurs vidéos ainsi qu'une piste audio, et d'aligner la transcription sur cette dernière. De plus, l'organisation en différents tiers – chaque tier correspondant à un·e locuteur·rice – permet de rendre compte de l'organisation séquentielle de la parole, tout en permettant l'annotation de phénomènes multimodaux. Grâce à ses fonctions de recherche avancée (notamment par expressions régulières) ainsi que ses paramètres d'export, ELAN facilite aussi bien l'élaboration de collections de phénomènes que leur transmission et traitement dans d'autres logiciels.

8 La disponibilité des archives prêtes à l'emploi, telles que synchronisées dans Adobe Premiere

Pro, rend possible de nouvelles exportations avec d'autres paramètres. L'important est de disposer de la vidéo de référence, en termes de qualité et de durée.

9 iMac 21.5 pouces, fin 2012, 2.9 GHz, 16 Go de RAM, NVIDIA GeForce GT 650M, macOS

Sierra.

10 Version 5.1, Max Planck Institute for Psycholinguistics, The Language Archive, Nijmegen, The

(15)

3.5.1 Conventions

Nous avons opté pour les conventions ICOR, disponibles en ligne11.

Développées par le laboratoire ICAR, ces conventions ont l'avantage de couvrir un grand nombre de phénomènes remarquables à l'oral et de garantir une bonne lisibilité de la transcription. De plus, elles évitent les mises en forme et caractères spéciaux pouvant poser des problèmes informatiques d'interopérabilité. Enfin, utiliser ces conventions permet d'entrevoir une intégration du corpus E-STAMP dans CLAPI (voir note 1).

3.5.2 Collaboration

Pour éviter que plusieurs personnes ne travaillent sur un même fichier, chacun·e des trois chercheur·se·s a pris en charge la transcription de plusieurs réunions de bout en bout. Afin de nous tenir au courant de notre avancement respectif, nous avons créé un tableau rassemblant les éléments suivants: • les choix quant à l'anonymisation;

• les problèmes rencontrés durant la transcription;

• les problèmes de compréhension quant aux extraits à transcrire.

Durant la période de collaboration entre les trois chercheur·se·s affilié·e·s au projet E-STAMP, trois séances ont été organisées, dans le but de s'assurer de l'uniformité des transcriptions et, si besoin, de trouver des solutions aux éventuels problèmes rencontrés (par ex. pour les questions relatives à l'anonymisation). À noter que l'aspect multimodal n'a pas encore été transcrit et que l'accent n'a été mis sur aucun phénomène particulier, afin que les transcriptions conviennent à tout·e chercheur·se, quel que soit son intérêt.

3.6 Partage et diffusion

Comme évoqué en introduction, le présent projet n'a pas été soumis aux directives édictées en 2017 par le Fond National Suisse de la recherche en matière d'Open Science et en particulier celles relevant de l'Open Research Data visant à encadrer l'utilisation et faciliter le partage des données confectionnées dans le cadre des projets financés. Si la demande n'a donc pas eu à inclure un Data Management Plan à proprement parler, certaines questions et enjeux relatifs au partage et à la diffusion des données ont toutefois été anticipés à différents égards dans le cadre du projet E-STAMP.

Notons déjà que du fait de la nature extrêmement délicate des données, dont la confidentialité constitue une condition de récolte et une préoccupation aiguë des entreprises, une distinction très claire a été établie entre l'équipe de

11 http://icar.univ-lyon2.fr/projets/corinte/bandeau_droit/convention_icor.html (consulté le 24

(16)

recherche du projet et toute autre personne susceptible d'avoir accès aux données d'une manière ou d'une autre. Cette imperméabilité est garantie au niveau du stockage des données: les données ne sont stockées que sur un serveur privé de l'Université de Lausanne, dont l'accès par identifiant et mot de passe est lié aux comptes collaborateur·rice·s authentifiés par le service RH de l'Université.

Toute donnée susceptible d'être extraite de ce serveur, qu'il s'agisse d'une publication, d'une conférence, d'un enseignement ou encore d'un workshop de recherche, est strictement encadrée par les conventions d'utilisation signées par les participant·e·s. Cela signifie que la donnée en question doit être au moins anonymisée au niveau verbal (usage de pseudonymes dans les transcriptions et bipage de l'audio12), et, suivant la décision des participant·e·s,

également au niveau paraverbal (floutage du visage et de la voix).

Finalement, à partir du moment où les données sont anonymisées conformément aux souhaits des participant·e·s, elles peuvent intégrer des bases de données institutionnelles de recherche à accès restreint, sur la base d'une convention d'accès préparée à cet effet. Il est ainsi prévu que les données puissent à terme intégrer CLAPI.

4. Conclusion

La présente contribution visait à documenter la constitution d'un corpus particulier, dans l'idée que le récit de la démarche entreprise, notamment en termes de choix et de stratégies adoptés, permette d'attirer l'attention du·de la lecteur·rice sur certains aspects théoriques, méthodologiques, techniques ou encore administratifs. Plutôt que des recettes ou un manuel, il s'agit donc de balises visant à faire connaître et situer la constitution de ce corpus vis-à-vis de ressources analogues.

En conclusion, le corpus élaboré alimente le projet de recherche initial en fournissant une large palette de marqueurs épistémiques émergeant dans des environnements multimodaux variés et soigneusement documentés. Il est également exploité pour une recherche doctorale en cours à l'Université de Lausanne. Inscrite en linguistique interactionnelle, elle entend étudier les potentielles fonctions pragmatiques, et principalement interactionnelles, de la variation morphophonologique du clitique JE dans les marqueurs épistémiques tels que JE PENSE, JE SAIS, JE CROIS, JE VOIS et JE TROUVE (Roh 2018). À terme, et à partir du moment où les conventions d'utilisation et de partage sont soigneusement appliquées et respectées, le corpus pourra intégrer des

12 Notons à ce propos que nous avons développé, avec l'aide de Francesco Cangemi, un script

Praat permettant, sur la base de la transcription faite dans ELAN, de biper automatiquement le signal audio et ainsi d'anonymiser les données très facilement et rapidement.

(17)

agrégateurs de corpus tels que CLAPI et ainsi servir de ressource pour entrevoir des collaborations plus ambitieuses et des pistes de recherche innovantes. Soulignons enfin la dimension appliquée du projet E-STAMP; une fois les données décrites et analysées, un retour ciblé sur la dimension langagière des mécanismes de collaboration et des ressources et processus de prises de décision sera fait aux participant·e·s. Il s'agira là d'une occasion pour les

chercheur·se·s de partager leurs observations et éventuelles

recommandations. Spécifiques, ces études de cas permettront aussi d'apporter un nouveau regard sur le fonctionnement interne des entreprises en général. Remerciements

La présente contribution est issue du projet E-STAMP financé par le Fonds National Suisse de la recherche [PZ00P1_168033]. Les auteurs tiennent également à remercier très chaleureusement Cécile Petitjean pour sa collaboration déterminante au projet en tant que chargée de recherche et pour sa relecture attentive d'une première version de ce texte. Les auteurs remercient finalement les deux relecteur·trice·s externes pour leurs commentaires.

BIBLIOGRAPHIE

Adolphs, S. & Carter, R. (2013): Spoken Corpus Linguistics: From Monomodal to Multimodal. London (Routledge).

Allwood, J. (2008): 12. Multimodal corpora. In A. Lüdeling & M. Kytö (éds.), Corpus Linguistics: Volume 1. Berlin, Boston (de Gruyter Mouton), 207-225.

Arminen, I. (2005): Institutional Interaction: Studies of Talk at Work. Aldershot (Ashgate).

Auer, P., & Pfänder, S. (éds.) (2011): Constructions. Emerging and Emergent. Berlin (Mouton de Gruyter).

Baude, O., Blanche-Benveniste, C., Calas, M.-F., Cappeau, P., Cordereix, P., Goury, L., Jacobson, M., de Lamberterie, I., Marchello-Nizia, C. & Mondada, L. (2006): Corpus oraux, guide des bonnes pratiques 2006. Presses Universitaires Orléans (CNRS Editions). Disponible: https://hal.archives-ouvertes.fr/hal-00357706 (accédé le 12 septembre 2018)

Borzeix, A. & Fraenkel, B. (2001): Langage et travail. Communication, cognition, action. Paris (CNRS Éditions).

De Coster, M. (1998): Introduction: bilan, actualité et perspectives de la sociologie du travail. In M. De Coster & F. Pichault (éds.), Traité de sociologie du travail. Bruxelles (de Boeck Université),

11-39.

Drew, P. & Heritage, J. (1992): Talk at Work: Interaction in institutional settings. Cambridge (Cambridge University Press).

Duranti, A. & Goodwin, C. (1992): Rethinking Context: Language as an Interactive Phenomenon. Cambridge (Cambridge University Press).

Filliettaz, L. & Bronckart, J.-P. (2005): L'analyse des actions et des discours en situation de travail. Louvain (Peeters).

(18)

Heath, C. (1997): Analysing work activities in face to face interaction using video. In D. Silverman (éd.), Qualitative Research: Theory, Method and Practice. London (Sage), 306-326.

Heritage, J. (1984): Garfinkel and ethnomethodology. Cambridge (Polity Press).

Jacquin, J. (2013): Quelques pistes et jalons pour une approche réflexive de l'élaboration des corpus en analyse des discours et de la communication publique. Cahiers de l'ILSL, 34, 123‑140. Jacquin, J. (2017): La deixis en français : explorations multimodales. Langue française, 193. Paris

(Armand Colin).

Jordan, B., & Henderson, A. (1995): Interaction Analysis: Foundations and Practice. The Journal of the Learning Sciences, 4(1), 39‑103.

Mondada, L. (1995): Pour une approche des formes linguistiques dans les dynamiques interactionnelles. Cahiers de l'ILSL, 7, 1‑18.

Mondada, L. (2006): Video Recording as the Preservation of Fundamental Features for Analysis. In H. Knoblauch, J. Raab, H.-G. Soeffner, & B. Schnettler (éds.), Video Analysis. Berne (Peter

Lang), 51-68.

Mondada, L. (2010): Constitution et exploitation de corpus vidéo en linguistique interactionnelle: rendre disponibles les détails multimodaux de l'action située. Cahiers de praxématique, 54‑55, 327‑350. Mondada, L. (2013): The Conversation Analytic Approach to Data Collection. In J. Sidnell & T. Stivers

(éds.), The Handbook of Conversation Analysis. Chichester (Wiley-Blackwell), 32-56.

Pekarek Doehler, S., De Stefani, E., & Horlacher, A.-S. (2015): Time and Emergence in Grammar. Dislocation, Topicalization and Hanging Topic in French Talk-in-Interaction. Amsterdam (John Benjamins).

Rastier, F. (2004): Enjeux épistémologiques de la linguistique de corpus. Texto! En ligne. [en ligne : http://www.revue-texto.net/Inedits/Rastier/Rastier_Enjeux.html, accédé le 15 janvier 2014]. Roh, S. (2018): La variation morphophonologique du clitique JE dans les marqueurs épistémiques: une

fonction pragmatique? Projet de thèse déposé à l'Université de Lausanne. Document inédit. Sarangi, S., & Roberts, C. (éds.) (1999): Talk, work and institutional order: discourse in medical,

Figure

Tableau 1: Aperçu des données récoltées dans le cadre du projet E-STAMP.
Figure 1: Comparaison du champ de vision de la caméra grand-angle avec les autres prises de vue.
Figure 2: Exemples de cas où des objets (écrans d'ordinateur, bouteilles d'eau) obstruent le champ de vision
Figure 3: Mosaïque composée des trois prises de vue (latérale 1, latérale 2 et grand angle, en bas)

Références

Documents relatifs

Dans ce papier nous avons présenté la construction d’un corpus spécialisé du domaine médical dédié à la recherche d’informations ainsi que des résultats

Pour Prost (1996), trois critères majeurs s’impliquent dans l’élaboration d’un corpus : la contrastivité (pour établir des comparaisons), la diachronicité

Ce Guide (voir notamment le Chapitre 5) précise la façon dont ces principes fondamentaux, ainsi que ceux dont ils découlent, sont appliqués dans la pratique.

Ce Guide (voir notamment le Chapitre 5) précise la façon dont ces principes fondamentaux, ainsi que ceux dont ils découlent, sont appliqués dans la pratique.

L'évolution de nos corpus – (1) interactions didactiques, (2) entretiens, (3) interactions didactiques et entretiens – au cours du temps, entre dans cette logique

L’évolution de nos corpus – (1) interactions didactiques, (2) entretiens, (3) interactions didactiques et entretiens – au cours du temps, entre dans cette

Nous avons décelé, à partir de notre recherche, que l’essentiel de la déverbalisation est la conceptualisation de l’information de départ, que la correspondance entre le

Dans cette perspective, cinq chercheurs ont étudié un même corpus vidéo comportant l’enregistrement d’une séance d’enseignement et des documents associés.. De telles