Traitement préalable des données textuelles : la transcription orthographique

pic sur la pénultième (2syl) 12%

4.3 Le traitement préalable des données

4.3.1 Traitement préalable des données textuelles : la transcription orthographique

présidé à l’établissement de cette transcription. Nous expliquerons ensuite le traitement qu’ont subi les données acoustiques.

4.3.1 Traitement préalable des données textuelles : la transcription orthographique

La transcription d’un corpus oral n’est jamais une opération neutre mais s’avère entièrement assujettie à l’usage qu’on lui assigne et c’est pourquoi il faut la concevoir avec beaucoup d’attention. On y inscrira des détails plus ou moins précis selon le type d’analyse que l’on projette. Pour ce qui nous concerne, la transcription du corpus doit essentiellement servir deux objectifs : elle doit d’abord servir de support à l’identification des contours intonatifs telle que nous l’avons décrite plus haut (voir section 4.2.2) ; elle doit surtout servir de matériau de base à l’analyse discursive. Nous avons donc opté pour une transcription de type orthographique, la plus transparente possible, car c’est la lisibilité immédiate du texte qui nous importait d’abord. Nous nous sommes inspirée des conventions proposées par le Groupe Aixois de Recherche en Syntaxe (GARS) qui s’attache à la description du français parlé (Blanche-Benvéniste et Jeanjean 1987). Notre transcription comporte ainsi un certain nombre de particularités que cette section se propose de décrire :

Nous avons éliminé toute ponctuation ainsi que les majuscules de début de phrase (en conservant néanmoins celles des noms propres) car ces marques reflètent dans la langue écrite des informations qui sont en grand partie transmises par la prosodie dans le langage oral. La transposition n’étant cependant pas du tout transparente, l’absence de ponctuation permet d’éliminer toute information prosodique à priori de la transcription orthographique.

En revanche, nous avons transcrit les pauses pleines par la suite orthographique

« euh » et différents phénomènes de performance comme les bruits d’éclaircissement de la voix, retranscrits par « hum ».

Les répétitions de morphèmes, voire de morphèmes tronqués, sont également représentés sous leur forme orthographique dans la transcription, comme le montrent les passages en caractères gras dans l’extrait (1) ci-dessous :

(1) euh ça pose quand même effectiv(e)ment euh euh un problème euh ce ce cette définition

(2) YS3 : (…) alors la conférence intergouvernemen- AL6 : Je j'y reviendrai quand vous voudrez hein

Quelques erreurs de performance sont rendues sous une forme orthographique témoignant de la distorsion phonétique, comme dans les exemples (3) et (4) suivants (en caractères gras) extraits du tour de parole AL2 :

(3) et je crois que les critères géographiques sont quand mouême les moins mauvais

(4) je mets en garde ceux qui sont tentés y'en a dans tous les partis politiques de s'appuyer sur des nodées historiques culturelles ou religieuses

Nous avons noté les liaisons uniquement quand elles étaient remarquables, comme certaines liaisons sans enchaînement produites par le locuteur AL (la consonne muette que la liaison phonétise est alors notée en caractères majuscules) dans l’exemple (5)² ; ou cette réalisation tout à fait curieuse de liaison persistante malgré la réalisation d’une pause pleine entre les deux termes en liaison. L’exemple concerné (6), est extrait du tour de parole DJ1 (les mots concernés sont en caractères gras ; la liaison, notée par le graphème qui représente sa valeur phonologique, est soulignée) :

(5) mais pour le reste c'esT la le critère je dirais le moins incontestable

(6) lorsqu'on euh nétudie un peu l'histoire de la construction européenne

La notation de ces quelques phénomènes propres à l’oral apparaissent dès l’étape de transcription orthographique car ils sont relativement aisés à repérer au fil de la transcription et nous semblent faciliter la lecture du corpus lorsqu’elle doit suivre l’écoute du signal de parole. Une transcription plus riche nuirait selon nous à la lisibilité de l’ensemble et doit être réservée aux passages à analyser plus précisément selon les besoins de l’étude ou bien à des étapes plus avancées de l’analyse (voire par exemple l’annotation des contours dans la section 4.2.2 ci-dessus).

La seule marque de structuration que nous ayons conservée dans la transcription du corpus concerne la distinction des tours de parole. Le genre discursif dont relève notre corpus, le débat radiophonique, favorise l’établissement de tours de parole relativement longs, clairement distincts les uns des autres et soumis à très peu de chevauchements.

Nous avons distingué les tours de parole qui constituent chacun un paragraphe isolé.

2 On peut considérer qu’il s’agit là d’une liaison avec une mot virtuel auquel le locuteur renonce finalement en cours de production

Chaque tour est repéré par les initiales du locuteur qui en est responsable et par son numéro d’ordre séquentiel dans la série des tours d’un même locuteur. Par exemple, la premier tour de parole du locuteur Alain Lamassour est repéré par AL1, son deuxième tour par AL2, etc.

Toute prise de parole par l’un des locuteurs est considéré comme un tour autonome, pourvu d’un numéro spécifique, y compris lorsqu’elle est constituée d’une seule clause. C’est le cas, par exemple, pour le tour AL6 (7) :

(7) AL6 : Je j'y reviendrai quand vous voudrez hein

Seul les tours de parole DJ2 et YS5 sont coupés en deux parties séparées par un tour de parole du locuteur Ja : Dans les deux cas, le tour intercalé n’est pas acoustiquement autonome mais est prononcé en chevauchement avec les paroles de l’autre locuteur.

Par exemple pour YS5 (8), le chevauchement concerne la partie d’YS5b qui répond directement et instantanément à l’interruption (soulignée dans la transcription) et la clause commencée dans la YS5a se termine dans lYS5b (cohésion syntaxique) ; Dans le cas de DG2 (9), le locuteur Ja profite d’une hésitation du locuteur DG pour compléter les propos de ce dernier, qui a son tour reprend et ratifie les termes de l’interruption en un bel exemple de co-énonciation :

(8) YS5a : je j(e) veux donner juste un p(e)tit exemple Ja13 : Yves Salaisse

YS5b : excusez-moi là-d(e)ssus

(9) DG2a : (…) il a fallu mettre en place euh tant bien qu(e) mal une une forme de stratégie sur le long terme euh

Ja : assez pragmatique

DG2b : assez pragmatique et passant précisément par la dénégation des euh des enjeux politiques

Ces différents faits (chevauchements, cohésion syntaxique en (8), co-énonciation en (9)) suffisent selon nous à justifier le traitement des deux parties d’YS5 et de DJ2 comme un seul tour de parole et non pas deux. Les paroles intercalées du locuteur Ja ne sont pas numérotées car nous ne nous y référerons pas de façon séparée par la suite.

quant à elles, à un traitement préalable plus important que nous exposons dans la section suivante.

Dans le document Prosodie et économie du discours : Spécificité phonétique, écologie discursive et portée pragmatique de l'intonation d'implication (Page 69-72)