• Aucun résultat trouvé

Nous analysons à présent l'eet du type de production (TYPE) sur la hauteur et l'étendue du registre. Nous avons réparti nos données sous deux catégories. La lecture oralisée des corpus PFC et PAC est notée R ; les conversations des corpus PFC et CID et les entretiens radiopho-niques du corpus Aix-Marsec sont notées A - pour parole authentique (nous rappelons, c'est-à-dire dont le but est de communiquer et non de répondre à une tâche demandée). La représentation graphique en 49 laisserait à penser à un eet de TYPE. La parole authentique serait caractérisée par un registre plus bas et plus étroit que la parole lue, ce qui, d'ailleurs, irait à l'encontre des faits rapportés dans la littérature.

Figure 49 Boîtes à moustaches de la hauteur du registre (KEY ; à gauche) et de l'étendue du registre (RANGE ; à droite) selon les modalités de la variable TYPE. Les données sont représentées en Hz pour le KEY et en octave pour le RANGE.

Cependant, l'analyse de variance conclut un eet non signicatif (KEY : F(1,95)=3.143, p-value= 0.07944 ; RANGE : F(1,95)=2.65, p-p-value=0.1068). D'ailleurs, si l'on veut comparer un éventuel changement de registre en fonction du type de production, il faut plutôt le faire à partir de mêmes locuteurs. Nous proposons donc d'évaluer ces possibles diérences sur le corpus PFC puisque les locuteurs sont enregistrés en lecture oralisée (LO), en conversation guidée (CG) et en conversation spontanée (CS). Si l'on catégorise LO sous l'étiquette R et CG et CS sous l'étiquette A, l'analyse de variance ne montre aucun eet du TYPE aussi bien pour la hauteur KEY (F(1,28)= 0.8227 ; p-value=0.3721) que pour l'étendue RANGE (F(1,28)=

0.6692 ; p-value=0.42). Elle ne révèle, de plus, aucun eet de TYPE sur KEY et RANGE si l'on distingue les trois catégories LO, CG et CS (KEY : F(2,27)=0.5909 ; p-value= 0.5608 ; RANGE : F(2,27)=0.4632 ; p-value= 0.6342). Nous pouvons donc conclure, que, à partir de nos données, la lecture oralisée, la conversation guidée et la conversation spontanée ne sont pas caractérisées par des diérences de registre signicatives. Cependant, il est important de noter que cette analyse n'a été menée qu'à partir de 10 locuteurs ; les résultats obtenus ne peuvent donc être en aucun cas généralisables. Pour répondre à cette problématique, il faudrait partir d'un échantillon de données bien plus important.

5.5 Discussion

Les analyses eectuées à partir des corpus PAC, PFC, Aix-Marsec et CID ont montré que les diérences de registre résultent du sexe du locuteur plutôt que de la langue parlée ou encore du type de parole pratiqué. Penser que l'étendue du registre des femmes est plus large pour celle des hommes n'est pas stéréotypisation mais s'explique par la forte corrélation qu'entretient l'étendue avec la hauteur, et par conséquent, par les diérences biologiques qu'on constate entre hommes et femmes.

Notre étude ne corrobore donc pas celle de Demers (2000) ou encore de S. F. Mennen I.

et Docherty (2008) qui ont observé des diérences de registre entre individus de nationalité diérente. Pour notre part, nous pensons que ces résultats résultent d'un artefact et ne sont que le reet du registre intrinsèque des locuteurs de ces études.

Par ailleurs, nos résultats ne corroborent pas non plus les travaux révélant des diérences de registre entre style de parole. Nous pensons, en revanche, que l'étude des variations de registre intra-locuteurs en fonction des styles de parole révèlerait, elle, les diérentes stratégies que les locuteurs peuvent adopter en fonction de la parole qu'ils pratiquent ou en fonction de leurs intentions.

6 Conclusion : une synthèse

L'élaboration de ce chapitre s'appuie sur la problématique de la diculté de la mesure du registre. Nous avons d'abord listé les problématiques sous-jacentes à sa mesure : (1) la diculté d'une mesure able de la f0, (2) le choix d'une unité de mesure ou échelle de mesure et (3) le choix d'une mesure acoustique vs. d'une mesure linguistique. Nous avons ensuite cherché à répondre à deux de ces problématiques, celle de la diculté d'une mesure able à partir de la f0 et celle d'un choix de mesure (acoustique vs. linguistique). La deuxième ne nécessite pas d'étude approfondie puisque les auteurs s'entendent généralement sur l'unité de mesure à utiliser. Les résultats de nos travaux ont cependant révélé qu'une autre échelle de mesure que celles proposées communément pouvait être intéressante pour l'étude du registre et de ses variations.

La première problématique est abordée à partir d'une base de données importante, extraite des corpus Aix-Marsec et PFC. Plus précisément, nous avons proposé une optimisation de la détection des valeurs extrêmes de la f0, dans PRAAT, an de rendre plus able la mesure du registre. Le travail passe d'abord par une annotation manuelle des extrema de la f0 pour l'ensemble des locuteurs. Une fois ces extrema annotés, nous les avons corrélés à une détection

automatique des extrema de la f0. Nous avons montré que la détection de ces extrema sans ajustements des seuils plancher et plafond de laf0 sont très peu corrélés à l'annotation ma-nuelle. Ce résultat montre qu'en l'état la détection automatique des extrema est sujette à des valeurs aberrantes. Par conséquent, nous avons proposé de comparer un ensemble de possibles seuils plancher et plafond et avons regardé ceux qui permettent une meilleure détection des extrema. L'étude, qui s'appuie sur un ajustement à partir des quantiles de laf0, a pu montrer que la combinaison, dont le seuil plancher est le produit du 15me quantile et du coecient 0.83 et dont le seuil plafond est le produit du 65me quantile et du coecient 1.92, est la plus adéquate dans l'estimation des valeurs extrêmes de la f0. Elle est aussi bien plus adaptée qu'un ajustement manuel des seuils en fonction du sexe du locuteur. Nous avons conclu qu'il est donc possible d'estimer les limites du registre du locuteur.

Une fois la abilité de la mesure du registre établie, nous nous sommes intéressée à la pro-blématique d'une mesure linguistique vs. acoustique du registre. Cette étude s'ancre dans la dichotomie avancée par Patterson (2000) qui soutient que les mesures linguistiques sont pré-férables aux mesures acoustiques dans l'étude du registre. Elles seraient en eet davantage corrélées au jugement perceptif du locuteur. Par ailleurs, selon lui, les mesures acoustiques seraient sujettes à des erreurs de détection et seraient inadaptées du fait que la distribution de la f0 ne suit pas une loi normale. Après avoir décrit les diérentes mesures acoustiques et linguistiques, nous avons montré, à partir de 4 corpus (PFC, PAC, CID et AM), et pour répondre aux objections portées aux mesures acoustiques, qu'une simple transformation des données sut à rendre la distribution des données proche d'une loi normale. Ensuite, une fois la certitude de la abilité de laf0 posée et la transformation des données eectuée, nous avons comparé les mesures acoustiques aux mesures linguistiques pour vérier la réalité de cette dichotomie. Notre étude révèle ainsi que les mesures linguistiques et les mesures acoustiques sont très proches et s'équivalent dans la mesure du registre. Ainsi nous avons conclu que cette dichotomie est sans réel fondement.

Par ailleurs, la comparaison de ces deux mesures nous a mené à un constat intéressant. Nous avons pu démontrer que les cibles basses et hautes du registre sont fortement corrélées à la médiane. Nous avons pu ainsi proposer une mesure de la hauteur et de l'étendue du registre à partir de cette dernière. En outre, ce phénomène suggère que la hauteur et l'étendue du registre co-varient. De plus, ce constat a permis d'envisager un nouvel ajustement des seuils plancher et plafond, i.e. respectivement à partir de la demi-octave inférieure par rapport à la médiane et à partir de l'octave supérieure par rapport à la médiane.

Le chapitre se termine par l'étude du registre et de ses fonctions extra-linguistiques, notamment par une comparaison des registres des locuteurs en fonction de leur sexe, de leur origine géogra-phique et du style de parole qu'ils adoptent. Après un rappel des fonctions extra-linguistiques des variations de registre, nous avons montré qu'il n' y a pas d'eets de langue ou de type de

production sur le registre. Les diérences qui ont pu être observées dans la littérature seraient plutôt le reet des diérences biologiques entre hommes et femmes.

Détection des variations de registre

Nous nous intéressons à présent aux variations de registre intra-locuteurs. Nous avions sou-levé, au cours du premier chapitre, un certain nombre de problématiques autour du concept de registre, notamment celle de la diculté de sa mesure, que nous avons traitée dans le deuxième chapitre de cette thèse. Une autre problématique qui s'ore à l'étude du registre est celle de la dénition de l'empan temporel de ses variations. Nous proposons donc, à présent, de poser plus précisément cette problématique, et ensuite, d'y répondre par la présentation d'expérimentations.

1 Problématique

Nous avions soulevé qu'une description des patrons intonatifs d'une langue, sans la considéra-tion des variaconsidéra-tions globales de registre, semblait, à elle seule, fragile. Or, nous avons également montré la diculté d'établir le domaine à partir duquel opèrent les variations de registre. A partir de ce qui avait déjà été observé, nous avions remarqué que les variations déclinantes et verticales pouvaient se faire sur un empan temporel diérent, selon qu'elles résultent de la structure hiérarchique et de l'organisation informationnelle du discours, des choix (conscients ou inconscients) ou de l'intention du locuteur dans le message qu'il veut faire passer. Les em-pans temporels des variations de registre, décrits dans la littérature, sont ainsi le syntagme, la proposition, la phrase, le groupe de sens ou groupe de soue, l'unité intonative, l'énoncé,

le paraton, des domaines ou constituants aussi bien syntaxiques, prosodiques que phonolo-giques. Les variations déclinantes résulteraient de la modication du registre sur un locus très court (de l'ordre de la syllabe) mais qui servirait de délimitation de domaines plus larges (le syntagme ou encore l'énoncé). Les variations verticales, quant à elles, sont généralement considérées sur un empan temporel global, bien qu'elles puissent opérer sur un empan plus court, de la taille du mot prosodique (Nespor & Vogel, 1983) par exemple.

Nous avons donc cherché à déterminer l'empan temporel des variations de registre, de façon automatique, an de mesurer l'apport de l'intégration de ces variations dans le système INT-SINT et d'étudier la façon dont ces variations indiquent la structure hiérachique du discours, notamment des changements de topique. La détection automatique a nécessité l'élaboration d'un algorithme, ADoReVA, que nous présenterons ci-après et à partir duquel nous avons pu eectuer nos analyses.

Pour cette étude, nous avons utilisé les 4 corpus présentés dans le chapitre 2 de cette thèse : le PFC et le CID pour le français, le PAC et Aix-Marsec pour l'anglais. Nous décrivons ci-après les échantillons sélectionnés de ces données et les annotations eectuées.

2 Base de données et annotations