• Aucun résultat trouvé

2.2.1. Etymologie et dérive phonétique

Dans ce présent manuscrit, le mot parole est uniquement utilisé pour désigner la manifestation orale articulée du langage verbal (humain, inévitablement). Son étymologie la

plus lointaine remonte au grec ancien, avec ʋɲʌɲɴʉʄɼ (lire « parabolé ») qui pouvait signifier

« comparaison » ; récupéré par le latin sous la forme parabola, le mot évolua en « parawola » (les lèvres ne se ferment plus complètement, transformant ainsi le phonème /b/) puis paraula (lire « paraoula »). Ainsi, le sens ancien a-t-il davantage rapport à l’intention de désigner par le mot, de « comparer » l’objet visé c’est-à-dire littéralement de former une paire entre le mot et l’objet, qu’à la production orale même de ce mot. Ce sens ancien est volontiers poétique, puisque nous pouvons penser cette paire comme liant l’esprit à la matière.

2.2.2. La parole en poupée russe

Comme nous l’avons vu dans le précédent chapitre, en empruntant quelques concepts à Henri Laborit, la réalité peut se décrire par une succession de niveaux d’organisation, et l’information-structure regroupe l’ensemble des règles liant les éléments unitaires d’un niveau donné en une unité de niveau supérieur.

ϭϭ

La parole n’échappe pas à cette règle : d’un point de vue acoustique, son unité de base, sa « particule élémentaire », est le phone. Il s’agit du son prononcé, tel qu’étudié par la phonétique, et varie en fonction de chaque langue, de chaque accent voire de chaque locuteur ; il est écrit par convention entre crochets (par exemple [r]). La phonologie ne s’intéresse quant à elle qu’aux variations phonétiques changeant le sens des mots à l’intérieur d’une même langue ; autrement dit, elle ne prend pas en compte les variations de prononciation sémantiquement insignifiantes. De ce point de vue, l’unité de base de la parole est le phonème, écrit par convention entre barres obliques (par exemple /r/). A l’intérieur d’une langue, un même phonème peut avoir plusieurs réalisations phonétiques, c’est-à-dire qu’il peut être prononcé en utilisant différents phones sans que le sens du mot n’en soit altéré. Concrètement,

si nous demandions à un Parisien et à un Ardéchois de prononcer le mot drôle (/dݘol/), le

premier utiliserait le phone [o] (o fermé, comme dans mot) pour réaliser le phonème /o/, et le

second le phone [ܬ] (o ouvert, comme dans parole). Pourtant, l’usage d’un phone ou de l’autre

ne change pas notre compréhension du mot ; il s’agit alors d’allophones (équivalents phonétiques des formes allotropiques de la chimie ; en d’autres mots, les allophones sont à un phonème ce que le graphite et le diamant, éléments allotropiques, sont au carbone).

Les phonèmes sont ensuite assemblés entre eux pour former l’unité du niveau supérieur qu’est la syllabe (par exemple, l’association des phonèmes /b/ et /a/ forme la syllabe /ba/). Puis les syllabes se juxtaposent pour former les mots (par exemple /ba/ et /to/ pour le mot

bateau ; notons là de façon légèrement digressive que le « langage texto » associé aux jeunes

et tant décrié par certains est plus proche de la phonologie que le sont les graphèmes usuels). Enfin, les mots s’organisent en phrases grâce à l’information-structure que constituent grammaire et syntaxe, et les phrases en paragraphes, les paragraphes en discours, et cetera jusqu’à atteindre ultimement l’ensemble des paroles d’un individu au cours de sa vie.

2.2.3. Composition des phonèmes

En repartant de la base et dans la direction opposée, les phonèmes sont réalisés par des phones eux-mêmes constitués de sons complexes, contenant de l’énergie à de nombreuses fréquences (fondamentale et harmoniques) que l’on pourrait enfin considérer comme des sons purs. Les phonèmes regroupent les sons pertinents pour la compréhension d’une langue, et recouvrent les consonnes, les voyelles et les pseudo-voyelles. La langue française contient notamment 36 phonèmes (17 consonnes, 16 voyelles et 3 semi-voyelles), comparativement aux 26 lettres de notre alphabet. Le contenu fréquentiel de ces sons de parole s’observe idéalement avec un spectrogramme (figure représentant l’énergie acoustique en fonction des fréquences et du temps ; Figure 2.3).

ϭϮ

Figure 2.3. Forme d’onde (en haut) et spectrogramme (en bas) de l’enregistrement de la phrase « Ceci est un spectrogramme ». Les syllabes sont délimitées par les barres verticales rouges, et les phonèmes par les barres verticales vertes.

En observant la Figure 2.3., un premier constat est la dynamique temporelle des fréquences composant la parole : les syllabes durent quelques centaines de millisecondes (ce qui correspond à un rythme de 3 à 8 syllabes par seconde, ou Hertz - nombre d’évènements par seconde ; barres verticales rouges), avec des consonnes comportant des transitions fréquentielles de quelques dizaines de millisecondes (par exemple, pour le s de « spectro », bande foncée descendante aux alentours de 4,5 kHz), et des voyelles montrant une stabilité fréquentielle de l’ordre de la centaine de millisecondes (e de « ceci », bandes foncées stables entre 0 et 4 kHz). Un second constat s’opère suivant l’axe fréquentiel, avec l’observation de bandes compactes d’énergie à certaines fréquences (même exemple du e de « ceci », en dessous de 4,5 kHz), de bandes plus diffuses à d’autres fréquences (deuxième s de « ceci », énergie diffuse entre 4 et 10 kHz), ainsi que de vides énergétiques (o de « spectro » autour de 5 kHz). Ces bandes sont la manifestation des formants, reflets acoustiques de la configuration de l’appareil phonatoire et responsables de la perception de phonèmes, que nous verrons plus en détail accompagnés de leurs corrélats physiologiques au point 2.3.1, en étudiant la production de parole.

ϭϯ

2.2.4. Information paralinguistique

La parole naturelle s’incarne dans la voix humaine qui, plus ou moins efficacement, véhicule bien plus d’information circulante que le simple message linguistique : genre, âge, identité, état émotionnel, voire même orientation sexuelle, classe sociale et niveau intellectuel. La prise en compte de cette information paralinguistique est rendue possible par la présence d’indices vocaux tels que la fréquence fondamentale (hauteur de voix), le timbre (texture), la prosodie (mélodie) et le rythme (vitesse des mots). Pour être complet, notons que la voix est perçue non pas en tant que telle, mais dans un flux sonore plus général qui contient également des informations sur l’environnement, comme par exemple la position du locuteur, ou le type (intérieur ou extérieur) et la taille de l’environnement en fonction de la réverbération.

Si les phonèmes, syllabes et mots peuvent relativement bien être délimités, d’où leur dénomination d’information segmentale, certains indices paralinguistiques sont d’ordre suprasegmental. C’est le cas en français de la prosodie, ou mélodie de la voix, qui véhicule l’intonation tout au cours d’une phrase pour donner de l’information sur l’état émotionnel du locuteur. Cet indice est analysé sur une échelle de temps de quelques secondes, donc recouvrant plusieurs segments phonémiques, syllabiques ou lexicaux.

Une information importante concerne le cas des langues tonales, où un même mot prononcé avec différentes trajectoires tonales, sortes de prosodies à l’échelle lexicale, aura des sens différents. Cela n’exclut cependant pas l’existence d’une prosodie suprasegmentale, indiquant toujours l’humeur du locuteur.

Maintenant que nous en connaissons un peu plus sur ce qu’est la parole dans sa structure macro- et microscopique, sa place dans le monde et son utilité chez l’Homme, il est temps d’aborder les différentes facultés et autres notions la sous-tendant.

Documents relatifs