• Aucun résultat trouvé

C. Tests réalisés

4. Méthodes d’analyse du langage

a. Acoustico-verbale

Au cours de notre quatrième et dernière étude nous avons utilisés différentes méthodes d’analyse du langage que nous avons appliqué à l’étude du langage nocturne, la somniloquie.

Premièrement nous avons effectué une analyse descriptive du langage nocturne en classifiant tous les verbatim selon la présence ou non de certaines catégories linguistiques : cris, rires, marmonnements, chuchotements, gémissements, mouvements de lèvres sans son, pleurs, bégaiements, répétitions, gros mots, chants, tonalité du langage (affirmatif, négatif et interrogatif), langue étrangère. Nous avons aussi compté le nombre de mots proférés par chaque sujet au cours d’un épisode de somniloquie (Total word count, TWC).

La suite des analyses a été effectuée avec l’aide d’une équipe d’étudiants en orthophonie de Besançon. Celles-ci concernent les analyses acoustico-phonétiques du langage nocturne, les aspects prosodiques, les silences du langage et le langage ordurier.

- l’analyse acoustico-phonologique pour laquelle le logiciel Praat qui permet de visualiser les signaux de la parole dans des dimensions de temps, d’amplitude et de fréquence, a été utilisée. Dans ce projet d’analyse d’une masse de données importante, transcrire des énoncés oraux à l’écrit a contraint d’emblée à proposer une transcription phonétique large, à l’aide des symboles de l’Alphabet Phonétique International (Figure 34). Les transcriptions ont été faites sur 3 niveaux : le lexique, les syllabes et les phonèmes. Ensuite, à partir des fichiers son, les voyelles ont été isolées, étiquetées manuellement et caractérisées par des valeurs formantiques moyennées sur toute la longueur de la voyelle. Enfin, un script Praat a exploité ces mesures formantiques afin de générer des triangles vocaliques.

Figure 34. Extraits de transcription et segmentation avec le logiciel Praat

- l’analyse des caractéristiques prosodiques du langage nocturne a été elle aussi réalisé à travers le logiciel Praat. L’ensemble des corpus a été annoté avec une annotation prosodique (recherche et codification des syllabes proéminentes qui sont caractérisées par des modifications acoustiques telles qu’une augmentation de la hauteur, un allongement de la durée syllabique et une augmentation de l’intensité) et grammaticale afin de détecter la présence ou non du respect des règles de l’accentuation de la langue Française.

b. Analyse sémantique

- l’analyse des silences dans les productions verbales nocturnes a été effectuée sous Praat. Trois tires ont été créés : une pour les mots, contenant l’indication silence en l’absence de ceux-ci, une répertoriant le type de syllabes et une pour les phonèmes. Ensuite, un script relevant le contenu et la durée de chaque intervalle non vide de la première tire (mots et silences) a été appliqué. Enfin, le nombre et la nature des marqueurs de prise de parole et de fin de tour de parole ont été relevés ainsi que la fréquence des questions, requêtes, insultes qui font partie du statut illocutoire.

- l’analyse de la violence verbale a été effectuée avec l’utilisation du logiciel ELAN, qui est un logiciel d’annotation de fichiers multimédia qui permettant d’obtenir une interface où figurent la vidéo sélectionnée ainsi que la forme du signal acoustique (Figure 35). Pour chaque vidéo contenant de la somniloquie, a été indiqué le temps de parole assimilé à de la violence verbale potentielle. Ensuite une analyse qualitative de la violence verbale repérée a été effectuée (distinction entre jurons et gros mots ; axiologiques négatifs ; destinataire de la violence verbale ; facteurs aggravants) (M Laforest, 2013).

Figure 35. Interface du logiciel ELAN

- Enfin nous avons analysé le langage nocturne à travers la lemmatisation. La lemmatisation désigne l'analyse lexicale du contenu d'un texte regroupant les mots d'une même famille. Chacun des mots d'un contenu se trouve ainsi réduit en une entité appelée lemme (forme canonique). La lemmatisation identifie donc les différentes formes que peut revêtir un mot, soit : le nom, le pluriel, le verbe à l'infinitif, afin de les regrouper dans des mêmes unités de formes graphiques qui correspondent aux différentes flexions d’un même lemme (par exemple : verbe conjugué ramené à l’infinitif, les pluriels ramenés au singulier) Pour ce faire nous avons utilisé deux logiciels spécifiques : SPAD (version 5.5) et Iramuteq (Figure 36). Le logiciel SPAD est un logiciel de traitement statistique spécialisé dans la gestion de la qualité des données et de leur analyse. Iramuteq est quant à lui une Interface de R pour les Analyses Multidimensionnelles de Textes et de Questionnaires, son fonctionnement consiste à préparer les données et écrire des scripts qui sont ensuite analysés dans le logiciel statistique R. Après l’insertion du corpus de verbatim analysés dans les logiciels, un tableau dit tableau de contingence, va être construit avec en ligne les unités de verbatim (un verbatim d’un sujet par ligne) et en colonne les lemmes retenus. Finalement, l’Analyse Factorielle des Correspondances (AFC) analysera chacune des

distances ou les proximités entre les éléments de l’autre dimension. L’ensemble des colonnes permettra de définir des distances entre les lignes et l’ensemble des lignes permettra de calculer des distances entre les colonnes. L’interprétation du graphique résultant de ces analyses se fait sur les deux plans : l’axe horizontal est l’axe factoriel principal, les points sont examinés en termes de distance entre eux et en termes de distance par rapport au centre (qui représente le centre de gravité du nuage de point, donc le point sans « originalité »). Ainsi, les lemmes se démarquant et ayant une distance significative d’utilisation entre eux sont les lemmes les plus éloignés des deux axes, en périphérie. La taille du cercle représente sur ces graphiques le poids du lemme en termes d’utilisation.

Figure 36. Exemple d’analyse de lemmatisation avec le logiciel Iramuteq