• Aucun résultat trouvé

Recueil et exploitation des données

7.1 Recueil des données

7.2.1 Le logiciel PHON

Après avoir été numérisée et compressée, chaque vidéo a été traitée à l’aide du logiciel PHON. Le logiciel PHON a été créé et construit par Yvan Rose et Greg Hedlund (Rose et al., 2006) et permet une analyse phonétique et phonologique de corpus audio ou vidéo.

Dans un premier temps, chaque session a été segmentée, c’est-à-dire que la vidéo a été découpée en fonction des énoncés de chaque participant. Puis, chaque énoncé a été aligné sur un extrait vidéo qui lui correspond, et pour chaque énoncé une fiche a été créée.

Chaque fiche (exemple en figure 7.3 page 176) comporte les lignes par défaut de PHON, c’est-à-dire :

– le numéro de la fiche ainsi que le nom du locuteur,

– ‘Orthography’, qui correspond à la production verbale du locuteur, écrite orthographiquement,

– ‘IPA Target’, qui correspond phonétiquement à la ligne ’Orthography’, donc la cible phonétiquement transcrite,

– ‘IPA Actual’, qui est la transcription phonétique de ce qui est réellement produit par le locuteur,

– ‘Segment’ qui est l’extrait temporel de la vidéo correspondant à l’énoncé, – ‘Notes’

On notera que le contenu des lignes ‘IPA Target’ et ‘IPA Actual’ a été généré automatiquement par PHON à l’aide d’un dictionnaire phonétique. Cependant, l’utilisateur est libre de modifier les propositions faites par le logiciel et d’adapter la transcription phonétique.

A ces lignes par défaut sous PHON, nous avons rajouté trois lignes

supplé-mentaires :

– ‘Indices Phonetiques’, qui permet de noter les indices acoustiques justifiant la transcription phonétique de la ligne ’IPA Actual’,

– ‘Gestes’, où l’on peut noter les gestes du locuteur

– ‘Situation’ qui permet de décrire le contexte lorsque ceci est nécessaire.

Figure 7.3: Fiche correspondant à un énoncé, sous PHON

Le logiciel PHON possède d’autres fonctionnalités que nous avons utilisées pour nos analyses. En premier lieu, le module ‘Syllabification & Alignment’

propose une syllabification des énoncés selon la langue cible, et en proposant une catégorisation syllabique aussi neutre que possible : ainsi chaque utilisateur peut choisir le cadre syllabique qui lui convient, avec les catégorisations qui lui conviennent (coda, attaque de noyau vide, etc.). Nous en avons un exemple à la figure 7.4, où les attaques syllabiques sont marquées en bleu et les noyaux en rouge. Nous décrivons au chapitre suivant les choix de catégorisation syllabique que nous avons faits.

En second lieu, PHON permet de créer le fichier audio correspondant à la totalité de la vidéo, d’extraire la bande audio correspondant à une fiche et de visualiser le signal correspondant à un énoncé. Tout ceci a permis de faciliter les analyses acoustiques ultérieures.

Figure7.4: Syllabification et alignement sous PHON

Enfin, la fonctionnalité la plus importante du logiciel PHON est la recherche systématique à partir des différentes transcriptions, sur les différentes lignes. Plu-sieurs types de recherche sont possibles avec PHON, comme illustré dans la figure 7.5 page 178. Dans cet exemple, nous effectuons une recherche ‘Aligned Phones’

au sein de la session 18, intitulée 2007_10_11#18, pour laquelle nous ne sélec-tionnons que le participant Adrien. Cette recherche consiste à demander ce qui est réellement produit ou effacé lorsque dans la cible nous avons une consonne.

7.2.2 La transcription

Après la segmentation, a eu lieu la phase de transcription à proprement parler.

C’est une phase extrêmement importante, car toutes les recherches sous PHON se basent sur les transcriptions. Les énoncés de chaque locuteur (parent et en-fant) ont été d’abord transcrits orthographiquement. Ensuite, la cible phonétique a été générée automatiquement grâce au dictionnaire de prononciation intégré à PHON, et révisée quand il le fallait par nous-même : phénomènes de liaison, d’élision, prononciation particulière, qu’elle soit due à l’origine géographique des parents ou à une façon familiale de prononcer les mots... Enfin la réalisation phonétique de l’énoncé a été transcrite à l’aide de l’Alphabet Phonétique Inter-national (API ou IPA en anglais) dans une version fine.

Les énoncés parentaux n’ont pas tous été transcrits phonétiquement, alors

Figure 7.5: Recherche de consonnes avec PHON

que les énoncés enfantins l’ont tous été systématiquement. Pour les productions de Madeleine, tous les énoncés ont été transcrits phonétiquement deux fois, dont une fois par nous-même. Quant aux productions d’Adrien, les transcriptions pho-nétiques faites par l’auteur ont été vérifiées par un deuxième transcripteur, en aveugle, sur 4,5% des données. Le pourcentage d’accord sur la transcription des données, calculé uniquement sur les traits consonantiques pertinents pour l’ana-lyse, fut de 95,5%.

Lors de la transcription phonétique, en cas de doute ou de désaccord entre transcripteurs sur un segment, nous avons travaillé sur le spectrogramme de l’énoncé à l’aide du logiciel Praat. Nous avons listé les indices acoustiques per-mettant de vérifier l’identification du segment dans la ligne ‘Indices Phonétiques’

et ceux-ci nous ont permis de décider de la réalisation phonétique d’un segment donné.

Dans cette thèse, les énoncés enfantins sont transcrits phonétiquement entre crochets et lorsque la cible adulte est indiquée, elle est transcrite entre barres obliques. Par exemple, on pourra avoir pour ‘gâteau’ : [tato] /gato/. Nous souli-gnons que l’utilisation des crochets et barres obliques dans cette thèse est diffé-rente de ce qui est traditionnellement signifié par ces symboles typographiques, la transcription entre crochets signifiant habituellement ‘transcription phonétique’

et la transcription entre barres obliques indiquant habituellement ‘transcription phonologique’.

8

Sélection et utilisation du corpus :