• Aucun résultat trouvé

Inversion acoustique-articulatoire avec contraintes

N/A
N/A
Protected

Academic year: 2021

Partager "Inversion acoustique-articulatoire avec contraintes"

Copied!
171
0
0

Texte intégral

(1)

HAL Id: tel-01748423

https://tel.archives-ouvertes.fr/tel-01748423v2

Submitted on 29 Mar 2011

HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

Blaise Potard

To cite this version:

Blaise Potard. Inversion acoustique-articulatoire avec contraintes. Interface homme-machine [cs.HC].

Université Henri Poincaré - Nancy 1, 2008. Français. �NNT : 2008NAN10085�. �tel-01748423v2�

(2)

UFR STMIA

Inversion acoustique-articulatoire avec contraintes

TH` ESE

pr´esent´ee et soutenue publiquement le 23 octobre 2008 pour l’obtention du

Doctorat de l’universit´ e Henri Poincar´ e – Nancy 1

(sp´ ecialit´ e informatique)

par

Blaise Potard

Composition du jury

Rapporteurs : R´egine ANDRE-OBRECHT, Professeur, Universit´e Paul Sabatier Pierre BADIN, Directeur de Recherche, CNRS

Examinateurs : No¨elle CARBONELL, Professeur, Universit´e Henri Poincar´e Shinji MAEDA, Directeur de Recherche, CNRS

Xavier RODET, Professeur, Universit´e Paris VI Directeur de th` ese : Yves LAPRIE, Directeur de Recherche, CNRS

Laboratoire Lorrain de Recherche en Informatique et ses Applications — UMR 7503

(3)
(4)

Je tiens tout partiulièrement à remerier mon direteur de thèse, Yves Laprie, pour sa

patiene, ses onseils et ses enouragements. Je tiens également à remerierShinji Maeda pour

nous avoir fourni son modèle artiulatoire et ses données, et pour les éhanges sientiques

frutueuxquenousavonspuavoir.

Je remerie profondément Martine Kuhlmann, la serétaire de l'équipe,pour sa patiene et

sagentillesse sans limites.

Je remerie ensuite tous les enseignants du département Informatique de l'Université Henri

Poinaré Nany 1, pour leurs onseils, leur patiene et leur soutien, et tout partiulièrement

AlainMirgaux, OdileMella et Vinent Colotte.

Enn, je remerie mafamille et tousmes amis,pour leursoutiensans faille.

(5)
(6)

ÀDelphine, Stéf,Matthias,Ben,Nio,Véro ettousles autres,pare qu'ilsle valent bien;

Àtousles membresdu Loria grâeàquij'aipupasser de trèsbonsmoments, toutpartiulièrement

les oupants dubureau C130,les membresdes équipes Parole, MagritetMaia, ettouseux queje

ne itepas maisquise reonnaîtront.

Etàtous euxquisontpartis.

(7)
(8)

Introdution

Chapitre 1

Préliminaires

1.1 Aoustique de laparole . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.1.1 Prodution de laparole . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.2 Synthèse artiulatoire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.2.1 Modélisationdu onduitvoal . . . . . . . . . . . . . . . . . . . . . . 4

1.2.2 Passage de laoupesagittaleà lafontion d'aire . . . . . . . . . . . . 7

1.2.3 Simulation aoustique . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

1.3 Inversionaoustique-artiulatoire . . . . . . . . . . . . . . . . . . . . . . . . . 11

1.3.1 Problème malposé. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

1.3.2 Prinipe de résolution . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

1.3.3 Résolution par introdution de ontraintes . . . . . . . . . . . . . . . 15

1.4 Conlusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

Partie I Inversion 17 Introdution Chapitre 2 Constrution de odebook hyperuboïque 2.1 Paramétrisationaoustique et artiulatoire . . . . . . . . . . . . . . . . . . . 21

2.1.1 Modèleartiulatoire de Maeda . . . . . . . . . . . . . . . . . . . . . . 21

2.1.2 Synthétiseur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

2.1.3 Paramétrisation aoustique . . . . . . . . . . . . . . . . . . . . . . . . 23

2.1.4 Quelquesrésultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

2.2 Présentation de lastruture hyperuboïdale . . . . . . . . . . . . . . . . . . . 24

(9)

2.2.1 Choixde lastruture . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

2.2.2 Dénitions de lastruturehyperuboïdale . . . . . . . . . . . . . . . . 24

2.2.3 Modélisation mathématique. . . . . . . . . . . . . . . . . . . . . . . . 25

2.3 Constrution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

2.3.1 Test derégularité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

2.3.2 Utilisationdespolynmesmultivariéspour aluler l'approximation . 30 2.3.3 Seuillage aoustique . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

2.3.4 Subdivision . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

2.4 Réalisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

2.4.1 Caluldu veteur aoustique . . . . . . . . . . . . . . . . . . . . . . . 36

2.4.2 Cahe de formants . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

2.4.3 Génération despointsde test . . . . . . . . . . . . . . . . . . . . . . . 39

2.5 Évaluation expérimentale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

2.5.1 Resynthèsed'un veteur artiulatoire par interpolation . . . . . . . . 43

2.5.2 Valeursoptimalespour lealul delamatrie jaobienne . . . . . . . 44

2.5.3 Seuilsde subdivisionet préision aoustique . . . . . . . . . . . . . . 44

2.5.4 Temps de onstrution . . . . . . . . . . . . . . . . . . . . . . . . . . 46

2.5.5 Couverture de l'espaeartiulatoire . . . . . . . . . . . . . . . . . . . 47

Chapitre 3 Inversion par odebook 3.1 La méthode d'inversion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

3.1.1 Prinipe général . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

3.1.2 Restreindrel'ensembled'hyperuboïdes àexplorer . . . . . . . . . . . 52

3.1.3 Résolution dusystèmed'équation

P (X) = s

. . . . . . . . . . . . . . 53

3.1.4 Éhantillonnage de solutions . . . . . . . . . . . . . . . . . . . . . . . 55

3.2 Quelquesrésultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

3.2.1 Inversionde voyellesisolées . . . . . . . . . . . . . . . . . . . . . . . . 56

3.2.2 Domaines aoustiques . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

3.2.3 Statistiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

3.2.4 Temps de alul . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

Chapitre 4 Trajetoires artiulatoires 4.1 Lissagenon-linéaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

4.1.1 Critèressur larégularité de latrajetoire desartiulateurs . . . . . . 70

4.1.2 Critère global àminimiser. . . . . . . . . . . . . . . . . . . . . . . . . 71

(10)

4.3 Inversiondynamique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

4.3.1 Inversionde lasynthèse aoustique. . . . . . . . . . . . . . . . . . . . 75

4.4 Conlusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

Partie II Contraintes 81 Introdution Chapitre 5 Contraintes phonétiques 5.1 Prinipe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85

5.2 Domaines artiulatoires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85

5.2.1 Classiation desphonèmes . . . . . . . . . . . . . . . . . . . . . . . . 85

5.2.2 Transposition desontraintes phonétiques danslemodèle artiulatoire 86 5.3 Domaines aoustiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87

5.3.1 Partitionnement del'espae aoustique . . . . . . . . . . . . . . . . . 88

5.3.2 Données aoustiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89

5.4 Sore phonétique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90

5.5 Inversionave ontraintes phonétiques . . . . . . . . . . . . . . . . . . . . . . 92

5.5.1 Constrution de odebooks . . . . . . . . . . . . . . . . . . . . . . . . 92

5.5.2 Inversionstatique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93

5.5.3 Inversiondynamique. . . . . . . . . . . . . . . . . . . . . . . . . . . . 93

5.6 Exemples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94

Chapitre 6 Évaluation des ontraintes phonétiques 6.1 Correspondaneartiulatoire-aoustique . . . . . . . . . . . . . . . . . . . . . 99

6.2 Inversionstatique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

6.2.1 Expérienes d'inversion . . . . . . . . . . . . . . . . . . . . . . . . . . 101

6.2.2 Analyse desrésultats . . . . . . . . . . . . . . . . . . . . . . . . . . . 102

6.3 Inversiondynamique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113

6.3.1 Inversionde transitionsVoyelle-Voyelle . . . . . . . . . . . . . . . . . 113

6.3.2 Réapitulatif . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120

6.4 Conlusions et perspetives . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122

(11)

Chapitre 7

Contraintes visuelles

7.1 Origine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125

7.2 Données multimodales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126

7.2.1 Miniorpus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127

7.2.2 CorpusAL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128

7.2.3 Données duprojetASPI . . . . . . . . . . . . . . . . . . . . . . . . . 128

7.3 Traitement desdonnées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128

7.4 Implémentation desontraintes visuelles . . . . . . . . . . . . . . . . . . . . . 129

7.4.1 Correspondane entre les marqueurset lemodèleartiulatoire . . . . 130

7.4.2 Inversionave ontraintesvisuelles . . . . . . . . . . . . . . . . . . . . 133

7.5 Expérienes d'inversion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133

7.5.1 Comparaisondesdeux méthodes . . . . . . . . . . . . . . . . . . . . . 133

7.5.2 Expérienes d'inversion . . . . . . . . . . . . . . . . . . . . . . . . . . 135

7.6 Conlusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137

Conlusions et perspetives 139 Conlusions et perspetives Annexe A Corpus PB A.1 Paramètres artiulatoires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143

Annexes

Bibliographie 147

(12)

L'

unedesprinipalesaratéristiquesquidistinguent l'hommedel'animalestl'utilisation de

laommuniation parlée. Bien que ne possédant pasl'appareil phonatoire leplus sophis-

tiqué(ertains oiseaux peuvent en eet réaliser des sons nettement plus élaborés), la parole et

lesméanismesde produtions'yrattahant restent parmiles manifestationsles plusomplexes

et lesmoinsbien onnus du génie humain.

L'Homme n'aeu deessed'étudier e phénomène, et depuisque lesordinateurs existent, de

herher à le reréer artiiellement. Depuis relativement longtemps, on a réalisé des modèles

logiiels de l'appareil phonatoire, apables d'imiter la voix humaines en simulant les équations

physiquesdel'aoustiquedefaçonplusoumoinssimpliée,et ave plusoumoinsde suès.Ces

modèles desynthèse peuvent parfoisémettre dessonsqui ressembleà s'yméprendreà unevoix

humaine réelle; malheureusement, pour piloter dèlement de tels modèles, il est néessaire de

disposer dedonnées surlemouvement des diérentsartiulateurs, et surlasoure sonore.

Il existe destehniquesd'imagerie permettant d'obtenirdesinformations surlapositiondes

artiulateurs,maisauunede estehniquesn'est parfaite:soit ellesneapturent quepartielle-

mentle onduit(images duvisagedu louteur permettant de voirlapositiondeslèvres et dela

mâhoire,apteursmagnétiquesàdespositionspréisesàl'intérieurdelabouhe,éhographie...),

soit n'ont pas une résolution temporelle susante pour apturer les subtilités de l'artiulation

de la parole naturelle (par exemple l'IRM, qui permet d'obtenir une vue tridimensionnelle du

onduitvoal, maisnéessitedestempsde poseprohibitifs,oularépétitiond'unemêmephrases

desentainesdefois),soitenoresontfranhementdangereuses(parexemplelainéradiographie,

lelouteursubit desentainesde radiographiessurune durée dequelquesseondes).

L'obtentionlogiielle desmouvements artiulatoiresà l'origined'un sondonné,ou inversion

aoustique-artiulatoire,voiretoutsimplement inversion,estunepropositionalternativeetom-

plémentaire àestehniquesd'imagerie.Ils'agitenréalitéd'unproblèmepourdenombreuses

appliations.Outrelesmodèlesdesynthèsevoale,esdonnéespeuventeneetêtreutilesdansde

nombreuxas:laompressiondeparolepourlatéléphonie, l'étudedeslangues,etsurtout l'ani-

mation de têtes parlantes(pour l'industrie inématographique et desloisirs, l'apprentissage des

langues,l'aideauxpersonnesmalentendantes...). Parailleurs, lesdonnéesartiulatoires peuvent

aussitrouver leurutilité dans desdomainesaussidisparates quelareonnaissane automatique

delaparole,lasynthèse voale paronaténation,laphonétiqueet laphonologie,lamédeine...

De part sa position entrale dans tous les domaines liés au traitement automatique de la

parole,et par samyriaded'appliations potentielles, l'inversionaoustique-artiulatoire est l'un

despointsruiauxdel'étudedelaparole.D'ailleurs,trèstt,lespionniersdel'étudedelaparole

sesontintéressésàlamodélisationartiulatoire duonduitvoal(notammentFant(Fant 1960 ),

Stevens (Stevens&House 1955 ), Flanagan (Ishizaka &Flanagan1972 )...). Mais la véritable

étude fondamentale du domaine de l'inversion, et également l'une desplus intéressantes, est le

travailréalisé par Atalet sesollègues (Atalet al.1978 ).

Malheureusement, les quatre années onsarées à l'étude de e sujet ne me permettent pas

Références

Documents relatifs

En observant pour chaque langue les trois meilleurs modèles calques et contre-épreuves on constate en ce qui concerne les modèles calques, que ceux obtenant les meilleurs f-scores

Nous avons extrait des modèles d’in- teraction à partir de données issues de 3458 apprenants inscrits dans trois MOOC distincts, et les avons utilisés pour classer les étudiants

Il reste un certain nombre d’essais à réaliser pour valider les modèles du moteur Ericsson et les modèles des transferts thermiques dans l’échangeur gaz

Nous avons extrait des modèles d’in- teraction à partir de données issues de 3458 apprenants inscrits dans trois MOOC distincts, et les avons utilisés pour classer les étudiants

La figure III.1.6 montre l’évolution de l’effort et du couple en fonction de l’angle par unité de longueur, mesurés et calculés pour les trois modèles pour l’essai de

Pour un revêtement à trois couches d'épaisseur "quart d'onde" répondant à la condition (2.8), et tenant compte des remarques faites à partir des essais

Des matrices "boo- léennes clairsemées" d'ordre (1000x1000) peuvent ainsi être analysées en un temps très court (quelques secondes). La visualisation du graphe à partir

Le point faible des méthodes d’ inversion utilisant une table articulatoire construite à partir d’ un échantillonnage partiel de l’ espace articulatoire est d’ orienter