• Aucun résultat trouvé

TAP : TRAITEMENT AUTOMATIQUE DE LA PPAROLE

N/A
N/A
Protected

Academic year: 2022

Partager "TAP : TRAITEMENT AUTOMATIQUE DE LA PPAROLE"

Copied!
16
0
0

Texte intégral

(1)

TAP : TRAITEMENT AUTOMATIQUE DE LA PPAROLE

ENCADRÉ PAR : PRÉSENTÉ PAR :

MME CATHERINE RECANATI CHOUTTA ABOUBAKR

IHM : INTERACTION HOMME- MACHINE

1

(2)

INTRODUCTION

2

(3)

PLAN :

Définition Historique

Principes de base

Exemples d’applications Reconnaissance vocale Difficultés du TAP

Conclusion

3

(4)

DÉFINITIONS :

• Parole: Flux continu constitué d'une suite de mots, eux

mêmes constitués d'un enchainement de phonèmes et de bruits articulatoires

• Le traitement de la parole est une discipline technologique dont l'objectif est la captation, la transmission, l'identification et la synthèse de la parole.

• Phonèmes: plus petite unité discrète ou distinctive (c'est-à-

dire permettant de distinguer des mots les uns des autres)

que l'on puisse isoler par segmentation dans la chaîne parlée

4

(5)

HISTORIQUE :

1952 : reconnaissance des 10 chiffres, pour un « monolocuteur » , par un dispositif électronique câblé

1960 : utilisation des méthodes numériques

1965 : reconnaissance de phonèmes en parole continue

1968 : reconnaissance de mots isolés par des systèmes implantés sur gros ordinateurs (jusqu’à 500 mots)

1969 : utilisation d’informations linguistiques

1971 : lancement du projet ARPA aux USA (15 millions de dollars) pour tester la faisabilité de la compréhension automatique de la parole continue avec des contraintes raisonnables

1972 : premier appareil commercialisé de reconnaissance de mots

1976 : fin du projet ARPA ; les systèmes opérationnels sont HARPY, HEARSAY I et II et HWIM

1978 : commercialisation d’un système de reconnaissance à microprocesseurs sur une carte de circuits imprimés

5

(6)

1981 : utilisation de circuits intégrés VLSI (Very Large Scale Integration) spécifiques du traitement de la parole

1981 : système de reconnaissance de mots sur un circuit VLSI

1983 : première mondiale de commande vocale à bord d’un avion de chasse en France

1985 : commercialisation des premiers systèmes de reconnaissance de plusieurs milliers de mots

1986 : lancement du projet japonais ATR de téléphone avec traduction automatique en temps réel

1988 : apparition des premières machines à dictée par mots isolés

1989 : recrudescence des modèles connexionnistes neuro-mimétiques

1990 : premières véritables applications de dialogue oral homme- machine

1994 : IBM lance son premier système de reconnaissance vocale sur PC

1997 : lancement de la dictée vocale en continu par IBM  6

(7)

PRINCIPE DE BASE :

• Le traitement acoustique

• L’apprentissage automatique

• Le décodage

7

(8)

EXEMPLES D’APPLICATIONS

 Une dictée vocale peut être associée à un traitement de

texte : Un locuteur parle et le texte s’affiche ; ainsi, il n’a plus besoin de taper son texte au clavier.

 Les serveurs d’informations par téléphone

 La messagerie

 La sécurité possible grâce à la signature vocale

8

(9)

• HTTPS://WWW.YOUTUBE.COM/WATCH?V=4XNQPOQ6-5S HTTPS

://WWW.YOUTUBE.COM/WATCH?V=SDRUY39YN2I&LIST=RDCMUC UAHJ0FTA-1THER8A8POLMW&START_RADIO=1

9

EXEMPLES D’APPLICATION :

(10)

COMMENT ÇA MARCHE :

• https://www.youtube.com/watch?v=tEmXaHPE6Ys&t=6s

10

(11)

RECONNAISSANCE VOCALE :

11

(12)

ARCHITECTURE D’UN SYSTÈME DE RECONNAISSANCE VOCALE

12

(13)

L’ÉTAPE DE LA RECONNAISSANCE :

 Analyser le signal inconnu sous la forme d’une suite de vecteurs acoustiques

 Comparer la suite inconnue à des exemples préalablement enregistrés.

 Le mot «reconnu» sera alors celui dont la suite de vecteurs acoustiques colle le mieux à celle du mot inconnu.

13

(14)

DIFFICULTÉS DU TAP :

Grande quantité d’informations

Grande variabilité des informations

Type de parole

Environnement

Locuteur

Coarticulation

Diversité des sources

de connaissances

Acoustique

Linguistique

Extra-linguistique

14

(15)

DIFFICULTÉS DE LA

RECONNAISSANCE VOCALE:

15

https://www.youtube.com/watch?v=ZzSzkAuK Pe0&t=1s

(16)

THANK YOU FOR YOUR ATTENTION !

16

Références

Documents relatifs

On trouvera ci-joint des graphiques montrant comment ces installations ont été utilisées en 1967, 1968

Les dictionnaires électroniques pris en compte ici ont les particularités suivantes : (i) ils rapportent les unités lexicales à la distinction prédicats de

Reconnaître les différents mots d'une même phrase dans deux écritures différentes.. Consigne : Je relie par un trait de la même couleur les phrases identiques écrites en script

- Depuis 1955, trente quatre jaugeages ont été effectués dont un au flotteur à 214 m3/s~ La section est instable en basses et moyennes eaux. L'étalonnage eet à reprendre après

variations temporelles présentées par le signal de parole (comme cela a été établi dans les expériences de type gating), va davantage dans le sens d'un modèle non phonémique

et dans lequel la traduction joue un rôle essentiel pour sa diffusion, mais qui, malgré sa richesse, n’est pas souvent traité dans des travaux universitaires. Nous chercherons ainsi

Un autre aspect à souligner est le fait que si nous considérons ces trois tendances de la pensée saussurienne - o Notes item, le CLG et les Niebellungen - comme appartenant au

Dans notre activité de sous-titrage nous avons eu affaire à différents niveaux de langue, mais les plus gros problèmes rencontrés ont été dus à la traduction des gros mots, car