• Aucun résultat trouvé

RECONNAISSANCE AUTOMATIQUE DU LOCUTEUR RAL Par Djellali Hayet

N/A
N/A
Protected

Academic year: 2022

Partager "RECONNAISSANCE AUTOMATIQUE DU LOCUTEUR RAL Par Djellali Hayet"

Copied!
14
0
0

Texte intégral

(1)

R

ECONNAISSANCE

A

UTOMATIQUE DU LOCUTEUR

RAL

Par Djellali Hayet

Master 1 RSI

UBMA ANNABA ALGERIE S2- 2020

05/05/2020

1

Reconnaissance Automatique du Locuteur Djellali Hayet UBMA Algérie

P

LAN

Généralités sur la parole

Reconnaissance Automatique du Locuteur

Définition

Type de RAL

Processus de RAL Apprentissage-Test

Prétraitement

Extraction de caractéristiques

Modélisation de locuteurs

Dépendant du Texte

Indépendant du texte

Décision

05/05/2020Reconnaissance Automatique du Locuteur Djellali Hayet UBMA Algérie

(2)

I

NTRODUCTION

A partir d’un signal de parole différentes informations peuvent être extraites:

Reconnaissance de la Parole

Reconnaissance du Locuteur

Reconnaissance de la langue

Reconnaissance des émotions

QU’est ce qui a été dit?

QUI A PARLE

Quelle Langue

Quelle l’état psychologique?

05/05/2020Reconnaissance Automatique du Locuteur Djellali Hayet UBMA Algérie

3

R

ECONNAISSANCE

L’apellation ”reconnaissance de la parole” (ASR pour Automatic Speech Recognition en anglais) se réfère à plusieurs types de systèmes dont la mission est de décoder l’information portée par le signal vocal. On distingue plusieurs types de reconnaissance :

La reconnaissance du Locuteur dont le but est de reconnaître la personne qui parle parmi une population de locuteurs

(identificateur) ou de vérifier son identité (vérificateur).

La reconnaissance de Parole, dont le but est de transcrire l’information symbolique exprimée par le locuteur. (

Monolocuteur, Multilocuteur, ou Indépendant du Locuteur).

Reconnaissance de la Langue

Déterminer dans quelle langue la parole est prononcée.

Reconnaissance des émotions

Déterminer l’état psychologique du locuteur (triste, nerveux, content, peur ,…etc)

05/05/2020Reconnaissance Automatique du Locuteur Djellali Hayet UBMA Algérie

4

(3)

RAL

05/05/2020

5

Reconnaissance Automatique du Locuteur Djellali Hayet UBMA Algérie

Reconnaissance Automatique du Locuteur RAL : A QUI Appartient ce Son?

T

YPE DE

P

AROLE ET TAILLE

Mots isolés

Mots connectés

Détection de mots clés

Parole contrainte

Parole continue

Parole spontanée

• Taille du Vocabulaire

Quelques mots (5 – 50)

Petit vocabulaire (50 – 500)

Vocabulaire moyen (500 – 5000)

Grand vocabulaire (5000 – 50000)

Très grand vocabulaire (> 50000)

05/05/2020Reconnaissance Automatique du Locuteur Djellali Hayet UBMA Algérie

(4)

L’

APPAREIL

P

HONATOIRE

H

UMAIN

La production de la parole est assurée par plusieurs organes successifs: Les poumons sont indispensables dans ce processus puisqu’ils assurent la génération de l’air sous pression. Cet air, expulsé, traverse alors les cordes vocales qui entrent ou non en action pour produire un voisement qui correspond à la fréquence fondamentale .

Cette fréquence fondamentale produite est propagée dans l’ensemble du conduit vocal qui est de forme et de volume variable. Les dents et les lèvres agissent également par occlusion ou constriction.

Le conduit vocal est constitué du seul conduit buccal.

La luette et son prolongement vers le palais, le vélum, assurent normalement la fermeture du conduit nasal pendant la production de parole.

05/05/2020Reconnaissance Automatique du Locuteur Djellali Hayet UBMA Algérie

7

P

RODUCTION ET PERCEPTION DE LA

P

AROLE

Anatomie

Drygaglo ‘Traitement de la parole’, EPFL

Lausanne(2005).

Il n’ y a pas à proprement parlé d’organes spécifiques destinés à la production de la parole.

La fréquence de vibration des cordes vocales est appelée

fréquence du

fondamental (pitch)

hommes: 80-200 Hz,

femmes: 150-450 Hz,

enfants: 200-600 Hz

05/05/2020Reconnaissance Automatique du Locuteur Djellali Hayet UBMA Algérie

8

(5)

R

ECONNAISSANCE

A

UTOMATIQUE DU

L

OCUTEUR

RAL

Définition

Obtenir l’identité d’une personne à partir d’un échantillon de voix

05/05/2020

9

Reconnaissance Automatique du Locuteur

Identification Automatique du Locuteur

Vérification Automatique du Locuteur

Dépendant du Texte

Indépendant du Texte Dépendant

du Texte

Indépendant du Texte

Reconnaissance Automatique du Locuteur Djellali Hayet UBMA Algérie

TYPE DERAL

Dépendant du texte

: un texte spécifique est prononcé par les locuteurs en phase d’apprentissage et test

Indépendant du Texte

: Les textes prononcés sont libres. Les locuteurs prononcent des textes lors d’apprentissage différent des textes en phase de Test.

05/05/2020Reconnaissance Automatique du Locuteur Djellali Hayet UBMA Algérie

(6)

M

ODE D

IDENTIFICATION

Ensemble Ouvert

Le nombre n’est pas limité.

Ensemble Fermé

Un nombre fixe de locuteurs de 1 à N

Ex: N=100 locuteurs ç identifier

05/05/2020

11

Reconnaissance Automatique du Locuteur Djellali Hayet UBMA Algérie

Identification

Automatique du Locuteur

Ensemble Ouvert

Ensemble Fermé

R

ECONNAISSANCE

A

UTOMATIQUE DU

L

OCUTEUR

Objectifs

obtenir l’identité d’une personne à partir d’un échantillon de voix.

La RAL comporte deux phases:

1- Apprentissage : créer les modèles de chaque locuteur

2- Test : effectuer un calcul des scores , Identifier la personne à partir d’un nouveau échantillon de voix

05/05/2020

12

Reconnaissance Automatique du Locuteur Djellali Hayet UBMA Algérie

(7)

LES ÉTAPES DE LA RECONNAISSANCE RAL PHASE APPRENTISSAGE

05/05/2020

Module d’apprentissage 13

Signal de Parole Prétraitement

Extraction de Caractéristiques Modélisation des

Locuteurs

Modèles L1, L2, …LN 70% des échantillons pour

chaque locuteur Prétraitement: Réduire le bruit

et éliminer le silence

Extraction de Caractéristiques Pertinentes: Les coefficients

MFCC ou LPCC,..

Les Modèles de Mélanges Gaussiennes GMM ou les Modèles de Markov Cachés

Reconnaissance Automatique du Locuteur Djellali Hayet UBMA Algérie

LES ÉTAPES DE LA RECONNAISSANCE RAL PHASE DE TEST

05/05/2020

Signal de Parole

Test

Prétraitement

Extraction de Caractéristiques

Décision

Modèles Appris L1, L2, …LN

Identité du 70% des échantillons pour

chaque locuteur

Calcul des Scores

Reconnaissance Automatique du Locuteur Djellali Hayet UBMA Algérie

(8)

P

ARTIE

I

Module

Prétraitement

05/05/2020

15

Reconnaissance Automatique du Locuteur Djellali Hayet UBMA Algérie

L

ES ÉTAPES DE LA

R

ECONNAISSANCE

RAP M

ODULE

P

RÉTRAITEMENT

L’énoncé de parole d’un locuteur comporte également des trames qui ne sont pas représentatives de la voix de l'auteur de l'énoncé pas porteuses d’informations utiles et par conséquent affecterons les performances du système comme le silence ou le bruit.

BUT: Récupérer uniquement le signal de parole éliminer le silence et diminuer le bruit.

05/05/2020

16

Reconnaissance Automatique du Locuteur Djellali Hayet UBMA Algérie

(9)

L

ES SONS SIFR

,

WAHID

,

ITHNANE

,…

TISAA

05/05/2020

17

Reconnaissance Automatique du Locuteur Djellali Hayet UBMA Algérie

PRÉTRAITEMENTS

LA DÉTECTION DU SILENCE

En cette étape, nous procédons à l’élimination des trames inutiles et plus précisément le silence ou les trames de faible énergie.

Le Taux de passage par zero ZCR et l’energie sont calculées pour évaluer les zones à supprimer.

05/05/2020Reconnaissance Automatique du Locuteur Djellali Hayet UBMA Algérie

(10)

D

ETECTION

P

AROLE

–N

ON

P

AROLE

Détection des zones voisées/ non voisées permettent de se concentrer sur les zones de parole.

Son voisés= quasi périodque Voyelles

Sons non voisés ف

Le taux de passage par zéro

Energie (à court terme)

05/05/2020

19

Reconnaissance Automatique du Locuteur Djellali Hayet UBMA Algérie

L

E SON

S

IFR

05/05/2020

20

Reconnaissance Automatique du Locuteur Djellali Hayet UBMA Algérie

(11)

S

ON

V

OYELLE A

أ

EN ARABE

05/05/2020

21

Reconnaissance Automatique du Locuteur Djellali Hayet UBMA Algérie

C

HOIX ET LECTURE DU FICHIER SON

(1)

[filename, pathname] = uigetfile('*.wav', 'Pick a Wav file');

if isequal(filename,0) || isequal(pathname,0)

disp('User pressed cancel')

else

disp(['Son selectionne ', fullfile(pathname, filename)])

end

%6500+4*1024

[X,fs]=audioread(filename); sound(X,fs)

05/05/2020Reconnaissance Automatique du Locuteur Djellali Hayet UBMA Algérie

(12)

L

ES SONS DE

S

IFR

,

WAHID

,…

TISAA

05/05/2020

23

Les Zones marquées en rouge 1« parole» les autres

0« silence»

Reconnaissance Automatique du Locuteur Djellali Hayet UBMA Algérie

2- L

ES MÉTHODES NON PARAMÉTRIQUES

(

EXEMPLE

)

Analyse à court terme

24 Analyse acoustique de la parole| para métrisation| Méthodes d'analyse acoustique | conclusion

exemple

05/05/2020Reconnaissance Automatique du Locuteur Djellali Hayet UBMA Algérie

(13)

2- L

ES MÉTHODES NON PARAMÉTRIQUES

(

EXEMPLE

)

Analyse à court terme

25 Analyse acoustique de la parole| para métrisation| Méthodes d'analyse acoustique | conclusion

Énergie

Puissance

Taux de passages par zéro

Amplitude moyenne

05/05/2020Reconnaissance Automatique du Locuteur Djellali Hayet UBMA Algérie

P

ARTIE

2

RAL

 Extraction de Caractéristiques

 Prochain Cours Partie 2

05/05/2020Reconnaissance Automatique du Locuteur Djellali Hayet UBMA Algérie

(14)

Merci de Votre Attention

05/05/2020

27

Reconnaissance Automatique du Locuteur Djellali Hayet UBMA Algérie

Références

Documents relatifs

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des

Wright, c’est une figure nouvelle qui prend naissance dans Ie roman noir américain : Ie Nouveau Noir, bardé d’une cuirasse intellectuelle qui en fait l’égal du Blanc, iI se

Abstract : Dans le cadre de ce travail de thèse, nous nous intéressons au problème d’amélioration des performances de reconnaissance automatique de locuteur en mode indépendant

Figure I.13 — Les performances d’un syst`eme RAL `a base fusion de donn´ee entre GMM-UBM et GMM-SVM.. figure I.13 illustre les performances des deux syst`emes GMM/SVM et GMM/UBM

Les Mod`eles de M´elange de lois Gaussiennes Gaussian Mixture Models GMM [Reynolds and Rose, 1995], [Reynolds et al., 2000], un HMM `a un seul ´etat, restent les mod`eles ´etat de

Although this study clarifies the nature and composition of the fluid phase present in subducted sediments, clearly more experiments are needed to constrain the interaction of

ﺔﯿﺟرﺎﺨﻟا ةرﺎﺠﺘﻠﻟ يﺮﻈﻨﻟا رﺎطﻹا :لوﻷا ﻞﺼﻔﻟا 7 - لﻘﻨﻟا تﺎﻘﻔﻨ مادﻌﻨا ﺔﯿرظﻨﻟا ضرﺘﻔﺘ ﻔﻨﻟا ﻩذﻫ نﺄﺒ ﺎﻤﻠﻋ ﺔﯿﻛرﻤﺠﻟا ﺔﻔﯿرﻌﺘﻟاو ﻠﻛﺘ نﻤﻀ بﺴﺤﺘ تﺎﻘ ﺔﻔ ﺔﻌﻠﺴﻟا جﺎﺘﻨإ ؛

Cette deuxième partie de notre corpus nous a permis d’utiliser un questionnaire adressé aux enseignants de la 1ére année moyenne avec des questions qui se situent au niveau de