• Aucun résultat trouvé

Sujet de magistère

N/A
N/A
Protected

Academic year: 2022

Partager "Sujet de magistère"

Copied!
1
0
0

Texte intégral

(1)

Sujet de magistère

Proposé par Daniel Moraru et Laurent Besacier Laboratoire CLIPS, équipe GEOD

Mots clés

Traitement de la parole, indexation, segmentation en locuteur, regroupement hiérarchique, machine à support de vecteurs

Contexte général

Les domaines de recherche de l'équipe GEOD sont le traitement de la parole et le dialogue.

Dans le domaine de traitement de la parole une des thèmes auquel on s'intéresse est l'indexation des documents audio notamment l'indexation selon le locuteur (segmentation en locuteurs) ou autres clés.

L'indexation des documents audio est une nouvelle tache issue de la nécessite d'accéder facilement à des bases de données de documents multimédias. Différentes clés peuvent être définies comme le locuteur, les séquences musique parole, la langue.

Le principe général pour la segmentation en locuteurs est de détecter d'abord les changements de locuteurs et ensuite de regrouper les segments issus de cette phase selon le locuteur. La partie la plus importante pour le résultat final est la partie finale c'est à dire le regroupement.

Une technique assez récente pour la classification est fondée sur les machines à support de vecteurs (Support Vector Machine: SVM). L'idée est l'apport de tels algorithmes de classification pour la segmentation en locuteurs.

Travail demandé

Le travail demandé sera d'effectuer une étude sur la possibilité d'appliquer la technique SVM à la segmentation notamment dans le regroupement.

L'étudiant fera d'abord une étude bibliographique sur la segmentation et la technique SVM.

Ensuite il essayera d'appliquer cette technique en utilisant un des toolkits SVM disponibles sur le web et comparer les résultats avec l'état de l'art en termes d'erreur et temps de calcul. La validation de la méthode se fera sur la base de données NIST 2002 pour la segmentation en locuteurs et sur la base des données TREC 2002 pour la segmentation parole / musique.

L'étudiant disposera d'un PC, d'une connexion Internet et d'une connexion sur une machine Linux pour le développement. Il aura aussi à disposition le système de segmentation du laboratoire.

Contact

Daniel Moraru ou Laurent Besacier Laboratoire CLIPS, équipe GEOD Université Joseph Fourier

BP 53 – 38041 GRENOBLE Cedex 9

Mail: daniel.moraru@imag.fr ; laurent.besacier@imag.fr

Références

Documents relatifs

Pour se faire, chaque objet a été immergé au coeur d’un même fond colorimétriquement dense image d’une Macbeth DC Color Checker afin de ne privilégier aucune approche

Il s agit ici de déterminer les germes de départ (courbes initiales) et les classes auxquelles seront rattachées les régions. Notre méthode se compose de deux étapes :.. A la suite

point un algorithme très eae de reherhe dans une base de données sonores.. qui démontre à la fois la ompatibilité des strutures salables ave

Ces cinq cantons sont très nettement orientés à gauche, François Hollande obtenant entre 60 % et 66 % des suffrages exprimés sur ces territoires lors du second

‚ Ouvrages censurés (XVI ème , index librorum prohibitorum). ‚ Liste alphabétique de termes ñ

Discrete time approximation and Monte Carlo simulation of backward stochastic differential equations. Méthodes probabilistes pour les équations de

Pour évaluer notre approximation de la distance d’édition de graphes, nous avons procédé à différentes expérimentations où à chaque fois nous avons produit une comparaison

Ce qui confirme que l'inertie à elle seule peut servir à choisir un sous-ensemble de mots en ne gardant la fréquence que pour s'arrêter quand elle devient trop faible