• Aucun résultat trouvé

Reconnaissance des instruments ` a partir d’extraits de musique multi-instrumentaled’extraits de musique multi-instrumentale

Dans le document The DART-Europe E-theses Portal (Page 186-189)

classification des instruments de musique

C. R´ ecapitulation des performances des diff´ erents syst` emes

X. Reconnaissance des instruments ` a partir d’extraits de musique multi-instrumentaled’extraits de musique multi-instrumentale

Nous pr´esentons dans ce chapitre notre syst`eme de reconnaissance des instruments de musique en contexte multi-instrumental. Au moment o`u ce syst`eme a ´et´e d´evelopp´e nous n’avions pas encore exp´eriment´e tous les descripteurs pr´esent´es au chapitre IV ni explor´e tous les algorithmes de s´election d’attributs compar´es au chapitre VI. Par cons´equent, ne sont utilis´es ici que 355 attributs parmi les 543 examin´es au final (ils seront sp´ecifi´es dans la section X-2-B). De plus, l’approche de s´election FSFC n’est pas exploit´ee puisqu’elle n’a ´et´e d´evelopp´ee que tardivement.

Des choix de param`etres effectu´es `a l’´epoque (tels que le nombre d’attributs s´electionn´es et leur normalisation, les param`etres des SVM ou la longueur de d´ecision) ne correspondent pas `a ceux que nous pr´econisons `a la lumi`ere des derni`eres exp´eriences effectu´ees.

L’architecture propos´ee a fait l’objet d’un article de revue [Essid et al., 2006a] dont nous proposons ici un r´esum´e. Nous pensons que de meilleures performances que celles qui ont ´et´e publi´ees `a l’´epoque peuvent ˆetre atteintes en exploitant les r´ecents d´eveloppements.

Nous commen¸cons par une description de l’approche adopt´ee et nous pr´esentons ensuite une synth`ese des r´esultats exp´erimentaux obtenus avant de proposer des conclusions. Pour plus de d´etails nous invitons le lecteur `a consulter l’article correspondant (cf.annexe C).

X-1. Description du syst` eme propos´ e

L’id´ee de d´epart est d’identifier tous les m´elanges ou combinaisons d’instruments pouvant ˆetre jou´es simultan´ement `a un instant donn´e de la pi`ece musicale trait´ee. Dans ce sch´ema, les classes peuvent ˆetre, par exemple, piano, (piano+contrebasse), (piano+contrebasse+batterie), (batterie+contrebasse), etc. Imm´ediatement se pose le probl`eme de la combinatoire ´elev´ee qui

174 X. Reconnaissance des instruments `a partir d’extraits de musique multi-instrumentale

en r´esulte. A titre d’exemple, en restreignant l’univers des instruments `a seulement 10 possibles, pour des orchestrations variant des solos aux quartets, en th´eorie le nombre de combinaisons possible atteint d´ej`a C110+ C210+C310+ C410 = 595. ´Evidemment, un syst`eme devant tester un nombre aussi ´elev´e de classes (potentiellement encore plus ´elev´e pour un nombre d’instruments et d’orchestrations plus important) avant de parvenir `a une d´ecision, peut difficilement ˆetre mis en œuvre en pratique. La question qui se pose est alors : Comment un syst`eme ciblant la classification de m´elanges d’instruments peut-il ˆetre viable ?

D’abord, la r´eduction de la complexit´e du syst`eme doit essentiellement concerner la proc´edure de test. En effet, des proc´edures d’apprentissage de complexit´e ´elev´ee peuvent ˆetre tol´er´ees puisqu’elles sont sens´ees ˆetre effectu´ees “une fois pour toutes” dans des laboratoires disposant de ressources importantes de calcul, alors que le test doit rester assez “l´eger” pour ˆetre support´e par l’´equipement des utilisateurs finaux.

Ensuite, mˆeme si en th´eorie toutes les combinaisons d’instruments sont possibles, certaines de ces combinaisons sont particuli`erement rares en musique. Il est ´evident que le choix de l’orchestration constitue l’un des degr´es de libert´e du compositeur. Cependant, si une large vari´et´e d’orchestrations est utilis´ee dans la musique contemporaine (en particulier en classique et jazz), il est clair que la majorit´e des formations du type trio et quartet utilisent des orchestrations typiques, en rapport avec le genre musical. Par exemple, en jazz, les trios typiques se composent d’une guitare ou d’un piano, d’une contrebasse et d’une batterie ; les quartets font intervenir un piano ou une guitare, une contrebasse, une batterie et un instrument `a vent ou une voix chant´ee...

Dans une vaste majorit´e de genres musicaux, chaque instrument, ou groupe d’instruments, joue un rˆole typique, en relation avec le rythme, l’harmonie ou la m´elodie. Clairement, les pi`eces de jazz faisant intervenir le piano, la contrebasse et la batterie sont beaucoup plus probables que des pi`eces qui mettraient en sc`ene violon et saxophone t´enor sans aucun autre accompagnement, ou des duos d’alto et de hautbois... Par cons´equent, des m´elanges aussi rares peuvent ˆetre raisonnablement ´elimin´es de l’ensemble des classes possibles (optionellement) ou inclus dans une classe “divers”.

Mˆeme si l’on consid`ere que les orchestrations les plus courantes, le nombre de combinaisons possibles reste ´elev´e. L’id´ee cl´e est d’exploiter une taxonomie hi´erarchique qui regroupe les m´elanges d’instruments pr´esentant des caract´eristiques acoustiques similaires au sein de super-classes (constituant les niveaux ´elev´es de la taxonomie). Nous d´efinissons ainsi un sch´ema de classification hi´erarchique fonctionnant sur le mˆeme principe que celui pr´esent´e dans le chapitre

X-1. Description du syst`eme propos´e 175

IX, dans lequel le nombre de classes possibles `a un niveau donn´e de la hi´erarchie se trouve r´eduit (par rapport au nombre total de m´elanges possibles).

Cette taxonomie doit donner lieu `a de bonnes performances de classification et dans la mesure du possible ˆetre “lisible” afin qu’un nombre maximum de super-classes pr´esentent des ´etiquettes qui puissent ˆetre facilement formul´ees par l’utilisateur. De cette fa¸con, une classification “gros-si`ere” (s’arrˆetant `a des niveaux interm´ediaires de la taxonomie) demeure utile.

Un diagramme en blocs du syst`eme propos´e est donn´e dans la figure X.1.

Extract. attrib.

Attributs à extraire, d’après 2.a Modèles SVM + Taxonomie 3. Phase de test Fusion des décisions

Fig. X.1 Sch´ema de principe du syst`eme de reconnaissance. Les blocs de test sont gris´es.

A l’´etape d’apprentissage, le syst`eme effectue les tˆaches suivantes : 1) Construction de la taxonomie :

a) les descripteurs (donn´es dans le tableau X.1) sont extraits du signal ;

b) la dimension de l’espace des attributs est r´eduite par une PCA donnant lieu `a un ensemble (plus petit) d’attributs transform´es (cf.section VI-3) ;

c) un algorithme de clustering hi´erarchique (exploitant des distances probabilistes robustes) est utilis´e pour inf´erer une taxonomie hi´erarchique (tel que d´ecrit dans la section IX-3-B) ;

2) Apprentissage de classificateurs :

a) l’ensemble d’attributs original (obtenu `a l’´etape 1.a) est trait´e par l’algorithme de s´election IRMFSP utilis´e dans une configuration binaire (cf.chapitre VI) pour pro-duire un sous-ensemble optimal d’attributs pour chaque paire de classes possible,

176 X. Reconnaissance des instruments `a partir d’extraits de musique multi-instrumentale

`

a chaque nœud de la taxonomie (obtenue `a l’´etape 1.) ;

b) des classificateurs SVM (cf.section V-2) sont appris `a chaque nœud de la taxonomie se basant sur les attributs s´electionn´es `a l’´etape 2.a.

Pour le test (blocs gris´es), seuls les attributs s´electionn´es sont extraits du signal audio pour ˆetre utilis´es dans la classification exploitant la taxonomie et les SVM apprises en 2.a.

X-2. Performances du syst` eme propos´ e

Nous testons notre syst`eme sur le corpus MINS (cf. chapitre II), compos´e d’extraits de jazz.

Nous pensons que l’approche propos´ee peut ˆetre facilement suivie pour d’autres genres de musique (en supposant que le timbre des instruments n’ait pas ´et´e fortement modifi´e par des effets d’´equalisation ou d’autres retouches par des ing´enieurs du son).

Dans le document The DART-Europe E-theses Portal (Page 186-189)