• Aucun résultat trouvé

Lagure 3.1 montre une interfa e d'interrogation, un exemple de requête saisie par un utilisateur etla réponse.

Un index pour la re her he par

ontenu dans une olle tion de

sour es musi ales symboliques

Les travaux exposés dans e hapitre ont fait l'objet de deux publi ations : In- dexingSymboli Musi S ore [23℄etTheMelodi SignatureIndex For FastContent- Based Retrieval of Symboli S ores [24℄.

Dans e hapitre nous proposons l'utilisationd'un index pour la re her he par ontenu dans une grande olle tionde sour es musi ales symboliques. Il permet de onduire diérents typesde re her he sans avoirà hangerde stru ture d'index. Sa parti ularité repose sur l'en odage de diverses informations qui interviennent dans lesdiérentes re her hes.Ils'appuiedemanièrefondamentalesurlanotiondesigna- ture algébrique. L'index utilisé est une adaptation de l'AS-index [31℄ aux données musi alessymboliques. Pour lare her he appro hée, lasimilaritéest mesurée grâ e àla distan e

n

-gramintroduitedans [81℄.

1 Remarques préliminaires

On sepla edansle ontexted'unebibliothèquede partitionsnumériques(DSL), 'est-à-dire une olle tionde ontenu musi al symbolique. Une partition peut être interrogée de plusieurs façons : re her he exa te, transposée, ave ou sans rythme, et re her he appro hée par motif. On pourrait également envisager une re her he uniquement rythmique ou par rythme relatifsimplement en adaptant les prin ipes exposés dans e hapitre. La re her he par similarité (déterminer des ensembles de partitionssimilaires)n'est en revan he pas abordée i i.

Dénition 31 (Représentation exa te, représentation transposée). On distingue deuxtypesderéprésentations.Lareprésentationexa te estlasuite absoluedes notes de la partition. La représentation transposée est lasuite relative des notes, 'est-à- dire les intervalles su essifs de la partition. L'information rythmique peut être ou non asso iée à ha une des représentations.

Exemple 7. Soit la représentation exa te (ou absolue) : <21; 22; 21; 26; 26; 28; 24 >.

La représentation transposée (ou relative) orrespondante est la suivante :

<+1; -1; +5; 0; +2; -4>.

On remarqueque la représentation exa te est équivalente à la représentation trans- posée ave une information supplémentaire (valeur de la note initiale).

Une appro he naïve onsiste à sto ker autant de représentations que de types d'interrogationspossibles,etde onstruireunindex pour ha une. Ilest évidentque ette solution n'est plus envisageable dès que la olle tion grandit. Le volume de données à sto ker et à indexer est en eet rédhibitoire. De plus, la répétition des informations d'une représentation à l'autre montre que ette appro he est ontre- produ tive.Réussirà onstruireunindexuniquepourtouslestypesd'interrogations représente un avantage onsidérable.

2 Re her he par ontenu

Un servi e de re her he par ontenu onçu pour notre olle tion de ressour es musi alessymboliques doit prendre en entrée un motif

P

et renvoyer une partition ayant aumoins une voix

v

, telle qu'elle mêmeait aumoins une position

p

telle que

P

orresponde au fragment

fp

= v[p]v[p + 1] . . .

. La notion de orrespondan e est totalement subje tive.

Prin ipe de re her he exa te

Lagure4.1montrequatremotifsquipeuventrépondreaumêmemotifpasséen requête, en tant que re her he exa te, re her he transposée ave rythme, re her he mélodique, re her he transposée sans rythme.

1. Re her he exa te 2.Re her he transposée, ave rythme

3. Re her he exa te, sans rythme 4. Re her he transposée, sans rythme

Fig.4.1 Quatre typesde re her he.

L'interprétation1 orrespondàunere her heexa teave rythme.Lemotifpassé en requête doit être représenté pré isémentdans la partition.

L'interprétation2 orrespond àune re her he transposée ave rythme. Le motif passé en requête et le fragment restituéen réponse ont la même su ession d'inter- valles, mais pas la même su ession de notes. On remarque que l'interprétation 1 répond également àune re her he transposée ave rythme.

L'interprétation3est une re her he exa te sans rythme.Lasu ession desnotes est la même que elle du motif passé en requête, mais le rythme est ignoré. L'in- terprétation1répond àune re her he exa te sans rythme,mais pas l'interprétation 2.

Enn, l'interprétation 4 est une re her he transposée sans rythme. On her he les fragments de voix ayant la même su ession d'intervalles que elle du motif re her hé, en ignorant le rythme. Cette requête est la plus générale, 'est elle qui aura leplus grand nombre de réponses.

Prin ipe de re her he appro hée

La re her he appro hée pour une distan e

d

se dénit omme suit : pour un motif

P

donné, et un fragment

fp

d'une voix

v

à une position

p

, on dit qu'il y a orrespondan esi

d(P, fp) ≤ η

pourunetoléran ed'erreur

η

dénieparl'utilisateur. Ladistan e que l'on souhaiteutiliserpour mesurer lasimilaritéentre deux frag- ments de voix est la distan e d'édition [53℄, dont on a rappelé la dénition dans le hapitre 1. Il est onnu que la distan e d'édition est di ile à indexer [58℄. Notre appro he se passe en deux étapes, en suivant une méthode proposée par [19℄. Pre- mièrement on fait une re her he appro hée pour une distan e qui est une borne inférieure de ladistan e d'édition, etpourlaquelle onpeut utiliser un index. Pré i- sément,nousutiliseronsladistan e

n

-gram

An

introduitedans[81℄(dontonrappelle ladénitiondans e hapitre,se tion7dénition 40).Unere her he baséesur ette distan e retrouve tous les fragments de voix tels que

An(P, fp) ≤ τ

. Tous les frag- ments ne vériant pas ette inégalité (et don é artés) ne vérient a fortiori pas

dedit(P, fp) ≤ τ.

Cependant, omme

An

estuneborneinférieuredeladistan ed'édition,ilpeutse produire que

An(P, fp) ≤ τ < d

edit

(P, fp)

, autrementdit que

fp

soitun faux positif. La deuxième étape a ède aux andidats restants et fait une nouvelle re her he, ette fois iave ladistan e d'édition, an d'é arter lesfaux positifs.

La distan e

An

sert don de ltre pour ladistan e d'édition.

3 Prin ipes généraux du MS-index

Le prin ipe de l'index introduit dans [31℄, appelé AS-index, peut être résumé ommesuit:(i)unestru turetraditionnelledetabledeha hage;(ii)les lésutilisées sont des fragments musi aux de taille xe, les

n

-gram, présents dans au moins un do ument de la olle tion; (iii) la fon tion de ha hage s'appuie sur un al ul de signature algébrique des

n

-grams.

Silesdeux premiersaspe tssontrelativement lassiquesdansledomainedel'in- dexationtextuelle[56℄, ledernierpoints'inspirede travauxré entssur letraitement de texte basés sur les signatures algébriques[54, 31℄. Dansle présent travail,on les adapteaux spé i ités de lamusique symbolique.

L'e a ité de et index repose en grande partie sur les propriétés al ulatoires dessignaturesalgébriques.Onadaptel'AS-indexauxdonnéesmusi alessymboliques pourreprésenterdansun enregistrementtoutel'informationmusi alené essaireaux diérents types de re her he. On ne parle alors plus de signature algébrique mais signaturemusi ale.Ce nouvelindex est appeléMS-index(Musi alSignatureIndex).

Remarque. Il est évident que l'indexation de ontenu musi al ne peut pas s'envi- sager de lamême manière que l'indexation d'un texte. Une diéren e inévitable est l'absen ede notion demot dans le ontextemusi al.Ledé oupage de lapartitionen segments de longueurs onstantes

n

permetde réintroduire arti iellement ette no- tion. En ela on se rappro he beau oup des te hniques utilisées en bio-informatique et re her he génomique [14℄.

4 Notations, rappels et dénitions

Unepartitionsymboliqueest dé oupée en voixmonophoniques, haque voix est une séquen e d'éléments de

E × D

.

Dénition 32 (Des ripteur). On appelle des ripteur la représentation d'une voix. Un des ripteur est en odé textuellement sous la forme

D =

<e

1

-d

1

; e

2

-d

2

;

. . .

; e

n

-d

n

> où haque e

i

∈ E

ode un événement et haque d

i

∈ D

sa durée.

Dans equisuit

ǫ(D)

désigneunesuited'événements,

τ (D)

lasuitedesintervalles dans

ǫ(D)

, et

ρ(D)

la suite des durées de

D

.

Autrement dit,

ǫ(D)

représente le prol mélodique de la voix,

τ (D)

l'évolution relativedes notes et

ρ(D)

leprolrythmiquede lavoix.Toutesles ombinaisonsde es représentations sont possibles.

Unévénement musi al est représenté par un élément d'un orps ni.

Onrappellequ'un orpsniestunensemblenimunidedeuxloisinternesnotées

+

et

×

, asso iatives, ommutativeset distributives, telles que tous les élémentsde l'ensembleontun inverse sauf l'élémentneutre additif. On note

K

un orps ni. Dénition 33 (Elémentprimitif). Soit

K

un orps ni. Un élément primitif de

K

est un élément

α

tel quelespuissan es su essivesde

α

énumèrenttous leséléments de

K

.

Unélémentprimitifn'est pas né essairement unique.

On hoisitle orpsnisà256élémentspourl'en odagedesévénementsmusi aux. Ce i permet l'en odage de 12 o taves de 12 notes, ainsi que elui des silen es, ns de phrases, et autres ara tères parti uliers.

On introduit à présent une suite de dénitions de signatures algébriques ainsi que leurs propriétés. C'est sur es propriétés fondamentales que repose l'e a ité de notre index. Dans e qui suit, on désigne par

D = e0e1. . . eM−1

un des ripteur en odantune séquen e de

M

événements, onsidérés ommedes élémentsde

K

. Dénition 34 (AS-signature). Soit

K

un orps ni et

α

un élément primitif. La

α

-signature algébrique d'undes ripteur

D

est dénie par

ASα(D) = e0+ e1.α + e2.α2

+ . . . + eM−1.αM−1

Dénition 35 (

ASm

-signature). Soit

K

un orps ni et

α1, . . . αm

m

éléments pri- mitifs distin ts. Alors la

m

-signature algébrique d'un des ripteur

D

est obtenue en on aténant l'ensemble des

αi

-signatures. On obtient ainsi une signature de taille

On s'intéresse à la signature partielle d'un des ripteur. Les propriétés al ula- toires de ette signature sont un des piliersde l'index.

Dénition36 (Signature umuléeCAS). Soit

l ∈ [0, M − 1]

une positionde

D

. La signature algébrique umulée

CAS(D, l)

en

l

est la signature algébrique du préxe de

D

nissant en

el

, 'est-à-dire

CAS(D, l) = AS(e0. . . el).

Enn, ons'intéresse au as parti ulier des

n

-gramstirés d'un des ripteur

D

.

Dénition 37 (Signature partielle et signature

n

-gram). La signature algébrique partielle de

l

à

l

est la signature de la sous- haîneextraite de

D

entre les positions

l

et

l

:

P AS(D, l, l′) = AS(elel+1. . . el′).

En parti ulier, on s'intéresse aux sous- haînesde longueur

n

:

NAS(D, l) = P AS(D, l − n + 1, l).

Lorsqu'au une onfusion n'est possible, onne pré ise pas le des ripteur

D.

Fig.4.2 Diérentes signatures d'un des ripteur.

La gure4.2 ré apitule lesliens entre lesdiérentes signatures.

Les propriétés suivantes permettent de al uler de manièrein rémentale les dif- férentes signatures lors de l'indexation d'une partition ou du pré-traitement d'un motif de re her he. La dernière propriété est utilisée de manière ru iale lors de la re her he ee tive.

Proposition 1. Soient

K

un orps et

α

un élément primitif. On a les égalités suivantes : 1.

CAS(l) = CAS(l − 1) + elα

l

2.

NAS(l) =

N AS(l−1)−el−n

α

+ el.α

n−1

3.

CAS(l) = CAS(l

) + αl′+1

P AS(l′+ 1, l)

Ces propriétés se vérient très simplement et ne né essitent pas de démonstra- tion.

Fig. 4.3 Stru ture de l'index

5 Création du MS-index

L'index de signature musi ale (MS-index) a une stru ture lassique de table de ha hage, qu'on note

HD[0 . . . L − 1]

de taille

L = 2

c

. Lesélémentsde HD renvoient vers des lignes de taillevariable. Chaque ligne ontient une liste d'enregistrements qui indexe ha un un

n

-gram présent dans aumoins un des ripteur.

On détailleà présent la onstru tionde l'index.

On ommen e par répertorier de manièreexhaustive les

n

-grams ontenus dans la olle tion ( 'est-à-dire qu'on fait l'inventaire de haque

n

-gram de haque voix de haque partition de la olle tion). Sur haque

n

-gram ainsi exhibé, on al ule plusieurs signatures quivont déterminer l'organisationde l'index.

Soit

G

un

n

-gramtiréde

ǫ(D)

,et

τ

lafon tiontransformantun

n

-gramde notes

en un

(n − 1)

-gram d'intervalles de notes (ou progression relative des notes). Soit

S = hL(G) = ASm(τ (G)).

On al ule alors

i

l'index de laligne qui réfère à

G

par

i = S mod L.

En

HD[i]

,on insèrel'enregistrement suivant.

Dénition 38. Soit

G

un

n

-gram à la position

p

d'undes ripteur

D

. L'enregistre- ment indexant

G

est un 6-uplet

(id(D), p, cǫ, cρ, ASρ, ⊥)

1.

= CAS(ǫ(D), p)

2.

cρ= CAS = (ρ(D), p)

3.

ASρ= ASm(ρ(D), p)

4.

est lanote la plus bassede

G

Plusieurs hoses sont à remarquer. Premièrement on ne al ule qu'une seule si- gnature sur le

n

-gram

G

, qui porte sur sa représentation transposée (ou relative). La fon tion de ha hage

hL

est la fon tion qui à un

n

-gram

G

asso ie la signature algébriquedesareprésentationtransposée.Ensuite,lessignaturessto kéesdansl'en- registrement orrespondant sont les signatures umulées, 'est-à-dire les signatures du des ripteurtronqué à laposition

p

.

On va voir que es informations sont susantes pour réaliser tous les types de requêtes dénis plus haut, transposée, exa te, ave ousans rythme.

6 Re her he exa te de partitions

Documents relatifs