Lagure 3.1 montre une interfa e d'interrogation, un exemple de requête saisie par un utilisateur etla réponse.
Un index pour la re her he par
ontenu dans une olle tion de
sour es musi ales symboliques
Les travaux exposés dans e hapitre ont fait l'objet de deux publi ations : In- dexingSymboli Musi S ore [23℄etTheMelodi SignatureIndex For FastContent- Based Retrieval of Symboli S ores [24℄.
Dans e hapitre nous proposons l'utilisationd'un index pour la re her he par ontenu dans une grande olle tionde sour es musi ales symboliques. Il permet de onduire diérents typesde re her he sans avoirà hangerde stru ture d'index. Sa parti ularité repose sur l'en odage de diverses informations qui interviennent dans lesdiérentes re her hes.Ils'appuiedemanièrefondamentalesurlanotiondesigna- ture algébrique. L'index utilisé est une adaptation de l'AS-index [31℄ aux données musi alessymboliques. Pour lare her he appro hée, lasimilaritéest mesurée grâ e àla distan e
n
-gramintroduitedans [81℄.1 Remarques préliminaires
On sepla edansle ontexted'unebibliothèquede partitionsnumériques(DSL), 'est-à-dire une olle tionde ontenu musi al symbolique. Une partition peut être interrogée de plusieurs façons : re her he exa te, transposée, ave ou sans rythme, et re her he appro hée par motif. On pourrait également envisager une re her he uniquement rythmique ou par rythme relatifsimplement en adaptant les prin ipes exposés dans e hapitre. La re her he par similarité (déterminer des ensembles de partitionssimilaires)n'est en revan he pas abordée i i.
Dénition 31 (Représentation exa te, représentation transposée). On distingue deuxtypesderéprésentations.Lareprésentationexa te estlasuite absoluedes notes de la partition. La représentation transposée est lasuite relative des notes, 'est-à- dire les intervalles su essifs de la partition. L'information rythmique peut être ou non asso iée à ha une des représentations.
Exemple 7. Soit la représentation exa te (ou absolue) : <21; 22; 21; 26; 26; 28; 24 >.
La représentation transposée (ou relative) orrespondante est la suivante :
<+1; -1; +5; 0; +2; -4>.
On remarqueque la représentation exa te est équivalente à la représentation trans- posée ave une information supplémentaire (valeur de la note initiale).
Une appro he naïve onsiste à sto ker autant de représentations que de types d'interrogationspossibles,etde onstruireunindex pour ha une. Ilest évidentque ette solution n'est plus envisageable dès que la olle tion grandit. Le volume de données à sto ker et à indexer est en eet rédhibitoire. De plus, la répétition des informations d'une représentation à l'autre montre que ette appro he est ontre- produ tive.Réussirà onstruireunindexuniquepourtouslestypesd'interrogations représente un avantage onsidérable.
2 Re her he par ontenu
Un servi e de re her he par ontenu onçu pour notre olle tion de ressour es musi alessymboliques doit prendre en entrée un motif
P
et renvoyer une partition ayant aumoins une voixv
, telle qu'elle mêmeait aumoins une positionp
telle queP
orresponde au fragmentfp
= v[p]v[p + 1] . . .
. La notion de orrespondan e est totalement subje tive.Prin ipe de re her he exa te
Lagure4.1montrequatremotifsquipeuventrépondreaumêmemotifpasséen requête, en tant que re her he exa te, re her he transposée ave rythme, re her he mélodique, re her he transposée sans rythme.
1. Re her he exa te 2.Re her he transposée, ave rythme
3. Re her he exa te, sans rythme 4. Re her he transposée, sans rythme
Fig.4.1 Quatre typesde re her he.
L'interprétation1 orrespondàunere her heexa teave rythme.Lemotifpassé en requête doit être représenté pré isémentdans la partition.
L'interprétation2 orrespond àune re her he transposée ave rythme. Le motif passé en requête et le fragment restituéen réponse ont la même su ession d'inter- valles, mais pas la même su ession de notes. On remarque que l'interprétation 1 répond également àune re her he transposée ave rythme.
L'interprétation3est une re her he exa te sans rythme.Lasu ession desnotes est la même que elle du motif passé en requête, mais le rythme est ignoré. L'in- terprétation1répond àune re her he exa te sans rythme,mais pas l'interprétation 2.
Enn, l'interprétation 4 est une re her he transposée sans rythme. On her he les fragments de voix ayant la même su ession d'intervalles que elle du motif re her hé, en ignorant le rythme. Cette requête est la plus générale, 'est elle qui aura leplus grand nombre de réponses.
Prin ipe de re her he appro hée
La re her he appro hée pour une distan e
d
se dénit omme suit : pour un motifP
donné, et un fragmentfp
d'une voixv
à une positionp
, on dit qu'il y a orrespondan esid(P, fp) ≤ η
pourunetoléran ed'erreurη
dénieparl'utilisateur. Ladistan e que l'on souhaiteutiliserpour mesurer lasimilaritéentre deux frag- ments de voix est la distan e d'édition [53℄, dont on a rappelé la dénition dans le hapitre 1. Il est onnu que la distan e d'édition est di ile à indexer [58℄. Notre appro he se passe en deux étapes, en suivant une méthode proposée par [19℄. Pre- mièrement on fait une re her he appro hée pour une distan e qui est une borne inférieure de ladistan e d'édition, etpourlaquelle onpeut utiliser un index. Pré i- sément,nousutiliseronsladistan en
-gramAn
introduitedans[81℄(dontonrappelle ladénitiondans e hapitre,se tion7dénition 40).Unere her he baséesur ette distan e retrouve tous les fragments de voix tels queAn(P, fp) ≤ τ
. Tous les frag- ments ne vériant pas ette inégalité (et don é artés) ne vérient a fortiori pasdedit(P, fp) ≤ τ.
Cependant, omme
An
estuneborneinférieuredeladistan ed'édition,ilpeutse produire queAn(P, fp) ≤ τ < d
edit
(P, fp)
, autrementdit que
fp
soitun faux positif. La deuxième étape a ède aux andidats restants et fait une nouvelle re her he, ette fois iave ladistan e d'édition, an d'é arter lesfaux positifs.La distan e
An
sert don de ltre pour ladistan e d'édition.3 Prin ipes généraux du MS-index
Le prin ipe de l'index introduit dans [31℄, appelé AS-index, peut être résumé ommesuit:(i)unestru turetraditionnelledetabledeha hage;(ii)les lésutilisées sont des fragments musi aux de taille xe, les
n
-gram, présents dans au moins un do ument de la olle tion; (iii) la fon tion de ha hage s'appuie sur un al ul de signature algébrique desn
-grams.Silesdeux premiersaspe tssontrelativement lassiquesdansledomainedel'in- dexationtextuelle[56℄, ledernierpoints'inspirede travauxré entssur letraitement de texte basés sur les signatures algébriques[54, 31℄. Dansle présent travail,on les adapteaux spé i ités de lamusique symbolique.
L'e a ité de et index repose en grande partie sur les propriétés al ulatoires dessignaturesalgébriques.Onadaptel'AS-indexauxdonnéesmusi alessymboliques pourreprésenterdansun enregistrementtoutel'informationmusi alené essaireaux diérents types de re her he. On ne parle alors plus de signature algébrique mais signaturemusi ale.Ce nouvelindex est appeléMS-index(Musi alSignatureIndex).
Remarque. Il est évident que l'indexation de ontenu musi al ne peut pas s'envi- sager de lamême manière que l'indexation d'un texte. Une diéren e inévitable est l'absen ede notion demot dans le ontextemusi al.Ledé oupage de lapartitionen segments de longueurs onstantes
n
permetde réintroduire arti iellement ette no- tion. En ela on se rappro he beau oup des te hniques utilisées en bio-informatique et re her he génomique [14℄.4 Notations, rappels et dénitions
Unepartitionsymboliqueest dé oupée en voixmonophoniques, haque voix est une séquen e d'éléments de
E × D
.Dénition 32 (Des ripteur). On appelle des ripteur la représentation d'une voix. Un des ripteur est en odé textuellement sous la forme
D =
<e1
-d1
; e2
-d2
;. . .
; en
-dn
> où haque ei
∈ E
ode un événement et haque di
∈ D
sa durée.Dans equisuit
ǫ(D)
désigneunesuited'événements,τ (D)
lasuitedesintervalles dansǫ(D)
, etρ(D)
la suite des durées deD
.Autrement dit,
ǫ(D)
représente le prol mélodique de la voix,τ (D)
l'évolution relativedes notes etρ(D)
leprolrythmiquede lavoix.Toutesles ombinaisonsde es représentations sont possibles.Unévénement musi al est représenté par un élément d'un orps ni.
Onrappellequ'un orpsniestunensemblenimunidedeuxloisinternesnotées
+
et×
, asso iatives, ommutativeset distributives, telles que tous les élémentsde l'ensembleontun inverse sauf l'élémentneutre additif. On noteK
un orps ni. Dénition 33 (Elémentprimitif). SoitK
un orps ni. Un élément primitif deK
est un élémentα
tel quelespuissan es su essivesdeα
énumèrenttous leséléments deK
.Unélémentprimitifn'est pas né essairement unique.
On hoisitle orpsnisà256élémentspourl'en odagedesévénementsmusi aux. Ce i permet l'en odage de 12 o taves de 12 notes, ainsi que elui des silen es, ns de phrases, et autres ara tères parti uliers.
On introduit à présent une suite de dénitions de signatures algébriques ainsi que leurs propriétés. C'est sur es propriétés fondamentales que repose l'e a ité de notre index. Dans e qui suit, on désigne par
D = e0e1. . . eM−1
un des ripteur en odantune séquen e deM
événements, onsidérés ommedes élémentsdeK
. Dénition 34 (AS-signature). SoitK
un orps ni etα
un élément primitif. Laα
-signature algébrique d'undes ripteurD
est dénie parASα(D) = e0+ e1.α + e2.α2
+ . . . + eM−1.αM−1
Dénition 35 (
ASm
-signature). SoitK
un orps ni etα1, . . . αm
m
éléments pri- mitifs distin ts. Alors lam
-signature algébrique d'un des ripteurD
est obtenue en on aténant l'ensemble desαi
-signatures. On obtient ainsi une signature de tailleOn s'intéresse à la signature partielle d'un des ripteur. Les propriétés al ula- toires de ette signature sont un des piliersde l'index.
Dénition36 (Signature umuléeCAS). Soit
l ∈ [0, M − 1]
une positiondeD
. La signature algébrique umuléeCAS(D, l)
enl
est la signature algébrique du préxe deD
nissant enel
, 'est-à-direCAS(D, l) = AS(e0. . . el).
Enn, ons'intéresse au as parti ulier des
n
-gramstirés d'un des ripteurD
.Dénition 37 (Signature partielle et signature
n
-gram). La signature algébrique partielle del
àl
′
est la signature de la sous- haîneextraite de
D
entre les positionsl
etl
′
:
P AS(D, l, l′) = AS(elel+1. . . el′).
En parti ulier, on s'intéresse aux sous- haînesde longueur
n
:NAS(D, l) = P AS(D, l − n + 1, l).
Lorsqu'au une onfusion n'est possible, onne pré ise pas le des ripteur
D.
Fig.4.2 Diérentes signatures d'un des ripteur.
La gure4.2 ré apitule lesliens entre lesdiérentes signatures.
Les propriétés suivantes permettent de al uler de manièrein rémentale les dif- férentes signatures lors de l'indexation d'une partition ou du pré-traitement d'un motif de re her he. La dernière propriété est utilisée de manière ru iale lors de la re her he ee tive.
Proposition 1. Soient
K
un orps etα
un élément primitif. On a les égalités suivantes : 1.CAS(l) = CAS(l − 1) + elα
l
2.NAS(l) =
N AS(l−1)−el−n
α
+ el.α
n−1
3.CAS(l) = CAS(l
′) + αl′+1
P AS(l′+ 1, l)
Ces propriétés se vérient très simplement et ne né essitent pas de démonstra- tion.
Fig. 4.3 Stru ture de l'index
5 Création du MS-index
L'index de signature musi ale (MS-index) a une stru ture lassique de table de ha hage, qu'on note
HD[0 . . . L − 1]
de tailleL = 2
c
. Lesélémentsde HD renvoient vers des lignes de taillevariable. Chaque ligne ontient une liste d'enregistrements qui indexe ha un un
n
-gram présent dans aumoins un des ripteur.On détailleà présent la onstru tionde l'index.
On ommen e par répertorier de manièreexhaustive les
n
-grams ontenus dans la olle tion ( 'est-à-dire qu'on fait l'inventaire de haquen
-gram de haque voix de haque partition de la olle tion). Sur haquen
-gram ainsi exhibé, on al ule plusieurs signatures quivont déterminer l'organisationde l'index.Soit
G
unn
-gramtirédeǫ(D)
,etτ
lafon tiontransformantunn
-gramde notesen un
(n − 1)
-gram d'intervalles de notes (ou progression relative des notes). SoitS = hL(G) = ASm(τ (G)).
On al ule alorsi
l'index de laligne qui réfère àG
pari = S mod L.
En
HD[i]
,on insèrel'enregistrement suivant.Dénition 38. Soit
G
unn
-gram à la positionp
d'undes ripteurD
. L'enregistre- ment indexantG
est un 6-uplet(id(D), p, cǫ, cρ, ASρ, ⊥)
où1.
cǫ
= CAS(ǫ(D), p)
2.
cρ= CAS = (ρ(D), p)
3.
ASρ= ASm(ρ(D), p)
4.
⊥
est lanote la plus bassedeG
Plusieurs hoses sont à remarquer. Premièrement on ne al ule qu'une seule si- gnature sur le
n
-gramG
, qui porte sur sa représentation transposée (ou relative). La fon tion de ha hagehL
est la fon tion qui à unn
-gramG
asso ie la signature algébriquedesareprésentationtransposée.Ensuite,lessignaturessto kéesdansl'en- registrement orrespondant sont les signatures umulées, 'est-à-dire les signatures du des ripteurtronqué à lapositionp
.On va voir que es informations sont susantes pour réaliser tous les types de requêtes dénis plus haut, transposée, exa te, ave ousans rythme.
6 Re her he exa te de partitions