• Aucun résultat trouvé

Cao et al. [14℄ proposent une indexation à deux niveaux (table de ha hage et arbre) permettant également un ltrage pour l'indexation de ladistan e d'édition. Ons'appuieentreautressurl'observationquedeuxséquen es ontiennentunnombre important de

n

-grams ommuns si la distan e d'édition est inférieure à un ertain seuil. Cette méthode reprend en les améliorant leste hniques développées par Uk- konen dans [81℄.

Le problème de la re her he appro hée est posé de la manièresuivante:

Problème 1 : Pour une longueur

l

etune distan e d'édition

τ

, trouvertoutes les sous-séquen es

S

telles que

|S| ≥ l

etd

edit(S, Q

) ≤ τ

pour une sous-séquen e

Q

de laséquen e requête

Q

.

Ce problème est luimême réduit auproblème suivant :

Problème 2 : Pour une longueur

ω

et une distan e d'édition

ε,

trouver tous les segments

si

de taille

ω

tels que d

edit(si, qj) ≤ ε

pour tout segment

qj

de longueur

ω

in lus dans larequête

Q.

Chaqueséquen eestdé oupéeensegmentsdetaillexe

ω

.Ongénèredes lusters de

n

-gramssimilaires(

n

Clusters).Lepremierniveaud'indexationestla onstru tion d'une table de ha hage sur les segments respe tivement aux

n

Clusters. Dans le se ond niveau d'indexation, les segments sont transformés en leur

c

-signature, et indexés par un arbre de

c

-signature.

9 Con lusion et positionnement

En introduisant un ontenu aussi peu onventionnel que peut l'être le ontenu musi al symbolique dans l'univers des bases de données et des bibliothèques nu- mériques, nous espérons faire progresser en parallèle aussi bien le domaine de la re her he d'information musi alequelespossibilitésoertespar lesplateformesnu- mériques.

En eet, devant gérer les ara téristiques de e ontenu inhabituel, les biblio- thèques numériquesren ontrent etsurmontent de nouveaux dés; de même lasou- plesse apportée par une appro he base de données permet de faire progresser les outils lassiquesde re her he d'information musi ale.

Parailleurs,lesidéesnaissantdel'étudedu ontenumusi aldépassentlargement e domaine. Si l'on fait abstra tion de la dimension musi ale du ontenu, notre appro he nous permet d'aborderun problème plus général.

A notre onnaissan e, il n'existe pas de modèle représentant le ontenu de don- néessyn hroniséessusammentsouplepourêtreutilisabledansplusieursdomaines. Siles séquen e temporellesve torielles sont déjà onnues, elles ne sont pas utilisées omme nous le ferons, 'est-à-dire omme un ensemble de voix syn hronisées pou- vant être prises séparément ou au ontraire superposées pour obtenir de nouvelles séquen es. En eet, es opérations né essitent d'avoir été dénies rigoureusement

pourêtre menéessans danger.C'est e quimotivel'introdu tiond'unealgèbreopé- rant de manière fermée sur es objets. Les opérateurs de proje tion (permettant d'isoler une voix) et de produit (pour lasyn hronisation de plusieursvoix) sont un exemple d'opérationspossibles.

Les bases de données temporelles ou les bases de données de séries temporelles sont en ore trop pro hes des domaines d'appli ation pour lesquelles elles ont été développées, mettant en avant des fon tionalités, ertes avan ées et performantes, maisrigidesetnonpérennes.Notreappro he onsisteàétendrelemodèlerelationnel en in luant un nouveau type, lesséquen es temporelles, mais également un ertain nombre d'opérateurs nouveaux qui leurssont destinés.

Les plateformes musi ales existantes mettent en avant un nombre ni de fon - tionnalités, portant sur un type de ontenu bien déterminé. Nous nous distinguons de elles ien her hantàmettreen pla e uneplateformearan hiedes ontraintes imposées par le ontenu qu'elle est sensée a euillir.Laplateformedoit être onçue de manièreà pouvoirsto ker, géreret étudierdes olle tionsentières don lastru - ture n'est pas onnue a priori, sans pour autant en modier l'ar hite ture. Celle- i peut sans esse s'enri hirde nouveaux outils, au gré de l'apparition des olle tions et des nouveaux besoins.

L'indexationdelare her heexa teestindispensablesil'on onsidèrelesvolumes de données en jeudèsquedes séquen es temporellesinterviennent.Parailleurs,une ontraintesupplémentairetientàlanaturede esdonnées etauxmultiplesfaçonsde les interroger. Il n'existe pour l'instant pas de stru ture d'index unique permettant de réaliser plusieurs types d'interrogation. Pour ela, nous adaptons un index dont le prin ipe est pro he des index

n

-grams. Cet index permet également de onduire des re her hes appro hées par motif.

Le point de départ de e travail est don la gestion du ontenu musi al symbo- lique.Maislesquestionssoulevéespar e sujetpermettentd'envisagerdesproblèmes plus généraux. Le modèle unié et l'appro he base de données que nous proposons peuvent être repris et adaptés à de nombreux types de données syn hronisées. De même, ilest intéressantde voir dans quelle mesurediérentstypes d'interrogations peuvent avoirun sens dans un domaineautre que musi al.

Modélisation des séquen es

temporelles et appli ation aux

sour es musi ales symboliques.

Le travaux exposés dans e hapitre ont fait l'objet de deux publi ations : A Database Approa h to Symboli Musi Content Management [34℄ et Modeling Syn- hronized Time Series [35℄.

Dans e hapitre, nous proposons un modèle logique spé ialement destiné à la gestiondesséquen estemporelles.Ons'intéresseenparti ulieràlanotiondesyn hro- ni itédeséquen estemporellesqui on eptualisel'alignementdeplusieursséquen es partageant un même domainetemporel.

Le modèleque nous proposons est une extensiondu modèle relationnel in luant letypeséquen e temporelle, ainsique plusieursopérateurs rassemblés dans deux al- gèbresagissantsur emodèle,notammentunealgèbretemporellepermettantd'opé- rer sur le temps. Les opérateurs de l'algèbrepeuvent être ombinés à des fon tions déniespar un utilisateur.

Notre modèle repose sur le on ept de séquen es temporelles syn hronisées. In- tuitivement,une séquen e temporellesyn hronisée est un groupede séquen es tem- porellespartageantundomainetemporel.Cettedénitionfournitun adredetravail pertinent pour l'étudede séquen es temporelles devant être alignées, omparées ou fusionnées.

Dans e hapitre,nousdé rivonsdemanièreformellelemodèle ommeuneexten- siondu modèlerelationnel,etnousdé rivonspré isémentlesopérateurs del'algèbre qui opère de manière fermée sur e modèle.

Nous montrons que (i) ette algèbre permet de retrouver toutes les opérations usuellessur lesséquen es temporelles,(ii)unehauteexpressivitéestatteintegrâ eà la ompositionnonbornéedes opérateurs,et(iii)lapossibilitéde pouvoirintroduire des fon tions utilisateur dans les expressions permet de ne pas limiter l'utilisation du modèle à un domaineappli atif spé ique.

Cette appro he pose les bases pour la on eption d'un système dédié à l'étude des séquen es temporelles à grandeé helle.

1 Motivation

Unsystème sebornantà sto ker etinterroger lesséquen es temporelles est trop limité dans un ontexte appli atif, et il est né essaire de pouvoir y ombiner des fon tionsd'analysede manièreuide.Anotre onnaissan e, lesoutilspermettantde réaliser es opérations restent spé ialiséset s'appuient trop fortementsur le format des données, e qui rend le ouplage de es opérationslaborieux, voire impossible.

Parailleurs,unsystème onçupour gérerdesséquen es temporellesdoitpouvoir faireappelàdesoutilsanalytiquesetstatistiquess'appliquantdemanièreglobaleou lo ale.Ce i impose de pouvoirintervenir sur ledomainetemporel. En onséquen e, lesséquen estemporellesne sontpasun asparti ulierde donnéestemporellesetne peuventpas être traitées fa ilementdans un système de gestionde basede données temporelles.

Les séquen es temporelles peuvent être à valeur s alaire ou ve torielle. Les sé- quen es ve torielles sont des séquen es syn hronisées partageant un domaine tem- porel ommun. On dit alors que la séquen e temporelle est un ensemble de voix syn hronisées, haquevoixprenantses valeursdansdes domainesaprioridiérents. La syn hronisation de séquen es temporelles peut avoir plusieursfon tions : soitla simultanéité d'événements de natures diérentes (par exemple les diérents indi es boursiersdeplusieursvaleurs,letexteasso iéàunenotedanslapartitiond'un han- teur), soit la juxtaposition de plusieurs ensembles de données à omparer ( omme la onsommationéle triquemensuelle d'un parti ulier).

Les séquen es temporelles permettent don de représenter deux informations ru iales : la hronologie (su ession des événements) et la syn hronisation (simul- tanéité des événements). Autrement dit, les le tures verti ales et horizontales sont possibleset pertinentes.

2 Exemples de séquen es temporelles

Lesséquen es temporelles interviennent dans de nombreux domaines, et, même si notre exemple privilégié reste le ontenu musi al symbolique, le modèle présenté i-après ne se limite pas à et exemple pré is. Dans ette partie nous présentons diérents exemples d'appli ationsoù lesséquen es temporelles peuvent apparaitre, ainsi que les besoins utilisateursasso iés.

Documents relatifs