• Aucun résultat trouvé

2.5 Les extraits musicaux

2.5.3 La pulsation, le tempo

La question Quelles sont les valeurs du tatum, du tactus et de la mesure ?

Terminologie Le tatum est d´efini comme « la division r´eguli`ere du temps qui co¨ıncide avec la majorit´e des d´ebuts de notes » [KEA06]. Le tactus est d´efini comme « la p´eriode perceptuellement la plus dominante, [. . . ] la fr´equence `a laquelle la majorit´e des gens taperaient du pied ou des mains en phase avec la musique » [Pee07a]. Les indications de tempo ´eventuellement donn´ees par l’auteur se r´ef`erent g´en´eralement au tactus. La mesure est d´efinie par le compositeur. La recherche de la mesure correspond `a la recherche des temps forts parmi les pulsations d´etect´ees (les tactus a priori ).

Une illustration de ces termes est donn´ee sur la figure2.9, qui correspond au d´ebut du deuxi`eme petit pr´elude de Bach : le tatum (en bleu) correspond `a la croche, le tactus (en vert) `a la noire ; la mesure (en bordeaux) est de 4 noires.

Dans le chiffrage de la mesure, le tactus correspond souvent au d´enominateur (4 pour une noire, 8 pour une croche. . . ), alors que la d´etection des temps forts correspond au num´erateur [GD05]. Il est cependant int´eressant de noter que la perception du tempo (du tactus) est diff´erente d’une personne `a l’autre. L’ˆage, les connaissances musicales, mais aussi le moment de la journ´ee sont sources de diff´erences [Dra93, DW00, Lap00]. Cependant, ces variations de tempo sont la plupart du temps li´ees par des rapports deux, un-demi, trois, ou un-tiers.

Cette tˆache trouve des applications `a la fois dans le domaine de l’indexation musicale, ou de l’analyse automatique de musique, mais ´egalement dans des domaines plus « exo- tiques », tels que la synchronisation des lumi`eres sur une musique (concerts, boites de nuit), ou encore la synchronisation d’un diaporama sur les changements de notes.

Historique Les premiers travaux se sont naturellement pench´es sur le probl`eme de la d´etection de la pulsation dans des cas o`u la pulsation est r´eguli`ere. Des restrictions ont parfois ´et´e rajout´ees, en supposant que le chiffrage de la mesure est connu, ou encore que le rythme est donn´e par des percussions [GM94]. Plus r´ecemment les travaux se sont abstraits de certaines contraintes, pour traiter des cas de plus en plus g´en´eraux, jusqu’`a arriver au probl`eme de tempos non r´eguliers [Pee05b, Pee07a].

Parmi les premiers articles publi´es sur le sujet, Brown [Bro91b, Bro93], en contexte monophonique, utilise une m´ethode par calcul de l’autocorr´elation : `a chaque instant est attribu´e un poids. Celui-ci correspond `a la dur´ee de la note `a l’instant de d´ebut des

Fig. 2.9 – Exemple des relations entre le tatum, en bleu, le tactus, en vert, et la mesure, en bordeaux, sur le d´ebut du deuxi`eme petit pr´elude de Bach.

notes, 0 ailleurs. En calculant l’autocorr´elation de cette repr´esentation, on d´etermine `a la fois la pulsation, qui correspond aux pics de l’autocorr´elation, mais aussi la mesure, qui correspond aux maxima.

M´ethodes actuelles

Cependant, il est clair que cette m´ethode ne peut ˆetre appliqu´ee que pour des morceaux pour lesquels soit de la transcription (par exemple en MIDI), soit des enregistrements s´epar´es des voix sont disponibles. Cela se ram`ene alors au cas monophonique.

Pour la d´etection du rythme par l’analyse de signaux audio polyphoniques, deux ap- proches sont actuellement utilis´ees : la premi`ere, la plus courante, r´ealise une analyse directe du signal pour extraire le tatum et/ou le tactus et/ou la mesure. La deuxi`eme, plus rare, extrait des informations d’assez haut niveau (les changements d’accords, les d´ebuts de notes, la partition percussive. . . ) et analyse ces informations pour trouver le rythme.

Les diff´erentes ´etapes de la majorit´e des algorithmes sont les suivantes :

1. Trouver la bonne repr´esentation du signal (´energie par bandes de fr´equences [Sch97], Transform´ee de Fourier Discr`ete [Pee05a], repr´esentation temps-fr´equence [Kla06]), 2. ( ´Etape facultative) Comparer les vecteurs `a diff´erents instants (par une fonction

d’autocorr´elation[Pee05a], de diff´erence [Sch97], de similarit´e [FU01]. . . ),

3. Analyser fr´equentiellement la fonction pr´ec´edente (bancs de filtres [Sch97], filtres particulaires [HM03], filtres en peigne [KEA06]),

4. En d´eduire la pulsation.

Pour la deuxi`eme approche [GM99, Got01, ADR04, Pee05b], l’analyse des d´ebuts de notes, changements d’accords et motifs rythmiques est faite `a l’aide d’heuristiques, suivie

d’une ´etape de r´esolution des ambigu¨ıt´es issues des diff´erentes analyses. Cette m´ethode de- mande cependant le d´eveloppement d’outils performants pour l’extraction des « indices ». Les heuristiques sont construites `a partir de connaissances musicales relativement bien ´etablies, mais n´ecessitent une adaptation pour tout nouveau type de musique analys´e.

Enfin, des travaux ont ´et´e men´es, pour estimer conjointement plusieurs param`etres partiellement corr´el´es : le rythme et les accords [PP08], la tonalit´e, le rythme et les ac- cords [SW05, Kla03]. Les accords et la tonalit´e sont naturellement corr´el´es, puisque le premier contraint les seconds, selon des r`egles d´efinies pour chaque style de musique. Les accords et le rythme sont ´egalement corr´el´es : les changements d’accords se font principa- lement sur les temps forts.

Performances Comme pr´ecis´e pr´ec´edemment, tout le monde n’a pas la mˆeme percep- tion de la pulsation d’un morceau. Pour cette raison, il est g´en´eralement admis que les pulsations double (resp. triple) ou moiti´e (resp. un tiers) de l’annotation sont justes pour les morceaux en binaires (resp. en ternaire).

Pendant la conf´erence ISMIR 2004, une comparaison de divers algorithmes d’estima- tion du tempo a ´et´e r´ealis´ee sur un corpus commun. Ce corpus est d´ecrit dans [GKD+06] et est en partie disponible sur Internet18. Il est compos´e de boucles rythmiques, de danses,

et de chansons. Sur ces extraits dont le tempo est fixe, l’accuracy est de l’ordre de 80 % `

a 90 %. Elle tombe cependant `a 50 % `a 65 % en consid´erant faux les doubles, moiti´e, etc [Pee07a]. Les r´esultats sont variables selon le type de musique consid´er´e. Le tempo des musiques de danse (rock, tango, valse, cha-cha,. . . ) est en g´en´eral plus facile `a estimer que celui des chansons.