• Aucun résultat trouvé

telecharger

N/A
N/A
Protected

Academic year: 2022

Partager "telecharger"

Copied!
46
0
0

Texte intégral

(1)

Université Pierre et Marie Curie – Paris VI

Mémoire de stage de Master 2 ATIAM

Estimation du tempo perceptif et

réduction des erreurs d’octave du tempo

Joachim FLOCON-CHOLET

Sous la direction de Geoffroy Peeters

1er mars 2012 – 31 juillet 2012

Institut de Recherche et Coordination Acoustique/Musique 4, place Igor Stravinsky 75004 Paris

(2)
(3)
(4)

x

y

T

a

α

(5)
(6)

x X p(x)

E E x y

N (z | µ, Σ) µ

Σ

T

e

T

a

BP M

M F CC

GM M

(7)
(8)
(9)
(10)
(11)

M T T

T

i

i = 1, ..., 5

M T

i

M

T

T

= arg max

Ti

p(T

i

| M)

p(T

i

| M ) T

i

M

(12)

y

T F (y) F M ACF (y)

T F (y) × F M ACF (y)

(13)

Au d io O n se t D e te ct io n F u n ct io n

Pe ri o d ici ty Est ima tio n T e mp o / Me te r Est ima ti o n Me te r/ Be a t Su b d ivi si o n Te mp la te

R e a ssi g n e d Sp e ct ra l En e rg y F lu x C o mb in e d D F T / F M- AC F V it e rb i d e co d in g o f MBST o ve r ti me

(14)
(15)

0 50 100 150

rock

country pop soul classic rock

rnb christian oldies

alternative disco

vocalists hip−hop

christmas dance reggae latin jazz hard rock

rap salsa funk folk Genres musicaux représentés dans la base de données

Nombre d’occurrences

(16)

| x ¯

r

− x ¯

s

| < 6% max { x ¯

r

; ¯ x

s

}

¯

x

r

x ¯

s

r s

¯ x

r

= 1

n

r

n i=1

x

ri

6%

T a 4%

4%

T e

T a

(17)

T e = kT a k ∈ { 1/3; 1/2; 2/3; 2; 3 }

% T

e

= 2T

a

T

e

= T

a

/2 T

e

= 2/3T

a

T e = 3/2T

a

T

e

= 3T

a

T

e

= T

a

/3

± 6%

% % %

T

e

= 2T

a

T

e

= T

a

/2 T

e

= 3T

a

T

e

= T

a

/3

%

(18)

!

"#"

"#"$

"#"$%

"#&"$%

"#%&"$

"#"

"#%"

(19)

t

S(f

k

, t) f

k

f

k

t

i

l ∈ [0, 11] l

n(f

k

, t

i

) = 12 log

2

� f

k

f

ref

mod 12

(20)

f

ref

t

i

c(l, t

i

) = �

fk n(fk,ti)=l

| S(f

k

, t

i

) |

2

l = 0, 1, ..., 11

C(l, t)

t t

C(l, t) t

i

L t

i

R t

i

L R

T

h

T

h

∈ [30, 200]

L = [t

i

− αT

h

, t

i

] R = [t

i

, t

i

+ αT

h

] T

h

α = 4

t

i

µ

L

C(l, L) µ

R

C (l, R) µ

L

µ

R

d(L, R) = 1 − µ

L

· µ

R

|| µ

L

|| · || µ

R

||

C

i

(ω, T

h

) C

i

i ω

T

h

(21)

Temps [sec]

Tempo assumption

5 10 15 20 25

40 60 80 100 120 140 160 180

Freq [bpm]

Tempo assumption

0 20 40 60 80 100 120 140 160 180 200

40 60 80 100 120 140 160 180

T

h

T

h

(22)

t

i

T

h

∈ [30; 200]

t

i

L kmax

r(t

i

) =

ti+L/2 t=ti−L/2

N/2

k=kmax

| S(ω

k

, t) |

2

ti+L/2 t=ti−L/2

kmax

k=1

| S(ω

k

, t) |

2

N L T

h

/2 kmax

t

i

r T

h

r

j

(t

i

) = r(t

i

− (j − 1)T

h

)

j ∈ { 1; 2; 3; 4 } r

j

(t

i

) �

j

r

j

(t

i

) = 1 r

j��

(t

i

) = 1 − r

j

(t

i

)

r

tot

(t

i

) = r

��j=1;3

(t

i

) − r

j=2;4��

(t

i

)

T

h

t

i

r

tot

(t

i

) r

tot

(t

i

+ T

h

)

B(t

i

, T

h

) r

tot

(t

i

)

r

tot

T

h

B(ω, T

h

) w

B(t

i

, T

h

) B(w, T

h

)

B

i

(ω, T

h

) B

i

i ω

T

h

(23)

Time [sec]

Hypothèse de tempo (Th)

5 10 15 20 25

40 60 80 100 120 140 160 180

Freq [bpm]

Hypothèse de tempo (Th)

0 20 40 60 80 100 120 140 160 180 200

40 60 80 100 120 140 160 180

r T

h

r T

h

t

i

S(t

i

, t

j

) t

i

t

j

v

ti

t

i

S(t

i

, t

j

) = d(v

ti

, v

tj

)

(24)

S(t

i

, t

j

) L(t

i

, l

j

) l

j

= t

j

− t

i

l

j

l

j

t

i

Matrice d’auto−similarité

Temps [sec]

Temps [sec]

0 2 4 6 8 10 12 14 16 18 20

0 5 10 15 20

Matrice de retard

Temps [sec]

Retard [sec]

0 2 4 6 8 10 12 14 16 18 20

0 5 10 15 20

0 20 40 60 80 100 120 140 160 180 200

0 0.5 1 1.5

2 x 10

−3

Fréquence de répétition [BPM]

(25)

E(i) = �

f

| X(f, t

i

) | − | X(f, t

i−1

) |

X(f, t

i

) x t

i

E(i)

(26)

0 5 10 15 20 25 30 0

2 4 6 8

Temps [sec]

Amplitude

Fonction d’energie

0 50 100 150 200

0 0.05 0.1 0.15 0.2 0.25

Spectre de la fonction d’energie

Freq [BPM]

Amplitude

(27)
(28)

z z D K

p(z) =

K k=1

π

k

N (z | µ

k

, Σ

k

)

N (z | µ

k

, Σ

k

) N (z | µ

k

, Σ

k

)

N (z | µ

k

, Σ

k

) = 1

(2π)

D/2

| Σ |

1/2

exp

− 1

2 (z − µ

k

)

T

Σ

−1

(z − µ

k

)

µ

k

D Σ

k

D × D

| Σ | Σ

π

k

π

k

z

k

eme

K k=1

π

k

= 1, π

k

� 0

x = [x

1

x

2

...x

N

] Y = [y

1

y

2

...y

N

] z

x

i

y

i

z =

� y

i

x

i

π

k

µ

k

Σ

k

p(z)

p(x

i

, y

i

) EM

x y

F (y) = E [x | y] =

K k=1

h

k

µ

xk

+ Σ

xyk

yyk

)

1

(y − µ

yk

) �

h

k

(y) = π

k

N (y | µ

yk

, Σ

yyk

)

K

k=1

π

k

N (y | µ

yk

, Σ

yyk

)

y k

eme

Σ

k

=

� Σ

yyk

Σ

yxk

Σ

xyk

Σ

xxk

µ

k

=

� µ

yk

µ

xk

x

y

(29)

x

m

i

m

i

=

� T a

i

T e

i

z = [y x]

T

x

y

y

(30)

i C

i

B

i

s

i

e

i

C

i

B

i

s

i

e

i

T e

i

C

i

B

i

s

i

e

i

k =

� 1 4 ; 1

3 ; 1 2 ; 2

3 ; 3

4 ; 1; 1.25; 1.33; ...; 2

C

i

B

i

T h

k D = 12

D = 48

T

T eT

k

!" # $ %&'(

T e T e = 106.3

c

i

b

i

s

i

e

i

(31)

y

i

=

 

 c

i

b

i

s

i

e

i

 

z

i

=

� y

i

x

i

=

 

 

 c

i

b

i

s

i

e

i

T a

i

 

 

T e

T T e

= 1

T e

T e = T a T e = 2T a

EM

EM

(32)

loglikelihood

N

N loglikelihood

N

loglikelihood

N−1

− 1 < 1

10

(33)

T a

T e

T a T a T e

T

a

T

e

Obs T

a

K

6%

T a

K

K = 20

K = 4 K = 8 K = 12 K = 16 K = 20 K = 24

K

K = 20

(34)

σ

σ = 1.45 − 4.1 σ = 2.96 +0.9 σ = 3.50 +0.4 σ = 2.31 − 1.13 σ = 1.91 − 0.36 σ = 2.33 − 2.05

T a

1%

α

α

αT e = T a

T e

= ˆ αT e α ˆ

α α =

T aT e

T e α

α α

T e = 2T a T e =

T a2

α =

12

α = 2

(35)

α = 1 α ∈ �

1

2

; 1; 2 �

α α ∈ �

1/2; 1; 2 � α ∈ �

1/2; 1; 2 �

± 0.2 α = 0.65

α = 0.5

T a T a ∈ [30, 200]

K

K = 2 K = 4 K = 8

% σ % σ % σ

1.79 2.36 2.22

3.27 3.39 2.38

1.79 3.69 1.94

2.24 3.78 3.26

2.16 2.29 3.00

2.34 2.03 2.65

2.33 3.53 2.95

3.11 1.72 3.16

2.52 2.51 2.63

2.31 1.99 2.82

1.43 2.01 2.01

2.59 2.86 2.84

α

α = 1 α = 1/2

α = 2

(36)

α = 1 T e = 2T a α = 1/2 T e = T a/2 α = 2

p(y) =

K k=1

π

k

N (y | µ

k

, Σ

k

)

y K

µ

k

Σ

k

(37)

K = 2 K = 4

% %

σ = 3.22 σ = 3.08

σ = 4.03 σ = 2.71

σ = 2.53 σ = 2.29

σ = 2.97 σ = 3.03

σ = 3.70 σ = 3.90

σ = 3.08 σ = 2.23

σ = 2.83 σ = 2.46

σ = 3.04 σ = 2.39

σ = 2.72 σ = 1.63

σ = 3.56 σ = 2.30

σ = 2.28 σ = 2.90

σ = 3.82 σ = 2.76

T a

(38)

T e = 2T a T e = T a/2

α αT e = T a

10%

(39)
(40)

N (z | µ

k

, Σ

k

) = 1

(2π)

D/2

| Σ |

1/2

exp

− 1

2 (z − µ

k

)

T

Σ

−1

(z − µ

k

)

µ

k

D Σ

k

D × D

| Σ | Σ

x D N (x | µ, Σ)

x x

a

x

b

x

a

M x x

b

M − D

x =

� x

a

x

b

µ µ =

� µ

a

µ

b

Σ Σ =

� Σ

aa

Σ

ab

Σ

ba

Σ

bb

Σ

T

= Σ Σ

aa

Σ

bb

Σ

ba

= Σ

Tab

Λ

Λ ≡ Σ

1

(41)

Λ =

� Λ

aa

Λ

ab

Λ

ba

Λ

bb

Λ Σ

Λ

aa

Σ

aa

12

(x − µ)

T

Σ

1

(x − µ) = −

12

(x

a

− µ

a

)

T

Λ

aa

(x

a

− µ

a

) −

12

(x

a

− µ

a

)

T

Λ

ab

(x

b

− µ

b

)

12

(x

b

− µ

b

)

T

Λ

ba

(x

a

− µ

a

) −

12

(x

b

− µ

b

)

T

Λ

bb

(x

b

− µ

b

) N (x | µ)

− 1

2 (x − µ)

T

Σ

1

(x − µ) = − 1

2 x

T

Σ

1

x + x

T

Σ

1

µ + const x µ

T

Σ

−1

µ

Σ

1

x

x Σ

−1

µ

p(x

a

| x

b

)

µ

a|b

Σ

a|b

x

a

x

b

x

a

− 1

2 x

Ta

Λ

aa

x

a

p(x

a

| x

b

) Σ

a|b

= Λ

aa1

x

a

x

Ta

Λ

aa

µ

a

− Λ

ab

(x

b

− µ

b

Λ

Tba

= Λ

ab

x

a

Σ

a|b1

µ

a|b

µ

a|b

= Σ

a|b

Λ

aa

µ

a

− Λ

ab

(x

b

− µ

b

) �

= µ

a

− Λ

aa1

Λ

ab

(x

b

− µ

b

)

µ

a|b

Σ

a|b

Λ

� A B C D

−1

=

� M − M BD

−1

− D

1

CM D

1

+ D

1

CM BD

1

M = (A − BD

−1

C )

1

.

(42)

M

1

� Σ

aa

Σ

ab

Σ

ba

Σ

bb

−1

=

� Λ

aa

Λ

ab

Λ

ba

Λ

bb

Λ

aa

= (Σ

aa

− Σ

ab

Σ

−1bb

Σ

ba

)

−1

Λ

ab

= − (Σ

aa

− Σ

ab

Σ

bb1

Σ

ba

)

−1

Σ

ab

Σ

bb1

p(x

a

| x

b

)

µ

a|b

= µ

a

+ Σ

ab

Σ

bb1

(x

b

− µ

b

) Σ

a|b

= Σ

aa

− Σ

ab

Σ

−1bb

Σ

ba

µ

a|b

F (y) = E [x | y] =

K k=1

h

k

µ

xk

+ Σ

xyk

yyk

)

1

(y − µ

yk

) �

h

k

(y) = π

k

N(y | µ

yk

, Σ

yyk

)

K

k=1

π

k

N (y | µ

yk

, Σ

yyk

)

F (y) = E [x | y] = µ

x|y

h

k

(y)

µ

x|y

x

i

C

i

(43)

!""# $%"&$

(44)

!""# $#!$

!""# $%$

(45)
(46)

Références

Documents relatifs

Le CNCR a pour rôle la coordination et la représentation des établissements de santé (32 CHU et 35 CH membres) eux-mêmes promoteurs de recherches et d’innovations

Fonction :(AetM) rotation G, inclinaison D, inspirateur accessoire (P) rotation D, inclinaison D, inspirateur accessoire En décubitus dorsal.. Etirement :(AetM)

Etirement : abduction, genou fléchi pour les mono-articulaires et genou tendu pour le droit interne. En

Chapeau rond rouge. Chapeau rond

On recouvre le plafond et les murs du local d'un matériau acoustique de coefficient d'absorption α de façon à abaisser le niveau de pression à la valeur L'p=90dB?. On

Section: souvent en zone 1, 2 et 5 avec une rupture de continuité franche sans forte.. rétraction de la

C'est dans ce cadre que s'inscrit le projet d'expérimentation Plaine Commune et la création de la chaire de recherche contributive : il s'agit d'accueillir des

Nouveau Projet : Etude des indices acoustiques représentatifs de l’intelligibilité/audibilité chez les malentendants appareillés dans un. local industriel (thèse débuté en