• Aucun résultat trouvé

En acoustique géométrique des salles, on représente la réflexion d’une onde acoustique sur une surface plane de la même façon qu’une réflexion optique sur un miroir [Allen et Berkley,1979].

Cette approche débouche sur le concept de source image1. On considère que le son réfléchi sur une paroi se propage comme s’il avait été émis par une source virtuelle, symétrique de la source réelle par rapport au plan de la paroi. Il s’agit ici des sources images du premier ordre. De façon plus générale, chaque source image peut ensuite engendrer d’autres réflexions, caractérisées par de nouvelles sources images dites d’ordre supérieur. C’est donc un procédé itératif qui revient à déplier infiniment la salle par symétrie. On peut ensuite trouver l’ensemble des sources images d’ordre n ≥ 1 comme les symétriques des sources images d’ordre n − 1 où la source d’ordre 0 correspond à la source réelle.

Dans ce modèle de sources images, chaque réflexion est dite spéculaire. C’est-à-dire que chaque «rayon» incident donne naissance à un unique «rayon» réfléchi. Ce modèle ne permet donc pas de représenter des réflexions diffuses, où du fait des irrégularités des parois de la salle le son serait réfléchi dans plusieurs directions. Ce modèle simple caractérise donc chaque contribu- tion précoce (trajet direct ou réflexion) par une impulsion à laquelle sont associés une amplitude (ou plutôt une atténuation) et un retard. Pour le trajet direct, le temps d’arrivée est égal à la distance source-microphone divisée par la vitesse du son tandis que l’atténuation est inversement propor- tionnelle à la distance source-microphone. Pour chaque réflexion, le temps d’arrivée dépend de la distance entre la source image qui lui est associée et le microphone. L’atténuation quant à elle tient compte non seulement de la distance parcourue mais également du coefficient d’absorption de la paroi.

3.3.1 Modèle autorégressif

Formellement, nous considérons que la partie précoce de la RIR est constituée de R contribu- tions, chacune étant représentée par un dirac auquel est associé un terme d’atténuation ρk et un

retard τk, k = 0, ..., R − 1. La RFR associée Ae(f ) est ainsi approchée par G(f ), f = 0, ..., T −1,

avec : G(f ) = R−1 X k=0 ρkδkf, δk= e−ı2πτk/T. (3.4)

Dans l’équation ci-dessus nous avons utilisé le fait qu’un retard dans le domaine temporel cor- respond à un déphasage (une multiplication par une exponentielle complexe) dans le domaine fréquentiel. D’après l’équation (3.4) il est possible de montrer que {G(f )}f =R,...,T −1satisfait une

équation récurrente de la forme suivante :

R

X

r=0

ϕerG(f − r) = 0, (3.5)

tel que {ϕer}R

r=0et {δk}R−1k=0 sont respectivement les coefficients et racines d’un même polynôme

de degré R. Ce résultat nous vient de la littérature liée à l’estimation des paramètres des modèles sinusoïdaux à modulation d’amplitude exponentielle (exponential sinusoidal models (ESM) en an- glais) [Kumaresan,1983]. En effet l’équation (3.4) est un cas particulier d’un tel modèle ESM. Par ailleurs, il est important de remarquer que l’on représente ici un signal dans le domaine fréquen- tiel alors qu’en général un modèle ESM est défini dans le domaine temporel, pour caractériser l’amortissement exponentiel des systèmes vibratoires libres par exemple.

Sans perte de généralité nous considérons que le premier coefficient ϕe0 = 1 ; l’équation (3.5) étant toujours valide si l’on multiplie les deux membres par une constante. Nous supposons fina- lement que Ae(f ) satisfait l’équation récurrente (3.5) à un terme de déviation près κ(f ) modélisé

1. Dans ce chapitre, le terme de source image désigne une source virtuelle et non la convolution du signal source avec un filtre de mélange comme c’était le cas aux chapitres précédents.

par un bruit blanc gaussien complexe propre :

R

X

r=0

ϕerAe(f − r) = κ(f ), κ(f ) ∼ Nc(0, σ2κ). (3.6)

Nous voyons alors à partir de cette dernière équation que la RFR Ae(f ) associée aux contributions

précoces est représentée par un modèle autorégressif (AR) d’ordre R, noté AR(R).

Nous avons proposé ce modèle dans [Leglaive et al., 2015a,b] pour guider l’estimation des filtres de mélange dans une application de séparation de sources. Nous supposions dans ces travaux préliminaires que A(f ) = Ae(f ), c’est-à-dire que nous négligions la réverbération tardive.

3.3.2 Choix de l’ordre du modèle

L’ordre de ce modèle AR doit théoriquement être égal au nombre de contributions précoces. Par exemple, la RIR représentée en haut de la figure 3.2 semble contenir environ 5 premières réflexions significatives qui ajoutées au trajet direct donnent R ≈ 6 contributions précoces. Ce- pendant si l’on considère que le trajet direct domine les premiers échos, il peut être suffisant de choisir R = 1. Dans ce cas, d’après les équations (3.4)-(3.6) nous avons :

Ae(f ) = δ0Ae(f − 1) + κ(f ), (3.7)

où δ0 = e−ı2πτ0/T et τ0 = b(r0/c)fsc avec r0 la distance source-microphone en mètres et c la

vitesse du son en mètres par secondes. Ce modèle AR(1) peut également être interprété comme exprimant le fait que la réponse en fréquence associée aux contributions précoces varie lentement en terme de module et phase (pour σ2κ suffisamment faible), car la réponse impulsionnelle asso- ciée est concentrée aux instants proches de l’origine. Nous pouvons en effet écrire les relations suivantes pour le module et la phase de Ae(f ) d’après l’équation (3.7) :

| Ae(f ) |≈| Ae(f − 1) | (3.8)

arg(Ae(f )) ≈ arg(Ae(f − 1)) − 2πτ0/T. (3.9)

Connaissant la distance source-microphone, nous pouvons vérifier ces relations à partir d’une RIR réelle provenant de la base de donnée RWCP [Nakamura et al.,2000]. Celle-ci est représentée en haut de la figure 3.2 où la partie précoce utilisée pour calculer Ae(f ) par TFD est en bleu. Les

relations de module et phase sont représentées en bas de cette même figure. Nous observons que les points bleus associés aux coefficients de la RFR sont concentrés sur les droites rouges d’équation y = x, validant ainsi les relations (3.8)-(3.9). Par conséquent, considérer un modèle AR d’ordre 1 pour Ae(f ) semble être un choix raisonnable lorsque les premiers échos sont effectivement

d’amplitude négligeable par rapport au trajet direct.