Critique de la Raison Pure - « Pourquoi y a-t-il quelque chose plutôt que rien ? »

Conhecido o padrão de excita¸cão de um sinal mascarante, pode-se estimar o limiar de mascaramento de um ru´ıdo de banda estreita por simples dedu¸cão do ´ındice de mascaramento àquele

padrão. Num codificador, porém, introduz-se ru´ıdo em múltiplas bandas, que são combinadas no padrão de excita¸cão por convolu¸cão com a fun¸cão de espalhamento. Assim, componentes de ru´ıdo que individualmente eram mascaradas, podem tornar-se aud´ıveis quando combinadas. Para determinar o limiar neste caso de múltiplos alvos de mascaramento, seria necessário fa- zer uma desconvolu¸cão do limiar calculado atrás, como reconheceu Johnston [83]. Na prática, dadas as dificuldades que levanta, esta opera¸cão é substitu´ıda por uma renormaliza¸cão, que serve apenas para compensar o ganho introduzido pelo espalhamento da excita¸cão. Esta simplifica¸cão é um dos principais problemas apontados a esta abordagem [160].

A renormaliza¸cão consiste simplesmente na aplica¸cão estática do ganho inverso ao padrão de excita¸cão. Esta opera¸cão pode ser inclu´ıda mesmo em modelos de representa¸cão interna, pois não afecta as diferen¸cas relativas entre os padrões de excita¸cão.

Abaixo descrevemos modelos emp´ıricos para avalia¸cão do ´ındice de mascaramento em fun¸cão da frequência, tanto no caso de tons a mascarar ru´ıdo como no caso inverso. Também se referem algumas medidas de tonalidade que podem ser usadas para determinar o ´ındice de mascaramento de um sinal mascarante que não seja nem um tom puro nem uma banda de ru´ıdo.

Tons a Mascarar Ru´ıdo

Um primeiro modelo para o ´ındice de mascaramento de ru´ıdo por tons, abreviadamente TMN (Tone Masking Noise), foi dado em [136]:

TMN (z)/dB = 15.5 + z.

As tabelas de TMN dispon´ıveis na recomenda¸cão do MPEG para o Modelo Psicoacústico 2 parecem seguir esta lei, com uma adapta¸cão nas frequências mais baixas. No entanto, como esta fórmula foi constru´ıda sobre dados experimentais obtidos para frequências baixas (até 3 ou 4 kHz), poderá estar errada para frequências mais altas. Na verdade, foi reconhecido em [41] que esta expressão levava a uma sobrecodifica¸cão das altas frequências em detrimento das baixas e foi proposta uma fórmula alternativa para corrigir esse defeito:

TMN (z)/dB = 19.5 − 18 26z.

Em [131], propusemos ainda outra express˜ao, baseando-nos em dados experimentais de [146]:

TMN (z)/dB =        166−z₆ + 28z₆ se 0 ≤ z < 6 28 se 6 ≤ z < 16 28₂₀₋₁₆20−z + 20₂₀₋₁₆z−16 se 16 ≤ z < 20 20 se 20 ≤ z . (6.7)

Esta expressão é mais conservadora que a de Schroeder até à frequência de 12.5 Bark (1.8 kHz). Para frequências mais altas, o ´ındice não cresce mais; até diminui ligeiramente a partir de 20 Bark (7 kHz). Não há portanto consenso quanto à curva exacta do ´ındice TMN em fun¸cão da frequência.

Ru´ıdo a Mascarar Tons

O ´ındice de ru´ıdo mascarando tons (NMT) é bastante mais baixo, e apresenta menor varia¸cão ao longo da frequência. Um modelo aproximado, considerado razoável, para este ´ındice é:

Ferreira usou um modelo ligeiramente diferente [41]: NMT (z)/dB = 6.56 −3.06

26 z.

Em codifica¸cão perceptual, só interessa considerar situa¸cões de mascaramento de ru´ıdo de quantiza¸cão, não de mascaramento de tons. Contudo, na falta de dados mais espec´ıficos para essa circunstância, usa-se o ´ındice NMT para avaliar o mascaramento de ru´ıdo de quantiza¸cão por sinais não tonais.

Avalia¸c˜ao de Tonalidade

As diferen¸cas significativas entre o poder mascarante de tons e de bandas de ru´ıdo levanta o problema da determina¸cão da tonalidade dos sinais a processar por um codificador perceptual. Uma primeira solu¸cão para este problema foi proposta em [83] e aplicada no codificador PXFM. Baseia-se no cálculo da medida de planura espectral (SFM) avaliada a partir do espectro de potência de cada bloco do sinal, estimado por uma DFT. Essa medida é então convertida num coeficiente de tonalidade, α, de tal forma que α = 0 quando o espectro é absolutamente plano (SFM = 0 dB), indicando a natureza “ruidosa” do sinal; e α = 1 quando SFM < −60 dB, considerado um indicador de “tonalidade pura”. O ´ındice de mascaramento final é calculado por interpola¸cão entre TMN e NMT segundo:

MI (z) = αTMN (z) + (1 − α)NMT (z). (6.8) Um inconveniente deste modelo é que o coeficiente de tonalidade é uma medida global para todo o espectro, não discriminando regiões tonais e regiões não tonais que ocorrem simultaneamente em frequências diferentes em determinados sinais. Apercebendo-se disso, Brandenburg e Johnston propuseram um outro método de avaliar a tonalidade, baseado numa medida de coerência entre valores sucessivos de cada componente espectral [22]. O princ´ıpio subjacente é que uma componente “tonal” terá uma evolu¸cão temporal coerente (previs´ıvel), enquanto uma componente de ru´ıdo será imprevis´ıvel. A medida de coerência é calculada em cada componente espectral pela distância euclidiana entre o valor registado no bloco actual e o valor estimado por um preditor simples baseado na amplitude e na fase medidas nos dois blocos anteriores. Por uma rela¸cão logar´ıtmica, é derivado o coeficiente de tonalidade α(z), dependente da frequência, que permite finalmente calcular o ´ındice de mascaramento pela expressão 6.8. Esta medida de tonalidade é aplicada igualmente no Modelo Psicoacústico 2, recomendado em [77].

Em [42] é proposto um terceiro método que permite também uma avalia¸cão local da tonalidade, mas com a vantagem de se basear em coeficientes de uma MDCT, directamente dispon´ıveis na maioria dos codificadores de áudio modernos.

Dans le document « Pourquoi y a-t-il quelque chose plutôt que rien ? » (Page 39-42)