Conhecido o padr˜ao de excita¸c˜ao de um sinal mascarante, pode-se estimar o limiar de masca- ramento de um ru´ıdo de banda estreita por simples dedu¸c˜ao do ´ındice de mascaramento `aquele
padr˜ao. Num codificador, por´em, introduz-se ru´ıdo em m´ultiplas bandas, que s˜ao combinadas no padr˜ao de excita¸c˜ao por convolu¸c˜ao com a fun¸c˜ao de espalhamento. Assim, componentes de ru´ıdo que individualmente eram mascaradas, podem tornar-se aud´ıveis quando combinadas. Para determinar o limiar neste caso de m´ultiplos alvos de mascaramento, seria necess´ario fa- zer uma desconvolu¸c˜ao do limiar calculado atr´as, como reconheceu Johnston [83]. Na pr´atica, dadas as dificuldades que levanta, esta opera¸c˜ao ´e substitu´ıda por uma renormaliza¸c˜ao, que serve apenas para compensar o ganho introduzido pelo espalhamento da excita¸c˜ao. Esta simplifica¸c˜ao ´e um dos principais problemas apontados a esta abordagem [160].
A renormaliza¸c˜ao consiste simplesmente na aplica¸c˜ao est´atica do ganho inverso ao padr˜ao de excita¸c˜ao. Esta opera¸c˜ao pode ser inclu´ıda mesmo em modelos de representa¸c˜ao interna, pois n˜ao afecta as diferen¸cas relativas entre os padr˜oes de excita¸c˜ao.
Abaixo descrevemos modelos emp´ıricos para avalia¸c˜ao do ´ındice de mascaramento em fun¸c˜ao da frequˆencia, tanto no caso de tons a mascarar ru´ıdo como no caso inverso. Tamb´em se referem algumas medidas de tonalidade que podem ser usadas para determinar o ´ındice de mascaramento de um sinal mascarante que n˜ao seja nem um tom puro nem uma banda de ru´ıdo.
Tons a Mascarar Ru´ıdo
Um primeiro modelo para o ´ındice de mascaramento de ru´ıdo por tons, abreviadamente TMN (Tone Masking Noise), foi dado em [136]:
TMN (z)/dB = 15.5 + z.
As tabelas de TMN dispon´ıveis na recomenda¸c˜ao do MPEG para o Modelo Psicoac´ustico 2 parecem seguir esta lei, com uma adapta¸c˜ao nas frequˆencias mais baixas. No entanto, como esta f´ormula foi constru´ıda sobre dados experimentais obtidos para frequˆencias baixas (at´e 3 ou 4 kHz), poder´a estar errada para frequˆencias mais altas. Na verdade, foi reconhecido em [41] que esta express˜ao levava a uma sobrecodifica¸c˜ao das altas frequˆencias em detrimento das baixas e foi proposta uma f´ormula alternativa para corrigir esse defeito:
TMN (z)/dB = 19.5 − 18 26z.
Em [131], propusemos ainda outra express˜ao, baseando-nos em dados experimentais de [146]:
TMN (z)/dB = 166−z6 + 28z6 se 0 ≤ z < 6 28 se 6 ≤ z < 16 2820−1620−z + 2020−16z−16 se 16 ≤ z < 20 20 se 20 ≤ z . (6.7)
Esta express˜ao ´e mais conservadora que a de Schroeder at´e `a frequˆencia de 12.5 Bark (1.8 kHz). Para frequˆencias mais altas, o ´ındice n˜ao cresce mais; at´e diminui ligeiramente a partir de 20 Bark (7 kHz). N˜ao h´a portanto consenso quanto `a curva exacta do ´ındice TMN em fun¸c˜ao da frequˆencia.
Ru´ıdo a Mascarar Tons
O ´ındice de ru´ıdo mascarando tons (NMT) ´e bastante mais baixo, e apresenta menor varia¸c˜ao ao longo da frequˆencia. Um modelo aproximado, considerado razo´avel, para este ´ındice ´e:
Ferreira usou um modelo ligeiramente diferente [41]: NMT (z)/dB = 6.56 −3.06
26 z.
Em codifica¸c˜ao perceptual, s´o interessa considerar situa¸c˜oes de mascaramento de ru´ıdo de quantiza¸c˜ao, n˜ao de mascaramento de tons. Contudo, na falta de dados mais espec´ıficos para essa circunstˆancia, usa-se o ´ındice NMT para avaliar o mascaramento de ru´ıdo de quantiza¸c˜ao por sinais n˜ao tonais.
Avalia¸c˜ao de Tonalidade
As diferen¸cas significativas entre o poder mascarante de tons e de bandas de ru´ıdo levanta o problema da determina¸c˜ao da tonalidade dos sinais a processar por um codificador perceptual. Uma primeira solu¸c˜ao para este problema foi proposta em [83] e aplicada no codificador PXFM. Baseia-se no c´alculo da medida de planura espectral (SFM) avaliada a partir do espectro de potˆencia de cada bloco do sinal, estimado por uma DFT. Essa medida ´e ent˜ao convertida num coeficiente de tonalidade, α, de tal forma que α = 0 quando o espectro ´e absolutamente plano (SFM = 0 dB), indicando a natureza “ruidosa” do sinal; e α = 1 quando SFM < −60 dB, considerado um indicador de “tonalidade pura”. O ´ındice de mascaramento final ´e calculado por interpola¸c˜ao entre TMN e NMT segundo:
MI (z) = αTMN (z) + (1 − α)NMT (z). (6.8) Um inconveniente deste modelo ´e que o coeficiente de tonalidade ´e uma medida global para todo o espectro, n˜ao discriminando regi˜oes tonais e regi˜oes n˜ao tonais que ocorrem simultaneamente em frequˆencias diferentes em determinados sinais. Apercebendo-se disso, Brandenburg e Johnston propuseram um outro m´etodo de avaliar a tonalidade, baseado numa medida de coerˆencia entre valores sucessivos de cada componente espectral [22]. O princ´ıpio subjacente ´e que uma componente “tonal” ter´a uma evolu¸c˜ao temporal coerente (previs´ıvel), enquanto uma componente de ru´ıdo ser´a imprevis´ıvel. A medida de coerˆencia ´e calculada em cada componente espectral pela distˆancia euclidiana entre o valor registado no bloco actual e o valor estimado por um preditor simples baseado na amplitude e na fase medidas nos dois blocos anteriores. Por uma rela¸c˜ao logar´ıtmica, ´e derivado o coeficiente de tonalidade α(z), dependente da frequˆencia, que permite finalmente calcular o ´ındice de mascaramento pela express˜ao 6.8. Esta medida de tonalidade ´e aplicada igualmente no Modelo Psicoac´ustico 2, recomendado em [77].
Em [42] ´e proposto um terceiro m´etodo que permite tamb´em uma avalia¸c˜ao local da tonalidade, mas com a vantagem de se basear em coeficientes de uma MDCT, directamente dispon´ıveis na maioria dos codificadores de ´audio modernos.