Universidad Nacional de Quilmes Licenciatura en Composición con Medios Electroacústicos Computación Aplicada a la Música 2
Temas de Audio Digital Técnicas de reducción del ruido de cuantización Emanuel Bonnier Existen numerosas técnicas para lograr una óptima relación señal/ruido de cuantización. Sin duda las más eficaces de todas ellas son: Para el caso de la digitalización de las señales analógicas en general, el empleo de hardware de la máxima calidad y la obtención de tomas que aprovechen al máximo el rango de la mayor profundidad en bits disponible desde su origen. En el caso particular de la grabación de señales acústicas, la calidad de nuestros micrófonos y de la cadena de audio en general es capital para lograr lo antes dicho. Para el caso de las señales generadas artificialmente, esto es, señales digitales “nativas” que no han pasado por un proceso de conversión ADC, el énfasis habrá de ponerse en la correcta estimación de las características de la señal previamente a su generación, para la correcta asignación de los diversos parámetros relevantes para el archivo de trabajo. Aquellos parámetros que serán cruciales para la reducción del ruido de cuantización serán, en primerísimo primer orden, la selección de una profundidad en bits adecuada. El criterio que en condiciones ideales seguiremos es muy sencillo: la mayor disponible. En segundo orden seleccionaremos de acuerdo al mismo criterio la frecuencia de muestreo más adecuada. Este apunte no pretende otra cosa que describir brevísimamente dos técnicas de reducción del ruido de cuantización para ser empleadas en la corrección o mejoramiento de lo que en los pasos previos para la obtención de las señales digitales no se hubiera logrado de manera óptima: el enmascaramiento o ditering y el noise shaping.
Dithering o enmascaramiento Esta técnica consiste en “inyectar” ruido en la señal digital para enmascarar la dsitorsión de una señal digital al ser remuestreada a una profundidad en bits inferior a la original. El efecto de enmascaramiento buscado puede encontrar un correlato gráfico en las técnicas del mismo nombre empleadas para la compresión de imágenes .jpg, en donde un cierto grado de “borroneo” de los bordes netos de una imagen permite encubrir el efecto de pixelado propio de los mapas de bits de baja resolución. Esta técnica emplea diversos tipos de distribución para el ruido inyectado. Las “formas” de las mismas describen la manera en que este proceso se realizará de acurdo al siguiente criterio: El eje X expresa la amplitud del ruido inyectado, el eje Y la probabilidad de ocurrencia de cada uno de esos valores de amplitud del ruido. Por ejemplo, en el caso de una distribución rectangular, la probabilidad de ocurrencia de los diversos valores de amplitud del ruido
es idéntica (fig. 1). En el caso de la distribución triangular, los valores de amplitud media serán los más frecuentes, siendo los extremos menos frecuentes (fig. 2).
Probabilidad de ocurrencia
Figura 1 Distribución rectangular
Amplitud del ruido inyectado
Probabilidad de ocurrencia
Figura 2 Distribución triangular
Amplitud del ruido inyectado Distintas distribuciones probables:
para
el
enmascaramiento
y
sus
efectos
más
•
Distribución rectangular: Reducirá el ruido de cuantización agregado por el remuestreo, pero la amplitud del remamente del mismo se manifestará más dependiente de la amplitud de la señal que en otras distribuciones.
•
Distribución triangular: Reducirá el ruido de cuantización agregado por el remuestreo, además de cualquier remanente de modulación del piso de ruido, pero el monto de la reducción será ligeramente menor a la distribución rectangular. Esta distribución puede emplearse con mejores resultados en combinación con técnicas de noise shaping.
•
Distribución triangular pasa altos: Se comportará con resultados similares a la distribución triangular antes citada, con el agregado de que “desplazará” su ruido hacia la región “alta” del espectro. Esta distribución es la más típicamente empleada en combinación con técnicas de noise shaping.
•
Distribución gausiana: Es menos efectiva para la mayoría de los casos que la rectangular o las triangulares, pero puede ser eficaz en casos de señales atípicas.
Noise Shaping
Esta técnica se funda en conocimientos elementales de psicoacústica y tiene por objeto desplazar el ruido hacia regiones de frecuencias menos pregnantes para la audición humana, esto reduce el monto de ruido precibido, creando la ilusión de una señal mas “limpia”. La técnica más usual consiste en desplazar el ruido de cuantización hacia las frecuencias más altas, para las cuales la capacidad de discriminación de nuestra audición se supone menor en la mayoría de las condiciones. Una consecuencia que podemos extraer rápidamente de esta noticia es la inconveniencia de usar esta tecnica cuando estemos trabajando con señales registradas a frecuencias de muestreo bajas. Esto podría resultar, incluso, en una sensación de incremento del ruido. Esta condición se hace evidente si consideramos un instante estos dos casos: 1. SR = 44.100 Hz.
=> F. de Nyqvist = 22.050 Hz.
2. SR = 11.025 Hz.
=> F. de Nyqvist = 5.512,5 Hz.
En (1) el ruido podrá desplazarse por encima de los 20 KHz, esto es, por encima de nuestro umbral perceptual y resultará en una sensación de menor nivel de ruido. En (2) el ruido se concentrará en la región en torno a los 5 KHz que, si bien es algo por encima de nuestra zona más privilegiada en cuanto a la audición, se encuentra en una región bien audible. El mismo hecho de su desplazamiento y concentración provocará casi con seguridad un “subrayado” del ruido que resultará en una sensación de incremento del mismo. Como consecuencia de lo expuesto, cae por su propio peso la recomendación de no emplear esta técnica cuando trabajemos con frecuencias de muestreo inferiores a los 44.100 Hz. El desarrollo de hardware de alta performance nos permite hoy en día y a futuro superar este piso por un margen cada vez mayor.