Diferencia entre revisiones de «Adaptive Transform Acoustic Coding»
Contenido eliminado Contenido añadido
m Robot: Reemplazo automático de texto (-([Pp])er([íi])odo de tiempo +\1eríodo); cambios triviales |
|||
Línea 46:
Este bloque de longitud adaptable escoge la longitud de las ventanas de acuerdo con las características de la señal. Hay dos modos:
*
*
Sin embargo, el hecho de usar ventanas de longitud adaptable no hace inmune el sistema de lo que se denomina [[pre-eco]] y que resulta ser uno de los principales problemas en la mayoría de los códecs de audio con pérdidas. El '''pre-eco''' es fruto de transiciones abruptas de audio, como por ejemplo el ruido de un vaso rompiéndose, esto crea un ruido que se extiende por todas las muestras de la ventana. No obstante, si la longitud de la ventana es suficientemente pequeña, el [[enmascaramiento temporal]] puede oscurecer el ruido añadido antes y después de la transición. Los efectos del eco son más preocupantes antes de la transición ya que los efectos del enmascaramiento temporal afectan mucha más las zonas posteriores al tono que las anteriores.
=== ¿Cómo soluciona ATRAC este problema? ===
Para prevenir el "pre-eco" ATRAC cambia a modo corto de ventana (short mode) cuando detecta una señal de ataque (transición abrupta). Así, solo hay un pequeño segmento de ruido antes del ataque y el resto se disimula gracias al post-enmascaramiento temporal. Sin embargo, si el cambio de ventana no se llevase a cabo a causa de un error del bloque adaptativo y siguiéramos en modo largo, el enmascaramiento temporal posterior (post-enmascaramiento) no tendría los efectos deseados porque el ruido quedaría enmascarado durante un
=== Cuantificación espectral ===
Línea 59:
El factor de escalado se escoge de una lista fija de posibilidades y refleja la magnitud de los coeficientes espectrales de cada unidad. La longitud de palabra se determina con el algoritmo de asignación de bits.
Para cada trama de sonido (correspondiente a 512 muestras de la señal de entrada), se almacena la siguiente información:
*
*
*
*
Para garantizar la correcta reconstrucción de la señal, la información más relevante se guarda de forma redundante. Como también se guarda información sobre la cantidad de datos redundantes.
Línea 79:
Divide la señal en 4 partes:
*
*
*
*
[[Archivo:Señal_audio.PNG|center|frame|Análisis señal de audio en 4 bandas]]
Línea 98:
Presenta dos modos: LP2 y LP4
*
*
Ambas técnicas permiten minimizar el efecto del pre-eco con mejores resultados que en la anterior versión.
|