Diferencia entre revisiones de «MP3»

Contenido eliminado Contenido añadido
Sin resumen de edición
Etiquetas: posible pruebas Edición desde móvil Edición vía web móvil
Etiqueta: Revertido
Línea 73:
La [[compresión de datos|compresión]] se basa en la reducción del margen dinámico irrelevante, es decir, en la incapacidad del sistema auditivo para detectar los errores de [[Cuantificación (procesado de audio)|cuantificación]] en condiciones de [[enmascaramiento sonoro|enmascaramiento]]. Este estándar divide la señal en bandas de frecuencia que se aproximan a las bandas críticas, y luego cuantifica cada subbanda en función del umbral de detección del ruido dentro de esa banda. El modelo psicoacústico es una modificación del empleado en el esquema II, y utiliza un método denominado predicción polinómica. Analiza la [[señal de audio]] y calcula la cantidad de ruido que se puede introducir en función de la frecuencia, es decir, calcula la «cantidad de enmascaramiento» o [[umbral de enmascaramiento]] en función de la frecuencia.
 
El codificador usa esta información para decidir la
El codificador usa esta información para decidir la mejor manera de gastar los [[bits]] disponibles. Este estándar provee dos modelos psicoacústicos de diferente complejidad: el modelo I es menos complejo que el modelo psicoacústico II y simplifica mucho los cálculos. Estudios demuestran que la distorsión generada es imperceptible para el oído experimentado en un ambiente óptimo desde los 192 kbps y en condiciones normales.{{citarequerida}} Para el oído no experimentado, o común, con 128 kbps o hasta 96 kbps basta para que se oiga «bien» (a menos que se posea un equipo de audio de alta calidad donde se nota excesivamente la falta de graves y se destaca el sonido de «fritura» en los agudos). Las personas que tienen experiencia en la parte auditiva de archivos digitales de audio, especialmente música, desde 192 hasta 256 kbps basta para oír bien, pero la compresión en 320 kbps es la óptima para cualquier escucha. {{citarequerida}}. La música que circula por Internet, en su mayoría, está codificada entre 128 y 192 kbps, aunque hoy debido al aumento de ancho de banda es cada vez más frecuente compartir archivos en calidad máxima de compresión.
 
=== [[Codificación digital]] y [[Cuantificación_(procesado_de_audio) |cuantificación]] ===
La solución que propone este estándar en cuanto a la repartición de bits o ruido, se hace en un ciclo de iteración que consiste de un ciclo interno y uno externo. Examina tanto las muestras de salida del banco de filtros como el [[SMR]] (signal-to-mask ratio) proporcionado por el modelo [[psicoacústica |psicoacústico]], y ajusta la asignación de bits o [[ruido de cuantificación]], según el esquema utilizado, para satisfacer simultáneamente los requisitos de tasa de bits y de enmascaramiento. Dichos ciclos consisten en:
 
==== Ciclo interno ====
El ciclo interno realiza la cuantización no-uniforme de acuerdo con el sistema de [[punto flotante]] (cada valor espectral [[MDCT]] se eleva a la potencia 3/4). El ciclo escoge un determinado intervalo de cuantización y, a los datos cuantizados, se les aplica [[codificación de Huffman]] en el siguiente bloque. El ciclo termina cuando los valores cuantizados que han sido codificados con Huffman usan menor o igual número de bits que la máxima cantidad de bits permitida.
 
==== Ciclo externo ====
Ahora el ciclo externo se encarga de verificar si el factor de escala para cada bandas tiene más [[distorsión]] de la permitida (ruido en la señal codificada), comparando cada banda del factor de escala con los datos previamente calculados en el análisis acústico. El ciclo externo termina cuando una de las siguientes condiciones se cumple:
 
* Ninguna de las bandas del factor de escala tiene mucho ruido.
* Si la siguiente alternación amplifica una de las bandas más de lo permitido.
* Todas las bandas han sido amplificadas al menos una vez.
 
=== Empaquetado o formateador de bitstream ===
Este bloque toma las muestras cuantificadas del banco de filtros, junto a los datos de asignación de bits/ruido y almacena a agapio el audio codificado y algunos datos adicionales en las tramas. Cada trama contiene información de 1152 muestras de audio y consiste de un encabezado, de los datos de audio junto con el chequeo de errores mediante [[Comprobación de redundancia cíclica|CRC]] y de los datos particulares (estos dos últimos opcionales).
 
=== Volumen ===
La normalización de volumen, también conocido como Normalización de audio, básicamente consiste en la nivelación del volumen de las pistas que conforman un álbum, lo que permite escuchar las canciones que lo componen siempre con el mismo volumen, evitando el salto entre una canción que «suena bajo» con otra que «suena alto».<ref>{{cita web|título=Normalizar el volumen en los MP3|url=http://www.informatica-hoy.com.ar/multimedia/Normalizar-volumen-MP3-audio.php|obra=InformáticaHoy}}</ref> Para ello se utilizan programas como [[QMP3Gain]].<ref>{{cita web|apellidos1=Branyiczky|nombre1=Zsolt|título=QMP·Gain|url=http://sourceforge.net/p/qmp3gain/wiki/Home/|obra=SourceForge}}</ref>
 
== Estructura de un fichero MP3 ==