Volumen en la masterización – parte 2(Letto 179 volte)

Continúa desde la primera parte: https://alessandrofois.com/staging-a2/loudness-nel-mastering-parte-1-dinamica/
Para evitar que el ruido de fondo y otros trastornos inherentes a los soportes de grabación (por ejemplo, el susurro de las cintas analógicas) se ha intentado:
- mantener el pico máximo de la grabación al nivel más alto posible, pero por debajo del punto de distorsión
- De comprimir el “espacio dinámico útil” en una banda relativamente estrecha, capaz de reproducir un rango dinámico funcional para los distintos tipos de uso, pero lo suficientemente amplio como para reproducir dignamente la expresividad dinámica de la música.
En los años siguientes, especialmente en el ámbito del pop, la industria discográfica redujo gradualmente el espacio dinámico, comprimiéndolo cada vez más con el fin de aumentar el volumen de los momentos más bajos de la dinámica interpretativa, hasta reducir a pocos db el espacio dinámico utilizado.
Como veremos, el fenómeno se ha acelerado considerablemente con la llegada de los soportes digitales.
A lo largo de unos 20 años (desde los años 90 hasta los años 10 del tercer milenio), la necesidad de comprimir la música para garantizar un uso más cómodo se ha transformado gradualmente en una carrera desenfrenada hacia el Volumen perceptible.
El objetivo, impulsado por los productores, era superar “a golpe de volumen” el impacto sonoro de las producciones musicales de la competencia, lo que desencadenó una auténtica Guerra del Volume, definida precisamente “Guerra del volumen”.
Guerra del volumen
El término guerra del volumen Se refiere, por lo tanto, a la tendencia de la industria musical, impulsada por artistas y productores, a producir y publicar música utilizando altos niveles de volumen, que se han vuelto cada vez más elevados año tras año, en un intento continuo por superar en volumen las producciones editadas por los artistas y discográficas “competidores”.
La introducción de los procesadores de señales digitales y de limitadores La mejor calidad y la extrema precisión han permitido a los técnicos de sonido aumentar significativamente el volumen percibido en una grabación; y dado que “más fuerte” era generalmente percibido por los usuarios como “mejor”, los ingeniero de sonido, debido a las “presiones” de los productores, intentaron “empujar” el volumen hasta el límite máximo posible, lo que llevó al mundo discográfico a la guerra del volumen.
Muchos profesionales del mundo de la música, sobre todo técnicos de sonido y artistas, consideran que esta tendencia ha supuesto el sacrificio de la calidad del sonido y de la expresión dinámica para obtener niveles elevados de volumen en soporte de audio.
Arriba se muestran las formas de onda de una canción publicada en 1980 y remasterizada varias veces en ediciones posteriores, con una tendencia al aumento del volumen en 2001 hasta alcanzar su punto álgido en la guerra del volumen en 2005, para luego volver a una intensidad elevada pero más moderada en 2011.
La era analógica
Este procedimiento no se utilizaba antes de la llegada de la tecnología digital, debido también a las limitaciones físicas inherentes al sistema de grabación mecánica del vinilo.
En realidad, incluso con los vinilos, algunos discos sonaban más fuertes, según la dinámica natural de los distintos géneros musicales y gracias a las diferentes técnicas de masterización entonces en uso, pero cada disco era “una isla en sí misma”, y la única necesidad percibida era la de:
- garantizar que todas las canciones del mismo álbum tuvieran un volumen proporcional entre sí, manteniéndose dentro de un espacio dinámico superior al nivel de ruido de fondo, sin nunca distorsionar en picos más elevados y haciendo que tal espacio dinámico resultara lo suficientemente amplio para una’expresión dinámica-musical correcta.
En el caso de las producciones de discos “recopilatorios” (con canciones ya editadas extraídas de diferentes álbumes y, a veces, incluso realizadas por diferentes artistas), a menudo se realizaba un remasterización, con el fin de nivelar el volumen y el equilibrio tonal perceptible durante la escucha de las distintas canciones, con el fin de lograr una mayor “homogeneidad” entre los contenidos del disco.
En el’era analógica, quien quisiera escuchar “más fuerte” simplemente podía subir el volumen de la amplificación de su propio sistema de reproducción, ajustando el volumen de escucha cada vez que se cambia el disco en el tocadiscos, para adaptarlo a las necesidades de escucha del momento.
El único límite estaba determinado por la potencia de amplificación y la resistencia mecánica de los altavoces del sistema de reproducción.
Con la llegada de las cintas de audio, el criterio de uso por parte de los usuarios no cambió sustancialmente, dejando aún a la botón de volumen del usuario final individual la tarea de nivelar el’intensidad sonora, según las preferencias del oyente.
La era digital
Durante un tiempo, por costumbre, incluso la escucha de CD se caracterizó básicamente por los mismos procedimientos de escucha por parte de los usuarios, y esa rutina continuó durante gran parte de los años 80, una década caracterizada, sin embargo, por un notable aumento del volumen, pero progresivo y moderado.
Allá “Guerra del Volume” (Guerra del volumen)” La verdadera parece haber comenzado en los años 90, con la difusión de los reproductores múltiples de discos compactos instalados en los automóviles, que permitían pasar de una canción a otra “saltando” también de un CD a otro; este modo de uso, de hecho, ponía de manifiesto las diferencias de volumen entre un disco y otro.
En concreto, la carrera por el volumen se acentuó cuando los fabricantes se dieron cuenta de que los usuarios que poseían reproductores de CD múltiples solían utilizar un criterio de reproducción “libre”, pasando de una canción a otra de diferentes CD, lo que les obligaba a “ajustar” continuamente el volumen de escucha, algo especialmente desagradable mientras se conduce.
Si el usuario no modificaba el volumen de escucha, las canciones con mayor espacio dinámico (que se percibían con un volumen medio más bajo) se veían penalizadas, ya que sonaban más “escasas” en comparación con otras que sonaban más fuertes.
Esta constatación fue el detonante decisivo que llevó a varios productores y artistas a exigir a los técnicos de sonido una solución, es decir, la compresión exagerada de la masterización, llevándola a niveles cada vez más altos.
El fenómeno continuó incluso con la llegada de los reproductores portátiles y las memorias USB, llegando a ser insostenible en pocos años y provocando las quejas de muchos técnicos de sonido y artistas, que pedían que se estableciera un estándar de referencia capaz de respetar un poco más la calidad del sonido, la música y sus dinámicas.
Consecuencias en el audio
Dado que el nivel sonoro de un archivo de audio no puede superar un determinado límite (0 db digital), el volumen total solo puede aumentarse reduciendo el rango dinámico y posteriormente “normalizando el nivel de la canción” (lo que eleva el pico máximo en el punto de máxima tolerancia del muestreo digital, es decir, cerca del 0 db).
Lo anterior se ha logrado “comprimiendo hacia arriba” y de forma cada vez más extrema la “dinámica”, con el resultado de comprometer cada vez más los picos y provocar distorsiones acústicas de diversa índole y la pérdida casi total de la modulación expresiva dinámica.
Efectos negativos
- La música con un rango dinámico reducido resultó estresante y poco expresiva.
- El excesivo recorte de los picos ha producido muchos “puntos de ruido”, cada vez más densos y audibles cuanto mayor era la compresión. En los peores casos, es como si se hubiera creado un “ruido de fondo continuo de tipo ferroso”, similar al “ruido blanco”.”
Efectos positivos concretos
- Mayor facilidad de uso del contenido de audio al escuchar en lugares ruidosos.
NÓTESE BIEN
Durante años, los técnicos de sonido se han visto obligados a “trepar por las paredes” para satisfacer las exigencias de los clientes.
Con el fin de contener al máximo los daños provocados por la compresión excesiva, han aprendido a optimizar al máximo los procesos, también mediante:
- del uso de la compresión multibanda
- de la automatización “paso a paso” de los valores de compresión,
- de las técnicas de compresión analógicas y valvulares (o digitales con emulación analógica), con el fin de crear “muros de saturación” más armoniosos.
Pero incluso así se han producido “monstruos sonoros” que, en opinión de muchos, resultan intolerables.
Las soluciones
Deseoso de poner fin a la guerra del volumen, a finales de los años 90, el ingeniero de sonido Bob Katz desarrolló un criterio denominado Sistema K.
Sistema K
En Sistema K (Sistema de Katz Bob) es un protocolo para configurar las calibraciones de mezcla y monitorización en un estudio de audio.
Aunque los estándares de volumen como EBU R128, como veremos, se utilizan más ampliamente hoy en día utilizando una escala en LUFS/dB, el Sistema K , que utiliza una escala en RMS/dB, sigue siendo una buena forma de ajustar los niveles de audio.
Este sistema utiliza tres estándares diferenciados, conocidos como K-20, K-14 e K-12.
Estos números expresan en dB RMS la amplitud del rango dinámico de la canción, por lo que en cada paso (de K-20 a K-12), el rango dinámico disponible disminuye y aumenta el volumen (entendido como volumen medio percibido).
La pantalla “etiqueta” situada en la parte superior de la escala del medidor debe indicar el nivel máximo previsto en función del objetivo (20 dB, 14 dB o 12 dB) y, al igual que con la medición normal, corresponde a la señal digital en fondo de escala.
Para funcionar correctamente, el sistema requiere que el nivel de escucha del monitor se calibre cuidadosamente, de modo que su nivel perceptible, cuando se encuentra en la etiqueta 0 dB del medidor, corresponda a 85 dB SPL.
De hecho, esta es la condición ideal de referencia para realizar una mezcla y una masterización a K-20, a K-14 y a K-12.
Los medidores del Sistema K muestran simultáneamente tanto el nivel máximo que eso RMS.
La parte superior roja de los medidores es la zona de máxima intensidad.
En la grabación musical, el nivel RMS solo debería alcanzar la zona roja en los pasajes más intensos, en los momentos culminantes, en los momentos puntuales más destacados.
De hecho, según la media de los resultados de las pruebas realizadas por el propio Katz con En algunas muestras de usuarios, se ha observado que, si siempre utilizas la zona roja, es posible que sientas la necesidad de reducir la ganancia del monitor.
A continuación se detallan las tres mediciones:
K-12
Este nivel se había diseñado exclusivamente para la radiodifusión.
Con ello se obtiene que -12 dBFS = 0 VU = 85 dB SPL.
El headroom limitado a solo 12 dB explica su uso exclusivo para material de audio comprimido destinado únicamente a la transmisión por aire (aunque posteriormente también se utilizó para la finalización de géneros musicales más intensos, como la música dance (especialmente la electrónica) y cierto tipo de música pop).
K-14
Esto debía constituir el estándar para la mayoría de las grabaciones comerciales de tipo pop, creadas para su escucha doméstica y privada en general.
Las mezclas de música pop son ejemplos de material adecuado para K-14, donde -14 dBFS = 0 VU = 85 dB SPL.
El margen de headroom es de 14 dB.
La escala K-14 fue probablemente la más utilizada de las tres normas.
K-20
Esta escala ofrece el rango dinámico más amplio disponible entre los tres sistemas.
Estaba pensada principalmente para grandes mezclas teatrales, mezclas musicales dinámicas, cine, radiodifusión televisiva, mezclas de estilos clásicos y tradicionales.
Cualquier programa de audio con un amplio rango dinámico debería haberse ajustado al estándar K-20.
Con ello se obtiene que -20 dBFS = 0 VU = 85 dB SPL, con un margen de 20 dB.
Representación esquemática de la escala de volumen ideada por Bob Katz. Una buena referencia alternativa para contrarrestar la guerra del volumen, posteriormente sustituida por la medición en LUFS tras la entrada en vigor de las normas sobre radiodifusión y la llegada de las plataformas de streaming. Los tres puntos más altos de las zonas rojas (aquí representadas en gris oscuro) están alineados con el nivel de 0 dB de la escala digital.
En resumen, el objetivo era establecer el rango dinámico de referencia para los distintos tipos de escucha. Durante años, algunos ingenieros de sonido (pocos, en realidad) se alinearon con los criterios propuestos por el ingeniero Katz, mientras que la mayoría de ellos, presionados por los productores, continuaron trabajando con el volumen “a tope”.
LUFS
Mientras tanto, desde el año 2006 en adelante, las instituciones ITU y EBU elaboraron progresivamente un protocolo destinado a limitar la guerra dinámica, definiendo finalmente un estándar de medición con relativa unidad de medida, que permitiera analizar mejor la señal de audio interpretándola sobre todo en el ámbito perceptivo, con el fin de producir masters con características estándar.
La unidad de medida en cuestión se llamaba LKFS, luego redefinida y renombrada LUFS desde Unión Europea de Radiodifusión (EBU) en el documento EBU R128 del 2014.
Este sistema de medición actual permite analizar un archivo de audio ya no en función de la escala RMS, sino utilizando un protocolo diferente, con un criterio de medición que en esencia es muy similar al’RMS, pero con variables añadidas que tienen en cuenta la percepción psicoacústica del usuario medio.
El acrónimo LUFS significa “unidad de medida del volumen relativa al fondo de escala”.
Se trata, en origen, de un estándar de volumen diseñado para permitir la normalización de los niveles de audio para la transmisión televisiva.
LUFS está estandarizado en un conjunto de algoritmos destinados a medir el volumen del programa de audio y el nivel de su “pico real” (para más información, consulte el documento ITU-R BS 1770 y las modificaciones posteriores introducidas entre 2011 y 2015).
Los LUFS se miden en una escala absoluta y corresponden a un decibelio (dB).
El nuevo sistema se perfeccionó en los años siguientes, y el estándar de:
-23 LUFS (EBU)
se impuso en los contextos de la radiodifusión, involucrando (en parte) también a la industria cinematográfica.
El nivel de:
-1 dBTP
se convirtió en el estándar para el pico máximo del programa de audio, garantizando así amplios márgenes para prevenir cualquier riesgo de recorte.
Pronto, el estándar se convirtió en norma legal, obligando, sin embargo, en este sentido solo a los operadores del radiodifusión.
L'industria discográfica, sin embargo, respondió haciendo oídos sordos, ya que ningún productor querría publicar productos fonográficos que suenen “más bajos” que los de la competencia.
La revolución del streaming
Por lo tanto, se necesitaba un nuevo elemento, tan decisivo que disuadiera a la’industria fonográfica de continuar con la guerra del volumen.
La oportunidad llegó con la difusión de las plataformas de streaming, un fenómeno que ya en 2019 alcanzó una difusión capilar en todo el mundo y, por lo tanto, un enorme poder para determinar la imposición “de facto” de un estándar.
Le plataformas de streaming, con el fin de garantizar una máxima homogeneidad En lo que respecta a la reproducción de audio, deben ser capaces de reproducir de forma suficientemente correcta cualquier género musical, desde la música clásica más refinada y delicada hasta el heavy metal más denso e intenso.
Estas plataformas deben ofrecer:
- un volumen medio percibido suficientemente constante de escucha para todas las canciones de su “catálogo”, a pesar de que dichos volúmenes son extremadamente heterogéneos.
- una excursión dinámica aceptable, con el fin de respetar suficientemente la expresividad musical.
- un sonido sin distorsiones
Esto ha favorecido la imposición “de facto” de algunos estándar de volumen con valores muy similares entre sí, pero que por el momento no son idénticos para todas las plataformas.
Sea cual sea el volumen original de las piezas musicales presentes en las plataformas de streaming, siempre sufrirán algunos procesos automáticos de control y, si no cumplen con los criterios estándar impuestos por la plataforma de streaming específica, se procesarán automáticamente con el fin de adaptarlos a los valores de volumen requeridos.
Para ello, la plataforma se encargará automáticamente de contener el volumen general de los archivos de audio con un volumen excesivo, con el fin de obtener un nivel satisfactorio para todas las canciones del catálogo de la propia plataforma.
Es evidente que, teniendo en cuenta lo anterior, incluir en dichas plataformas fragmentos caracterizados por una Compresión excesiva del archivo de audio. solo servirá para aplanar su dinámica, afectando también a la pureza del sonido., sin tener ningún efecto real sobre el volumen que será percibido por los usuarios que están escuchando.
Esto está desanimando progresivamente a los productores a continuar con la insensata Guerra del Volume, dirigiéndolos a producir sus masters con dinámicas más amplias y relajadas.
NÓTESE BIEN
Si bien por un lado se garantiza la reducción del volumen, por otro lado no se garantiza la mejora de los archivos de audio con un volumen inferior al estándar.
Por lo tanto, en general, será preferible conferir a las pistas un ligero exceso de volumen en lugar de lo contrario (por ejemplo, suponiendo que -14,0 sea el estándar para una plataforma específica, será recomendable un volumen comprendido entre -13,5 y -14,0 en lugar de entre -14,0 y -14,5).
Le plataformas de streaming En este momento no están perfectamente alineadas según un norma común, sino que en la actualidad oscilan entre -13 LUFS (por ejemplo, YouTube, que tiene la dinámica más comprimida) y -16,5 LUFS (por ejemplo, Apple Music, que tiene la dinámica más amplia).
La tendencia parece estabilizarse en torno a un posible estándar único de -14 LUFS, que es el que propone Spotify, que actualmente es el más importante. plataforma de streaming musical del mundo.
Por este motivo, otras empresas de streaming “menores” tienden a alinearse con ella, lo que favorece aún más la consolidación definitiva de esta medida, que probablemente se convertirá en el estándar único y definitivo.
Por este motivo, los principales fabricantes de plugins destinados a la finalización dinámica del master Están configurados por defecto a niveles de -23 LUFS para la radiodifusión y de -14 LUFS para el streaming musical, y en este sentido predisponen las utilidades del software, dotándolo a menudo de un indicador de nivel específico, contribuyendo también al establecimiento de dicho estándar.
Esto no excluye la posibilidad de completar varios másteres específicos, con niveles de volumen diferentes, para adaptarse mejor a cada una de las plataformas de streaming.
Volumen de referencia
Antes de proceder a la finalización, primero hay que aclarar cuáles son los tres tipos de medición en LUFS útiles para nuestros análisis:
Medidor de volumen momentáneo
De manera similar a los tradicionales Medidor de vacío analógicos, expresa “en tiempo real” las oscilaciones del volumen, imponiendo una inercia reactiva discreta (aproximadamente 400 ms), ideal para una cómoda “lectura” del nivel.
Muy útil para visualizar el nivel de los picos con el fin de evaluar la conveniencia de intervenciones más o menos marcadas en el ámbito de la limitación preliminar de la mezcla.
Medidor de sonoridad a corto plazo
Expresa el nivel medio del sonido, calculado en un patrón de tiempo breve, equivalente a unos 3 segundos.
Muy útil para seguir de forma fácil y suave la evolución general de los niveles de audio.
Se caracteriza por una velocidad de reacción frenada, algo similar a la ’memoria temporal’ de muchos medidores LED.
Medidor de volumen integrado
Expresa el objetivo real, según los parámetros de referencia y los normativos. EBU – ITU
NÓTESE BIEN
En la revisión de la norma ITU-R BS.1770 se ha añadido el concepto de medición del “Loudness Gated”, que reduce de forma “inteligente” la medición de las pausas ejecutivas y los pasajes musicales con un nivel particularmente bajo.
Un buen medidor de volumen integrado tendrá en cuenta este parámetro, con el fin de no obtener resultados fuera de lo normal.
Nivel de pico verdadero
El procesamiento digital del audio, debido también a la limitación ultrarrápida y al problemático clipping, puede producir picos entre muestras (picos entre muestras).
NÓTESE BIEN
Su equivalente analógico, tras la conversión D/A, revelaría una señal superior al valor real de la muestra, como se muestra claramente en la siguiente figura.
Un pico como este también se denomina nivel de pico real (Nivel de pico verdadero).
Según la calidad del convertidor D/A utilizado en reproducción, estos picos podrían causar distorsiones audibles.
Por supuesto, siempre será mejor prevenir o reducir al mínimo los picos entre muestras y, al mismo tiempo, asegurarse de que cada pico de audio, normal e intermuestra, permanezca “realmente” dentro del límite máximo sin distorsión del 0 db digital.
Un buen plugin de finalización dinámica para masterización debería estar equipado con una función de contención de Picos verdaderos (Limitación de pico verdadero), conforme con las normas EBU R128 e ITU-R BS 1770.
Tenga en cuenta que la medición del pico real (TP) no es una ciencia exacta: hay muchas formas diferentes de implementar la medición conforme a la norma ITU-R BS 1770, que podrían ofrecer resultados ligeramente diferentes.
De hecho, no será raro detectar diferencias de unas décimas de dB TP entre diferentes medidores de pico verdadero.
Los altos valores de sobremuestreo, la capacidad de interactuar en modo “look-ahead” y la elevada calidad general del plugin podrían garantizar una mayor precisión y fiabilidad en la contención de los picos verdaderos.
Recordemos que las normativas y convenciones del sistema imponen o sugieren utilizar un valor de atenuación del pico verdadero igual o inferior a -1 LUFS; algunas plataformas de streaming exigen incluso un valor de atenuación TP de -2 db; en las grabaciones comerciales para CD de audio, en cambio, el ajuste del TP suele ser menos prudente, con valores de -0,5, -0,3, -0,2 db, lo que expone la grabación a riesgos de distorsión transitoria.
Los medidores de un sistema completo de medición en LUFS. A la izquierda, el medidor de referencia clásico con 0 db digital y, a su lado, la medición en db de la reducción de nivel determinada por el limitador. A la derecha, los 3 medidores del sistema LUFS: corto plazo (S), momentáneo (M) e integrado (I). Abajo a la izquierda, el botón de activación del True Pick y, a la derecha, su ajuste de nivel (aún no configurado al valor normativo de -1 dB).
Los nuevos estándares
Para resumir, podemos decir que hoy en día la tendencia es utilizar los siguientes estándares de referencia en LUFS:
Audio CD
- -9 LUFS, con pico verdadero a -0,3 db: es el estándar más extendido para la música rock-pop y derivados, aunque, lamentablemente, muchos productores siguen forzando el estándar, llegando a valores de -8 y -7 LUFS.
NÓTESE BIEN
Personalmente, también en estos casos suelo mantener el TP en -1 db.
Otros géneros musicales más “expresivos”, incluso para el CD, tienden a elegir soluciones capaces de ofrecer un mayor espacio dinámico:
- -10 / -12 LUFS, con True Peak a -1 db – para los géneros musicales modernos más expresivos, como la fusión, el jazz moderno, la música ligera “culta” y alternativa, el etno-pop (este rango de volumen está conquistando gradualmente a más productores “alternativos” y personalmente espero que se convierta en un estándar definitivo también en el ámbito del rock-pop).
- -15 /-23 LUFS, con pico verdadero a -1,0 db, para música popular tradicional, jazz tradicional y música clásica (la que no es estrictamente purista).
- dinámica sin comprimir, con pico real a -1,0 db, para música popular tradicional, jazz tradicional y música clásica (de enfoque estrictamente purista).
Representación esquemática de la dinámica útil y el nivel de sonoridad correspondiente utilizados como estándar en los usos más habituales. Es evidente que, al normalizar a niveles cercanos a 0 db, tendremos poca dinámica útil y alta sonoridad. Sin ninguna compresión (a la derecha), la dinámica natural, con expresiones de 20 a 50 db y más (según los casos), se respetará completamente. Cabe señalar también que el nivel de normalización para el CD de música pop se establece generalmente en valores de nivel pico de pocos decimales, sin el control del ’circuito“ de True Peak.
Transmisión en directo
- El estándar actual más extendido, que debe considerarse temporalmente como referencia, es de -14 LUFS, pero podría estabilizarse en el futuro en -15 db o -13 db.
- Otros servicios de streaming oscilan actualmente entre -13 LUFS (YouTube) y -16,5 LUFS (iTunes).
- Sin embargo, por motivos de sonoridad, hay muchos casos en los que se finaliza con niveles similares a los utilizados para el CD, aunque las plataformas penalizarán automáticamente dichos niveles para que coincidan con los estándares previstos en sus normas de publicación.
Radiodifusión y cine
- El estándar es -23 LUFS con True Peak a -1,0 db, que para la radiodifusión es también una norma legal vinculante.
En el cine se observan oscilaciones significativas, entre -27 y -21 LUFS (con un volumen sonoro a corto plazo de hasta -6 LUFS).
Dejar un comentario
¿Quieres unirte a la conversación?Siéntete libre de contribuir!