Loudness dans le mastering – partie 1(Letto 116 volte)

10 juillet 2023/0 Commentaires/dans Audio, Mastering audio/par Alessandro Fois

Dynamique

Amplitude dynamique

Dans un morceau de musique ou dans un discours, il s'agit de la différence de volume entre les phrases les plus faibles et les plus fortes.

Dans le domaine de la musique acoustique (sans amplification), celle jouée par le grand orchestre symphonique “ romantique ” est celle qui possède la plus grande amplitude dynamique, pouvant atteindre 60 dB.

Avec ce type de musique, le volume sonore dans l'Auditorium peut atteindre des pics acoustiques d'environ 100 dB (les accents les plus intenses de l'orchestre complet, également appelés “ hits ”).

Il sera possible de distinguer même les passages musicaux les plus délicats, qui pourraient atteindre le seuil minimum d'environ 40 dB, à condition que le volume du bruit de fond ambiant soit suffisamment inférieur à ce niveau (dans un théâtre, le silence est suffisant).

Afin d'éviter qu'une grande partie du contenu harmonique ne soit perdue lors des passages à très faible volume, il faudra donc maintenir une “ marge ” aussi élevée que possible entre le niveau de ces passages et le seuil du bruit de fond.

Un exemple :

35 dB de bruit ambiant présent dans une salle de concert moyennement remplie
+ 5 dB de marge
+ 60 dB dans les passages les plus intenses de la musique
= 100 dB de volume maximal d'écoute dans les pics “ fortissimo ”

Dans la pratique, cependant, nous avons besoin de pouvoir écouter la musique enregistrée à des volumes bien plus modérés, qui permettent une bonne écoute même dans des situations où il ne serait pas possible de dépasser 60 dB de bruit de fond, comme par exemple : l'écoute à des volumes relaxants, la nuit, dans des endroits bruyants, dans une voiture avec le moteur allumé, sur de petits haut-parleurs, en tant que musique de fond.

Dans ces conditions, l'écoute sera plus agréable si l'amplitude dynamique naturelle de la musique ou de la parole est considérablement réduite (par exemple de moitié, voire davantage), afin de rendre les passages musicaux les plus délicats suffisamment audibles, même dans les circonstances susmentionnées.

Il faut donc tenir compte du fait que plus le volume d'écoute est faible, plus le volume du bruit de fond est élevé, et par conséquent, plus l'amplitude dynamique doit être faible afin de garantir la jouabilité de chaque passage musical sans rien perdre en cours de route pendant l'écoute.

En revanche, la réduction de l'amplitude dynamique aura tendance à aplatir de plus en plus l'expressivité dynamique, avec un “ pianissimo ” renforcé et des accents de fortissimo atténués, donnant lieu à une écoute agréable mais ennuyeuse.

Intensité dynamique moyenne mesurée

La intensité dynamique moyenne, exprimée en RMS, c'est le niveau moyen de la somme des valeurs de crête détectés sur la ligne temporelle d'un morceau (ou d'un fragment de celui-ci).

Intensité dynamique moyenne perçue

Exprimé en LUFS, L’intensité dynamique moyenne perçue également appelée simplement Loudness ou mieux encore Intensité sonore intégrée, correspond dans les grandes lignes à la intensité dynamique moyenne mesurée ci-dessus, mais introduit également de nouveaux éléments de calcul, notamment :

une mesure basée sur des critères perceptifs humains, plutôt que uniquement électroacoustiques, qui diffèrent en fonction de la fréquence et de la vitesse du contraste dynamique
une diminution adéquate de la sensibilité pendant les pauses exécutives et dans les passages musicaux à faible intensité en dessous d'un certain seuil

Comme nous le verrons, l’intensité dynamique moyenne perçue est le critère d'évaluation le plus récent et le plus utile du intensité sonore d'un morceau, élément particulièrement utile dans le domaine de la maîtrise.

À gauche, on voit l'espace acoustique dynamique de l'orchestre, qui peut s'exprimer pleinement à condition que le bruit ambiant soit inférieur ou égal à 35 dB. À droite, une comparaison avec la dynamique utile d'un système d'enregistrement numérique 24 bits, égale à 144 dB, dont les “ maillons faibles ”, en termes de dynamique, sont les composants analogiques et les convertisseurs. En utilisant des équipements de très haute qualité et en prêtant attention à l'utilisation des niveaux, il est toutefois possible de garantir une dynamique utile équivalente à celle d'un grand orchestre symphonique (60 dB au maximum), même en enregistrant avec des pics maximaux très bas (jusqu'à -30 dB). Par conséquent, la pratique courante consistant à enregistrer avec des pics à -12 dB (voire -18 dB) respectera pleinement la dynamique “ extrême ” de cet effectif orchestral.

L'écoute

Avant de poursuivre, voici quelques exemples analytiques des situations d'écoute les plus courantes de nos jours :

concerts acoustiques ou amplifiés, au théâtre, avec une acoustique contrôlée et le silence dans la salle – plage dynamique jusqu'à 60 db (puissance d'émission de 40 à 100 db)
concerts amplifiés avec auditorium bruyant – plage dynamique d'environ 25 dB (puissance d'émission de 85 à 110 dB)
projections audiovisuelles – plage dynamique d'environ 20 db (puissances d'émission variables selon le lieu d'utilisation – exemples : de 35 à 60 dB dans des auditoriums très silencieux, comme dans un musée – de 75 à 95 dB dans des auditoriums moyennement silencieux où un certain impact sonore est requis, comme au cinéma – de 90 à 110 dB dans des auditoriums bruyants, comme par exemple lors de la projection publique d'un match de football lors d'une fête de quartier
musique pop écoutée à la maison avec des amis – plage dynamique de 15 dB – (puissance d'émission de 75 à 90 dB)
musique classique non symphonique écoutée seul chez soi – plage dynamique de 30 dB – (puissance d'émission de 50 à 80 dB)
musique dans un bar disco (volume d'écoute soutenu) – plage dynamique 10 db – (puissance d'émission de 90 à 100 db)
musique pour danser dans une discothèque moderne – plage dynamique 10 db – (puissance d'émission de 100 à 110 db, très fatigante pour l'oreille
musique en fond sonore – aucune plage dynamique utile, sauf par moments – car la lisibilité de la musique sera principalement perturbée par un bruit ambiant d'intensité variable

Représentation comparative entre les niveaux d'écoute et de bruit ambiant ; ce dernier devra être dominé afin de garantir une dynamique suffisamment large pour profiter pleinement du contenu sonore. Il convient de noter qu'une marge d'au moins 5 dB est recommandée pour une plus grande clarté des passages sonores les plus “ délicats ”. Il convient en revanche de noter la force du volume dans les discothèques et les bars-discothèques, avec des marges trop larges pour des contenus sonores à dynamique très compressée : une charge inutile sur les tympans à un volume très élevé. Enfin, évaluez la “ non-utilisabilité ” substantielle du son dans le domaine de la musique de fond, dont la gamme expressive sera souvent complètement incorporée dans le bruit de fond ambiant.

Comme on peut le constater, pour garantir la jouissance de l'ensemble du tissu musical, la dynamique devra être d'autant plus comprimée que le niveau de bruit ambiant sera élevé.

Pour la musique de fond, il ne sera pas possible d'obtenir une lisibilité claire, continue et correcte du contenu musical (sauf par courts instants).

Il existe également des cas (la musique dans les discothèques, par exemple) où l'on s'obstine à maintenir, par habitude bien ancrée, une musique fortement compressée à un niveau très élevé, créant ainsi des marges très importantes (jusqu'à 15-20 dB) par rapport au seuil de bruit de fond déterminé par le public (aussi bruyant soit-il), ce qui nous permettrait d'abaisser le niveau d'au moins 10-15 dB, pour le plus grand soulagement de nos oreilles.

Dynamique naturelle

Nous avons dit qu'une interprétation musicale s'exprime dans un dynamique expressive qui s'étend d'un niveau sonore minimal jusqu'au pic maximal produit dans les moments “ très forts ”.

La différence de volume exprimée en décibels (db) entre les deux extrêmes susmentionnés est définie comme “ l'amplitude dynamique ” du morceau ou simplement “ la dynamique ”.

Lors de l'enregistrement audio, l'exécution imprime une “ trace ” (magnétique ou numérique) sur un support.

Pour des raisons pratiques, dans un souci d'optimisation et de normalisation, on cherche toujours à faire coïncider le pic le plus élevé d'une exécution avec le point de containment dynamique maximal sans distorsion accordée par le support lui-même (dans notre cas, le fichier audio), en évitant de dépasser cette limite afin d'éviter la distorsion de l'onde sonore d'origine (c'est comme remplir un seau jusqu'au bord, sans en renverser une seule goutte).

Dans les systèmes numériques, on considère comme “ limite ” le point de clipping correspondant à un niveau de 0 dB sur l'échelle numérique (qui correspond à l'allumage de la dernière LED en haut, de couleur rouge).

Cette limite ne doit pas être dépassée, et il serait préférable qu'elle ne soit même pas atteinte, en réservant une marge de tolérance appropriée, qui devrait être comprise, selon les cas, entre 0,2 db et 2 db ; elle est généralement fixée à 1 db en streaming, tandis qu'elle est le plus souvent réglée à 0,3 db dans le mastering destiné à la production de CD.

Comme nous le verrons, une mesure précise du True Peak permettra de choisir la marge de tolérance la plus appropriée.

Comme nous l'avons vu, certaines exécutions acoustiques utilisent un espace dynamique même supérieur à 60 dB, ce qui peut être considéré comme environ 90 dB si l'on inclut les moments de silence absolu, qui font également partie de la portée expressive du morceau (il s'agit en fait d'utiliser toute la gamme dynamique offerte par un enregistreur analogique professionnel de la plus haute qualité, ou par un système numérique 16 bits, qui est la principale norme de finalisation commercialisation des fichiers audio musicaux).

Ce qui précède peut être remarqué, par exemple, dans certains morceaux interprétés par un grand orchestre symphonique : du solo de flûte dans le registre pianissimo aux accents fortissimo de l'orchestre tout entier, en passant par les pauses et les contractions exécutives d'un silence presque absolu.

Pour garantir une écoute capable de saisir toute la dynamique, il faudra utiliser un volume qui, dans les pics maximaux, dépasse d'au moins 60 dB le bruit de fond ambiant, afin de pouvoir percevoir les points pianissimo au moins un peu au-dessus du niveau du bruit ambiant.

Il est évident que cela ne sera possible que dans des environnements très silencieux, comme dans un théâtre pendant un concert, où le bruit de fond ne dépasse pas 35 dB, permettant une bonne audibilité même pendant les passages pianissimo (avec une pression acoustique de 40 dB) jusqu'aux passages fortissimo (100 dB).

Un concert avec une dynamique aussi large ne pourra donc pas être pleinement apprécié dans des environnements très bruyants (comme par exemple lors d'une “ fête de la bière ”) ; dans de tels environnements, pour pouvoir percevoir toute la gamme dynamique, il faudrait pousser le registre fortissimo bien au-delà du seuil de rupture des tympans de l'oreille.

Dynamique d'enregistrement

Il en résulte donc la nécessité pratique, dans la plupart des circonstances d'écoute, tant dans les exécutions amplifiées en direct que dans la reproduction de musique enregistrée, de réduire l'amplitude dynamique des reproductions sonores, jusqu'à des valeurs appropriées permettant une écoute suffisamment correcte de la musique dans les différentes circonstances d'écoute.

Avec un niveau de compression suffisamment “ poussé ”, il sera possible d'écouter la musique en détail même à des niveaux légèrement supérieurs au niveau de bruit ambiant, ce qui est utile pour :

éviter de déranger les voisins
Ne fatiguez pas et n'endommagez pas vos oreilles avec des pics sonores trop élevés lorsque vous écoutez dans des environnements bruyants.

Comme on peut s'y attendre, certains genres musicaux, pour une question de “ culture sonore ”, seront fortement pénalisés par les compressions importantes (par exemple la musique classique et les autres genres pouvant être qualifiés de “ puristes ”) ; d'autres, en revanche, pourraient même en tirer profit dans une certaine mesure (par exemple les genres rock-pop-dance).

Une compression excessive n'est toutefois pas avantageuse, même pour les genres musicaux les plus “ poussés ” (comme la musique dance), car elle aura tendance à :

transformer le signal audio utile en quelque chose qui s'apparente à du bruit blanc, dans une mesure plus ou moins grande, selon le degré de compression appliqué, ce qui est un phénomène plus perceptible sur les fréquences aiguës (qui ont tendance à devenir “ métalliques ”) ;
insérer dans le son des intermodulations de fréquence de plus en plus audibles qui interfèrent avec les harmoniques naturelles du son, créant ainsi des battements harmoniques supplémentaires qui salissent le son et diminuent la perception de l'harmonie musicale.

Pour éviter que le bruit de fond et d'autres troubles inhérents aux supports d'enregistrement (par exemple le fruscio des bandes analogiques), on a cherché :

de maintenir le pic maximal de l'enregistrement à un niveau aussi élevé que possible, mais inférieur au point de distorsion
De comprimer le “ espace dynamique utile ” dans une bande relativement étroite, capable de reproduire une gamme dynamique fonctionnelle pour différents types d'utilisation, mais suffisamment large pour reproduire dignement l'expressivité dynamique de la musique.

Au cours des années suivantes, en particulier dans le domaine de la pop, l'industrie de production a progressivement réduit l'espace dynamique, le comprimant de plus en plus afin d'augmenter le volume des moments les plus bas de la dynamique d'exécution, jusqu'à réduire à quelques décibels l'espace dynamique utilisé.

Comme nous le verrons, ce phénomène s'est considérablement accéléré avec l'avènement des supports numériques.

Au cours d'une vingtaine d'années (des années 90 aux années 10 du troisième millénaire), la nécessité de compresser la musique pour garantir une utilisation plus pratique s'est progressivement transformée en une course effrénée vers le Volume perceptible.

L'objectif, encouragé par les producteurs, était de surpasser “ en termes de volume sonore ” l'impact sonore des productions musicales concurrentes, ce qui a déclenché une véritable Guerre du volume, définie précisément “ La guerre du volume sonore ”.

Suite dans la 2e partie : https://alessandrofois.com/staging-a2/loudness-nel-mastering-parte-2/

Pour plus d'informations sur le mastering audio numérique

Manuel de masterisation audio numérique

0 réponses

Laisser un commentaire

Rejoindre la discussion?
N’hésitez pas à contribuer !