On le sait tous, l'enceinte parfaite n'existe pas, et pourtant si en quelque sorte, mais nous verrons par la suite pourquoi nous ne pouvons en apprécier pleinement les avantages...
Mais alors comment savoir si notre enceinte est parfaite ? du moins d'un point de vue scientifique, puisque d'un point de vue ressenti, nous avons tous des oreilles différentes et donc forcement, des goûts différents.
Avant de pouvoir en décider, je pense qu'il serait intéressant de se pencher sur la question afin de savoir comment on mesure une enceinte. Afin de pouvoir comprendre comment elle fonctionne et ce qui fait qu'on les aimes tant (ou pas).
Ce sont précisément leurs imperfections qui caractérise leurs sons, qui pourrait s'interpréter comme le "facteur émotionnel".
Les différents types de mesures
Fréquence glissante
Il s’agit de la plus ancienne méthode de mesure utilisée en électroacoustique. Celle-ci utilise une fréquence pure sinusoïdale qui glisse régulièrement de 20 Hz à 20 000 Hz. On peut en tirer principalement la courbe de réponse « niveau en dB / fréquence », mais n’est utilisable que dans un milieu anéchoïque (chambre sourde). Le champ d’application est donc très limité et rarement significatif du résultat perçu in situ (milieu semi réverbérant).
Il est à noter que cette mesure peut permettre de mettre en évidence certaines résonances parasites d’une enceinte et d’en isoler les fréquences problématiques.
Bruit rose
Le bruit rose est utilisé classiquement depuis les années 70 et représente une bonne approche de l’équilibre tonale globale perçue, à condition qu’il n’y ait pas d’autres problèmes (type temporel ou distorsion).
On peut obtenir une analyse « niveau en dB / fréquence » par octave ou 1/3 d’octave, ceci en temps réel.
Le bruit rose ne permet absolument pas de rendre compte des phénomènes d’effet de fusion (abordé ultérieurement) et donc peut ne pas être en corrélation avec notre sensation auditive dans le cas de présence de premières réflexions importantes dû aux objets proche (sur la console ou sur les écrans de contrôle, par exemple).
MLS, CHIRP, TDS
Ces trois types de mesures sont assez proches et utilisent des calculs par FFT (Fast Fourier Transform ou transformée de Fourrier) permettant d'accéder au domaine temporel en plus du domaine fréquentiel. Cette méthode permet de visualiser la réponse impulsionnelle qui est en quelque sorte la signature de l'enceinte, mais aussi celle de la salle d'écoute.
Cependant, celle ci est très difficilement interprétable directement par un néophyte. Et particulièrement parce qu'elle ne donne aucune indication visuelle sur la réponse dans le grave de l'enceinte. Seule une analyse par traitement mathématique permet d'en tirer toute sa pertinence au point d'écoute considéré.
La mesure TDS (Time Delay Spectrometry) génère dans sa version originale, un sweep (balayage sinusoïdal glissant linéaire de 20 kHz à 20 Hz) tandis que le CHIRP (mot anglais signifiant « gazouillis ») utilise un balayage particulier, linéaire ou logarithmique (de 20 Hz à 20 kHz).
Ces deux mesures sont donc effectuées dans le domaine fréquentiel et nécessite le calage précis (en général, automatique) d’une porte temporelle liée au chemin acoustique que l’on veut observer. Celle-ci permet une analyse « niveau en dB / fréquence » en 1/3 d’octave ou en bande étroite, mais aussi une analyse « retard / fréquence ».
À partir de là, on peut reconstituer par calcul FFT la réponse impulsionnelle « pression / temps » et l’échogramme «niveau en dB / temps».
Ce type d’analyse est bien adapté à la mesure acoustique d’un local associé à une source sonore et permet d’évaluer l’équilibre spectral, la définition en timbre et en transparence et bien entendu les critères de réverbération.
La méthode MLS (Maximum Length Sequence) mesure la réponse impulsionnelle du système (enceinte + salle) et génère un "dirac" (impulsion infiniment courte) modifié temporellement et ressemblant à un pseudo-bruit blanc ou rose. Cette analyse, courante depuis les années 90 permet une analyse très complète de la source sonore seule, du local seul ou de l’ensemble.
Cette mesure est très puissante pour autant que l’on reste dans le domaine linéaire (sans distorsion), ce qui représente la limite de corrélation entre le résultat visuel et notre audition.
Celle-ci permet de mesurer la courbe de réponse « niveau en dB / fréquence » avec toutes les résolutions nécessaires, le retard relatif entre les fréquences, appelé temps de propagation de groupe « retard / fréquence », le waterfall « niveau en dB / temps / fréquence » qui est une représentation 3D de la rapidité d'écoulement de l’énergie au point de mesure.
Une analyse en ondelettes (wavelet) « niveau en dB / temps / fréquence », en représentation 2D peut être possible à partir de la mesure MLS ; elle est visuellement très proche de notre audition en ce qui concerne notre sensibilité aux ni- veaux faibles, sons masqués, traînages, etc.
Pour exemple, on peut visualiser des défauts de diffractions du bafflage de l’enceinte, de résonances de haut-parleur ou encore identifier des ondes stationnaires de la salle, même si celles-ci sont de niveaux très faibles (-60 dB et plus) en dessous du signal initial, ces défauts pouvant être parfaitement audibles à l’oreille.
Ce type d’analyse très complet, permet dévaluer l’influence du système sur la construction (largeur, profondeur et relief), l’équilibre tonal et dynamique, la définition en timbre et en transparence ainsi que les critères de réverbération, liés au lieu d’écoute.
Seule la stabilité n’est pas évaluable par cette analyse, sauf en faisant plusieurs points de mesures pour des positions d'écoute proches et à l’aide d’une analyse en ondelettes.
Et la phase dans tout ça ?
Cette courbe est liée au temps de propagation de groupe, mais reste très abstraite et difficile à interpréter visuellement car ne correspondant pas à notre perception, plus directement sensible au retard.
En effet, tout ingénieur du son connaît l’effet de ‘phasing’ qui modifie en fait l’ordre temporel entre les fréquences en introduisant un angle de phase constant.
Ce qui est plus intéressant est ‘l’opposition de phase’ que nous devrions plutôt nommer ‘inversion de polarité’.
Aussi, il est tout à fait normal que la courbe de phase ne soit pas plate, ce qui signifierait que le signal sort de l’enceinte en même temps qu’il rentre (retard nul) ...ce qui est impossible !
Par conséquent, ce qui est significatif est la régularité de la courbe de phase (sans accident ou rupture dans la courbe).
Mesure du retard dynamique d'une enceinte lié au "facteur émotionnel"
Les mesures classiques :
Cette mesure visuelle récente est complémentaire à la mesure MLS et permet l’évaluation du régime dynamique réel de l’enceinte.
Depuis fort longtemps, nous sommes habitués à considérer que les mesures classiques effectuées sur les enceintes acoustiques ne correspondent que peu notre réalité auditive perçue. En effet, les mesures en fréquences glissantes sinusoïdales ou en bruit rose, usitées dans les années 70 et 80 ne reflétaient pas du tout notre impression auditive et ceci pour une raison principale : la mesure amplitude/fréquence ne fait pas apparaître le rapport temporel entre les fréquences, facteur déterminant du timbre d’une source sonore.
Ainsi, dans les années 90, une nouvelle approche fut d’effectuer des mesures en utilisant la réponse impulsionnelle, via des algorithmes du type MLS et permit enfin de visualiser la courbe retard/fréquence. On put aussi s’affranchir de la salle d’écoute en sélectionnant une fenêtre temporelle correspondant au son direct seul et indépendant de son environnement.
Un grand pas était franchi et ce type de mesures devint le standard des années 2000 jusqu’à nos jours.
Les courbes ci-dessous illustrent ces mesures.
Même si ces mesures correspondent mieux à notre audition, entre autre en donnant de précieuses indications sur la rapidité d’écoulement de l’énergie nécessaire au travail du mixage, deux enceintes ayant des réponses impulsionnelles très voisines, ne donnent encore pas un ressenti identique quant à l’équilibre dynamique et à l’émotion réellement ressentie.
Par exemple, sur une note de piano, une enceinte est comme aseptisée tandis que l’autre enceinte traduit une vivacité et une émotion proche de l’impression naturelle.
À l’inverse, des enceintes de cinéma projettent l’attaque de ce piano avec une certaine intelligibilité et agressivité propre à ce type de diffusion !
La transformée de Fourrier et ses limites :
La base du modèle mathématique utilisé pour mesurer la réponse impulsionnelle est la transformée de Fourrier issue des fameuses séries de Fourrier. Or savez-vous pour quelles raisons Fourrier inventât son modèle mathématique ?…
Tout simplement pour prédire la propagation de la chaleur et modéliser l’évolution de la température grâce à l’utilisation de séries trigonométriques. Plus tard, une des applications de ce modèle fut de construire un appareil mécanique permettant de calculer le cycle des marées en fonction de la rotation de la terre, de la lune et des autres planètes.
Nous appliquons donc un modèle validé pour des phénomènes sinusoïdaux dont la période va de quelques heures à quelques jours, à des sons de périodes de l’ordre de la milliseconde ! En plus de cela, le signal utilisé reste un bruit blanc ou rose (ou un sweep sinusoïdal) ne sollicitant pas du tout l’enceinte comme un son naturel réel le ferait.
Les rapports temporels entre les fréquences ne sont pas les retard instantanés mais les ‘temps de propagation de groupe’ (Tg) significatifs du retard en régime harmonique et non dynamique.
Ainsi, pour les sons transitoires (attaques) on se trouve en dehors du domaine de validité du modèle et on ne mesure pas les non-linéarités du système mesuré, ce qui peut expliquer en grande partie le décalage entre ces mesures et l’émotion ressentie.
La mise en évidence du ‘facteur émotionnel’ via le retard dynamique :
Par ‘facteur émotionnel’, j’entends l’aspect plus ou moins aseptisé ou naturel du son, lié à l’équilibre dynamique perçu.
Pour mettre en lumière ce phénomène, il faut recourir à des signaux plus proches des sons naturels et comme des ‘burst’ très courts. Celui-ci est un signal sinusoïdal court limité à une période et de fréquence déterminée.
Voici un test effectué sur plusieurs enceintes de réponse impulsionnelle très comparable. Ainsi, nous pouvons constater qu’un ‘burst’ à 16000 Hz sur certaines enceintes réputées neutres mais ‘ternes’, était décalé légèrement (de 0,10 à 0.30 ms) par rapport à son homologue à 4000 Hz.
Sur les enceintes Zéphyr de la marque Prosodia récemment conçues, ce décalage n’était que de 0.05 ms !… Ce qui peut expliquer son coté musical, très apprécié des mélomanes et musiciens.
Les illustrations ci-après parlent d’elles-mêmes. Ces mesures ont été effectuées sur 3 enceintes réputées pour leur neutralité et sur les Zéphyr.
Les réponses impulsionnelles des enceintes A, B, C et des Zéphyr ainsi que les mesures qui en découlent sont très proches les unes des autres et en particulier, les retards de groupe (régime harmonique) sont quasi constant entre 200 Hz et 20000 Hz.
Les mesures comparées entre les enceintes A, B, C et les Zéphyr montrent des courbes remarquablement similaires en ce qui concerne les courbes de réponse et les temps de propagation de groupe mesurés par la méthode MLS.-