La fréquence d’échantillonnage
Pour transformer un son dit analogique en numérique, nous utilisons un processus appelé : échantillonnage. L’échantillonnage se produit dans un convertisseur (ou une carte son). Le principe est de prendre des instantanés réguliers, qui sont les mesures de la tension du signal analogique et de les transformer en données numériques dont le langage sont des nombres (numéros).
Voici un schéma représentant les échantillons inclus dans l’amplitude d’une onde sonore. Le nombre d’échantillons dans cette onde défini le taux d’échantillonnage ou la fréquence d’échantillonnage.
La fréquence d’échantillonnage s’exprime en Hertz (Hz) ou (kHz). On retrouve communément les valeurs suivantes : 44 100 Hz, 48 000 Hz, 96 000 Hz, 192 000 Hz. Le standard CD et digital mondial est de 44 100 Hz. Ce qui veut dire que pour chaque seconde, il y a 44 100 échantillons (samples) joués. Plus la fréquence d’échantillonnage (nombre d’« instantanés » du son pris à chaque seconde) est élevée, plus l’analyse et l’encodage de la musique en données numériques seront précis. La fréquence d’échantillonnage affecte la plage de fréquence audio de la valeur tonale la plus basse à la plus élevée, pouvant être stockée.
L’encodage à 16 bits / 44,1 kHz, constituait la meilleure qualité disponible au lancement du CD au début des années 1980, mais les choses ont évolué, et nous sommes désormais capables d’enregistrer et de distribuer de la musique à des niveaux de profondeur de bit et de taux d’échantillonnage supérieurs. Ces formats sont utilisés lors des enregistrements en studio et pour le mastering depuis de nombreuses années.
L’audio haute résolution (HRA) correspond à tout format d’enregistrement supérieur à la norme 16 bits / 44,1 kHz du CD, et les enregistrements HRA recourent généralement à un encodage 24 bits, offrant une plage dynamique plus importante que le CD et des taux d’échantillonnage pouvant atteindre 192 kHz. Ce qui constitue le summum des enregistrements HRA commerciaux. Il s’agit avant tout de vous rapprocher au mieux du son entendu en studio.
Quelles fréquences d’échantillonnage choisir ?
Pour capturer les plus petits détails dans les hautes fréquences, nous devons prélever des échantillons plus souvent. La façon dont cela fonctionne est qu’un taux d’échantillonnage donné peut enregistrer avec précision des fréquences audio jusqu’à un peu moins de la moitié de sa valeur. Par exemple, un taux d’échantillonnage de 48 Khz peut enregistrer avec précision des fréquences audio jusqu’à un peu moins de 24 Khz. Cette limite de la moitié du taux d’échantillonnage s’appelle la fréquence de Nyquist, et elle est nommée d’après l’un des ingénieurs qui a développé le calcul derrière le principe de l’échantillonnage.
L’oreille humaine peut en général entendre sur le spectre suivant : 20 Hz – 20 000 Hz. Comme on vient de le voir, pour qu’il n’y ait pas de perte flagrante, la fréquence d’échantillonnage doit être au moins deux fois plus élevée que la fréquence maximale contenue dans le son à numériser. Il faut que la fréquence d’échantillonnage soit d’au moins 40000 Hz pour avoir un résultat correct à nos oreilles.
C’est pourquoi la résolution de 44 100 Hz est la plus utilisé car elle permet de couvrir le spectre jusqu’à 22 050 Hz. Nous bénéficions même d’une petite marge car nous aurions pu arrondir à 40000 Hz mais cela veut dire aussi que si vous exportez votre musique avec une fréquence d’échantillonnage supérieure à 44 100 Hz, votre oreille sera incapable d’entendre la différence.
Les filtres anti aliasing
La première chose qu’un convertisseur analogique-numérique fait à l’audio analogique avant l’échantillonnage est de filtrer toutes les fréquences au-dessus de la limite de Nyquist pour la fréquence d’échantillonnage souhaitée. Si elles ne sont pas filtrées, toutes les fréquences supérieures à Nyquist seront réinjectées dans l’échantillonnage. C’est ce qu’on appelle un effet d’aliasing.
Heureusement, presque tous les convertisseurs du marché ont aujourd’hui mis en place des filtres anti-aliasing de haute qualité. De ce fait, aucun effet indésirable d’aliasing ne se produira et toutes les fréquences inférieures à Nyquist seront enregistrées avec précision. Dans la plupart des cas, tant que vous utilisez un convertisseur de bonne qualité et un taux d’échantillonnage d’au moins 44,1 Khz, vous pouvez enregistrer proprement toutes les fréquences inclus dans la plage de l’audition humaine. Maintenant, comme le convertisseur analogique-numérique mesure chaque échantillon, il doit assigner un nombre à cet échantillon puisque c’est ce qui le rend numérique par opposition à l’analogique.
Et les cartes son allant jusqu’à 192 000 Hz ?
Il y a deux intérêt à travailler à une fréquence très élevés :
- La première est que les pilotes de votre carte son (surtout les convertisseurs professionnel) seront optimisés pour une fréquence d’échantillonnage donnée. En général, les pilotes ASIO de vos convertisseurs sont optimisés pour la fréquence d’échantillonnage maximum qu’elle propose : 96 000 Hz et 192 000 Hz dans la majorité des cas. Ca peut être surprenant, mais vous aurez moins de latence et plus de soulagement pour le micro-processeur avec une fréquence d’échantillonnage plus grande.
- La deuxième raison, ce sont les plugins et les banques sons (samples) utilisés. En effet, certains plug-in sont aussi optimisés pour une fréquence bien précise. Mais ça n’a que très peu de répercussions sur la qualité de votre son au final.
La quantification
Comme vous le savez probablement, les ordinateurs utilisent des nombres binaires, un langage de zéros et de uns. Ainsi, une mesure d’échantillon audio numérique est enregistrée comme une chaîne de nombres binaires. Et tout comme les nombres normaux peuvent être rendus plus précis en ajoutant des chiffres après la virgule, les nombres binaires peuvent être rendus plus précis en utilisant une résolution plus élevée soit plus de bits ou de chiffres binaires.
Le nombre de bits utilisés pour enregistrer une mesure d’échantillon est appelé la profondeur de bits. Une plus grande profondeur de bits divise la gamme des amplitudes possibles en morceaux de plus en plus petits, respectant avec plus de précisions les variations d’amplitude. Plus la valeur de quantification est élevée, plus la mesure est fidèle au signal original. En augmentant la valeur de quantification, on augmente la précision de la mesure et donc la fidélité de l’enregistrement. On augmente aussi la taille des fichiers générés qui contiennent plus de données.
Les profondeurs de bits les plus courantes sont 16 bits et 24 bits. L’audio 16 bits est la norme pour les CD, et il divise la plage d’amplitude en 65 536 niveaux de quantification possibles. L’audio 24 bits est la norme pour l’enregistrement et divers formats haute définition, et il divise la plage d’amplitude en 16 777 216 niveaux de quantification possibles, et cela fait beaucoup de niveaux.
Conclusion
L’audio analogique est converti en numérique en utilisant un échantillonnage à une fréquence d’échantillonnage spécifique. Et avant que les échantillons ne soient prélevés, l’audio passe par un filtre anti-aliasing pour supprimer toutes les fréquences au-dessus de la limite de Nyquist ou la moitié de la fréquence d’échantillonnage, ce qui pourrait potentiellement provoquer des effets indésirables. Ensuite, chaque échantillon est quantifié en un nombre dont la précision est déterminée par la profondeur de bit. C’est le processus fondamental pour créer de l’audio numérique, et tout ceci se répète des milliers et des milliers de fois chaque seconde.
Bonjour, pour une application telle que tiktok, pouvons-nous identifier un type d’échantillonnage et de quantification pour les données d’images ou de son standard ?
Bien d accord avec toi Dominique BF réduire le Jitter !!
Bonjour,
Désolé pour ma réponse tardive !
Les conversions de fréquence d’échantillonnage ne posent pas vraiment de problèmes si on va dans le sens de la réduction.
Encore faut il un logiciel qui permet de le faire proprement évidement.
On peut faire l’analogie avec la photo numérique par exemple avec les pixels, c’est un peu le même principe.
Pour l’amplitude, c’est un peu différent car pour faire les choses bien, on utilise un dither, c’est à dire que l’on va remplacer les informations supprimés par du bruit pour un rendu plus naturel.
Si tu convertis du 16 en 32, normalement il ne devrait pas y avoir d’impact sur le son mais ton fichier sera toujours encodé sur une échelle de 16 bits…
Bonjour, je voulais savoir ce qui se passait si lors d’une session, je modifie le taux d’échantillonnage par exemple de 96 kHz à 44,1 kHz ? Et aussi, que se passe-t-il si je modifie le bit depth de 16 bits à 32 bits?
Merci d’avance de ta réponse et de toutes les connaissances dont tu nous fait part !
Tant mieux si ça a pu t’aider !
Merci beaucoup pour cet article, cela m’a beaucoup aidé pour mon TPE 😉
Il y a quelque chose que je ne saisi pas dans la réponse de Mr blanc francard …. le jitter est , si j’ai bien saisi, la fluctuation non désiré (et aléatoire ?) de l’horloge d’un convertisseur . Comment une fréquence d’échantillonnage plus élévée peut avoir une influence sur le jitter ? …??
Exactement ! Merci Dominique pour cette réponse !
On peut comparer ça à la photo ou la vidéo où plus on a de pixels (donc d’informations) au départ et plus on a de la précision et moins d’erreur lors de réduction final, c’est un peu le même principe
Si je peux me permettre…Vu qu’il y a de moins en moins de CD , j’opterais, ce que nous faisons depuis des années maintenant, pour du 24-96, qui est un format parfait pour la vidéo qui est en 48k et parfait aussi pour les tuyaux et la HD. Il suffit de convertir en 44.1 uniquement pour le CD et ça ira très bien;-) L’avantage de ces fréquences élevées n’est pas tant d’avoir une bande passante plus étendue, mais surtout de bénéficier d’un jitter bien moins important, ce qui a vraiment une incidence sur l’écoute perceptible par tout le monde ( précision du son) My five cents…
Chris Rec en effet
Au point ou t en es je sommerais tout ds le toutools si j etais toi en attendant d acheter une console bien sur!
Chris Rec passe en aes !
A une époque on pouvait se poser la question par rapport aux ressources machines qui pouvait parfois faire défaut sur des résolutions élevées, mais de nos jours c’est moins problématique. A noter que certaines cartes son peuvent réduire le nombre d’I/O sur des taux élevées donc à prendre à compte pour une session de record. Mis à part ça, il n’y a pas vraiment de règle en la matière, certain préférerons enregistrer en 44.1 pour entendre un son « définitif » alors que d’autres vont échantillonner plus haut par rapport à un style de musique qui peut avoir besoin d’une grande définition dans le haut du spectre…
Mais du coup Nicolas, on choisi quoi pour un enregistrement/mixage (pour un home studio par exemple) 48khz/24bit ou 88,2khz/24bit ou 96khz/24bit ? (je dirais 88,2khz/24bit pour redescendre en 44,1khz/16bit en fin?)
Bonjour
Désole pour ma réponse tardive !
Le choix de la résolution d’enregistrement peut dépendre de ses besoins et des performances des machines, mais pour l’enregistrement d’une voix seul, on peut très bien utiliser une résolution maximale bien que ce soit plus que nécessaire pour avoir un son correct. Beaucoup d’ingénieur du son se contente du 24/44.1khz car au delà il est difficile d’entendre une réel différence…
Le mieux est de faire quelques tests pour voir ce qui fonctionne le mieux en terme de son et de perfomance
Bonjour, j’aurai une question tout simple à vous posez..
voilà, j’enregistre ma voix pour faire des musiques (rap).. je viens d’acheter un micro et une AudioBox PreSonus pour avoir une meilleure qualité de ma voix sur l’enregistrement.. ma question est la suivante, à combien de kHz et de bit me conseilleriez vous de mettre ? Je peux aller jusqu’à 96kHz et 32 bit nombre à virgule flottante ..
En espérant que vous puissiez m’aider, merci d’avance.
Il y a plein de politique différente sur le choix de la fréquence d’échantillonnage, certains préféreront utiliser du 44.1 pour entendre directement ce qui est enregistré sans conversion. Beaucoup diront que la différence est presque inaudible, je pense qu’il font choisir en fonction des informations qui seront enregistré notamment si le signal contient beaucoup d’information dans les aigus. C’est ce genre de fréquence qui est délicate au niveau de la conversion.
Dans le doute, il est vrai que si les convertisseurs et les ressources machines le permettent, travailler en haute résolution ne peut être que bénéfique
OK pour ma part, Je travail toujours en 48/24bits. je pense réellement que le son traité avant export en 44100/16 est de meilleur résolution (format CD). j’aimerais plutôt travailler en 88200 mais je sais qu’il existe des cartes son qui possède ce type de réglage. Je pense que dans ce cas la division d’export est beaucoup mieux réussi. Ai je tord ou raison ?!
Cordialement,
Guillaume
Bonjour Philippe
En fait j’ai déjà écrit quelques articles sur le sujet, et en terme de qualité l’intérêt est vraiment minime…
Je te laisse jeter un œil ici : https://deveniringeson.com/frequence-echantillonnage/ et là : https://deveniringeson.com/dynamique-et-profondeur-de-bits/
Je pense que cela pourra répondre à ta question 😉
Bonjour,
J’ai enregistré un trio de Jazz avec une console Qu24 Allen & Heath en 32 Bits 48 kHz. Je réaliserai le mixage sous Cubase avec une carte Roland UA-55 QUAD CAPTURE qui me permet un traitement en 192 kHz. Semble-t-il judicieux de sur-échantillonner mon projet en 32 Bits 192 kHz. Cette technique peut-elle me permettre d’améliorer la qualité finale (dynamique, efficacité des traitements, …) ?
Merci d’avance pour la réponse, musicalement.
Très honnêtement entendre la différence à l’oreille nu est très compliqué.
Beaucoup d’ingénieur du son travaille directement en résolution CD à 44.1 pour ne pas avoir à convertir les fichiers et entendre directement le son définitif.
L’intérêt de travailler en haute résolution peut être intéressant si il y a beaucoup d’informations dans le haut du spectre, mais aussi pour soulager les ressources machines qui sont moins sollicitées en HR.
J’ai une question très simple, si j’enregistre en 192/24b et que j’exporte e 192/24b, aurais-je une meilleure qualité audible, vais je avoir une meilleur résolution avec plus de détail ecetera que si j’enregistre en 48khz/24b et que j’exporte en 44.1/16b?
Ou j’aurais aucune différence si ce n’est le poid du fichier?
Cordialement.
Bonjour, entre la qualité 16/44.1 et les hautes résolutions il peut y avoir beaucoup de différences. Mais si tu écoute un cd, qui est donc échantillonné en 16/44.1, et que tu l’échantillonne en 48 kHz ou plus, tu ne pourras en revanche augmenter sa qualité. Tu peux la diminuer, mais partir d’un échantillonnage est vouloir l’augmenter, cela ne sert à rien… Au sujet de Deezer il propose un taux d’échantillonnage de 320 kbit/s il me semble…
Au sujet des bluray, on peut trouver des bluray musicaux en haute résolution, quant aux film, ils sont échantillonné à 48 kHz.
Bonjour à tous, je ne sais pas quel échantillonnage choisir pour écouter de la musique (CD et Deezer) et bluray sachant que j’utilise un lecteur bluray qui me propose 48KHz, 96KHz ou 192 KHz . Y a t-il une réelle différence à l’écoute ?
Merci.
Il faut trouver un son qui dépasse les 144db de dynamique, c’est quand même pas évident 😉 la résolution comme l’échantillonnage est quasiment impossible à différencier dans des valeurs très élevées
Un jour il faudra que je tente le test « à l’aveugle » pour voir (lol…) si j’entends réellement une difference entre le 16 et le 32 bits …