Déjà plus de
1 million
d'inscrits !
Le son, une information à coder
Déjà plus de
1 million
d'inscrits !
Introduction :
Depuis quelques années, on assiste à un développement des supports numériques. Les textes et images sont ainsi numérisés pour être disponibles sur Internet par exemple. Le son peut lui aussi être numérisé.
Comment procède-t-on pour transformer un signal analogique en un signal numérique ?
Pour répondre à cette question, nous allons d’abord voir en quoi consiste la numérisation, puis nous étudierons les paramètres influençant la qualité de la numérisation, et enfin nous nous intéresserons aux principes de compression d’un fichier numérique.
Les principes de la numérisation
Le son se traduit par un signal analogique.
Signal analogique :
Un signal analogique est un signal électrique continu au cours du temps.
Il est également continu en amplitude, ce qui signifie qu’il peut prendre toutes les valeurs possibles (entières ou décimales) entre un minimum et un maximum.
Le bit
L’enregistrement d’un son conduit donc à l’obtention d’un signal continu dans le temps : le signal analogique.
Pour devenir un signal numérique utilisable par un ordinateur, ce signal analogique doit subir une transformation par le biais d’un codage binaire.
Signal numérique binaire :
Un signal numérique est un signal non continu, qui varie de façon discrète au cours du temps.
On le qualifie de binaire, car il se compose d’une suite de et de , que l’on appelle des bits.
Le bit (BInary digiT) est le plus petit élément d’information qu’un ordinateur peut stocker.
Un bit ne peut prendre que deux valeurs, ou .
Le signal numérique est moins complexe que le signal analogique. Son codage lui permet d’être immédiatement lisible par un ordinateur qui peut le traiter ou le stocker.
Pour numériser un signal, il faut prélever des valeurs à intervalle régulier qui sont ensuite numérisées ; ces étapes constituent l’échantillonnage et la quantification.
Du continu au discret : l’échantillonnage
Le signal d’origine étant continu, il est composé d’une infinité de valeur.
Il est impossible de toutes les numériser, il faut donc choisir des valeurs à numériser : c’est ce que l’on appelle l’échantillonnage.
Le signal analogique est découpé régulièrement dans le temps.
On peut constater sur ce graphique que l’on est passé d’un signal continu à un signal discret (comportant un nombre limité de valeur).
La valeur attribuée à chaque échantillon : la quantification
La quantification est le fait d’attribuer une valeur numérique à chaque échantillon retenu.
Le signal numérique étant codé en binaire ( ou ), il existe un nombre limité de valeurs numériques pouvant être attribuées à un échantillon.
La quantité de valeurs numériques correspond à la quantité de nombres binaires possibles.
Par exemple, pour un signal analogique allant de à , si le codage se fait sur , il y a deux nombres binaires possibles ( et ) et donc il n’y aura que deux valeurs numériques possibles, le minimum () et le maximum ().
Si par contre le codage se fait sur , il y a quatre nombres binaires possibles (, , et ) et donc il y aura quatre valeurs numériques possibles (, , et ).
La quantité de nombres binaires possibles est appelée la résolution et est donnée par :
(avec )
Ainsi, pour numériser un signal analogique, on procède à sa discrétisation, c’est-à-dire qu’on l’échantillonne et qu’on le quantifie.
Maintenant que nous avons vu le principe de numérisation, nous allons pouvoir nous intéresser aux paramètres influençant la qualité de cette numérisation.
Le choix des paramètres de numérisation
Comme nous l’avons vu, lors de la numérisation, on passe d’un signal continu à un signal discret.
Il est donc important de bien choisir les paramètres de numérisation de façon à obtenir une numérisation de qualité.
La fréquence d’échantillonnage
La qualité d’une numérisation passe par le nombre d’échantillons retenu.
Plus le nombre d’échantillons est élevé, plus la numérisation est fidèle au signal d’origine.
Ce nombre d’échantillons est déterminé grâce à la fréquence d’échantillonnage.
Si la fréquence d’échantillonnage est trop basse, alors le nombre de valeur retenu peut conduire à l’obtention d’un signal très différent du signal d’origine.
On pourrait alors se dire qu’il faut prendre une très grande fréquence d’échantillonnage pour avoir une très bonne qualité de numérisation, mais l’inconvénient sera alors la taille du fichier numérique.
En effet, plus le nombre d’échantillons est grand, plus le nombre de données numériques sera important, plus le fichier sera lourd.
Il faut alors trouver un compromis entre la précision de la transcription du son d’origine et la taille maximale souhaitée pour le fichier numérique.
Une fois les échantillons retenus, il faut leur attribuer une valeur.
La finesse de quantification
Lors de la quantification, chaque échantillon se voit attribuer une valeur particulière (la plus proche possible) parmi un nombre limité de valeur possible.
Plus le nombre de valeurs possibles est grand, plus la valeur attribuée à un échantillon est proche de sa « vraie » valeur et plus le son numérique est fidèle au son analogique.
Nombre de bits | ||||||
Nombre de possibilités |
De nouveau, l’inconvénient de l’augmentation du nombre de bits pour le codage est l’augmentation de la taille du fichier numérique obtenu.
Taille d’un fichier et compression
L’enjeu de la numérisation d’un signal analogique est de préserver la qualité du signal tout en limitant la taille du fichier numérique.
Estimation de la taille d’un fichier audio numérique
La taille d’un fichier audio numérique dépend de plusieurs facteurs :
On sait que l’oreille humaine est sensible à des fréquences comprises entre et . Comme la fréquence d’échantillonnage doit être le double de la fréquence du signal à échantillonner, on va donc prendre une fréquence d’échantillonnage d’au moins . La fréquence utilisée est en fait souvent de .
La plus répandue pour la numérisation audio est celle liée à un codage en .
En effet le format stéréo comportant deux pistes différentes (une pour chaque enceinte), il y a alors deux fois plus d’informations à stocker.
La taille d’un fichier numérique s’obtient de la manière suivante :
(format stéréo)
Soit
C’est-à-dire
Comme correspond à , on obtient .
Pour une chanson de , on a alors un fichier de :
, soit .
Pour pouvoir stocker davantage de musique sur des supports numériques, mais surtout pour la transmettre plus facilement, il faut diminuer la taille du fichier, d’où le recours à la compression.
La compression audio
La compression audio consiste à réduire la taille d’un fichier audio dans le but de faciliter son stockage et sa diffusion.
Le processus de compression le plus fréquent est celui dit « avec perte de donnée ». Cela signifie que l’on enlève délibérément une partie de l’information pour alléger le fichier.
Pour choisir les parties à enlever, on se base sur deux procédés :
Ces deux procédés peuvent être utilisés séparément ou de façon simultanée.
Le premier permet une restitution très fidèle du son, mais le taux de compression est faible.
Le second néglige davantage d’informations, mais avec un taux de compression bien plus élevé.
À titre d’exemple, un fichier compressé au format MP3 dont la qualité sonore est bonne possède un débit de , en comparaison avec les du fichier non compressé (soit un taux de compression de l’ordre de 10 à 12 fois).
Conclusion :
Tous les sons enregistrés correspondent à des signaux analogiques, mais les besoins de stockage et de diffusion nous ont conduit à procéder à leur numérisation.
Pour cela, il a fallu maîtriser le codage binaire puis avoir des ordinateurs suffisamment puissants pour procéder à un échantillonnage et à une quantification des échantillons à une grande fréquence.
Enfin, des algorithmes ont été conçus pour permettre la compression d’un signal audio tout en conservant une bonne qualité sonore.
Tous ces défis ont été relevés durant la seconde moitié du XXe siècle et ont permis notamment le développement du streaming audio.