Le son, une information à coder

information-icon

Le bac de français 2024 arrive à grand pas ! Pas de stress, on a pensé à toi avec la liste des oeuvres ou bien un plan de révision pour les épreuves anticipées de 1ere 💪

Introduction :

Depuis quelques années, on assiste à un développement des supports numériques. Les textes et images sont ainsi numérisés pour être disponibles sur Internet par exemple. Le son peut lui aussi être numérisé.
Comment procède-t-on pour transformer un signal analogique en un signal numérique ?

Pour répondre à cette question, nous allons d’abord voir en quoi consiste la numérisation, puis nous étudierons les paramètres influençant la qualité de la numérisation, et enfin nous nous intéresserons aux principes de compression d’un fichier numérique.

Les principes de la numérisation

Le son se traduit par un signal analogique.

bannière definition

Définition

Signal analogique : 

Un signal analogique est un signal électrique continu au cours du temps.
Il est également continu en amplitude, ce qui signifie qu’il peut prendre toutes les valeurs possibles (entières ou décimales) entre un minimum et un maximum.

signal numérique

Le bit

L’enregistrement d’un son conduit donc à l’obtention d’un signal continu dans le temps : le signal analogique.
Pour devenir un signal numérique utilisable par un ordinateur, ce signal analogique doit subir une transformation par le biais d’un codage binaire.

bannière definition

Définition

Signal numérique binaire :

Un signal numérique est un signal non continu, qui varie de façon discrète au cours du temps.
On le qualifie de binaire, car il se compose d’une suite de $0$ et de $1$, que l’on appelle des bits.

signal numérique bit

bannière à retenir

À retenir

Le bit (BInary digiT) est le plus petit élément d’information qu’un ordinateur peut stocker.
Un bit ne peut prendre que deux valeurs, $0$ ou $1$.

Le signal numérique est moins complexe que le signal analogique. Son codage lui permet d’être immédiatement lisible par un ordinateur qui peut le traiter ou le stocker.

  • La numérisation est donc l’opération consistant à transformer un signal analogique en une suite de bits.

Pour numériser un signal, il faut prélever des valeurs à intervalle régulier qui sont ensuite numérisées ; ces étapes constituent l’échantillonnage et la quantification.

Du continu au discret : l’échantillonnage

Le signal d’origine étant continu, il est composé d’une infinité de valeur.
Il est impossible de toutes les numériser, il faut donc choisir des valeurs à numériser : c’est ce que l’on appelle l’échantillonnage.

Le signal analogique est découpé régulièrement dans le temps.

  • La durée séparant deux valeurs qui seront numérisées constitue la durée d’échantillonnage $T_e$.
  • Le nombre de mesures réalisées par seconde constitue la fréquence d’échantillonnage $f_e$.
    On utilise souvent la fréquence d’échantillonnage $f_e=\dfrac{1}{T_e}$.

échantillonnage numérique son

On peut constater sur ce graphique que l’on est passé d’un signal continu à un signal discret (comportant un nombre limité de valeur).

  • Plus la durée d’échantillonnage est petite, plus le nombre de valeur numérisé est grand.

La valeur attribuée à chaque échantillon : la quantification

La quantification est le fait d’attribuer une valeur numérique à chaque échantillon retenu.

bannière attention

Attention

Le signal numérique étant codé en binaire ($0$ ou $1$), il existe un nombre limité de valeurs numériques pouvant être attribuées à un échantillon.

La quantité de valeurs numériques correspond à la quantité de nombres binaires possibles.

Par exemple, pour un signal analogique allant de $0\,\text{volt}$ à $9\,\text{volts}$, si le codage se fait sur $1\,\text{bit}$, il y a deux nombres binaires possibles ( $0$ et $1$) et donc il n’y aura que deux valeurs numériques possibles, le minimum ($0\,\text{volt}$) et le maximum ($9\,\text{volts}$).
Si par contre le codage se fait sur $2\,\text{bits}$, il y a quatre nombres binaires possibles ($00$, $01$, $10$ et $11$) et donc il y aura quatre valeurs numériques possibles ($0\,\text{volt}$, $3\,\text{volts}$, $6\,\text{volts}$ et $9\,\text{volts}$).

échantillonage numérisation son bits

  • Lors de la quantification, la valeur de chaque échantillon est arrondie à la valeur la plus proche parmi les valeurs possibles.

La quantité de nombres binaires possibles est appelée la résolution $R$ et est donnée par :

$R = 2^n$ (avec $n=\text{nombre de bits utilisés pour le codage}$)

bannière à retenir

À retenir

Ainsi, pour numériser un signal analogique, on procède à sa discrétisation, c’est-à-dire qu’on l’échantillonne et qu’on le quantifie.

Maintenant que nous avons vu le principe de numérisation, nous allons pouvoir nous intéresser aux paramètres influençant la qualité de cette numérisation.

Le choix des paramètres de numérisation

Comme nous l’avons vu, lors de la numérisation, on passe d’un signal continu à un signal discret.

  • Il y a donc une « perte d’information » au cours du processus de numérisation.

Il est donc important de bien choisir les paramètres de numérisation de façon à obtenir une numérisation de qualité.

La fréquence d’échantillonnage

La qualité d’une numérisation passe par le nombre d’échantillons retenu.

bannière à retenir

À retenir

Plus le nombre d’échantillons est élevé, plus la numérisation est fidèle au signal d’origine.

Ce nombre d’échantillons est déterminé grâce à la fréquence d’échantillonnage.

Si la fréquence d’échantillonnage est trop basse, alors le nombre de valeur retenu peut conduire à l’obtention d’un signal très différent du signal d’origine.

fréquence basse échantillonnage

  • Pour éviter ce problème, il faut choir une fréquence d’échantillonnage au moins égale au double de la fréquence du signal à échantillonner.

On pourrait alors se dire qu’il faut prendre une très grande fréquence d’échantillonnage pour avoir une très bonne qualité de numérisation, mais l’inconvénient sera alors la taille du fichier numérique.
En effet, plus le nombre d’échantillons est grand, plus le nombre de données numériques sera important, plus le fichier sera lourd.
Il faut alors trouver un compromis entre la précision de la transcription du son d’origine et la taille maximale souhaitée pour le fichier numérique.

Une fois les échantillons retenus, il faut leur attribuer une valeur.

La finesse de quantification

Lors de la quantification, chaque échantillon se voit attribuer une valeur particulière (la plus proche possible) parmi un nombre limité de valeur possible.

quantification signal numérisation

bannière à retenir

À retenir

Plus le nombre de valeurs possibles est grand, plus la valeur attribuée à un échantillon est proche de sa « vraie » valeur et plus le son numérique est fidèle au son analogique.

  • Pour augmenter ce nombre de possibilité, il faut choisir un nombre de bits plus élevé pour le codage.

Nombre de bits $1$ $2$ $3$ $4$ $8$ $16$
Nombre de possibilités $2^1=2$ $2^2=4$ $2^3=8$ $2^4=16$ $2^8=256$ $2^{16}=65\,536$

De nouveau, l’inconvénient de l’augmentation du nombre de bits pour le codage est l’augmentation de la taille du fichier numérique obtenu.

Taille d’un fichier et compression

L’enjeu de la numérisation d’un signal analogique est de préserver la qualité du signal tout en limitant la taille du fichier numérique.

Estimation de la taille d’un fichier audio numérique

La taille d’un fichier audio numérique dépend de plusieurs facteurs :

  • la fréquence d’échantillonnage

On sait que l’oreille humaine est sensible à des fréquences comprises entre $20\,\text{Hz}$ et $20\,000\,\text{Hz}$. Comme la fréquence d’échantillonnage doit être le double de la fréquence du signal à échantillonner, on va donc prendre une fréquence d’échantillonnage d’au moins $40\,000\,\text{Hz}$. La fréquence utilisée est en fait souvent de $44\,100\,\text{Hz}$.

  • la résolution (nombre de possibilités)

La plus répandue pour la numérisation audio est celle liée à un codage en $16\,\text{bits}$.

  • le format stéréo ou mono

En effet le format stéréo comportant deux pistes différentes (une pour chaque enceinte), il y a alors deux fois plus d’informations à stocker.

  • la durée

La taille d’un fichier numérique s’obtient de la manière suivante :

  • On calcule tout d’abord le débit binaire, c’est à dire le nombre de bit utilisés par seconde :

$\text{fréquence d’échantillonnage}\times\text{nombre de bits du codage}\times 2$ (format stéréo)
Soit $44\,100\times 16\times 2 = 1\,411\,200$
C’est-à-dire $1\,411,2\,\text{kbits/s}$.

  • On convertit ensuite en octets, qui est l’unité de base utilisée pour les tailles de fichiers.

Comme $1\,\text{octet}$ correspond à $8\,\text{bits}$, on obtient $176\,400$
C’est-à-dire $176,4\,\text{ko/s}$.

  • Il suffit ensuite de multiplier par la durée du fichier pour obtenir la taille en octets du fichier.

Pour une chanson de $3\,\text{minutes}$, on a alors un fichier de :
$176\,400\times 180 = 3\,175\,200\,\text{octets}$, soit un peu plus de $3\,\text{Mo}$.

Pour pouvoir stocker davantage de musique sur des supports numériques, mais surtout pour la transmettre plus facilement, on peut diminuer la taille du fichier, d’où le recours à la compression.

La compression audio

bannière à retenir

À retenir

La compression audio consiste à réduire la taille d’un fichier audio dans le but de faciliter son stockage et sa diffusion.

Le processus de compression le plus fréquent est celui dit « avec perte de donnée ». Cela signifie que l’on enlève délibérément une partie de l’information pour alléger le fichier.

Pour choisir les parties à enlever, on se base sur deux procédés :

  • l’élimination des redondances. Le plus souvent, les sons présentent des répétitions ou des périodicités ; il est donc possible de ne conserver qu’une seule fois cette information et d’y faire appel à chaque fois que cela est nécessaire ;
  • l’adaptation aux imperfections de l’audition humaine. L’auditeur, ou plus exactement son cerveau, est très sélectif lors de l’écoute d’un son. En fonction du contexte, il est ainsi, capable d’éliminer certaines composantes de ce son. Lors de la compression, ces parties non essentielles sont repérées et supprimées.

Ces deux procédés peuvent être utilisés séparément ou de façon simultanée.
Le premier permet une restitution très fidèle du son, mais le taux de compression est faible.
Le second néglige davantage d’informations, mais avec un taux de compression bien plus élevé.

À titre d’exemple, un fichier compressé au format MP3 dont la qualité sonore est bonne possède un débit de $128\,\text{kbits/s}$, en comparaison avec les $1\,411,2\,\text{kbits/s}$ du fichier non compressé (soit un taux de compression de l’ordre de 10 à 12 fois).

Conclusion :

Tous les sons enregistrés correspondent à des signaux analogiques, mais les besoins de stockage et de diffusion nous ont conduit à procéder à leur numérisation.
Pour cela, il a fallu maîtriser le codage binaire puis avoir des ordinateurs suffisamment puissants pour procéder à un échantillonnage et à une quantification des échantillons à une grande fréquence.
Enfin, des algorithmes ont été conçus pour permettre la compression d’un signal audio tout en conservant une bonne qualité sonore.

Tous ces défis ont été relevés durant la seconde moitié du XXe siècle et ont permis notamment le développement du streaming audio.