Médaille
N°1 pour apprendre & réviser du collège au lycée.
Le son, une information à coder

Déjà plus de

1 million

d'inscrits !

Ce cours est en cours de création par nos équipes et il sera prêt pour la rentrée 2019 💪

Introduction :

Depuis quelques années, on assiste à un développement des supports numériques. Les textes et images sont ainsi numérisés pour être disponibles sur Internet par exemple. Le son peut lui aussi être numérisé.
Comment procède-t-on pour transformer un signal analogique en un signal numérique ?

Pour répondre à cette question, nous allons d’abord voir en quoi consiste la numérisation, puis nous étudierons les paramètres influençant la qualité de la numérisation, et enfin nous nous intéresserons aux principes de compression d’un fichier numérique.

Les principes de la numérisation

Le son se traduit par un signal analogique.

bannière definition

Définition

Signal analogique : 

Un signal analogique est un signal électrique continu au cours du temps.
Il est également continu en amplitude, ce qui signifie qu’il peut prendre toutes les valeurs possibles (entières ou décimales) entre un minimum et un maximum.

Image 1

/Le bit

L’enregistrement d’un son conduit donc à l’obtention d’un signal continu dans le temps : le signal analogique.
Pour devenir un signal numérique utilisable par un ordinateur, ce signal analogique doit subir une transformation par le biais d’un codage binaire.

bannière definition

Définition

Signal numérique binaire :

Un signal numérique est un signal non continu, qui varie de façon discrète au cours du temps.
On le qualifie de binaire, car il se compose d’une suite de 00 et de 11, que l’on appelle des bits.

Image 2

bannière à retenir

À retenir

Le bit (BInary digiT) est le plus petit élément d’information qu’un ordinateur peut stocker.
Un bit ne peut prendre que deux valeurs, 00 ou 11.

Le signal numérique est moins complexe que le signal analogique. Son codage lui permet d’être immédiatement lisible par un ordinateur qui peut le traiter ou le stocker.

  • La numérisation est donc l’opération consistant à transformer un signal analogique en une suite de bits.

Pour numériser un signal, il faut prélever des valeurs à intervalle régulier qui sont ensuite numérisées ; ces étapes constituent l’échantillonnage et la quantification.

Du continu au discret : l’échantillonnage

Le signal d’origine étant continu, il est composé d’une infinité de valeur.
Il est impossible de toutes les numériser, il faut donc choisir des valeurs à numériser : c’est ce que l’on appelle l’échantillonnage.

Le signal analogique est découpé régulièrement dans le temps.

  • La durée séparant deux valeurs qui seront numérisées constitue la durée d’échantillonnage TeT_e.

  • Le nombre de mesures réalisées par seconde constitue la fréquence d’échantillonnage fefe.
    On utilise souvent la fréquence d’échantillonnage fe=1Tef
    e=\dfrac{1}{T_e}.

    Image 3

On peut constater sur ce graphique que l’on est passé d’un signal continu à un signal discret (comportant un nombre limité de valeur).

  • Plus la durée d’échantillonnage est petite, plus le nombre de valeur numérisé est grand.

La valeur attribuée à chaque échantillon : la quantification

La quantification est le fait d’attribuer une valeur numérique à chaque échantillon retenu.

bannière attention

Attention

Le signal numérique étant codé en binaire (00 ou 11), il existe un nombre limité de valeurs numériques pouvant être attribuées à un échantillon.

La quantité de valeurs numériques correspond à la quantité de nombres binaires possibles.

Par exemple, pour un signal analogique allant de 0volt0\,\text{volt} à 9volts9\,\text{volts}, si le codage se fait sur 1bit1\,\text{bit}, il y a deux nombres binaires possibles ( 00 et 11) et donc il n’y aura que deux valeurs numériques possibles, le minimum (0volt0\,\text{volt}) et le maximum (9volts9\,\text{volts}).
Si par contre le codage se fait sur 2bits2\,\text{bits}, il y a quatre nombres binaires possibles (0000, 0101, 1010 et 1111) et donc il y aura quatre valeurs numériques possibles (0volt0\,\text{volt}, 3volts3\,\text{volts}, 6volts6\,\text{volts} et 9volts9\,\text{volts}).

Image 4

  • Lors de la quantification, la valeur de chaque échantillon est arrondie à la valeur la plus proche parmi les valeurs possibles.

La quantité de nombres binaires possibles est appelée la résolution RR et est donnée par :

R=2nR = 2^n (avec n=nombre de bits utiliseˊs pour le codagen=\text{nombre de bits utilisés pour le codage})

bannière à retenir

À retenir

Ainsi, pour numériser un signal analogique, on procède à sa discrétisation, c’est-à-dire qu’on l’échantillonne et qu’on le quantifie.

Maintenant que nous avons vu le principe de numérisation, nous allons pouvoir nous intéresser aux paramètres influençant la qualité de cette numérisation.

Le choix des paramètres de numérisation

Comme nous l’avons vu, lors de la numérisation, on passe d’un signal continu à un signal discret.

  • Il y a donc une « perte d’information » au cours du processus de numérisation.

Il est donc important de bien choisir les paramètres de numérisation de façon à obtenir une numérisation de qualité.

La fréquence d’échantillonnage

La qualité d’une numérisation passe par le nombre d’échantillons retenu.

bannière à retenir

À retenir

Plus le nombre d’échantillons est élevé, plus la numérisation est fidèle au signal d’origine.

Ce nombre d’échantillons est déterminé grâce à la fréquence d’échantillonnage.

Si la fréquence d’échantillonnage est trop basse, alors le nombre de valeur retenu peut conduire à l’obtention d’un signal très différent du signal d’origine.

Image 5

  • Pour éviter ce problème, il faut choir une fréquence d’échantillonnage au moins égale au double de la fréquence du signal à échantillonner.

On pourrait alors se dire qu’il faut prendre une très grande fréquence d’échantillonnage pour avoir une très bonne qualité de numérisation, mais l’inconvénient sera alors la taille du fichier numérique.
En effet, plus le nombre d’échantillons est grand, plus le nombre de données numériques sera important, plus le fichier sera lourd.
Il faut alors trouver un compromis entre la précision de la transcription du son d’origine et la taille maximale souhaitée pour le fichier numérique.

Une fois les échantillons retenus, il faut leur attribuer une valeur.

La finesse de quantification

Lors de la quantification, chaque échantillon se voit attribuer une valeur particulière (la plus proche possible) parmi un nombre limité de valeur possible.

Image 6

bannière à retenir

À retenir

Plus le nombre de valeurs possibles est grand, plus la valeur attribuée à un échantillon est proche de sa « vraie » valeur et plus le son numérique est fidèle au son analogique.

  • Pour augmenter ce nombre de possibilité, il faut choisir un nombre de bits plus élevé pour le codage.

Nombre de bits 11 22 33 44 88 1616
Nombre de possibilités 21=22^1=2 22=42^2=4 23=82^3=8 24=162^4=16 28=2562^8=256 216=655362^{16}=65\,536

De nouveau, l’inconvénient de l’augmentation du nombre de bits pour le codage est l’augmentation de la taille du fichier numérique obtenu.

Taille d’un fichier et compression

L’enjeu de la numérisation d’un signal analogique est de préserver la qualité du signal tout en limitant la taille du fichier numérique.

Estimation de la taille d’un fichier audio numérique

La taille d’un fichier audio numérique dépend de plusieurs facteurs :

  • la fréquence d’échantillonnage

On sait que l’oreille humaine est sensible à des fréquences comprises entre 20Hz20\,\text{Hz} et 20000Hz20\,000\,\text{Hz}. Comme la fréquence d’échantillonnage doit être le double de la fréquence du signal à échantillonner, on va donc prendre une fréquence d’échantillonnage d’au moins 40000Hz40\,000\,\text{Hz}. La fréquence utilisée est en fait souvent de 44100Hz44\,100\,\text{Hz}.

  • la résolution (nombre de possibilités)

La plus répandue pour la numérisation audio est celle liée à un codage en 16bits16\,\text{bits}.

  • le format stéréo ou mono

En effet le format stéréo comportant deux pistes différentes (une pour chaque enceinte), il y a alors deux fois plus d’informations à stocker.

  • la durée

La taille d’un fichier numérique s’obtient de la manière suivante :

  • On calcule tout d’abord le débit binaire, c’est à dire le nombre de bit utilisés par seconde :

freˊquence d’eˊchantillonnage×nombre de bits du codage×2\text{fréquence d’échantillonnage}\times\text{nombre de bits du codage}\times 2 (format stéréo)
Soit 44100×16×2=141120044\,100\times 16\times 2 = 1\,411\,200
C’est-à-dire 1411,2kbits/s1\,411,2\,\text{kbits/s}

  • On convertit ensuite en octets, qui est l’unité de base utilisée pour les tailles de fichiers.

Comme 1octet1\,\text{octet} correspond à 8bits8\,\text{bits}, on obtient 176,4ko/s176,4\,\text{ko/s}.

  • Il suffit ensuite de multiplier par la durée du fichier pour obtenir la taille en octets du fichier.

Pour une chanson de 3minutes3\,\text{minutes}, on a alors un fichier de :
176400×180=3175200octets176\,400\times 180 = 3\,175\,200\,\text{octets}, soit 31,75Mo31,75\,\text{Mo}.

Pour pouvoir stocker davantage de musique sur des supports numériques, mais surtout pour la transmettre plus facilement, il faut diminuer la taille du fichier, d’où le recours à la compression.

La compression audio

bannière à retenir

À retenir

La compression audio consiste à réduire la taille d’un fichier audio dans le but de faciliter son stockage et sa diffusion.

Le processus de compression le plus fréquent est celui dit « avec perte de donnée ». Cela signifie que l’on enlève délibérément une partie de l’information pour alléger le fichier.

Pour choisir les parties à enlever, on se base sur deux procédés :

  • l’élimination des redondances. Le plus souvent, les sons présentent des répétitions ou des périodicités ; il est donc possible de ne conserver qu’une seule fois cette information et d’y faire appel à chaque fois que cela est nécessaire ;
  • l’adaptation aux imperfections de l’audition humaine. L’auditeur, ou plus exactement son cerveau, est très sélectif lors de l’écoute d’un son. En fonction du contexte, il est ainsi, capable d’éliminer certaines composantes de ce son. Lors de la compression, ces parties non essentielles sont repérées et supprimées.

Ces deux procédés peuvent être utilisés séparément ou de façon simultanée.
Le premier permet une restitution très fidèle du son, mais le taux de compression est faible.
Le second néglige davantage d’informations, mais avec un taux de compression bien plus élevé.

À titre d’exemple, un fichier compressé au format MP3 dont la qualité sonore est bonne possède un débit de 128kbits/s128\,\text{kbits/s}, en comparaison avec les 1411,2kbits/s1\,411,2\,\text{kbits/s} du fichier non compressé (soit un taux de compression de l’ordre de 10 à 12 fois).

Conclusion :

Tous les sons enregistrés correspondent à des signaux analogiques, mais les besoins de stockage et de diffusion nous ont conduit à procéder à leur numérisation.
Pour cela, il a fallu maîtriser le codage binaire puis avoir des ordinateurs suffisamment puissants pour procéder à un échantillonnage et à une quantification des échantillons à une grande fréquence.
Enfin, des algorithmes ont été conçus pour permettre la compression d’un signal audio tout en conservant une bonne qualité sonore.

Tous ces défis ont été relevés durant la seconde moitié du XXe siècle et ont permis notamment le développement du streaming audio.