Passer au contenu

Le MP3 aurait-il fait son temps ?

Haut débit et grandes capacités de stockage favorisent l’apparition de nouveaux formats de compression audio, sans perte de qualité.

Ces trente dernières années, les innovations ont été particulièrement nombreuses dans le domaine de l’informatique et des technologies numériques. Mais si certaines d’entre elles sont dans toutes les mémoires, d’autres demeurent
méconnues.C’est le cas de la compression de données, une technologie logicielle pourtant à l’origine de plusieurs révolutions industrielles. On lui doit notamment le développement rapide d’Internet et son adoption en masse par le grand
public : quand le haut débit était encore un luxe réservé à certaines entreprises, la compression était le seul moyen d’échanger des fichiers dans des délais raisonnables. Et que dire du MP3 ? Trois lettres qui nomment une technologie de
compression, devenue si populaire qu’elles désignent aujourd’hui, par extension, les baladeurs musicaux que tous les jeunes ont dans leur poche.Et ce qui est vrai pour le son l’est aussi pour l’image : qu’est-ce qu’une photo aujourd’hui, sinon une image numérique compressée en Jpeg ? Et un DVD-Vidéo, sinon un disque contenant un film compressé en
Mpeg2 ?Pur produit du génie humain, la compression logicielle utilise des algorithmes mathématiques et statistiques très complexes pour réduire la taille des fichiers. Certains sont applicables à tous les types de données, d’autres
spécifiques à l’image ou au son. Il existe deux sortes d’algorithmes : destructifs ou non destructifs. Le MP3 et le Jpeg sont destructifs, mais pas le Zip des archives Windows, ni les formats de compression audio sans perte
(lossless, en anglais) qui sont le sujet du présent article.

Le taux dépend de l’usage final

Un algorithme destructif privilégie le taux de compression : l’important est de réduire la taille du fichier originel dans des proportions importantes, quitte à supprimer certaines données jugées non essentielles. Ainsi, lorsque
vous encodez un extrait d’un CD-Audio en MP3 (ou en WMA, Ogg Vorbis et AAC) en choisissant un débit constant de 128 kbit/s, vous divisez par dix environ la taille du fichier. Un taux de compression remarquable (10 %), qui facilite les
téléchargements et permet de graver une dizaine d’heures de musique sur un unique CD.Toutefois, il ne peut être obtenu qu’en supprimant certaines parties du signal audio, certaines fréquences censées être masquées par d’autres. La différence de rendu sonore reste néanmoins nettement perceptible lorsqu’on tend
l’oreille. Elle l’est beaucoup moins dans le cas d’une musique de fond jouée à faible volume. D’où une première leçon : l’arbitrage entre taux de compression et qualité dépend essentiellement de l’usage que l’on veut faire d’un fichier.Laissons maintenant la musique de côté pendant un instant, pour examiner un exemple simple de compression non destructive d’images. Celles-ci sont en effet plus faciles à reproduire dans notre magazine que les sons ! Dans
l’illustration ci-dessous, une photo au format BMP non compressé (en haut) a été convertie au format TIF (en bas), en activant l’algorithme de compression non destructif LZW. Observez, dans la boîte de
dialogue de droite, les tailles des fichiers résultants : on passe de 10,8 Mo pour le fichier BMP à 5,1 Mo pour le fichier TIF. Soit un taux de compression de 50 %, les deux images restant identiques au pixel près.Nous avons poursuivi l’expérience en appliquant la même conversion en TIF à une image de synthèse, un simple carré rempli d’une couleur uniforme : le taux de compression a cette fois baissé jusqu’à 25 %.

La structure du chaos

C’est le second enseignement : plus les données à traiter sont complexes, moins la compression non destructive est efficace. Or une photo de la nature, par exemple, est un ensemble très complexe, car la nature est une forme de
chaos.Et un morceau de musique l’est plus encore, car il est constitué d’un assemblage de sons qui, pris individuellement, sont eux-mêmes des structures très complexes. Toutefois, pour un véritable mélomane, la place occupée par un fichier
importe moins que sa qualité sonore. C’est d’autant plus vrai que les contraintes matérielles s’estompent peu à peu : la taille des disques durs ne cesse d’augmenter, de même que la mémoire des baladeurs et la capacité des disques compacts,
alors que dans le même temps leurs prix baissent. Quant aux échanges de données par Internet, ils se trouvent grandement facilités par la généralisation du haut débit et la banalisation du stockage en ligne. Alors oui à la compression, mais non
destructive !Les outils de compression audio lossless (voir la liste en page suivante) sont tous plus ou moins basés sur les mêmes principes mathématiques et les mêmes techniques logicielles :


La compression des silences. Un morceau de musique est parsemé de courts instants de silence, qui occupent le même espace que les sons complexes. En réduisant chacun de ces silences à un ou deux octets représentant leur durée, on
économise jusqu’à plusieurs kilo-octets, voire mégaoctets.


Le filtrage des fréquences. Le signal audio est divisé en plusieurs plages de fréquences : basses, bas-mediums, hauts-mediums (les fréquences de la voix humaine), aigus, par exemple. On peut alors appliquer à chacune de ces plages
un encodage spécifique, adapté à la façon dont elle est perçue par l’oreille humaine.La suppression de la redondance stéréophonique. Dans un fichier audio stéréo, la différence à un instant T est souvent faible entre le signal véhiculé par le canal droit et celui véhiculé par le gauche. Le fait de mémoriser une seule
fois les données communes aux deux canaux génère un gain de place important.Le codage entropique. Il consiste à prédire la valeur d’un échantillon (plus petit élément d’un signal audionumérique) à partir des échantillons précédents, puis à coder la différence entre la prédiction et la réalité.On retrouve cette méthode dans les algorithmes de compression vidéo comme le MPeg. En combinant ces techniques, chaque encodeur réduit la taille des fichiers de moitié environ.

A nuancer selon la musique

Mais le taux de compression dépend beaucoup du type de musique traité : limité à 55 % avec le rock et les musiques à forte dynamique, il peut tomber à 45 % avec la musique classique.En revanche, pour un même fichier, il varie peu d’un encodeur à l’autre, comme le montre l’illustration ci-contre. Elle indique la taille en kilo-octets d’un même fichier musical (un album complet) encodé en Wave, Flac, APE, WMA sans
perte, ainsi qu’en trois qualités différentes de MP3 (64 kilobits, 128 kilo-bits et 320 kilobits par seconde).Le taux de compression sans perte maximum obtenu, celui de Monkey’s Audio (APE), est de 51 %. Pour obtenir des taux supérieurs, il faut sortir du lossless et accepter de diminuer la qualité sonore. Ce qu’aucun vrai mélomane ne
saurait accepter !

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


Christophe Blanc