Passer au contenu

H.264 : la compression vidéo en haute qualité

MPeg2, le format de compression des DVD-vidéo et de la TNT gratuite, n’est pas adapté à la diffusion en haute définition. H.264, nettement plus performant, est appelé à le remplacer.

Ceux qui font du montage vidéo le savent bien : une heure de vidéo non compressée en 720 x 576 points monopolise quelque 71 Go d’espace disque. C’est beaucoup… mais ce n’est rien comparé à une heure de vidéo
en haute définition : en 1 920 x 1 080 points, il faut compter plus de 350 Go ! Un volume de données trop élevé pour être stocké sur un support optique actuel, et impossible à transférer en temps réel, ni par le
réseau hertzien, ni même par ADSL : le débit nécessaire à un tel transfert serait d’environ 800 Mbit/s ! C’est là qu’intervient la compression vidéo…Pour des images en 720 x 576 points, le MPeg2 fait très bien l’affaire. Il autorise le stockage d’un film ?” et de ses bonus ?” sur les quelque 8,5 Go d’un DVD-vidéo et, pour la télévision numérique, il
permet de réduire le débit à 8 Mbit/s, et même à 1 Mbit/s, selon le programme. Mais, avec l’avènement de la haute définition, et malgré l’apparition de supports optiques plus spacieux (Blu-Ray et HD-DVD), le Mpeg2 ne suffit plus. Il faut
un format qui compresse plus fortement les données vidéo tout en préservant les bénéfices de la haute définition. Et c’est le H.264, développé par les organismes de normalisation Iso/MPeg et UIT (Union internationale des télécommunications), qui a
été retenu par les industriels. Il permet, à qualité égale, d’obtenir un débit deux fois inférieur à celui du MPeg2 et, à débit égal, d’atteindre une qualité d’image bien supérieure à celle d’une vidéo en MPeg4-Part2 (qui est au c?”ur des formats
DivX, XviD et WMV).Les principes d’encodage du H.264, également connu sous les appellations MPeg4-Part10 ou MPeg4/AVC (pour Advanced Video Coding), ne diffère pas fondamentalement de ceux du MPeg2 ou du MPeg4-Part2 dont il est
dérivé. Il s’agit toujours d’effectuer la compression en partant d’un groupe d’images (Gop) de taille variable, composé d’une ‘ image de référence ‘ (appelée I pour intra) intégralement codée, et de
plusieurs ‘ images relatives ‘ (appelées P pour prédictive, ou B pour bidirectionnelle) dont seules les variations entre images sont conservées. Par rapport au MPeg2 et au MPeg4, le H.264 ajoute aux
images I, P et B, deux types d’images intermédiaires, SI et SP, calculées et intercalées dans le flux, notamment pour fluidifier la transmission de la vidéo sur les canaux à débit variable (ceux du réseau Internet, notamment).

Une compression plus forte et qui dégrade moins l’image

Pour analyser les variations entre images, c’est-à-dire le ‘ mouvement ‘ des pixels, le MPeg4 divise chaque image en blocs de pixels dont il recherche la présence dans les images
précédentes ou suivantes, les mouvements relevés étant ensuite traduits en vecteurs. Lors de cette opération, et contrairement au MPeg4, qui utilise une transformée de Fourrier, le H.264 exploite une transformée sans arrondi après la virgule, donc
sans perte d’informations supplémentaire. Au terme de cette phase, les informations redondantes d’une image à une autre ont été supprimées, et les mouvements observés ont été encodés sous forme de vecteurs et d’informations de variations. Le gain
est considérable mais, et c’est le propre des compressions destructrices, des informations ont été perdues lors de l’opération. Pour corriger les défauts trop visibles, le H.264 compare le bloc issu de cette première compression avec ceux qui le
jouxtent pour corriger les erreurs résiduelles après prédiction.Suit alors une seconde compression du bloc, non destructrice celle-là, du même type que celle utilisée pour créer une archive Zip, pour un gain en compression de l’ordre de 15 %. Finalement, le H.264 procède, par le biais de son
composant NAL (pour Network Abstraction Layer), à un dernier traitement (non illustré ci-contre). Il formate la vidéo en un signal structuré adapté au mode de diffusion : transmission par paquets (satellite, radio ou
Internet) ou en flux continu (disque optique). A l’arrivée, un flux en haute définition ne requiert plus que 8 Mbit/s, voire moins : Free a diffusé Roland-Garros 2006 en HD avec un débit de seulement 5,2 Mbit/s ! Des qualités qui
ne doivent pas masquer le principal défaut de ce format de compression : par rapport au MPeg4-Part2, la complexité du codage est multipliée par 8 ; ce qui, pour une diffusion en temps réel, nécessite une puissance de traitement colossale,
les codeurs temps réel actuels ne permettant, pour l’instant, de n’utiliser que 40 % du potentiel du H.264, avec des taux de compression encore limités.

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


Christophe Blanc, avec Eric Rault