Qu'est-ce que le H.264 ?

Une nouvelle norme pour la vidéo numérique

DivX® 7 est basé sur la norme H.264, le format d’encodage numérique à la pointe de la technologie pour la vidéo en haute définition. Pourquoi cette norme est-elle si remarquable ? Pour résumer, le H.264 consiste en une technologie de compression puissante qui permet une meilleure expérience vidéo à un faible débit binaire.

Plus précisément, nous pouvons vous dire que le contrôle flexible du débit de la norme permet au H.264 d’offrir une vidéo de haute qualité sur de nombreux appareils allant des téléphones portables à faible puissance aux appareils Blu-ray de grande puissance. C’est pourquoi la norme H.264 devrait remplacer certains formats actuels courants tels que le format DV, la norme utilisée par de nombreuses caméras vidéo de grande consommation, et le MPEG-2, la norme pour la vidéo DVD et certains types de télévision par câble et de diffusion numérique. En un mot, le H.264 s’adapte à toutes les plateformes et met la haute définition à portée de main.

Note d’avertissement avant de poursuivre : Si vous êtes uniquement intéressé par une présentation succincte de la norme H.264 et de ce qui en fait quelque chose de remarquable, les paragraphes ci-dessus vous auront sans doute éclairé. Si, en revanche, vous désirez des informations plus techniques sur les subtilités de la compression vidéo et les progrès réalisés avec la norme H.264 dans l’univers mystérieux de l’encodage vidéo, les quelques 900 mots qui suivent vous sont adressés.

Compression vidéo numérique : les bases

La vidéo numérique est compressée afin d’économiser de l’espace tant en termes de largeur de bande qu’en termes de média. Un codec (compression-décompression) effectue l’encodage et le décodage. L’amélioration des normes de compression sur lesquelles un codec est basé permet la transmission d’une qualité vidéo supérieure avec une largeur de bande identique.

La norme H.264 réduit le nombre d’informations nécessaire pour reproduire une vidéo. Les encodeurs traitent chaque image, les subdivisant dans une grille de blocs et recherchant les images précédentes ou suivantes pour chaque bloc afin de faire correspondre la texture, selon une technique qu’on appelle l’estimation du mouvement. Lorsqu’une correspondance pertinente est trouvée, un décodeur peut reproduire la texture du bloc dans l’image actuelle, à l’aide d’un seul vecteur pointant sur la texture de référence correspondante et de quelques informations pour corriger les petites différences de texture. Là où l’estimation du mouvement ne parvient pas à trouver de correspondances pertinentes, les encodeurs utilisent la texture des blocs voisins dans la même image pour deviner la texture du bloc et mémorisent la différence entre la prédiction et la texture réelle. Cette technique est plus efficace que la mémorisation directe de la texture mais elle est aussi plus coûteuse que l’estimation du mouvement. Les encodeurs agissent comme des compresseurs « avec pertes ». Leur but n’est pas de reproduire l’image originale à la perfection mais de choisir les moyens optimaux pour réduire le débit de données tout en préservant du mieux que possible la qualité visuelle. Grâce aux paramètres adaptés, les différences peuvent être imperceptibles même lorsque la compression par rapport aux données brutes avoisine 100:1.

La norme H.264 offre de considérables améliorations de la performance par rapport aux normes précédentes. Par exemple : un DVD standard peut contenir un film de deux heures compressé à l’aide du codec MPEG-2 (la norme courante pour les films DVD) et quatre heures de films avec le codec H.264. Le nouveau codec DivX 7 doté du H.264 est bien plus efficace que le codec DivX 6, basé sur la norme MPEG-4 ASP, prédécesseur du H.264.

Qu’y a-t-il de nouveau dans le H.264 ?

Le H.264 dispose de multiples nouvelles fonctionnalités qui améliorent la qualité d’image et la compression par rapport au codec DivX 6 (ASP) :

  • Le dégroupage en boucle: Le dégroupage est une technique intense pour le processeur qui tente de supprimer les défauts bloquant dans l’image décodée en question. Le décodeur DivX ASP utilise le dégroupage comme technique post-traitement optionnelle dans le but d’améliorer la qualité pendant la lecture, généralement appliqué en fonction de la disponibilité du processeur. Ceci permet aux ordinateurs rapides d’afficher la plus belle image possible et aux ordinateurs plus lents de rappeler le post-traitement pour une lecture plus fluide.

    Le H.264 effectue un dégroupage sur chaque image pendant l’encodage et le décodage. L’encodage en devient plus efficace car il y a moins de bruit dans les images de références. Il est toutefois impossible de désactiver le déblocage pour améliorer la performance de lecture sur les systèmes plus lents.
  • Estimation du mouvement d’un quart de pixel: Lorsque l’encodeur DivX ASP recherche des blocs dans les images précédentes ou suivantes, il définit les vecteurs de mouvement jusqu’à une précision d’un demi-pixel. Les recherches de demi-pixels peuvent être effectuées rapidement pendant l’encodage et la reconstruction de la texture à partir des vecteurs de mouvement avec une précision d’un demi-pixel pendant la lecture est également rapide.

    Le H.264 utilise la précision d’un quart de pixel pour la recherche de mouvement ce qui rallonge le temps de recherche pendant l’encodage et complexifie la reconstruction de la texture pendant la lecture. Bien que les exigences de traitement soient grandes, une prévision plus précise permet une meilleure netteté des images et une meilleure efficacité.
  • Tailles de bloc plus petites, meilleure prévision: L’ASP et le H.264 utilisent tous deux des blocs de 16x16 pixels comme taille de bloc de base. Avec l’ASP, les blocs peuvent être subdivisés en quatre partitions de 8x8 tandis qu’avec le H.264, les blocs sont subdivisés jusqu’à 4x4 pixels. Les tailles de bloc plus petites sont bénéfiques dans les zones à faible résolution spatiale et, par conséquent, particulièrement utiles pour la définition standard et le contenu mobile. Le H.264 offre également une plus grande flexibilité pour la prévision d’images I. Ainsi, lorsque l’estimation du mouvement échoue ou que les images-clés sont codées, la texture du bloc peut être conservée plus efficacement qu’avec la norme ASP.
  • Plus d’images de référence: Les normes ASP et H.264 utilisent tous deux l’estimation du mouvement pour un codage efficace de chaque image, reconstruisant les nouvelles images en déplaçant la texture des images voisines déjà décodées. Avec la norme ASP, les seules références image autorisées sont les images précédentes ou suivantes et les images faisant référence aux deux ne peuvent pas se servir de référence à elles-mêmes. Ces restrictions sont importantes car elles limitent la mémoire requise pour décoder un flux tout comme le temps qu’un encodeur peut passer à réduire le nombre d’images de référence pendant la recherche de mouvement. La norme H.264 étend considérablement le système d’images de référence en autorisant le fait qu’une seule image puisse servir de référence pour de nombreuses images précédentes ou suivantes et que tous les types d’image puissent servir d’images de référence. Ceci permet aux encodeurs d’être plus efficaces en trouvant de meilleures correspondances pendant la recherche de mouvement mais également d’augmenter le temps de recherche. Les décodeurs doivent également offrir davantage de mémoire pour conserver les images de référence. Pour lire une vidéo à 1080p, il faut six fois plus de mémoire par image de référence que pour lire une vidéo de définition standard.
Qu’y a-t-il d’exceptionnel dans l’intégration du H.264 dans DivX 7 ?

L’idée que le H.264 est un format de forme unique est une idée fausse communément répandue. Les différents profils du H.264 présentent différents ensembles de fonctionnalités qui ne sont pas de stricts sous-ensembles respectifs. Ceci entraîne des problèmes d’interopérabilité. Nous souhaitons unifier le format H.264 sous une seule forme afin que les utilisateurs puissent créer et lire indifféremment leurs fichiers numériques sur leurs caméras vidéo, baladeurs vidéo et téléviseurs. La compression puissante et la modulabilité du format LE H.264 nous permettent d’offrir réellement la lecture cinématographique promise sur votre ordinateur, dans le salon ou pendant vos déplacements.

Vous souhaitez en savoir encore plus ? Consultez DivX Labs pour vous tenir informé sur la communauté DivX.