L'optimisation actuelle des performances de la compression vidéo : le standard MPEG-4

04/09/2017
OAI : oai:www.see.asso.fr:1301:2005-11:19784
DOI :

Résumé

L'optimisation actuelle des performances de la compression vidéo : le standard MPEG-4

Métriques

9
4
2.3 Mo
 application/pdf
bitcache://d952600459e01dca3963c5c4698586a6ce89de0d

Licence

Creative Commons Aucune (Tous droits réservés)
<resource  xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
                xmlns="http://datacite.org/schema/kernel-4"
                xsi:schemaLocation="http://datacite.org/schema/kernel-4 http://schema.datacite.org/meta/kernel-4/metadata.xsd">
        <identifier identifierType="DOI">10.23723/1301:2005-11/19784</identifier><creators><creator><creatorName>Boris Felts</creatorName></creator><creator><creatorName>Gérard Mozelle</creatorName></creator><creator><creatorName>Nivedita Nouvel</creatorName></creator><creator><creatorName>Eric Le Bars</creatorName></creator></creators><titles>
            <title>L'optimisation actuelle des performances de la compression vidéo : le standard MPEG-4</title></titles>
        <publisher>SEE</publisher>
        <publicationYear>2017</publicationYear>
        <resourceType resourceTypeGeneral="Text">Text</resourceType><dates>
	    <date dateType="Created">Mon 4 Sep 2017</date>
	    <date dateType="Updated">Mon 4 Sep 2017</date>
            <date dateType="Submitted">Fri 20 Apr 2018</date>
	</dates>
        <alternateIdentifiers>
	    <alternateIdentifier alternateIdentifierType="bitstream">d952600459e01dca3963c5c4698586a6ce89de0d</alternateIdentifier>
	</alternateIdentifiers>
        <formats>
	    <format>application/pdf</format>
	</formats>
	<version>33578</version>
        <descriptions>
            <description descriptionType="Abstract"></description>
        </descriptions>
    </resource>
.

LA TECHNOLOGIE DE LA HAUTE DÉFINITION m a a L'optimisation actuelle des performances de la compression vidéo : le standard MPEGm4 Par Boris FELTS 1,Gérard MOZELLE 1, Nivedita NOUVEL 3,Eric LEBARS 1 Envivio.1 Thomson 1, Thales 1 ugotrim MPEG-2, MPEG-4, Macrobloc, Slice, CABAC, CAVLC, Multiplexagestatistique Les discussions qui ont accompagné la mise en place de la télévision numérique terrestre en France ont mis en umiere 'importance du choix de la norme de com- pression vidéo. Au-delà des aspects économiques, quelles sont les différences techniques entre le MPEG-2 et le MPEG-4 et comment expliquent-elles les écarts de performances entre ces deux standards ? Introduction La compression a pour objectif d'identifier et d'éliminer les redondances dans un signal vidéo afin de représenter de manière minimale l'information visuelle et d'assurer un transport optimal de l'information. Les principes fondamentaux de la compression sont basés sur l'étude du traitement du signal vidéo et du système psychovisuel humain. On considère en général deux classes d'algo- rithmes de compression (aussi appelés « codecs ») : . Les algorithmes de compression sans perte, où l'information est conservée intégralement mais représentée de manière optimale (par exemple, pour le stockage d'images médicales. . Les algorithmes de compression avec perte, où une partie de l'information originelle est perdue tout en essayant de préserver au maximum l'infor- mation pour laquelle notre système psychovisuel est le plus sensible. Ce sont ces algorithmes qui sont les plus répandus dans les appareils grand public et avec lesquels nous sommes en contact quotidiennement : DVD, téléphones portables, caméras, décodeurs de télévision numérique, décodeurs vidéo sur PC etc. Dans cet article, nous nous intéressons uniquement aux algorithmes standardisés de compression avec perte. Après avoir présenté la genèse et l'évolution des perfor- mances des algorithmes de compression (MPEG-2 et MPEG-4) développés par le groupe d'experts MPEG, nous exposons brièvement les principes génériques de compression utilisés par ces deux codecs, avant de poin- ter les différences à l'origine de leurs écarts de perfor- mances. Enfin, nous présentons quelques scénarios de migration ou de cohabitation de ces deux algorithmes de compression en prenant en compte la variable supplé- mentaire que représente le choix entre Définition Standard et Haute Définition. 2. l'évolution des codees vidéo standardisés Le groupe d'experts MPEG a développé, sous les aus- pices de l'ISO (International Standard Organisation) et de l'IEC (International Electrotechnical Commission), le ESSENTIEL SYNOPSIS Après avoir présenté la genèse et l'évolution des performances des algorithmes de compression (MPEG-2et MPEG-4)dévelop- pés par le groupe d'experts MPEG, nous exposons brièvement les principes génériques de compression utilisés par ces deux « codecs », avant de pointer les différences à l'origine de leurs écarts de performances.Enfin,nous présentonsquelquesscéna- nos de migration ou de cohabitationde ces deux algorithmesde compression en prenant en compte la variable supplémentaire que représente le choix entre Définition Standard et Haute Définition. After ashort presentationof the genesisof the lossycompression algorithms MPEG-2 and MPEG-4)developed by the experts' group of MPEG,we briefly exposethe generic principlesof com- pression used by these two « codecs », before underliningtheir differencesboth interms of technicalfeatures and performances. Finally,we presentsome scenariosof migrationor cohabitationof these two algorithms taking into account the additional possible choice between Standard Definition (SOI and High Definition (HO) REE HORS SÉRIE W ! Septembre2005 L'optimisation actuelle des performances de la compression vidéo : le standard MPEG-4 d2 .... 1/1 0 r. 0 u : J 3 m 7 m .o û ------------...... --------- -------------- ------....... a ra 3 5 i I J .u GY c. : ;'::;.-".':-':;' r.,ij" ;-'''\:!'.-. ;.,''s:.r'-;:.*.:..::-j,'.' :i.- ., !.\ - t " '''.''-''/ :',!'-;.-'.' ;:-';'i.' "'' ;'''-w<.t..M.M..t.--..Ll-.-..-- -Y.'.. y1I lwJrlk s 97. J. H264 MPEG-4 A vc 2005 Reproduitavec l'aimable autorisationdeKenMcCann,DVB-AVC chatrman Temps Figure 1. Présentation synthétique de 1,évolution des perforinances et de la coiiijlexité des algorithines de compression MPEG-2, MPEG-4 partie 2 et MPEG-4 AVC. standard de compression de flux audiovisuels le plus uti- lisé au monde. Baptisé MPEG-2, ce standard se décline en de nombreuses parties dont les plus importantes sont : I'ISO/IEC 13818-1 [Il qui spécifie la couche transport TS (Transport Stream) ; . FISO/IEC 13818-2 [2] qui définit la façon dont sont compressées les composantes vidéo des conte- nus ; I'ISO/IEC 13818-3 [3] qui décrit comment sont compressées les composantes sonores. La philosophie adoptée par le groupe MPEG consiste à privilégier l'interopérabilité des contenus en définissant précisément la syntaxe et l'algorithme de décodage sans imposer de contraintes sur la façon dont un encodeur doit opérer. De cette façon, on évite l'obsolescence des parcs installés de décodeurs sans entraver l'optimisation des performances des encodeurs. La figure 1 illustre de façon schématique la pertinence de cette approche dans le cas de l'algorithme MPEG-2 pour lequel les performances à qualité visuelle égale ont énormément évolué entre l'ap- parition des premiers encodeurs temps réel et ceux de la génération actuelle. Grâce à un accord de collaboration entre MPEG et l'ITU (International Telecommunication Union), le standard MPEG-2 a aussi été publié par cet organisme sous la référence générique ITU-T H.262. Le standard MPEG-2 ayant été conçu pour pouvoir supporter l'ensemble des applications utilisant des flux audiovisuels, il ne traite pas des spécificités relatives à un domaine particulier. De ce fait, les standards MPEG ont été repris et utilisés par le consortium DVB (Digital Video Broadcasting) comme fondation de l'ensemble des standards nécessaires au succès de la télévision numérique européenne. Outre des recommandations sur le codage de la vidéo et des composantes sonores (ETSI TS 101 154 [4]), le groupe DVB a aussi spécifié des standards de diffusion (EN 300 744 [5], EN 302 307 [6],...), de signalisation (EN 300 468 [7]) et diverses autres « Guidelines ». C'est sur la base de ces standards DVB que s'est réalisée en défi- nition standard la numérisation de la télévision européenne. Fort du succès de l'algorithme MPEG-2, le groupe MPEG a poursuivi ses efforts en développant l'environne- ment MPEG-4. Ce dernier devait améliorer les performances de son prédécesseur tout en augmentant les fonctionnalités offertes aux utilisateurs en particulier dans le domaine du multimédia. Ainsi, l'environnement MPEG-4 permet par exemple la manipulation d'objets (synthétiques ou pas) et de scènes. Dans le domaine de la compression vidéo, cet effort a produit l'algorithme MPEG-4 partie 2 dont les performances, bien que supérieures de 10 à 20 % à MPEG-2 (comme illustré à la figure 1), ne justifie pas son utilisation dans le monde de la télédiffusion conven- tionnelle où toute évolution technique doit être jaugée par rapport à son impact sur le parc installé. De son côté, l'ITU a développé successivement la famille de standards H263, H263+ puis H26L en octobre 1999. L'amélioration des performances apportées par le H26L par rapport au MPEG-2 était telle (de l'ordre potentiellement de 50 %) que MPEG et l'ITU joignirent de nouveau leur force pour créer le groupe de travail JVT (Joint Video Team) chargé de définir une version améliorée de H26L qui s'inscrit complètement dans l'environnement MPEG. Le groupe JVT termina en mai 2003, la définition du standards ISO/IEC 14496- 10 (MPEG-4 partie 10) Advanced Video Coding (AVC) ou ITU-T H264 [8]. C'est de ce standard qu'il s'agit lorsqu'on fait référence aux performances de l'algorithme MPEG-4 sans autre précision. On estime REE HORS SÉRIE Wl Septembre2005 LA TECHNOLOGIE DE LA HAUTE DÉFINITION aujourd'hui que les premiers encodeurs professionnels temps réel MPEG-4 AVC permettront une amélioration des performances de compression de l'ordre de 30 %. La seconde génération d'encodeurs devrait diviser par 2 le débit nécessaire à qualité visuelle égale (voir figure 1). Bien sûr, cette amélioration des performances entre le MPEG-2 et le MPEG-4 AVC s'accompagne d'une complexité accrue de conception des encodeurs. Afin de bénéficier des architectures de diffusion déjà déployées, l'encapsulation de flux vidéo MPEG-4 sur une couche transport (TS) MPEG-2 fut également spécifiée. Enfin, le groupe DVB a adapté ses recommandations dès la fin de l'année 2004, et en particulier la TS 101 154 [4], pour autoriser le lancement de chaînes de télévision en Europe (aussi bien en Standard Définition qu'en Haute Définition) utilisant le MPEG-4 AVC. 3. Les principes généraux de la compression vidéo Les codecs vidéo visent à minimiser toute redondance dans le signal initial et à optimiser la représentation de l'information (mesurée par l'entropie du signal). Les principaux types de redondances sont spatiaux, temporels, psychovisuels et statistiques. La redondance spatiale représente la corrélation entre des pixels voisins dans un arrière-plan uniforme par exemple. La redondance tem- porelle représente la corrélation entre différentes images successives, comme par exemple dans une scène statique sans mouvement de caméra. La redondance psychovi- suelle est le résultat des limitations de notre système per- ceptif : au-delà d'un certain degré d'excitation, ou sti- mulus, notre système n'est pas capable d'interpréter toute l'information qui lui parvient. Il est donc inutile de trans- mettre l'information en dessous de ce seuil, ou informa- tion « psychovisuellement redondante ». Les codecs uti- lisent aussi une propriété de notre oeil : il est beaucoup plus sensible à la précision des contours (information de luminance) qu'aux détails des couleurs (information de chrominance). L'information dédiée à la chrominance (couleur) est donc moins importante que celle liée à la luminance (contours). Enfin la redondance statistique représente la répétition d'éléments dans la séquence vidéo. Par une représentation plus compacte de ces élé- ments, le codage devient plus efficace. Les différents modules des codecs vidéo, et plus particulièrement ceux de MPEG-2 et MPEG-4 AVC ont été conçus pour réduire ces redondances. On retrouve dans ces deux codecs vidéo : . un module d'estimation et de compensation de mouvement par blocs, chargé d'exploiter la corré- lation temporelle et spatiale, . un module de transformation fréquentielle, chargé de traiter l'information dans un domaine plus fami- lier du traitement du signaL un module de quantification, qui permet d'intro- duire une perte mesurée d'information en utilisant les propriétés de notre système psychovisuel, un module de quantification inverse et de transformée inverse, associé à un module de filtrage dans le cas de MPEG-4 AVC qui permet de reconstruire l'ima- ge prédite. C'est cette image prédite qui va servir de base à l'estimation et la compensation de mou- vement, Images Video Estimat. Mvt -.- Compens. Mvt l Filtre : Transform Vecteurs Mouvement ï MC' m T -1 Quantif -jF Q Codee Codage Entropique T Syntaxe Elementary Stream Figure 2. Principe siiiiplifié d'tin codec MPEG. un module de codage statistique, ou entropique, visant à réduire la redondance résiduelle dans le flux binaire, enfin, un module d'écriture, formatant le flux binaire en suivant une syntaxe prédéterminée. 4. MPEG-2 versus MPEG-4, quelles différences ? 4.1. Estimation spatiale et compensation de mouvement Afin de réduire la redondance spatiale et temporelle, les algorithmes issus de MPEG découpent chaque image vidéo en blocs, établissent les corrélations entre blocs adjacents (prédiction intra image) et traquent et compensent le mouvement de ces blocs entre des images consécutives (prédiction inter images). Avec MPEG-2, le découpage de l'image est basé sur des blocs 16 x 16 ou 16 x 8 (appelés macroblocs). MPEG-4 AVC offre un plus grand éventail, REE HORS SÉRIE WI Septembre2005 L'optimisation actuelle des performances de la compression vidéo : le standard MPEG-4 16x16 16x8 8x16 8x8 8x8 8x4 4x8 4x4 Figtire 3. Différents types de iiiact-oblocs bitilisés par MPEG-4 AVC. avec des macroblocs 16 x 16, 8 x 16, 16 x 8, 8 x 8 ce dernier pouvant être divisé en blocs 8 x 4, 4 x 8 ou 4 x 4. Le nombre de prédicteurs spatiaux étant plus riche avec MPEG-4 AVC, les performances de la compression intra image sont améliorées. Mais la plus grande amélioration apportée par MPEG-4 AVC dans ce domaine réside dans sa compensation de mouvement étendue. Les codecs MPEG réduisent la redondance temporelle en recher- chant parmi la (ou les) image (s) adjacente (s), les blocs qui rassemblent le plus au au bloc de l'image courante. Après détermination de ces candidats, leur déplacement, ou vecteur de mouvement est stocké et l'image courante est « compensée en mouvement » par différence entre une ou plusieurs images de référence. Cette image com- pensée devient beaucoup plus facile à compacter que l'image d'origine. La précision des vecteurs de mouve- ment a été raffinée : de l'ordre du demi-pixel pour MPEG-2, elle est du quart de pixel pour MPEG-4. Cela contribue à une estimation plus fine. Non seulement MPEG-4 AVC propose plus de types de macroblocs et une plus grande précision des vecteurs de mouvement - augmentant ainsi les chances de trouver des paires similaires - mais il étend et généralise la notion d'images P (Prédîtes) et B (Prédîtes Bidirectionnelles) existante dans MPEG-2. Avec MPEG-2 il existe principalement trois types d'images : . Images l, ou Intra, qui sont des images encodées comme des images JPEG. Elles peuvent être prises comme référence . Images P (Prédîtes) : différence entre image de référence (image précédente) et image courante . Images B (Bidirectionnelles) : différence entre images de référence (image précédente et image suivante) et image courante Les images 1. P, B existent aussi avec MPEG-4 AVC : elles portent le nom de slice l, slice P et slice B mais la limitation à une ou deux slices de référence a été ôtée : les slices P sont obtenues à partir d'une liste de plusieurs images dans le passé, et les slices B à partir de deux listes d'images dans le passé et le futur. Grâce à l'utilisation de multiples slices de référence, MPEG-4 a des résultats nettement supérieurs à MPEG-2 sur les mouvements de translation et lors de la présence d'occlusions. L'algorithme de compensation de MPEG-4 AVC est donc beaucoup plus riche que celui de MPEG-2, mais demande aussi des performances plus élevées pour les encodeurs. 4.2. Transformée Après compensation, prédiction et différences, les images Intra ou Inter (P et B) sont transformées dans le domaine fréquentiel. La transformée utilisée dans MPEG-2 est une DCT et son inverse sur des blocs de taille 8 x 8. Dans le cadre de MPEG-4 AVC, la DCT 8 x 8 a été remplacée par une transformée entière, sur bloc 4 x 4 Y PPBPP yr JP P,B. P P 1 2 3 6 4 5 7 MPEG-4AVC MPEG-2 Image referene (n) Ordrededécodage Figtire 4. 1, P, B slices et iiiiages de i-féreiice potir MPEG-2 et MPEG-4 AVC. REE HORSSÉRIENT Septembre2005 LA TECHNOLOGIE DE LA HAUTE DÉFINITION ou 8 x 8, présentant les mêmes caractéristiques que la DCT. Ce changement procure plusieurs avantages : . en réduisant la taille de bloc, les artefacts de « ringing » et de « blocking » sont amoindris . la transformée entière est plus simple à calculer . enfin, cette transformée et son inverse sont exacts, grâce à l'utilisation de coefficients entiers. Ce n'est pas le cas de la DCT qui utilise des coeffi- cients réels : une série de DCT et IDCT introduit des erreurs d'approximation de plus en plus grandes, conduisant à une dégradation de l'image, 4.3. Quantification de l'image et représentation de la luminance et de la chrominance. La séquence vidéo analogique est tout d'abord échan- tillonnée pour en donner une représentation numérique. Chaque pixel originellement représenté avec trois composantes RGB est transformé dans un espace de couleur mieux approprié pour le codage. Les encodeurs MPEG utilisent préférentiellement l'espace Y, Cr, Cb (luminan- ce et deux composantes de chrominance) codé sur 8 bits. L'ceil étant plus sensible aux détails de luminance que ceux de chrominance, les composantes Cr et Cb sont généralement sous échantillonnées horizontalement et verticalement. Le mode de représentation le plus courant pour MPEG-2 et MPEG-4 est le 4 :2:0 (pour quatre échantillons Y, un échantillon Cr et un échantillon Cb). Pour des applications requérant une plus haute qualité, MPEG-2 et MPEG-4 ont un mode 4 :2:2, avec deux fois plus d'échantillons de chroma. Enfin MPEG-4 AVC offre un mode 4:4:4, respectant la résolution native (chaque pixel est représenté avec ses trois composantes non échantillonnées). L'échantillonnage est aussi étendu à 10 bits au lieu de 8, et différents espaces de couleurs ont été ajoutés. Tout cela contribue à une restitution de plus haute fidélité de l'image pour des applications exi- geantes en qualité. 4.4. Quantification des coefficients de la transformée Les coefficients issus de la DCT ou de la transformée entière sont ensuite quantifiés en suivant des tables de quantification prédéfinies pour chaque codec afin d'extraire l'information la plus importante pour notre système visuel. De manière générale, notre oeil est moins sensible aux hautes fréquences qui sont par conséquent éliminées lors du processus de quantification. Le contrôle de ce niveau de quantification est crucial et responsable en grande partie de l'efficacité d'un codec : les algo- rithmes proposés pour MPEG-4 AVC, basés sur l'optimi- sation débit/distorsion sont supérieurs à ceux utilisés pour MPEG-2. 4.5. Codage entropique Le codage entropique a pour but de réduire la redondance résiduelle dans le flux binaire. Les coefficients quantifiés, représentésjusqu'alors sous forme de matrice 4 x 4 ou 8 x 8, sont mis bout à bout en suivant un ordre prédéterminé (zigzag) qui privilégie les coefficients les plus importants en début de chaîne et les coefficients potentiellement de moindre importance en fin de chaîne. Après cette opération, la série de coefficients est représentée avec des codes de longueur variable (VLC). Dans le cas de MPEG-2, ces codes sont déterminés à l'avance et contenus dans des tables de correspondance. Dans le cas de MPEG-4 AVC, deux types de codage peuvent être utilisés : 'CAVLC (Context Adaptive VLC) : les tables de VLC peuvent être changées dynamiquement en fonction des valeurs rencontrées précédemment. Cet algorithme est une amélioration par rapport au VLC existant dans MPEG-2 . CABAC (Context Adaptive Binary Arithmetic Coding) : codage arithmétique avec adaptation en fonction du contexte. Cet algorithme est statisti- quement le plus efficace, puisque pour chaque symbole rencontré, l'algorithme calcule la meilleure représentation possible du symbole en fonction de sa fréquence d'apparition dans un contexte donné. Il est ainsi possible dans certains cas d'encoder un symbole sur moins d'un bit ! 4.6. Filtrage Une fois l'image courante compensée en mouvement, transformée et quantifiée, elle subit les transformations inverses pour reconstruire l'image de référence qui va être utilisée pour l'encodage des images suivantes. Comme le processus de quantification est un processus avec perte d'information, l'image reconstruite présente des artefacts : blocking, ringing etc. Avec MPEG-2, ces artefacts sont présents dans l'image reconstruite et sont donc propagés sur les images suivantes. MPEG-4 AVC atténue ce problème en appliquant un filtre de deblocking sur l'image reconstruite. Ceci contribue grandement à sup- primer les effets de blocs, particulièrement reconnaissables avec MPEG-2 et déplaisants à l'oeil. L'introduction de ce filtre est responsable d'une grande partie de l'amélioration subjective de la qualité de la vidéo. 4.7. Outils syntactiques Outre les outils présents dans MPEG-4 AVC pour obtenir une compression plus poussée que MPEG-2, MPEG-4 AVC présente aussi un certains nombre d'amé- liorations syntactiques permettant l'ajout de nouvelles fonctionnalités, particulièrement dans le domaine de la correction des erreurs et de la hiérarchisation de l'informa- tion contenue dans la vidéo. Nous citons ici quelques exemples : découpage des images vidéo en « slices », permettant une reconstruction partielle plus facile si l'infor- mation liée à une slice est perdue REE HORSSÉRIENûl Septembre2005 L'optimisation actuelle des performances de la compression vidéo : le standard MPEG-4 Outils MPEG-2 AVC Baseline AVCExtended AVCMain AVCHigh Slices J J J J Taille de blocs 16xl6, 16xl6 16XI6 16XI6 l6xl6 16x8 à 4x4 à 4x4 à 4x4 à 4x4 I, P J J J J J1, p Slices SI, SP B Mode entrelacé Transformée 8x8 DCT 4x4 Entière 4x4 Entière 4x4 Entière 4x4, 8x8Entière Filtre J J J J VLC CAVLC CABAC Correction d'erreurs 4:2: 4:2:2 4 : 4 : 4 Tableabi 7. Les profils de MPEG-4 partie 10 par rapport à l'algorithiiie MPEG-2. 4.1 i 4.0 :34.1 4. 0 4 3.8 3.65 a. 7i 3.4 3.3 ....- .:...-. "':).,..., ' :'.0 " 65 ... l v.4 7 4'm,,C High ttFE<-- 4.>'iC Hiq h tvIFE.e- 4 H l h Hillh o rif l in.31 e 2 2 4#ut> pc. py t-f i -, o rijt prz F'fcifile. 12tiltpc. FY rf le, lif, ttitip-. Pr i.f ik--, 20tutps ulih 1 : Figtire 5. Etude de l'efficacité de MPEG-4 AVC pai- rapport à MPEG-2, réalisée par la Bll (-ra, Disc Associatioli. 9 redondance de slices, utile sur des canaux avec perte d'information De plus MPEG-4 AVC introduit la notion de slice « S » (Switch slice) pour les slices de type 1 ou P. Dans le cas d'un encodage multirate, les slices S permettent une meilleure transition d'un flux MPEG-4 à l'autre, en encodant des slices combinant l'information des deux flux. 4.8. Les profils de MPEG-4 II existe quatre principales catégories de « profils » dans MPEG-4 AVC : . Baseline : destiné à des applications bas débits sur canal bruité (vidéo conférence, vidéo sur portables etc.) . Extended : destiné à des applications plus avancées de streaming vidéo sur transport de type IP (déco- dage vidéo multi-débit sur PC) . Main : destiné à des applications pour la télévision en Définition Standard et Haute Définition (Télévision numérique) a Hierh : destiné à des applications pour la télévision c de haute fidélité, ou pour de l'archivage (Télévision numérique Haute Définition, HD- DVD, contribution et archivage). Les différents outils offerts dans chacun de ces profils sont résumés dans le tableau 1. Dans le cas de la télévision numérique en Europe, le consortium DVB a sélectionné le Main profil pour la Définition Standard et le High profil pour la Haute Définition [4]. Les améliorations algorithmiques apportées par MPEG-4 AVC permettent d'obtenir un gain en qualité significatif par rapport aux solutions de codage MPEG-2. Les tests subjectifs (voir figure 5) montrent que MPEG-4 peut fournir une qualité visuelle équivalente aux solutions actuelles à un débit deux fois plus faible, voire trois fois plus faible pour la Haute Définition ! REE HORSSÉRIENol Septembre2005 LA TECHNOLOGIE DE LA HAUTE DÉFINITION Débit SD Débit HD Nombre de programmes SD Nombre de programmes HD moyen moyen pour un débit de 20 Mbps pour un débit de 20 Mbps MPEG-2 4 Mbits/s 18 Mbits/s 5 1 MPEG-4 2 Mbits/s 9 Mbits/s 10 2 Tableau 2. Comparaison des débits nécessai.res par programiiie en Standard Définition et en Haitte Définition, et coiiséqbletlces pour un intiltiplex ayant iine capacité de 20Mbps (cas approxii7iatf d'iiii nililtiplex sur tiii éseati terrestre). Multiplex :.g : e stititiqtie I\11,E (T-2 '-----/" 1 MipÏxe zti. ti : ti (Ille ID 'IPEG-2 HD MPECc-4 lA t Multiplexe sthshqucti J\1I'EG-2 l1-PE (-J-4 SD MPEG-2 HD MPEG-4 1 , Poolç (l codtale iii (lé-peitdilits Pools de coda_e nnstes Figure 6. Illustration des deux approches pour le nitiltiplexage statistique de flux MPEG-2 et MPEG-4. 5. Standard de compression et migration vers la Haute Définition. Dans un monde parfait, le choix du standard MPEG-4 AVC comme algorithme de compression pour la télévision numérique dans son ensemble ne souffrirait aucune discussion au regard de ses performances, mais dans la réalité il n'est pas possible de faire fi du passé et de son parc installé. Tant que les récepteurs compatibles avec la Haute Définition ne sont pas présents chez une forte proportion de téléspectateurs, l'offre en Définition Standard restera la référence pour l'ensemble des programmes. Mais il est nécessaire de développer une offre Haute Définition nouvelle suffisamment alléchante pour inciter les « early adopters » ou « technophiles » à franchir le pas et à s'équiper en récepteurs adaptés tout en souscrivant à des offres de contenus Haute Définition, le plus souvent payantes. Le passage de la télévision standard à la Haute Définition ne se fera donc pas de façon brutale, mais impliquera la cohabitation des deux formats sur un même réseau de diffusion ou une même chaîne. Cela est déjà le cas dans d'autres pays où la télévision Haute Définition est présente (USA et Japon) et où des multiplexes de pro- grammes voient des formats Standard et Haute Définition cohabiter. Les discussions qui ont accompagné la mise en place de la télévision numérique terrestre en France nous rappellent également que la problématique SD/HD est indissociable d'un questionnement sur la technique de compression utilisée pour les réseaux contraints en débit comme les réseaux de diffusion terrestre. L'introduction du standard MPEG-4 et/ou la migra- tion vers la Haute Définition peut donc s'effectuer de dif- férentes façons suivant le type de réseau et les services qui y sont déjà disponibles. A titre d'exemple, pour une capacité du multiplex de 20 Mbits/s et en s'appuyant sur les performances moyennes des algorithmes résumées dans le tableau 2, citons pour le cas idéal d'un nouveau réseau quelques alternatives possibles : . lancement de 2 chaînes HD en MPEG-4 ou . lancement de 10 chaînes SD en MPEG-4 ou . lancement de 3 chaînes gratuites SD en MPEG-2 et de 4 chaînes payantes SD en MPEG-4 . lancement de 2 chaînes gratuites SD en MPEG-2, de 1 chaîne payante SD en MPEG-4 et d'une chaîne payante HD en MPEG-4. Le dernier cas proposé met en évidence une possibilité technique supplémentaire puisqu'il permet pour la chaîne diffusée normalement en Haute Définition de pouvoir, à un certain moment de la journée, être diffusée en Définition Standard et en MPEG-2 afin d'être reçue par des décodeurs vendus pour recevoir les chaînes gratuites, REE HORSSÉRIE WI Septembre2005 L'optimisation actuelle des performances de la compression vidéo : le standard MPEG-4 ceci dans un but évident de promotion. Il apparaît également une complexité supplémentaire au niveau des mécanismes de multiplexage statistique pour faire cohabiter des programmes codés en MPEG-2 et en MPEG-4, ainsi que des programmes en Définition Standard et en Haute Définition. D'un point de vue de la standardisation, la flexibilité requise pour traiter ces différents cas a été prévue dans la signalisation DVB [7]. Au niveau de la réalisation pratique des multiplexeurs statistiques, deux solutions sont envisageables pour permettre cette cohabi- tation : réaliser des pools de codage statistique indépen- dants dans un même multiplex pour le codage MPEG-2 et le codage MPEG-4 ou bien réaliser simultanément le multiplexage statistique des deux types de programmes (MPEG-2 et MPEG-4). Ces deux solutions sont illustrées à la figure 5. 6. Conclusion L'algorithme de compression MPEG-4 AVC est aujourd'hui complètement standardisé en Europe. L'amélioration des performances de compression par rapport à la génération précédente (MPEG-2) s'explique par l'optimisation des différentes étapes de l'algorithme que sont principalement l'estimation spatiale, la compen- sation de mouvement, la transformée fréquentielle, l'optimisation débit versus distorsion et le codage arith- métique. Les premiers produits professionnels (encodeurs temps réel, multiplexeurs statistiques) et grand public (décodeurs) apparaissent déjà sur le marché, ouvrant la voie au lancement de la Haute Définition en Europe. Références [1] ! SO/ ! EC 13818-1 :2000 « Information technology -- Generic coding of moving pictures and associated audio informa- tion. Systems ». [2] ISO/IEC 13818-2 :2000 Il Information technology -- Generic coding of moving pictures and associated audio information : Video p. [31 JSO/l EC 1381 8-32000 Information technology -- Generic coding of moving pictures and associated audio information. Audio u [4] ETSI TS 101 154 « Implementation guidelines for the use of Video and Audio Coding in Broadcasting Applications based on the MPEG-2 Transport Stream)) [5] ETSI EN 300 744 ( Framing structure, channel coding and modulation for digital terrestrial television ». f6l ETSI EN 302 307 « Second generation framing structure, channel coding and modulation systems for Broadcasting, Interactive Services, News Gathering and other broadband satellite applications ». [7] ETSI EN 300 468 « Specification for Service Information (Sll in DVB systems n. [8] ISO/IEC 14496-1 O2004 " Information technology - Coding of audio-visual objects -- Part 10 : Advanced Video Coding ". tB EEj e u r 5 li 1-1 1 11 à Boris Felts est directeur du développe- ment produits à Envivio. Envivio est une des toutes premières compagnies à avoir créé et déployé des solutions basées sur MPEG-4. Avant de rejoindre Envivio, Boris Felts était chercheur aux Laboratoires de recherche Philips à Limeil-Brévannes, tra- vaillant sur un algorithme de compression basé sur la décomposition en ondelettes et le codage arithmé- tique. Il a obtenu deux diplômes d'ingénieur de l'Ecole Polytechnique à Palaiseau et de l'École National e Supérieure des Télécommunications à Paris. Gérard Mozelle est titulaire d'un doctorat de mathématiques et d'informatique de l'Université Paris V (René Descartes) et ingénieur diplômé de !'Éco ! e Supérfeure d'Électricité (SUPELEC). Après avoir été professeur invité à l'Universdé Texas A&M, il rejoint le centre de recherche fran- çais de Canon, où il participe à la définition du standard de compression JPEG-2000, avant de rejoindre le groupe Thomson, où il est actuellement affecté au Cabinet du Directeur technique, en charge du suivi de comités de standar- disation (parmi lesquels les travaux de l'EICTA et du groupe DVB) et du suivi d'une partie des activités de R&D du groupe. Nivedita Nouvel a rejoint Thales en 2003 en tant qu'ingénieur marketing sur les offres multimédias développées par la société. Elle a auparavant exercé des fonc- tions d'ingénieur d'études dans le domaine de la télévision numérique sur les normes DVB, MHP. MPEG2/4 notamment. Elle est diplômée de l'École Nationale Supérieures des Télécommunications de Bretagne et détient un Master Of Science in Spacecraft Technonogies & Satellite Communications de l'Université College London. Eric Le Bars est Responsable Technique Produit Broadcast chez Thales. II a débuté sa carrière en 1990 chez Matra Communication dans le développement d'applications pour la télévision basées sur la norme D2-Mac. Il a ensuite été en charge des produits d'analyses temps réel dans le monde de la télévision numérique au format MPEG-2/DVB jusqu'en 2000. Depuis 2000, il est en charge des produits et systèmes Broadcast chez Thales. II est diplômé de l'IFSIC à Rennes. Il est également l'auteur des brevets « Commutation de programme Audio-Vidéo dans le domaine com- pressé » et « Re-synchronisation de composantes audiovisuelles à l'image près dans le domaine compressé. » ÿ.;y.;kcs? A REE HORS SERIENT Septembre2005