L'optimisation actuelle des performances de la compression vidéo : le standard MPEG 14

01/09/2017
Publication REE REE 2006-3
OAI : oai:www.see.asso.fr:1301:2006-3:19743
DOI :

Résumé

L'optimisation actuelle des performances de la compression vidéo : le standard MPEG 14

Métriques

23
4
2.57 Mo
 application/pdf
bitcache://3a4c74e1d8b39700dfd2c74f760d81ab58aca229

Licence

Creative Commons Aucune (Tous droits réservés)
<resource  xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
                xmlns="http://datacite.org/schema/kernel-4"
                xsi:schemaLocation="http://datacite.org/schema/kernel-4 http://schema.datacite.org/meta/kernel-4/metadata.xsd">
        <identifier identifierType="DOI">10.23723/1301:2006-3/19743</identifier><creators><creator><creatorName>Boris Felts</creatorName></creator><creator><creatorName>Gérard Mozelle</creatorName></creator><creator><creatorName>Nivedita Nouvel</creatorName></creator><creator><creatorName>Eric Le Bars</creatorName></creator></creators><titles>
            <title>L'optimisation actuelle des performances de la compression vidéo : le standard MPEG 14</title></titles>
        <publisher>SEE</publisher>
        <publicationYear>2017</publicationYear>
        <resourceType resourceTypeGeneral="Text">Text</resourceType><dates>
	    <date dateType="Created">Fri 1 Sep 2017</date>
	    <date dateType="Updated">Fri 1 Sep 2017</date>
            <date dateType="Submitted">Fri 17 Aug 2018</date>
	</dates>
        <alternateIdentifiers>
	    <alternateIdentifier alternateIdentifierType="bitstream">3a4c74e1d8b39700dfd2c74f760d81ab58aca229</alternateIdentifier>
	</alternateIdentifiers>
        <formats>
	    <format>application/pdf</format>
	</formats>
	<version>33517</version>
        <descriptions>
            <description descriptionType="Abstract"></description>
        </descriptions>
    </resource>
.

Repères 1 LA TELEVISION NUMERIQUE m m L'optimisation actuelle des performances de la compres- m sion vidéo : le standard MPEG 14 BorisFELTS',GérardMOZELLE 1, Nived'Ita NOUVEL 1, ErcLEBARS 1 Envivlo', Thomson, Thales 1 LU MPEG-2, MPEG-4, Macrobloc, Slice, CABAC, CAVLC, Multiplexage statistique Les discussions qui ont accompagné la mise en place de la télévision numérique terrestre en France ont mis en lumière l'importance du choix de la norme de com-umièreterrestre en France ont mis en lumière l'importance du choix de la norme de com- pression vidéo. Au-delà des aspects économiques, quelles sont les différences techniques entre le MPEG-2 et le MPEG-4 et comment expliquent-elles les écarts de performances entre ces deux standards ? 1. Introduction La compressionapour objectif d'identifier et d'éliminer les redondancesdans un signal vidéo afin de représenter de manière minimale l'information visuelle et d'assurer un transport optimal de l'information. Les principes fondamentaux de la compression sont basés sur l'étude du traitement du signal vidéo et du systèmepsychovisuel humain. On considère en général deux classesd'algorith- mes de compression (aussi appelés « codecs ») : . Les algorithmes de compression sans perte, où l'information est conservée intégralement mais représentée de manière optimale (par exemple, pour le stockaged'images médicales. . Les algorithmes de compression avec perte, où une partie de l'information originelle est perdue tout en essayantde préserver au maximum l'infor- mation pour laquelle notre système psychovisuel est le plus sensible. Ce sont ces algorithmes qui sont les plus répandus dans les appareils grand public et avec lesquels nous sommes en contact quotidiennement : DVD, téléphones portables, cameras, décodeurs de télévision numérique, décodeurs vidéo sur PC etc. Dans cet article, nous nous intéressons uniquement aux algorithmes standardisésde compression avec perte. Après avoir présenté la genèseet l'évolution des perfor- mances des algorithmes de compression (MPEG-2 et MPEG-4) développés par le groupe d'experts MPEG, nous exposons brièvement les principes génériques de compression utilisés par ces deux codecs,avant de poin- ter les différences à l'origine de leurs écarts de perfor- mances. Enfin, nous présentons quelques scénarios de migration ou de cohabitation de ces deux algorithmes de compression en prenant en compte la variable supplé- mentaire que représente le choix entre Définition Standard et Haute Définition. 2. L'évolution des codecs vidéo standardisés Le groupe d'experts MPEG a développé, sousles aus- pices de l'ISO (International Standard Organisation) et de l'IEC (International Electrotechnical Commission), le ESSENTIEL SYNOPSIS Aprèsavoirprésentélagenèseet l'évolutiondesperformances desalgorithmesde compression(MPEG-2et MPEG-4)dévelop- pésparle grouped'expertsMPEG,nousexposonsbrièvement les principesgénériquesde compressionutiliséspar ces deux «codecs avantde pointerlesdifférencesà l'originede leurs écartsdeperformances.Enfin,nousprésentonsquelquesscéna- riosdemigrationoudecohabitationdecesdeuxalgorithmesde compressionen prenanten comptela variablesupplémentaire que représentele choixentre DéfinitionStandardet Haute Définition. Afterashortpresentationofthegenesisofthelossycompression algorithms(MPEG-2and MPEG-4)developedby the experts' groupof MPEG,we brieflyexposethegenericprinciplesofcom- pressionusedbythesetwo « codecs »,beforeunderliningtheirdif- ferencesbothin termsof technicalfeaturesandperformances. Finally,wepresentsomescenariosof migrationorcohabitationof thesetwo algorithmstakingintoaccountthe additional possible choicebetweenStandardDefinition(SD)andHighDefinition(HD). 92 REE No 3 Mars2006 L'optimisation actuelle des performances de la compression vidéo : le standard MPEG-4 CI) ro n : tJ)o c 0 o- - ro :J 'ro - 'B 'CI) o \. Performance de l'algorithme ! compiexttéPerformance de l'algorithme omple E>G-2 e "MPEG-....... - pMPEG ri - -tYIPCG-4ptâit - --.....".,--.. "!;8..........-....-............,. " ", ".... ".'"....... " " 0"' "..... Première împlémentatlon tempsréelcommerciale H264IMPEG-4AVC---- ""-------r----- --,-----r------r---,-----,---- 1 -l Reproduitavec l'aimable autorisationdeKenMcCann,DVB-AVC chairman Figure 1. Présentation synthétique de l'évolution des peiforinances et de la coiiiplexité deà- algoi-ithnies de compression MPEG-2, MPEG-4 partie 2 et MPEG-4 A VC. standard de compression de flux audiovisuels le plus uti- lisé au monde. Baptisé MPEG-2, ce standard se décline en de nombreuses parties dont les plus importantes sont : I'ISO/IEC 13818-1 [1] qui spécifie la couche trans- port TS (Transport Stream) ; . l'ISO/lEC 13818-2 [2] qui définit la façon dont sont compressées les composantes vidéo des contenus ; . I'ISO/IEC 13818-3 [3] qui décrit comment sont compressées les composantes sonores. La philosophie adoptée par le groupe MPEG consiste à privilégier l'interopérabilité des contenus en définissant précisément la syntaxe et l'algorithme de décodage sans imposer de contraintes sur la façon dont un encodeur doit opérer. De cette façon, on évite l'obsolescence des parcs installés de décodeurs sans entraver l'optimisation des per- formances des encodeurs. La figure 1 illustre de façon sché- matique la pertinence de cette approche dans le cas de l'al- gorithme MPEG-2 pour lequel les performances à qualité visuelle égale ont énormément évolué entre l'apparition des premiers encodeurs temps réel et ceux de la génération actuelle. Grâce à un accord de collaboration entre MPEG et l'ITU (International Telecommunication Union), le stan- dard MPEG-2 a aussi été publié par cet organisme sous la référence générique ITU-T H.262. Le standard MPEG-2 ayant été conçu pour pouvoir sup- porter l'ensemble des applications utilisant des flux audio- visuels, il ne traite pas des spécificités relatives à un domaine particulier. De ce fait, les standards MPEG ont été repris et utilisés par le consortium DVB (Digital Video Broadcasting) comme fondation de l'ensemble des stan- dards nécessaires au succès de la télévision numérique européenne. Outre des recommandations sur le codage de la vidéo et des composantes sonores (ETSI TS 101 154 [4]), le groupe DVB a aussi spécifié des standards de diffusion (EN 300 744 [5], EN 302 307 [6],...), de signalisation (EN 300 468 [71) et diverses autres « Guidelines ». C'est sur la base de ces standards DVB que s'est réalisée en défi- nition standard la numérisation de la télévision européenne. Fort du succès de l'algorithme MPEG-2, le groupe MPEG a poursuivi ses efforts en développant l'environne- ment MPEG-4. Ce dernier devait améliorer les performances de son prédécesseur tout en augmentant les fonctionnalités offertes aux utilisateurs en particulier dans le domaine du multimédia. Ainsi, l'environnement MPEG-4 permet par exemple la manipulation d'objets (synthétiques ou pas) et de scènes. Dans le domaine de la compression vidéo, cet effort a produit l'algorithme MPEG-4 partie 2 dont les performances, bien que supérieures de 10 à 20 % à MPEG-2 (comme illustré à la figure 1), ne justifie pas son utilisation dans le monde de la télédiffusion conven- tionnelle où toute évolution technique doit être jaugée par rapport à son impact sur le parc installé. De son côté, l'ITU a développé successivement la famille de standards H263, H263+ puis H26L en octobre 1999. L'amélioration des performances apportées par le H26L par rapport au MPEG-2 était telle (de l'ordre potentiellement de 50 %) que MPEG et l'ITU joignirent de nouveau leur force pour créer le groupe de travail JVT (Joint Video Team) chargé de définir une version améliorée de H26L qui s'inscrit complètement dans l'environnement MPEG. Le groupe JVT termina en mai 2003, la définition du standards ISO/IEC 14496-10 (MPEG-4 partie 10) Advanced Video Coding (AVC) ou ITU-T H264 [8]. C'est de ce standard qu'il s'agit lorsqu'on fait référence aux performances de l'algorithme MPEG-4 sans autre précision. On estime REE Nc 3 Mars2006 Repères 1 LA TELEVISION NUMERiQUE aujourd'hui que les premiers encodeurs professionnels temps réel MPEG-4 AVC permettront une amélioration des performances de compression de l'ordre de 30 %. La seconde génération d'encodeurs devrait diviser par 2 le débit nécessaire à qualité visuelle égale (voir figure 1). Bien sûr, cette amélioration des performances entre le MPEG-2 et le MPEG-4 AVC s'accompagne d'une complexité accrue de conception des encodeurs. Afin de bénéficier des architectures de diffusion déjà déployées, l'encapsulation de flux vidéo MPEG-4 sur une couche transport (TS) MPEG-2 fut également spécifiée. Enfin, le groupe DVB a adapté ses recommandations dès la fin de l'année 2004, et en particulier la TS 101 154 [4], pour autoriser le lancement de chaînes de télévision en Europe (aussi bien en Standard Définition qu'en Haute Définition) utilisant le MPEG-4 AVC. 3. Les principes généraüx de la cûmpressiûn vidéo Les codecs vidéo visent à minimiser toute redondance dans le signal initial et à optimiser la représentation de l'information (mesurée par l'entropie du signal). Les principaux types de redondances sont spatiaux, temporels, psychovisuels et statistiques. La redondance spatiale représente la corrélation entre des pixels voisins dans un arrière-plan uniforme par exemple. La redondance tem- porelle représente la corrélation entre différentes images successives, comme par exemple dans une scène statique sans mouvement de caméra. La redondance psychovi- suelle est le résultat des limitations de notre système per- ceptif : au-delà d'un certain degré d'excitation, ou sti- mulus, notre système n'est pas capable d'interpréter toute l'information qui lui parvient. Il est donc inutile de trans- mettre l'information en dessous de ce seuil, ou informa- tion « psychovisuellement redondante ». Les codccs uti- lisent aussi une propriété de notre oeil : il est beaucoup plus sensible à la précision des contours (information de luminance) qu'aux détails des couleurs (information de chrominance). L'information dédiée à la chrominance (couleur) est donc moins importante que celle liée à la luminance (contours). Enfin la redondance statistique représente la répétition d'éléments dans la séquence vidéo. Par une représentation plus compacte de ces élé- ments, le codage devient plus efficace. Les différents modules des codecs vidéo, et plus particulièrement ceux de MPEG-2 et MPEG-4 AVC ont été conçus pour réduire ces redondances. On retrouve dans ces deux codecs vidéo : . un modulc d'estimation et de compensation de mouvement par blocs, chargé d'exploiter la corré- lation temporelle et spatiale, . un module de transformation fréquentielle, chargé de traiter l'information dans un domaine plus fami- lier du traitement du sip-nal, un module de quantification, qui permet d'intro- duire une perte mesurée d'information en utilisant les propriétés de notre système psychovisuel, un module de quantification inverse et de transformée inverse, associé à un module de filtrage dans le cas de MPEG-4 AVC qui permet de reconstruire l'image prédite. C'est cette image prédite qui va servir de base à l'estimation et la compensation de mouvement, Images Video Estimat. Mvt Compens. iVivi f Filtre " Transform Vecteurs Mouvement ï Mc MC Quantif T 1 -i Q 1 Codee Codage Entropique T Syntaxe Elernentary Stream Figure 2. Principe simplifié d'un codec MPEG, . un module de codage statistique, ou entropique, visant à réduire la redondance résiduelle dans le flux binaire, . enfin, un module d'écriture, formatant le flux binaire en suivant une syntaxe prédéterminée. 4. MPEG-2 versus MPEG-4, quelles différences ? 4.1. Estimation spatiale et compensation de mouvement Afin de réduire la redondance spatiale et temporelle, les algorithmes issus de MPEG découpent chaque image vidéo en blocs, établissent les corrélations entre blocs adjacents (prédiction intra image) et traquent et compensent le mouvement de ces blocs entre des images consécutives (prédiction inter images). Avec MPEG-2, le découpage de l'image est basé sur des blocs 16 x 16 ou 16 x 8 (appelés macroblocs). MPEG-4 AVC offre un plus grand éventail, REE No 3 Mars2006 L'optimisation actuelle des performances de la compression vidéo : le standard MPEG-4 16xl6 16x8 8xl6 8x8 8x8 8x4 4x8 4x4 Figitre 3. Différents t) pes de ; iiacroblocs iiiiliséspai-MPEG-4 A VC. avec des macroblocs 16 x 16, 8 x 16, 16 x 8, 8 x 8 ce dernier pouvant être divisé en blocs 8 x 4, 4 x 8 ou 4 x 4. Le nombre de prédicteurs spatiaux étant plus riche avec MPEG-4 AVC, les performances de la compression intra image sont améliorées. Mais la plus grande amélioration apportée par MPEG-4 AVC dans ce domaine réside dans sa compensation de mouvement étendue. Les code cs MPEG réduisent la redondance temporelle en recher- chant parmi la (ou les) image (s) adjacente (s), les blocs qui rassemblent le plus au bloc de l'image courante. Après détermination de ces candidats, leur déplacement, ou vecteur de mouvement est stocké et l'image courante est « compensée en mouvement » par différence entre une ou plusieurs images de référence. Cette image com- pensée devient beaucoup plus facile à compacter que l'image d'origine. La précision des vecteurs de mouve- ment a été raffinée : de l'ordre du demi-pixel pour MPEG-2, elle est du quart de pixel pour MPEG-4. Cela contribue à une estimation plus fine. Non seulement MPEG-4 AVC propose plus de types de macroblocs et une plus grande précision des vecteurs de mouvement - augmentant ainsi les chances de trouver des paires similaires - mais il étend et généralise la notion d'images P (Prédîtes) et B (Prédîtes Bidirectionnelles) existante dans MPEG-2. Avec MPEG-2 il existe principalement trois types d'images : . Images l, ou Intra, qui sont des images encodées comme des images JPEG. Elles peuvent être prises comme référence . Images P (Prédîtes) : différence entre image de référence (image précédente) et image courante . Images B (Bidirectionnelles) : différence entre images de référence (image précédente et image suivante) et image courante Les images 1. P, B existent aussi avec MPEG-4 AVC : elles portent le nom de slice l, slice P et slice B mais la limitation à une ou deux slices de référence a été ôtée : les slices P sont obtenues à partir d'une liste de plusieurs images dans le passé, et les slices B à partir de deux lis- tes d'images dans le passé et le futur. Grâce à l'utilisation de multiples slices de référence, MPEG-4 a des résultats nettement supérieurs à MPEG-2 sur les mouvements de translation et lors de la présence d'occlusions. L'algorithme de compensation de MPEG-4 AVC est donc beaucoup plus riche que celui de MPEG-2, mais demande aussi des performances plus élevées pour les encodeurs. 4.2. Transformée Après compensation, prédiction et différences, les images Intra ou Inter (P et B) sont transformées dans le domaine fréquentiel. La transformée utilisée dans MPEG-2 est une DCT et son inverse sur des blocs de taille 8 x 8. Dans le cadre de MPEG-4 AVC, la DCT 8 x 8 a été remplacée par une transformée entière, sur bloc 4 x 4 .Tl clp p MPEG-4AVC 11 P P B P PI P P B P P f` MPEG-2 linage referencée (n) Ordredeclécodage Figure 4. 1, P B slices et images de référence pour MPEG-2 et MPEG-4 AVC. REE N 3 Mars2006 Repères 1 LA TELEVISION NUMERIQUE ou 8 x 8, présentant les mêmes caractéristiques que la DCT. Ce changement procure plusieurs avantages : . en réduisant la taille de bloc, les artefacts de « ringing » et de « blocking » sont amoindris . la transformée entière est plus simple à calculer . enfin, cette transformée et son inverse sont exacts, grâce à l'utilisation de coefficients entiers. Ce n'est pas le cas de la DCT qui utilise des coeffi- cients réels : une série de DCT et IDCT introduit des erreurs d'approximation de plus en plus gran- des, conduisant à une dégradation de l'image. 4.3. Quantification de l'image et représentation de la luminance et de la chrominance. La séquence vidéo analogique est tout d'abord échan- tillonnée pour en donner une représentation numérique. Chaque pixel originellement représenté avec trois composantes RGB est transformé dans un espace de couleur mieux approprié pour le codage. Les encodeurs MPEG utilisent préférentiellement l'espace Y, Cr, Cb (luminance et deux composantes de chrominance) codé sur 8 bits. L'ceil étant plus sensible aux détails de luminance que ceux de chrominance, les composantes Cr et Cb sont généralement sous échantillonnées horizontalement et verticalement. Le mode de représentation le plus courant pour MPEG-2 et MPEG-4 est le 4 :2:0 (pour quatre échantillons Y, un échantillon Cr et un échantillon Cb). Pour des applications requérant une plus haute qualité, MPEG-2 et MPEG-4 ont un mode 4 :2:2, avec deux fois plus d'échantillons de chroma. Enfin MPEG-4 AVC offre un mode 4 :4 :4, respectant la résolution native (chaque pixel est représenté avec ses trois composantes non échantillonnées). L'échantillonnage est aussi étendu à 10 bits au lieu de 8, et différents espaces de couleurs ont été ajoutés. Tout cela contribue à une restitution de plus haute fidélité de l'image pour des applications exigean- tes en qualité. 4.4. Quantification des coefficients de la transformée Les coefficients issus de la DCT ou de la transformée entière sont ensuite quantifiés en suivant des tables de quantification prédéfinies pour chaque codec afin d'extraire l'information la plus importante pour notre système visuel. De manière générale, notre oeil est moins sensible aux hautes fréquences qui sont par conséquent éliminées lors du processus de quantification. Le contrôle de ce niveau de quantification est crucial et responsable en grande partie de l'efficacité d'un codec : les algorith- mes proposés pour MPEG-4 AVC, basés sur l'optimisa- tion débit/distorsion sont supérieurs à ceux utilisés pour MPEG-2. 4.5. Codage entropique Le codage entropique a pour but de réduire la redondance résiduelle dans le flux binaire. Les coefficients quantifiés, représentés jusqu'alors sous forme de matrice 4 x 4 ou 8 x 8, sont mis bout à bout en suivant un ordre prédéterminé (zigzag) qui privilégie les coefficients les plus importants en début de chaîne et les coefficients potentiellement de moindre importance en fin de chaîne. Après cette opération, la série de coefficients est représentée avec des codes de longueur variable (VLC). Dans le cas de MPEG-2, ces codes sont déterminés à l'avance et contenus dans des tables de correspondance. Dans le cas de MPEG-4 AVC, deux types de codage peuvent être utilisés : . CAVLC (Context Adaptive VLC) : les tables de VLC peuvent être changées dynamiquement en fonction des valeurs rencontrées précédemment. Cet algorithme est une amélioration par rapport au VLC existant dans MPEG-2 . CABAC (Context Adaptive Binary Arithmetic Coding) : codage arithmétique avec adaptation en fonction du contexte. Cet algorithme est statisti- quement le plus efficace, puisque pour chaque symbole rencontré, l'algorithme calcule la meilleure représentation possible du symbole en fonction de sa fréquence d'apparition dans un contexte donné. Il est ainsi possible dans certains cas d'encoder un symbole sur moins d'un bit ! 4.6. Filtrage Une fois l'image courante compensée en mouvement, transformée et quantifiée, elle subit les transformations inverses pour reconstruire l'image de référence qui va être utilisée pour l'encodage des images suivantes. Comme le processus de quantification est un processus avec perte d'information, l'image reconstruite présente des artefacts : blocking, ringing etc. Avec MPEG-2, ces artefacts sont présents dans l'image reconstruite et sont donc propagés sur les images suivantes. MPEG-4 AVC atténue ce problème en appliquant un filtre de deblocking sur l'image reconstruite. Ceci contribue grandement à sup- primer les effets de blocs, particulièrement reconnaissables avec MPEG-2 et déplaisants à l'oeil. L'introduction de ce filtre est responsable d'une grande partie de l'amélioration subjective de la qualité de la vidéo. 4.7. Outils syntactiques Outre les outils présents dans MPEG-4 AVC pour obtenir une compression plus poussée que MPEG-2, MPEG-4 AVC présente aussi un certains nombre d'amé- liorations syntactiques permettant l'ajout de nouvelles fonctionnalités, particulièrement dans le domaine de la correction des erreurs et de la hiérarchisation de l'informa- tion contenue dans la vidéo. Nous citons ici quelques exemples : découpage des images vidéo en « slices », permettant une reconstruction partielle plus facile si l'infor- mation liée à une slice est perdue REE No 3 Mars2006 L'optimisation actuelle des performances de la compression vidéo : le standard MPEG-4 Outils MPEG-2 AVC Baseline AVCExtended AVCMain AVCHigh Slices V V V V Taille de blocs l6xl6, 16xl6 l6xl6 16xl6 l6xl6 -16x8 à 4x4 à 4x4 -à à 4x4 LP V V V V VStices S !,SP V Slices SI, SP v B v v v v Mode entrelacé Transformée 8x8 DCT 4x4 Entière 4x4 Entière 4x4 Entière 4x4, 8x8 EntièreTransformée 8x8 DCT 4x4 Entière 4x4 Entière 4x4 Entière 4x4, 8x8 Entière Filtre VLC VLC v CABAC Correction d'erreurs 4 : 2 : 0 CABAC V v 4 : 4 : 4 VI Tableau 1. Les prqfils de MPEG-4 partie 10 par rapport à l'algorithme MPEG-2. ,... 41 4 Q.). ;, - - (,.,-, .ti .5 .4 4 4. 3.65 1- 7-1 +9- ttjfBÏ 4., ", Higt tj'FE " * 4.e'...el- Hi, i 4.,*',..il-'H i i rif£ * 4 C : Hiqi 1 : i -.gf in.31r--.1. ? Fr #-If iP. : -- : ti,trc p r I : s f i 1 ril ti pc. FY -If 1 -, -1 Fi p - FY i-et ip-. *-1,1-ipit,P- - D'l- (H c. Figitt-e 5. Etitde de l'efficacité de MPEG-4 A VC pai- rapport à MPEG-2, réalisée par la Blu-ray Disc Association. 9 redondance de slices, utile sur des canaux avec perte d'information De plus MPEG-4 AVC introduit la notion de slice « S » (Switch slice) pour les slices de type r ou P. Dans le cas d'un encodage multirate, les slices S permettent une meilleure transition d'un flux MPEG-4 à l'autre, en encodant des slices combinant l'information des deux flux. 4.8. Les profils de MPEG-4 Il existe quatre principales catégories de « profils » dans MPEG-4 AVC : . Baseline : destiné à des applications bas débits sur canal bruité (vidéo conférence, vidéo sur portables etc.) . Extended : destiné à des applications plus avancées de streaming vidéo sur transport de type IP (déco- dage vidéo multi-débit sur PC) . Main : destiné à des applications pour la télévision en Définition Standard et Haute Définition (Télévision numérique) * High : destiné à des applications pour la télévision de haute fidélité, ou pour de l'archivage (Télévision numérique Haute Définition, HD- DVD, contribution et archivage). Les différents outils offerts dans chacun de ces profils sont résumés dans le tableau 1. Dans le cas de la télévision numérique en Europe, le consortium DVB a sélectionné le Main profil pour la Définition Standard et le High profil pour la Haute Définition [4]. Les améliorations algorithmiques apportées par MPEG-4 AVC permettent d'obtenir un gain en qualité significatif par rapport aux solutions de codage MPEG-2. Les tests subjectifs (voir figure 5) montrent que MPEG-4 peut fournir une qualité visuelle équivalente aux solutions actuelles à un débit deux fois plus faible, voire trois fois plus faible pour la Haute Définition ! REE No 3 Mars2006 Repères 1 LA TELEVISION NUMERIQUE Débit SD Débit HD Nombre de programmes SD Nombre de programmes HO moyen moyen pour un débit de 20 Mbps pour un débit de 20 Mbps MPEG-2 4 Mbits/s 18 Mbits/s 5 1 MPEG-4 2 Mbits/s 9 Mbits/s 10 2 ,fiTableau 2. Comparaison des débits nécessaires par programme en Standard Définition et en Haute Défnition, et conséquences pour un multiplex ayant une capacité de 2OMbps (cas approximatif d'un multiplex sur un réseau terrestre). 1\1111til) lexl£,,e statistique I\ III E (-J- -1 1 r-) l.l F E. -- ; - ,' 1, ,,----- l' ... À- 1\1111cil) le X.1 t_,e I\IPEG--Ing'EUT-MPECr-4 . I\//\--J\' 1 FiD vv lIIulhplexage ·thauluestishquc O 1\ El'E -i- -1 MI'E-4 >- " D MPEC,- HD MPEC,-4 1 \V/1 Pool,; (le ço (I.12e 111 (lépeil (I-titt. POOLS (le ço (l.-12e iluxte. Figure 6. Ilhistration des deux approches pour le multiplexage statistique deflux MPEG-2 et MPEG-4. 5. Standard de compression et migration vers la Haute Définition. Dans un monde parfait, le choix du standard MPEG-4 AVC comme algorithme de compression pour la télévision numérique dans son ensemble ne souffrirait aucune discussion au regard de ses performances, mais dans la réalité il n'est pas possible de faire fi du passé et de son parc installé. Tant que les récepteurs compatibles avec la Haute Définition ne sont pas présents chez une forte proportion de téléspectateurs, l'offre en Définition Standard restera la référence pour l'ensemble des programmes. Mais il est nécessaire de développer une offre Haute Définition nouvelle suffisamment alléchante pour inciter les « early adopters » ou « technophiles » à franchir le pas et à s'équiper en récepteurs adaptés tout en souscrivant à des offres de contenus Haute Définition, le plus souvent payantes. Le passage de la télévision standard à la Haute Définition ne se fera donc pas de façon brutale, mais impliquera la cohabitation des deux formats sur un même réseau de diffusion ou une même chaîne. Cela est déjà le cas dans d'autres pays où la télévision Haute Définition est présente (USA et Japon) et où des multiplexes de pro- grammes voient des formats Standard et Haute Définition cohabiter. Les discussions qui ont accompagné la mise en place de la télévision numérique terrestre en France nous rappellent également que la problématique SD/HD est indissociable d'un questionnement sur la technique de compression utilisée pour les réseaux contraints en débit comme les réseaux de diffusion terrestre. L'introduction du standard MPEG-4 et/ou la migra- tion vers la Haute Définition peut donc s'effectuer de dif- férentes façons suivant le type de réseau et les services qui y sont déjà disponibles. A titre d'exemple, pour une capacité du multiplex de 20 Mbits/s et en s'appuyant sur les performances moyennes des algorithmes résumées dans le tableau 2, citons pour le cas idéal d'un nouveau réseau quelques alternatives possibles : . lancement de 2 chaînes HD en MPEG-4 ou . lancement de 10 chaînes SD en MPEG-4 ou . lancement de 3 chaînes gratuites SD en MPEG-2 et de 4 chaînes payantes SD en MPEG-4 . lancement de 2 chaînes gratuites SD en MPEG-2, de 1 chaîne payante SD en MPEG-4 et d'une chaîne payante HD en MPEG-4. Le dernier cas proposé met en évidence une possibilité technique supplémentaire puisqu'il permet pour la chaîne diffusée normalement en Haute Définition de pouvoir, à un certain moment de la journée, être diffusée en Définition Standard et en MPEG-2 afin d'être reçue par des décodeurs vendus pour recevoir les chaînes gratuites, REE No 3 Mars2006 L'optimisation actuelle des performances de a compression vidéo e standard MPEG-4 ceci dans un but évident de promotion. Il apparaît également une complexité supplémentaire au niveau des mécanismes de multiplexage statistique pour faire cohabiter des programmes codés en MPEG-2 et en MPEG-4, ainsi que des programmes en Définition Standard et en Haute Définition. D'un point de vue de la standardisation, la flexibilité requise pour traiter ces différents cas a été prévue dans la signalisation DVB [7]. Au niveau de la réalisation pratique des multiplexeurs statistiques, deux solutions sont envisageables pour permettre cette cohabita- tion : réaliser des pools de codage statistique indépen- dants dans un même multiplex pour le codage MPEG-2 et le codage MPEG-4 ou bien réaliser simultanément le multiplexage statistique des deux types de programmes (MPEG-2 et MPEG-4). Ces deux solutions sont illustrées à la figure 5. 6. Conclusion L'algorithme de compression MPEG-4 AVC est aujourd'hui complètement standardisé en Europe. L'amélioration des performances de compression par rapport à la génération précédente (MPEG-2) s'explique par l'optimisation des différentes étapes de l'algorithme que sont principalement l'estimation spatiale, la compen- sation de mouvement, la transformée fréquentielle, l'optimisation débit versus distorsion et le codage arith- métique. Les premiers produits professionnels (encodeurs temps réel, multiplexeurs statistiques) et grand public (décodeurs) apparaissent déjà sur le marché, ouvrant la voie au lancement de la Haute Définition en Europe. Références 111 ISO/IEC 13818-1 :2000 « Information Technologv -- Generic Coding of Moving Pictures and Associated Audio Information : Systems ». 121 ISO/tEC 13818-2 :2000 « Information technologv -- Generic Coding of Moving Pictures and Associated Audio Information'Video) J. 131 ISO/IEC 13818-3i2OOO « Information Technology -- Generic Coding of Moving Plctures and Associated Audio Information : Audio) J. [41 ETSI TS 101 154 « Implementation Guidelines for the Use of Video and Audio Coding in Broadcasting Applications Based on the MPEG-2 Transport Srream J. [51 ETSI EN 300 744 « Framing Structure, Channel Coding and Modulation for Digital Terrestrial Television . [61 ETSI EN 302 307 « Second Generation Framing Siructure, Channel Coding and Modulation Systems for Broadcasting, Interactive Services, News Gathenng and other Broadband Satellite Applications u. [7] ETSI EN 300 468 « Specification for Service Information (SI) in DVB systems ». [81 ISO/IEC 14496-102004 " Information Technology - Coding of Audio-Visual Objects -- Part 10, Advanced Video Coding ". mm a u e u r s Boris Felts est directeur du développement produits à Envivio. Envivio est une des toutes premières compagnies à avoir créé et déployé des solutions basées sur MPEG-4. Avant de rejoindre Envivio, Boris Felts était chercheur aux Laboratoires de recher- che Philips à Limeil-Brévannes, travaillant sur un algorithme de compression basé sur la décomposition en ondelettes et le codage arithmétique. Il a obtenu deux diplômes d'ingénieur de l'Ecole Polytechnique à Palaiseau et de l'École National e Supérieure desTélécommunications à Paris. Gérard Mozelle est titulaire d'un doctorat de mathématiques et d'informatique de Université Paris V (René Descartes} et ingé- nieur diplômé de 'Ecole Supérieure d'Electricité (SUPELEC) Après avoir été professeur invité à l'Université Texas A&M, il rejoint le centre de recherche français de Canon, où il participe à la définition du standard de compression JPEG-2000, avant de rejoindre le groupe Thomson, où il est actuellement affecté au Cabinet du Directeur technique, en charge du suivi de comités de standardisation (parmi lesquels les travaux de !'EiCTA et du groupe DVB) et du suivi d'une partie des activités de R&D du groupe. Nivedita Nouvel a rejoint Thales en 2003 en tant qu'ingénieur marketing sur les offres multimédias développées par la société. Elle a auparavant exercé des fonctions d'ingénieur d'études dans le domaine de la télévision numérique sur les normes DVB, MHP, MPEG2/4 notamment. Elle est diplômée de l'École Nationale Supérieures desTélécommunications de Bretagne et détient un Master Of Science in Spacecraft Technonogies & Satellite Communications de l'Université College London. Eric Le Bars est Responsable Technique Produit Broadcast chez Thales. Il a débuté sa carrière en 1990 chez Matra Communication dans le développement d'applications pour la télévision basées sur la norme D2-Mac. Il a ensuite été en charge des produits d'analyses temps réel dans le monde de la télévision numérique au format MPEG-2/DVB jusqu'en 2000. Depuis 2000, il est en charge des produits et systèmes Broadcast chezThales. Il est diplômé de l'IFSIC à Rennes. Il est également l'auteur des brevets : " Commutation de programme Audio-Vidéo dans le domaine compressé " et " Re-synchronisation de composantes audiovisuelles à l'image près dans le domaine compressé° REE N3 Mars 2006 Repères 1 LA TELEVISION NUMERIQUE GLOSSAIRE ADSL - Asynchronous Digital Subscriber Une Technologie de communication numérique permettant d'attein- dre des connexions Internet à haut débit (de 128kbps à 20Mbps avec lADSL2+) via la ligne téléphonique. Analogique Désignation générique des anciens formats vidéo historiques (Betacam, Hi8, U-Matic...). Codee (COmpressor/DECompressor) Procédé matériel et/ou logiciel implémentant des algorithmes de compression et décompression à la volée de données numéri- ques, notamment des signaux audio et vidéo. Compression Réduction du volume de données informatiques représentant des images, basée sur des algorithmes de redondance spatiale ou temporelle (exemples de taux de compression 10 :1, 4 : 1 . DRM - Digital Rights Management (Gestion des droits numériques) Ensemble de technologies logicielles et matérielles permettant la gestion des droits d'auteur sur les contenus numériques. DVB - Digital Video Broadcasting Ensemble de standards pour la télévision numérique reconnus internationalement et publiés par un Joint Technical Committee formé de l'ETSI (European Telecomunications Standards lnstltute), du CENELEC (Comité européen de normalisation élec- trotechnique), et de l'UER (Union européenne de radio-télévi- sion). Le DVB définit notamment les standards de transmission numériques pour le câble (DVB-CI, le terrestre (DVB-T) et le satel- lite (DVB-S et DVB-S2). Haute définition (HD) Format d'image numérique haute qualité (1920 x 1080 pixels, ratio 16/9). MPEG-2 - Motion Picture Expert Group 2 Format de compression numérique standardisé au milieu des années 90 et utilisé depuis dans ! es DVDs, ! e câbe et satellite ainsi que la TNT gratuite en France. MPEG-4 - Motion Picture Expert Group 4 Nouvelle génération récemment standardisée de format de com- pression numérique, aux performances fortement accrues par rapport au MPEG-2 et standard européen pour la haute définition. MPEG-4-AVC -(Advanced Video Coding) Codec ouvert, inter-opérable, promu par plus 50 sociétés, défini conjointement par ISO/IEC et ITU. MPEG-4 Part 10, H.264 - Synonymes de MPEG-4-AVC : voir www.avc-alliance.org. Multiplexage Traitement consistant à insérer dans un même flux numérique plusieurs chaînes et radios. Le re-multiplexage est utilisé par l'opérateur de réseau câblé afin de recomposer sur son réseau des multiplex ne portant que des chaînes qu'il souhaite proposer à ses abonnés et non l'ensemble des chaînes initialement conte- nues dans le multiplex de l'opérateur satellite. Numérique Désignation générique des nouveaux formats vidéo (DigitalBetacam, HDCam, DV...). PVR - Personal Video Recorder Enregistreur numérique avec disque dur intégré. Standard définition (SD) Format d'image numérique traditionnel (720 x 576 pixels, ratio 4/3). TNT - Télévision numérique terrestre Mode de transmission numérique de signaux audiovisuels utili- sant la voie hertzienne. La TNT a fait ses débuts commerciaux en France le 31 mars 2005. UMTS - Universal Mobile Telecommunications System Un des standards de téléphonie mobile de troisième génération (3G, en cours de déploiement notamment en Europe. VoD - Video on Demand (Vidéo à la demande) Système de télévision interactive offrant le choix de visionner un programme au moment souhaité et de manière individualisée (ce qui le distingue du Pay Per View). La VoD offre également des fonctions de mise en pause, de rembobinage et d'avance rapide lors du visionnage du programme sélectionné. 4:2:0 Système d'échantillonnage de l'information couleur sur les signaux vidéo numériques qui prévoit que pour chaque ensemble de 4 échantillons de luminance, seulement 2 échantillons de chrominance sont conservés et codés. Il est utilisé pour la distri- bution des signaux vidéo à l'utilisateur final La totalité des servi- ces vidéo commerciaux par satellite est en 4:2:0. 4:2:2 Système d'échantillonnage de l'information couleur sur les signaux vidéo numériques qui prévoit que, pour chaque échantil- lon de luminance, 2 échantillons du signal «rouge » et 2 échantil- lons du signal « bleu » sont conservés et codés. 422 permet de maintenir une meilleure qualité que 4 : 2 : 0,et est utilisé pour les liaisons de contribution vers le studio. Autre référence http ://wvvvv.dvb.org/documents//dvb_glossary.pdf REE No 3 Mars2006