Compression d'Images par Transformée en Ondelettes

09/12/2016
Publication e-STA e-STA 2016-2
OAI : oai:www.see.asso.fr:545:2016-2:17683
DOI : You do not have permission to access embedded form.

Résumé

Compression d'Images par Transformée en Ondelettes

Média

0:00
available

Métriques

63
17
628.48 Ko
 application/pdf
bitcache://3f98055683c19b5ff47ce801fe54fe05ee832245

Licence

Creative Commons Aucune (Tous droits réservés)
<resource  xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
                xmlns="http://datacite.org/schema/kernel-4"
                xsi:schemaLocation="http://datacite.org/schema/kernel-4 http://schema.datacite.org/meta/kernel-4/metadata.xsd">
        <identifier identifierType="DOI">10.23723/545:2016-2/17683</identifier><creators><creator><creatorName>Malek Ammous</creatorName></creator><creator><creatorName>Noureddine Ellouze</creatorName></creator></creators><titles>
            <title>Compression d'Images par Transformée en Ondelettes</title></titles>
        <publisher>SEE</publisher>
        <publicationYear>2016</publicationYear>
        <resourceType resourceTypeGeneral="Text">Text</resourceType><dates>
	    <date dateType="Created">Fri 9 Dec 2016</date>
	    <date dateType="Updated">Fri 9 Dec 2016</date>
            <date dateType="Submitted">Mon 20 Nov 2017</date>
	</dates>
        <alternateIdentifiers>
	    <alternateIdentifier alternateIdentifierType="bitstream">3f98055683c19b5ff47ce801fe54fe05ee832245</alternateIdentifier>
	</alternateIdentifiers>
        <formats>
	    <format>application/pdf</format>
	</formats>
	<version>30196</version>
        <descriptions>
            <description descriptionType="Abstract"></description>
        </descriptions>
    </resource>
.

1 Compression d'Images par Transformée en Ondelettes Malek AMMOUS, Noureddine ELLOUZE Laboratoire de Signal, Images et Technologies de l’Information (LR-SITI-ENIT) Université Tunis El Manar Ecole Nationale d’Ingénieurs de Tunis ammous.malek@gmail.com, nourellouze@yahoo.fr, Abstract- Cet article étudie l’effet de l’élimination des sous bandes de la TO par ondelettes Bi-orthogonale 9/7, sur le taux de compression de l’image Lena. Des mesures du Rapport Signal à Bruit Crête PSNR et de l’indice de similarité structurelle SSIM sont opérées. Il est montré que la méthode de compression d'images, permet d’obtenir une bonne qualité d’image pour un taux de compression non négligeable. Il est montré que, l’élimination des sous-bandes des niveaux de décomposition 1 et 2 donne un taux de compression Tc=16 ; En ajutant en plus la sous bande HH3 le taux de compression devient Tc = 21 pour une qualité d’image sensiblement similaire. Mots clés- Compression d'images, transformation en ondelettes. I. INTRODUCTION La compression des images est une technique utilisée dans le stockage et la transmission d'images numériques. Cette technique est basée sur la réduction de la redondance de l’information contenue dans l’image. La compression d’image est nécessaire pour des applications telles que la vidéoconférence et la transmission des images par des canaux bruités. Son principal objectif est de réduire le débit binaire pour les phases de transmission ou de stockage de données tout en préservant une qualité acceptable d'image [2]. Les techniques de compression d'images sont multiples et peuvent être classées en deux catégories : La compression avec perte et la compression sans perte. La première classe permet une reconstruction parfaite de la source avec un faible taux de compression, alors que la compression avec perte permet d’obtenir un taux de compression élevé alors que la source n'est pas parfaitement préservée lors de la reconstruction [3]. Plusieurs approches de compression utilisent la transformée en cosinus discrète (DCT) [4] et la transformée en ondelettes discrètes (DWT). Ces transformations sont connues pour leur réversibilité et leur capacité de compression avec un nombre de coefficients relativement faible. WTSOM est une technique de compression d’image qui utilise la décomposition de l’image par une ondelette bi-orthogonale et l’annulation des sous bandes hautes fréquences et la classification par cartes de Kohonen des bandes restantes. L’objet de ce papier est la mesure de distorsion des images lors de l’annulation des sous bandes de la Transformée en ondelettes. Ce papier est organisé comme suit: la section 2, présente le principe de la compression d'images fixes et les mesures de la qualité de l’image restituée. La section 3 concerne les scenarios de compression par Transformée en ondelettes, l’élimination de sous-bandes et l’évaluation des valeurs de compression et de qualité. Finalement, nous terminons par une conclusion et les perspectives. II MESURE DE PERFORMANCE EN COMPRESSION D'IMAGE La compression d’image a fait l’objet de recherches intenses qui ont conduit au développement de diverses normes, recommandations et standards. La norme JPEG est actuellement la plus utilisée. Son principe consiste à utiliser une décomposition de l’image en blocs de taille 8 × 8 ; Puis une transformation en cosinus discrète (DCT) effectuée sur chaque bloc; Les coefficients DCT sont quantifiés puis codés. La nouvelle norme JPEG2000 utilise la transformée en ondelettes pour la compression d’image. Le codeur basé ondelette standardisé par ISO, permet d’avoir une meilleure qualité pour des taux de compression plus élevés, il permet d’introduire de nouvelles notions de services comme le codage progressif, l’accès rapide à une zone de l’image et la réduction de mémoire pour les images de grande taille. Diverses techniques de mesure de qualité d’images sont disponibles, citons le rapport signal sur bruit crête (PSNR), et l’indice de similarité structurelle (SSIM).  Mesure de distorsion (PSNR) Les mesures pour juger de la qualité d’une image sont standardisées. La métrique classique pour comparer deux images en transmission utilise le rapport signal sur bruit crête (PSNR) pour déterminer le niveau de distorsion d'une image compressée par rapport à sa source. [5]. Cette métrique est utilisée surtout pour évaluer les formats de compression d'images fixes, le PSNR est considéré comme une mesure indicative qui dépend grandement du format de compression choisi ou des particularités de l'encodeur. Le rapport signal sur bruit crête PSNR est donné par la formule suivante : est l’intensité maximale d’un pixel. Pour une image représentée en 256 niveaux de gris = 255. est la distance quadratique entre les deux images. I (i, j) est le niveau de gris du pixel (i, j) de l’image originale, Î (i, j) est le niveau de gris du pixel (i, j) de l’image codée, P*Q est le nombre total de pixels constituant l’image. 2  Mesure de similarité structurelle (SSIM) L’indice de similarité structurelle (SSIM) est une mesure de similarité entre deux images numériques. Ce paramètre permet de mesurer une certaine qualité visuelle d'une image compressée par rapport à l'image originale. L'idée du paramètre SSIM est de mesurer la similarité de structure entre deux images, plutôt qu'une différence de pixels comme pour le PSNR. Cette mesure trouve son fondement dans le système psycho-visuel humain (SVH) qui accorde beaucoup d'importance aux informations structurelles de l’image [6]. La mesure de l’indice de similarité structurelle (SSIM) de deux signaux x et y est donné par : Avec : - et les moyennes de x et y, - et les variances de x et y, - la covariance de x y, - et constantes de stabilisation. - = 255, et par défaut.  Taux de compression Le taux de compression est donné par l'équation suivante : Tc  é III COMPRESSION PAR TRANSFORMEE EN ONDELETTES La compression par TO consiste à appliquer la décomposition en ondelettes de l'image afin d'obtenir une structure hiérarchique de données, la compression est obtenue par extraction de sous bandes. Jain et al. [7] ont mené une étude détaillée sur la compression d'image basée sur la transformée en ondelettes en donnant une évaluation par comparaison de sept familles d'ondelettes : Haar, Daubechies, Symlets, Coiflets, Bi-orthogonal, Reverse Bi-orthogonal et l'approximation discrète de Meyer sur un ensemble d'images. Ils concluent que le choix de la meilleure ondelette de compression pour une qualité d'image désirée d'image dépend de la taille de l'image et de son contenu. Notre objectif, est la recherche du meilleur choix des sous bandes de la décomposition de l’image Lena, par l'ondelette bi-orthogonale (9/7) préconisée par le format JPEG 2000. En raison de la complexité de l'algorithme et du temps de calcul, trois niveaux de décomposition sont utilisés. Ce choix est discuté par B. Souhard [8] et W.Wei [9]. La décomposition en ondelettes sur trois niveaux d'une image de taille 512 * 512 pixels génère 10 sous-bandes qui peuvent être classées selon l’importance de l’information contenue pour la compression. (Voir figure1). Fig1: Image Lena et sa TO trois niveaux de décomposition par l’ondelette bi-orthogonale 9/7. La sous bande LL3 comporte les données les plus importantes, généralement les coefficients correspondants sont sauvegardés. Les sous-bandes HL3, LH3 et HH3 comportent des données moins importantes, les sous bandes HL2, LH2 et HH2 comportent les données moyennement importantes, et les sous bandes HL1, LH1 et HH1 comportent les données les moins importantes. Fig.2 Scenario A PSNR = 47.98, SSIM = 0.997, Tc = 1.33 Fig.2 Scenario B PSNR = 41.79, SSIM = 0.988, Tc = 2 Fig.2 Scenario C PSNR = 36.27, SSIM = 0.967, Tc = 4 3 Différents tests visuels sont effectués pour trouver un bon compromis entre la qualité de l’image restituée et un taux de compression acceptable. La figure 2 montre différents scenario de restitution de l’image de Lena après suppression des sous bandes barrées en rouge : Les scénarios A, B et C donnent des images de qualité excellentes pour des PSNR = 48, 42 et 36 correspondants à des SSMI de l’ordre de 0.99, 0.98 et 0.97, avec un taux de compression inférieur à 4. Fig.2 Scenario D : PSNR = 34.52, SSIM = 0.951, Tc = 5.33 Fig.2 Scenario E : PSNR = 31.91, SSIM = 0.919, Tc = 5.81 Fig.2 Scenario F : PSNR = 32.68, SSIM = 0.928 Tc = 8 Fig.2 Scenario G : PSNR = 30.78, SSIM = 0.901, Tc = 8 Les scénarios D et E donnent des images de bonne qualité pour des PSNR = 34 et 32 équivalents SSMI de l’ordre de 0.95 et 0.92 pour un taux de compression de 5 et 6. Le scenario E est de moins bonne qualité visuelle, liée à l’exclusion de la sous bande HH3. Le taux de compression faible et de 5 et 6. Les scénarios F et G donnent des images de moins bonne qualité PSNR = 33 et 32 équivalent SSMI de l’ordre de 0.93 et 0.92 pour un taux de compression de 8. Fig.2 Scenario H : PSNR = 30.77, SSIM = 0.897, Tc = 9.14 Fig.2 Scenario I : PSNR = 29.47, SSIM = 0.869, Tc = 9.14 Fig.2 Scenario J : PSNR = 30.61, SSIM = 0.899, Tc = 9.14 Fig.2 Scenario K : PSNR = 29.38, SSIM = 0.871, Tc = 9.14 4 Fig.2 Scenario L : PSNR = 28.11, SSIM = 0.848, Tc = 9.14 Fig.2 Scenario M : PSNR = 27.27, SSIM = 0.825, Tc = 9.14 Les scénarios H, I, J, K, L, M donnent des taux de compression Tc = 9.14 pour des images de qualité variable. Les PSNR sont comprises entre 27 et 31 équivalents SSMI entre 0,8 et 0.9. Les images H et I sont de qualité acceptable alors que les images J, K, L et M sont dégradées, provenant certainement de la disparition des sous bandes diagonales de troisième niveau HL3, LH3. Fig.2 Scenario N PSNR = 29.90, SSIM = 0.876 Tc = 16 Fig.2 Scenario 0 : PSNR = 28.78, SSIM = 0.845 Tc = 21.33 Enfin les scenarios N et O donnent des images de qualité acceptable pour un PSNR de l’ordre 30 et 29, équivalent à un SSIM de 0.88 et 0.85 et pour lesquels le taux de compression Tc = 16 pour le scenario N et Tc = 21 pour le scenario O. Scénario Tc PSNR SSIM A 1.33 47.98 0.997 B 2 41.79 0.988 C 4 36.27 0.967 D 5.33 34.52 0.951 E 5.81 31.91 0.919 F 8 32.68 0.928 G 8 30.78 0.901 H 9.14 30.77 0.897 I 9.14 29.47 0.869 J 9.14 30.61 0.899 K 9.14 29.38 0.871 L 9.14 28.11 0.848 M 9.14 27.27 0.825 N 16 29.90 0.876 O 21.33 28.78 0.845 Table 1: Comparaison de valeurs de PSNR, SSIM et taux de compression de l’image Lena pour différents scénarios. Comme indiqué dans la table 1, on trouve plusieurs scénarios de suppression de sous bandes et de reconstruction de l'image Lena. Le meilleur compromis entre le taux de compression et la qualité de restitution mesurée par le PSNR et le SSIM, doit tenir compte d’un taux de compression minimal quelque soit la qualité de l’image et d’une qualité minimale acceptable quelque soit le taux de compression. Les scenarios A, B, C, D, E, F et G ne peuvent être retenus car les taux de compression obtenus sont faibles < 8. Les scenarios H, I, J, K, L, M, donnent le même taux de compression relatifs à la suppression des 3 sous bandes du niveau 1, de deux sous bandes du niveau 2 et d’une sous bande du niveau 3. Ces scenarios ne donnent pas de solutions intéressantes. Les scenarios N et 0 présentent une forte similarité est proche pour des taux de compression de 16 et 21. Les deux scenarios opèrent la suppression de toutes les sous bandes des niveaux 1 et 2. La suppression de la sous bande HH3 appartenant niveau 3 qui fait la différence entre les deux scenarios N et O, permet d’améliorer le taux de compression de 16 à 21. 5 IV. CONCLUSION Ce papier concerne la qualité d’image mesurée par PSNR et SSMI après élimination de sous-bandes de la Transformée en ondelette bi-orthogonale 9/7. Pour cela nous avons mis en place une démarche d’évaluation de la qualité visuelle de l’image Lena compressée par la Transformation en ondelettes de type bi-orthogonale (9/7). La décomposition en ondelettes est opérée sur trois niveaux appliquée sur l'image entière, on élimine les sous-bandes de moyenne importance particulièrement celles relatives aux niveaux de décomposition 1 et 2 et on reconstruit l'image avec les sous bandes restantes, formant ainsi divers scenarios. Le présent travail montre que : L’élimination des coefficients des sous-bandes du premier niveau correspond à un taux de compression inférieur à 5 et ne dégrade pas la qualité de l’image. Un cas intéressant concerne le scenario qui élimine les coefficients des niveaux de décomposition 1 et 2, ce qui donne une image de qualité acceptable pour un taux de compression Tc = 16. Le meilleur taux de compression, sans introduction de forte distorsion est obtenu par le scénario qui élimine les sous bandes des niveaux 1 et 2 ainsi que la sous bande HH3 du niveau 3, donnant un taux de compression de Tc = 21. Tout autre scenario qui élimine l’une des sous-bandes ou les deux bandes HL3 et LH3 du niveau 3 de décomposition introduit des déformations importantes de l’image compressée. Les scenarios N et 0 présentent une forte similarité est proche pour des taux de compression de 16 et 21. Les deux scenarios opèrent la suppression de toutes les sous bandes des niveaux 1 et 2. La suppression de la sous bande HH3 appartenant niveau 3 qui fait la différence entre les deux scenarios N et O, permet d’améliorer le taux de compression de 16 à 21. En résumé les mesures expérimentales montrent que les deux scenarios N et O donnent des résultats acceptables en termes de qualité visuelle, de PSNR et de SSIM. Ces deux scenarios opèrent la suppression des sous bandes des niveaux 1 et 2. La suppression de la sous bande HH3 qui fait la différence entre les deux scenarios, permet d’améliorer le taux de compression de 16 à 21. Les perspectives de ces travaux concernent la généralisation des résultats sur un ensemble important d’images de différentes origines. Ainsi que l’étude de la compression en présence de bruits par SOM des scenarios retenus comparativement au scenario utilisé par la compression WTSOM. V. REFERENCES [1] Khalid Sayood: Introduction to data compression. Elsevier, San Francisco 2006. [2] J. D. Gibson et al , Digital Compression for Multimedia Principles & Standard, Morgan Kaufmann Publishers 1998. [3] R. C. Gonzales and R. E. Woods, Digital Image Processing. Reading, MA, Addison-Wesley, 1992. [4]: DeVore RA, Jawerth Bjorne, Lucier Bradley J, Image compression through wavelet transform coding. IEEE Trans Inform Theory , 1992. [5]: Jean-Loc Olivès, Optimisation d’un système imageur à l’aide de critères de qualité visuelle. Thèse présentée en vue de l’obtention du titre de docteur de l’école nationale supérieure de l’aéronautique et l’espace, septembre 1998. [6]: Tijani DELLEJI, Mohamed Salim BOUHLEL, Evaluation de deux métriques pour la mesure de la qualité des images compressées par la norme JPEG, SETIT 2005, 3rd International Conf. Sciences of Electronic, Technologies of Information and Telecommunications MARCH 27-31, 2005. [7]: Jain YK, Jain Sanjeev: Performance evaluation of wavelets for image compression. Asian J Inf Technol 2006. [8]: B. Souhard, "Codage conjoint source canal : Application à la transmission d’images fixes sur canal ionosphérique", Thesis, Université de Poitiers, 2004. [9] W. Wei, "Contribution à l'optimisation d'un codage source basé ondelettes", Rapport de stage Supélec/DEA ATS-Paris XI, 2004. [10] Mbainaibeye Jérôme, and Noureddine Ellouze, Optimal Image Compression Based on Sign and Magnitude Coding of Wavelet Coefficients, International Journal of Computer, Control, Quantum and Information Engineering Vol:1, No:7, 2007. [11] Mbainaibeye Jérôme(1), Noureddine Ellouze (2), and Christian Olivier (3), Wavelet Based Color Image Compression and Mathematical Analysis of Sign Entropy Coding, IJCSI International Journal of Computer Science Issues, Vol. 8, Issue 6, No 2, November 2011. [12] Saïd, Salma Ben, Marzouk Sihem Bouyahia, Duflos Emmanuel, Vanheeghe, Philippe, Ellouze, Noureddine, Landmines ground-penetrating radar signal enhancement by stationary wavelet transform, Large Scale Complex Systems Theory and Applications, Volume 9 , 2010. [13] Charaa, S., Ellouze, N., Multiscale Product Edge Detection in Different Colour Spaces, Information Technology: New Generations 2014. [14] Nadia Ben Youssef, Aicha Bouzid, Noureddine Ellouze, Multi-scale Product for Edge Detection,, Journal of Electronic Science and Technology of China, 2014. [15] Rania Goutali, Noël Richard, A. Ledoux, Noureddine Ellouze, Problématique de l'idempotence pour les images couleurs et multi--values, Traitement du Signal. VOL 31.