Reconnaissance faciale basée sur la transformée en ondelettes et les cartes auto-organisatrices de Kohonen

09/12/2016
Publication e-STA e-STA 2016-1
OAI : oai:www.see.asso.fr:545:2016-1:17679
DOI : You do not have permission to access embedded form.

Résumé

Reconnaissance faciale basée sur la transformée en  ondelettes et les cartes auto-organisatrices de Kohonen

Média

0:00
available

Métriques

62
15
454.35 Ko
 application/pdf
bitcache://10d8342c3bd854f66d98b45a3dd7ec7a83ad2ced

Licence

Creative Commons Aucune (Tous droits réservés)
<resource  xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
                xmlns="http://datacite.org/schema/kernel-4"
                xsi:schemaLocation="http://datacite.org/schema/kernel-4 http://schema.datacite.org/meta/kernel-4/metadata.xsd">
        <identifier identifierType="DOI">10.23723/545:2016-1/17679</identifier><creators><creator><creatorName>Noureddine Ellouze</creatorName></creator><creator><creatorName>Imen Mbazaâ</creatorName></creator></creators><titles>
            <title>Reconnaissance faciale basée sur la transformée en  ondelettes et les cartes auto-organisatrices de Kohonen</title></titles>
        <publisher>SEE</publisher>
        <publicationYear>2016</publicationYear>
        <resourceType resourceTypeGeneral="Text">Text</resourceType><dates>
	    <date dateType="Created">Fri 9 Dec 2016</date>
	    <date dateType="Updated">Fri 9 Dec 2016</date>
            <date dateType="Submitted">Mon 20 Nov 2017</date>
	</dates>
        <alternateIdentifiers>
	    <alternateIdentifier alternateIdentifierType="bitstream">10d8342c3bd854f66d98b45a3dd7ec7a83ad2ced</alternateIdentifier>
	</alternateIdentifiers>
        <formats>
	    <format>application/pdf</format>
	</formats>
	<version>30192</version>
        <descriptions>
            <description descriptionType="Abstract"></description>
        </descriptions>
    </resource>
.

Reconnaissance faciale basée sur la transformée en ondelettes et les cartes auto-organisatrices de Kohonen Imen Mbazaâ1 , Noureddine Ellouze2 Département Génie électrique, Ecole Nationale d’Ingénieurs de Tunis, Université Tunis Elmanar BP 37, Belvédère 1002 Tunis, Tunisie 1 imene.mbazaa@enit.rnu.tn Résumé— Le présent travail propose une nouvelle approche de reconnaissance faciale fondée sur le concours de la transformée en ondelettes discrète (DWT) et les cartes auto-organisatrices de Kohonen (SOM). Les phases de conception clefs du système proposé comprennent: i) une analyse multirésolution par ondelettes discrètes fractionnant les images originales en différentes échelles et fréquences. En plus de la sous-image d'approximation, la moyenne de celles horizontale, verticale et diagonale de même échelle est calculée donnant lieu à une seule sous-image de détail par niveau. ii) une représentation des sous- images effectuée par filtrage spatial afin de récupérer des statistiques locales, à savoir: l’entropie et l’énergie, ainsi que l’erreur moyenne et l’écart-type des coefficients d’ondelettes. Les vecteurs caractéristiques multidimensionnels sont alors construits par combinaison des descripteurs statistiques relatifs à toutes les sous-images.iii) une généralisation des images réalisée grâce à l'apprentissage et la classification du réseau de neurones non supervisé SOM. Les expériences montrent que la méthode proposée présente des résultats prometteurs quant au taux de reconnaissance. Mots clés— Reconnaissance faciale, transformée en ondelettes discrètes, cartes auto-organisatrices de Kohonen. I. INTRODUCTION De nos jours, la technologie de reconnaissance faciale a plusieurs champs d’application potentiels tels que le contrôle d'accès, la sécurité de l'information,... [1-3]. Cependant, malgré les questions soulevées et les multiples solutions proposées, le problème général de reconnaissance faciale garde toujours sa complexité intrinsèque liée à l’apparence changeante du visage humain. A titre d’exemple, l'occlusion (en raison de vêtements, lunettes ...), l’éclairage et la variation de l’expression sont inévitables et hors contrôle. Dans ce travail, nous introduisons une approche de reconnaissance faciale combinant la transformée en ondelettes discrète (DWT) et les cartes auto-organisatrices (SOM). Pour une pour une représentation automatique des images, la transformée en ondelette discrète (DWT) a été utilisée. Seulement, en dépit du fractionnement de l'information en canaux de différentes fréquences, les sous-images obtenues manquent de connaissances statistiques. Dans la littérature, il existe une grande variété de caractéristiques statistiques. En l’occurrence, nous avons opté dans cette étude pour la mise en œuvre de l'énergie et l’entropie comme caractéristiques locales, et l’erreur moyenne et l’écart-type comme analogues générales. Par ailleurs, la motivation d'effectuer la classification par l’algorithme SOM est appuyée par les propriétés des cartes SOM non-supervisées et non-paramétriques, permettant d’assurer un apprentissage robuste et une évaluation fiable des données injectées. Cet article est organisé comme suit: la méthode proposée est détaillée dans la section 2, l'ensemble de données et la méthodologie sont décrits dans la section 3, les expériences menées moyennnant la base de données FERET sont présentées dans la section 4. Enfin, les conclusions les travaux futurs sont présentées à section 5. II. METHODE PROPOSEE L'approche proposée est illustrée ci-dessous: Fig.1 Diagramme de l'approche de reconnaissance faciale proposée Pré-traitement DWT HHiHLiLHi… ième sous-image de détail moyenne LL: Sous-image approximative Extraction des descripteurs Normalisation des descripteurs SOM Image faciale Identité A. Pré-traitement Avant d’engager le processus de reconnaissance, toutes les images couleur (relatives aux ensembles d’apprentissage et de test) ont été converties en niveau de gris, puis normalisées afin de garantir que les données soient impartialement traitées lors de l'étape d’apprentissage. Puisque nous traitons des images en niveaux de gris, nous avons appliqué une égalisation d'histogramme. En effet, cet ajustement permet de mieux répartir l'intensité de l'histogramme. Enfin, dans chaque image normalisée, seule la face a été localisée et récupérée grâce à l’algorithme de détection d'objets de Viola et Jone qui présente une localisation rapide et précise grâce à la méthode de sélection des descripteurs AdaBoost et l'allocation en cascade des ressources nécessaires. B. Transformation en ondelettes Basée sur une ondelette mère donnée, la DWT à 2 niveaux a été effectuée sur les images prétraitées par la décomposition de chacune d'entre elles en une image approximée et 2x3 sous- images détaillées (horizontales, verticales et diagonales). C. Extraction des descripteurs Afin de réduire les dimensions des caractéristiques extraites, nous avons calculé les moyennes des sous-images horizontales, verticales et diagonales pour obtenir en conséquence une seule sous-image détail. Ainsi, par niveau de décomposition de la DWT, une sous-image approximative et une sous-image détaillée sont obtenues. A ce stade, étant donné les sous-images obtenues après transformation en ondelettes ne présentent pas de connaissances statistiques, nous avons effectué des mesures de l'énergie et de l’entropie (statistiques descriptrices locales), et celles de l’erreur moyenne et de l’écart type (statistiques descriptrices générales). Sur la base de ces éléments, les opérations de filtrage spatial ont été effectuées sur les coefficients d'ondelettes en faisant glisser une fenêtre de taille fixe sur les sous-blocs non- chevauchés relatifs aux sous-images d’approximation et de détail de chaque niveau de décomposition. Les descripteurs extraits sont : 1) L’entropy : mesure statistique du caractère aléatoire qui peut être utilisée pour caractériser la texture de l'image d'entrée: 2) L’énergie : qui est également une caractéristique statistique utilisée pour représenter des informations de texture, calculée comme suit: 3) L’erreur absolue moyenne (EAM): qui décrit la déviation des données de la moyenne 4) L’écart type : qui permet de cerner l’intervalle de dispersion des données Où xi représente un coefficient d'ondelettes et N la dimension du sous-bloc. Soit M la dimension de l'image entière, alors d = M / N correspond aux statistiques locales par nombre de descripteurs caractéristiques. Par conséquent, le vecteur des descripteurs caractéristiques FV est de la taille 8xd: = Avec: - Eapp : entropie des sous-blocs approximatifs - Edet : entropie des sous-blocs de la moyenne des détails - Enapp : energie des sous-blocs approximatifs - Endet : energie des sous-blocs de la moyenne des détails - µapp : EAM des sous-blocs approximatifs - µdet : EAM des sous-blocs de la moyenne des détails - σapp : écart type des sous-blocs approximatifs - σdet : écart type des sous-blocs de la moyenne des détails D. Normalisation des descripteurs Comme nous traitons plusieurs types de données caractéristiques, nous avons normalisé les caractéristiques composant les vecteurs descripteurs dans l’intervalle [0 1] avant de les déleguer au réseau SOM. En effet, avant la phase d'apprentissage automatique, il est préférable, si ce n'est obligatoire, d'effectuer une mise à échelle de tous les descripteurs dans le but de normaliser les données indépendantes selon un même ordre. E. Les cartes auto-organisatrices de Kohonen Les vecteurs descripteurs caractéristiques sont utilisés comme entrée du réseau neuronal carte auto-organisatrices de Kohonen (SOM). SOM a été initialisé à l'aide d’un processus aléatoire et lancé en mode batch. Le processus d’apprentissage a été exécuté en deux phases comme justifié dans [12], à savoir une phase d’apprentissage approximatif dans le but d’ajuster l'ordre topologique des caractéristiques des vecteurs, suivie d’une seconde phase d’affinement conduisant à une quantification précise de l'espace d'entrée. Après la phase d’apprentissage par SOM, chaque image de test est projetée sur le plan résultant en déterminant la distance euclidienne entre le vecteur des caractéristiques de l'image de test et les vecteurs des poids correspondants. Enfin, la décision de classification par SOM correspond au neurone vainqueur, c'est-à-dire le neurone dont le vecteur référent approchant l’image de test le mieux possible. III. BASE DE DONNEES ET METHODOLOGIE Pour prouver l'efficacité de la méthode proposée, à savoir l'algorithme DWT-SOM, nous avons mené plusieurs expériences sur la base de données couleur FERET, couramment utilisée dans le domaine d’application de la reconnaissance faciale. En effet, la base de données FERET contient un total de 11338 images faciales de 1208 sujets, offrant une grande variété d’échantillons de différents sexes, origines ethniques et âges. Elle est composée de 13 sous- ensembles, chacun représentant des images d'une même pose. Les expériences menées touchent la galerie d'images (fa) et le sous-ensemble de test (fb), où (fa) désigne le sous-ensemble d’images frontales régulières et (fb) celui des images frontales prises peu après les images (fa) correspondantes. Pour notre processus de reconnaissance, nous avons utilisé (fa) comme galerie d’images d’apprentissage et (fb) en tant qu’ensemble de test. Dans un premier temps, nous avons utilisé des images d’apprentissage et de test en format '.ppm' de taille 512x768 pixels. Pendant la phase de prétraitement, elles ont été converties en images en niveaux de gris (fichiers en format '.pgm') et normalisées selon l'approche d'égalisation d'histogramme. Enfin, les visages y appartenant ont été recadrés à la taille 256x256. Une DWT à 2 niveaux a été appliquée à chacune des images en utilisant la famille d'ondelettes de Daubechies. À la suite de la transformation, une sous-image approximative et 2*3 sous-images détails (horizontales, verticales et diagonales) ont été obtenues. Comme mentionné précédemment, chaque jeu de 3 sous-images détails de même niveau de décomposition a été calculé. En résumé, nous avons obtenu une sous-image approximative de taille 64x64 et 2 sous- images relatives aux moyennes des détails de tailles 64x64 et 128x128. Les descripteurs caractéristiques ont été extraits à partir de chaque sous-image en faisant glisser une fenêtre de taille préfixée. Comme nous avons choisi les statistiques locales d’entropie et d’énergie, et celles générales, à savoir ; l’erreur moyenne et l’écart-type, nous avons récupéré les vecteurs (FV), avec les caractéristiques déjà mentionnées. IV.TRAVAIL EXPERIMENTAL A. Exprérience n°1 Tout d'abord, la performance de la méthode proposée a été évaluée compte tenu de 200 images d’apprentissage et 200 images de test et une ondelette mère de type Daubechies 2. Pour différentes tailles de la fenêtre de test, les résultats obtenus sont résumés dans la table I: TABLE I PERFORMANCES DE L'ALGORITHME DWT-SOM POUR DIFFERENTES TAILLES DE LA FENETRE DE TEST Taille de la fenêtre de test Précision (%) 4 x 4 76.5 8 x 8 75 16 x 16 66.5 32 x 32 44 Notons que la meilleure performance de l'algorithme DWT- SOM a été atteinte pour une fenêtre de taille 4x4. Intuitivement, plus la taille de la fenêtre est réduite, plus le système est performant. De plus, il n'y a pas de différence notable en taux de précision entre les fenêtres de tailles 4x4 et 8x8. Par conséquent, pour réduire le temps d'exécution tout en obtenant un taux d'exactitude satisfaisant, nous pouvons opter pour une fenêtre de taille 8x8. B. Expérience n°2 La taille de la fenêtre de test étant fixée à 4x4 (car elle fournit la meilleure précision), nous avons étudié l'impact du choix de l’ondelette mère sur la performance de l'algorithme DWT-SOM. Les résultats récupérés sont résumés dans la table II : TABLE II PERFORMANCES DE L'ALGORITHME DWT-SOM POUR DIFFERENTS TYPES DE L’ONDELETTES MERE Ondelette mère Précision (%) Haar 78 Daubechies 8 80.5 Symmlet 2 75 Coiflet 1 77.5 Biorthogonale 1.1 79.5 Reverse Biorth. 1.1 78 Nous pouvons remarquer que la meilleure performance de l'algorithme DWT-SOM a été atteinte pour l’ondelette mère Daubechies 8. Cependant, tous les résultats obtenus, relatifs aux différents types d’ondelette mère, sont approximativement du même ordre. C. Expérience n°3 Afin d'étudier les performances de classification de l'approche proposée, nous avons rapporté les scores cumulatifs de correspondance (CMS) des rangs allant jusqu'à 10 représentant le pourcentage des images de test qui sont d'un certain rang k (k = 1, ..., 10) ou moins. Considérant 200 images d’apprentissage et 200 images de test, l’ondelette mère Daubechies 8 a été choisie. La fenêtre de test est de taille 4x4. Les valeurs obtenues sont représentées dans la figure 2. Fig.2 Performance de l'approche proposée Nous pouvons noter que la réponse correcte est de rang 1 pour au moins 80% des images, atteignant plus de 90% pour les rangs allant jusqu’à 10. V. CONCLUSION Dans cet article, nous avons mis en place un système de reconnaissance faciale automatique basé sur la transformée en ondelettes discrètes (DWT) et les cartes auto-organisatrices de Kohonen (SOM). Les résultats obtenus ont prouvé l’efficacité du système proposé grâce aux taux de reconnaissance, jugés prometteurs. Comme travaux futurs, nous avons l'intention d'étudier le taux de reconnaissance en fonction des propriétés d'ondelettes, à savoir: le niveau de décomposition et les sous-bandes à garder. En fait, ce sujet a rarement été discuté dans la littérature. REFERENCES BIBLIOGRAPHIQUES [1] R. Chellapa, C. L. Wilson and S. Sirohey, ”Human and machine recognition of faces: A survey”, Proc. of the IEEE, 83(5):705~740, 1995 [2] J. Daugman, “Face and gesture recognition: Overview,” IEEE Trans. Pattern Analysis and Machine Intelligence, 19(7):675~676, 1997. [3] W. Zhao, R. Chellappa, P. J. Phillips, and A. Rosenfeld, “Face Recognition: A Literature Survey”, ACM Computing Survey, December Issue, pp. 399-458, 2003. [4] A. M. Martinez, “Recognizing imprecisely localized, partially occluded, and expression variant faces from a single sample per class,” IEEE Trans. Pattern Analysis and Machine Intelligence 25(6): 748- 763, 2002. [5] D. Beymer and T. Poggio, "Face Recognition from One Example View," Science 272(5250), 1996. [6] J. Lu, K. N. Plataniotis, and A. N. Venetsanopoulos, ”Face Recognition using kernel direct discriminant analysis algorithms.” IEEE Trans. on Neural Networks,14(1),117-126, 2003. [7] P. N. Belhumeur, J. P. Hespanha, and D. J. Kriegman, ” Eigenfaces vs. Fisherfaces: recognition using class specific linear projection,” IEEE Trans. on Pattern Analysis and Machine Intelligence 19(7), 711-720, 1997. [8] B. Moghaddam, T. Jebara., A. Pentland, “Probabilistic visual learning for object detection,” Proc Int Conf Computer Vision, pp. 786–793, 1995. [9] C. Liu and H. Wechsler: "Evolutionary Pursuit and Its Application to Face Recognition", IEEE Trans. Pattern Analysis and Machine Intelligence, vol. 22, no. 6, pp. 570-582, 2000. [10] M. Fleming and G. Cottrell, “Categorization of faces using unsupervised feature extraction,” In Proc. IEEE IJCNN International Joint Conference on Neural Networks, 1990. [11] J. Kittler,M.hatef,R.Duin,and J.Matas. “On combining classifiers”. IEEE Trans. Pattern Analysis and Machine Intelligence, vol. 20, no. 3, pp. 226-239, 1998. [12] T. Kohonen, “Self-Organizing Map,“2nd edition, Berlin: Springer- Verlag,1997.