Théorie des jeux non-coopératifs et radio cognitive

03/04/2013
Auteurs :
OAI : oai:www.see.asso.fr:1301:2013-1:3948

Résumé

L’essence même de la théorie des jeux est l’étude des interactions entre plusieurs preneurs de décisions dont les décisions sont interdépendantes : ce qu’obtient un preneur de décision ou joueur ne dépend pas seulement de ce qu’il fait mais aussi de ce que font les autres joueurs. En radio cognitive, les émetteurs peuvent être vus comme des preneurs de décisions qui  doivent  choisir  leurs  paramètres  radio.  Ces  derniers peuvent typiquement inclure le niveau de puissance  du  signal  d’émission,  les  portions  du  spectre radio exploitées, les périodes d’émissions, le type de modulation utilisée, etc. Lorsque plusieurs émetteurs utilisent  une  partie  commune  du  spectre  radio  en même temps et dans une même zone géographique, les  performances  associées  à  une  communication entre un émetteur donné avec ses récepteurs d’intérêt dépendent généralement à la fois de la stratégie d’émission de l’émetteur lui-même (par exemple du niveau de puissance du signal d’émission) mais aussi des stratégies des autres émetteurs. Ainsi le fait que des ressources radio communes soient partagées en radio cognitive, que ceci génère de l’interférence ou non, les décisions des émetteurs munis de radio cognitive sont naturellement interdépendantes.  Il n’est donc pas étonnant que la théorie des jeux joue un rôle d’importance croissante dans le domaine de la radio cognitive [1] [2]. Mais ce raisonnement peut être raffiné. 


Théorie des jeux non-coopératifs et radio cognitive

Métriques

29
8
357.21 Ko
 application/pdf
bitcache://d7f16ba81978eb1864e782c2c365d13d23c20202

Licence

Creative Commons Aucune (Tous droits réservés)
<resource  xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
                xmlns="http://datacite.org/schema/kernel-4"
                xsi:schemaLocation="http://datacite.org/schema/kernel-4 http://schema.datacite.org/meta/kernel-4/metadata.xsd">
        <identifier identifierType="DOI">10.23723/1301:2013-1/3948</identifier><creators><creator><creatorName>Samson Lasaulce</creatorName></creator></creators><titles>
            <title>Théorie des jeux non-coopératifs et radio cognitive</title></titles>
        <publisher>SEE</publisher>
        <publicationYear>2013</publicationYear>
        <resourceType resourceTypeGeneral="Text">Text</resourceType><dates>
	    <date dateType="Created">Wed 3 Apr 2013</date>
	    <date dateType="Updated">Thu 26 Jan 2017</date>
            <date dateType="Submitted">Fri 13 Jul 2018</date>
	</dates>
        <alternateIdentifiers>
	    <alternateIdentifier alternateIdentifierType="bitstream">d7f16ba81978eb1864e782c2c365d13d23c20202</alternateIdentifier>
	</alternateIdentifiers>
        <formats>
	    <format>application/pdf</format>
	</formats>
	<version>28800</version>
        <descriptions>
            <description descriptionType="Abstract">L’essence même de la théorie des jeux est l’étude des interactions entre plusieurs preneurs de décisions dont les décisions sont interdépendantes : ce qu’obtient un preneur de décision ou joueur ne dépend pas seulement de ce qu’il fait mais aussi de ce que font les autres joueurs. En radio cognitive, les émetteurs peuvent être vus comme des preneurs de décisions qui  doivent  choisir  leurs  paramètres  radio.  Ces  derniers peuvent typiquement inclure le niveau de puissance  du  signal  d’émission,  les  portions  du  spectre radio exploitées, les périodes d’émissions, le type de modulation utilisée, etc. Lorsque plusieurs émetteurs utilisent  une  partie  commune  du  spectre  radio  en même temps et dans une même zone géographique, les  performances  associées  à  une  communication entre un émetteur donné avec ses récepteurs d’intérêt dépendent généralement à la fois de la stratégie d’émission de l’émetteur lui-même (par exemple du niveau de puissance du signal d’émission) mais aussi des stratégies des autres émetteurs. Ainsi le fait que des ressources radio communes soient partagées en radio cognitive, que ceci génère de l’interférence ou non, les décisions des émetteurs munis de radio cognitive sont naturellement interdépendantes.  Il n’est donc pas étonnant que la théorie des jeux joue un rôle d’importance croissante dans le domaine de la radio cognitive [1] [2]. Mais ce raisonnement peut être raffiné. 
</description>
        </descriptions>
    </resource>
.

REE N°1/2013 103 RADIO LOGICIELLE, RADIO COGNITIVE Samson Lasaulce Laboratoire des Signaux et Systèmes (CNRS - Supélec - Univ. Paris 11) La théorie des jeux : une théorie natu- rellement utile pour la radio cognitive L’essence même de la théorie des jeux est l’étude des interactions entre plusieurs preneurs de décisions dont les décisions sont interdépendantes : ce qu’ob- tient un preneur de décision ou joueur ne dépend pas seulement de ce qu’il fait mais aussi de ce que font les autres joueurs. En radio cognitive, les émetteurs peuvent être vus comme des preneurs de décisions qui doivent choisir leurs paramètres radio. Ces der- niers peuvent typiquement inclure le niveau de puis- sance du signal d’émission, les portions du spectre radio exploitées, les périodes d’émissions, le type de modulation utilisée, etc. Lorsque plusieurs émetteurs utilisent une partie commune du spectre radio en même temps et dans une même zone géographique, les performances associées à une communication entre un émetteur donné avec ses récepteurs d’inté- rêt dépendent généralement à la fois de la stratégie d’émission de l’émetteur lui-même (par exemple du niveau de puissance du signal d’émission) mais aussi des stratégies des autres émetteurs. Ainsi le fait que des ressources radio communes soient partagées en radio cognitive, que ceci génère de l’interférence ou non, les décisions des émetteurs munis de radio co- gnitive sont naturellement interdépendantes. Il n’est donc pas étonnant que la théorie des jeux joue un rôle d’importance croissante dans le domaine de la radio cognitive [1] [2]. Mais ce raisonnement peut être raffiné. Supposons que l’on modélise un émetteur radio- cognitif par un automate dont le rôle est d’implan- ter une partie du cycle de cognition décrit dans [3]. L’automate doit sélectionner de manière adaptative sa configuration (par exemple un ensemble de ca- naux fréquentiels effectivement utilisés) parmi un ensemble de configurations possibles. Pour cela, il reçoit régulièrement une information de retour sur ses choix passés et met à jour sa configuration ac- tuelle en implantant une loi d’évolution donnée, par exemple une règle d’apprentissage par renforce- ment [4] ; un exemple d’une telle règle est donné plus loin. De manière remarquable, sous certaines conditions suffisantes, si on laisse un ensemble d’automates (et donc d’émetteurs) mettre à jour leur configuration selon une règle d’apprentissage par renforcement, le point de fonctionnement vers lequel converge cet ensemble d’automates peut être un équilibre de Nash, concept fondamen- tal de la théorie des jeux sur lequel nous revien- drons. Supposons maintenant que l’on adopte une approche de type optimisation distribuée (et donc bien plus coordonnée que l’approche précédente) en imposant à un ensemble d’émetteurs d’exécuter un algorithme d’optimisation de type “sequential iterative water-filling” pour choisir leur allocation de puissance entre les canaux disponibles pour maximiser leur débit individuel de transmission [5]. L’idée de cet algorithme d’allocation élitiste de puis- sance est que les émetteurs mettent à jour à tour de rôle leur politique d’allocation en observant ce que les autres émetteurs ont choisi (en fait, l’obser- vation d’un signal agrégé de type rapport signal à bruit suffit pour implanter l’algorithme). Sous cer- taines conditions, cet algorithme itératif converge Théorie des jeux non-coopératifs et radio cognitive This article provides some reasons why game theory is fully relevant to study communication systems which comprise termi- nals equipped with a cognitive radio. In particular, links between distributed allocation and control algorithms and fundamental game-theoretic notions such as the Nash equilibrium and potential games are established. ABSTRACT 104 REE N°1/2013104 REE N°1/2013 RADIO LOGICIELLE, RADIO COGNITIVE et lorsqu’il converge, il converge vers un équilibre de Nash d’un certain jeu. Qu’il s’agisse de l’approche peu coordon- née de type automate ou de l’approche coordonnée de type optimisation distribuée, nous voyons que, sous cer- taines conditions à préciser, l’équilibre de Nash apparaît, montrant ainsi le lien naturel entre ces approches impor- tantes pour la radio cognitive et la théorie des jeux. Corrélativement aux observations faites ci-dessus, cet article est structuré de la manière suivante. Tout d’abord, nous définirons mathématiquement et nous proposerons une classification simplifiée des types de jeux. Ensuite nous décrirons un concept important de solution d’un jeu, l’équi- libre de Nash. Enfin nous présenterons deux algorithmes qui ont été utilisés dans la littérature de la radio cognitive au sens large et qui convergent vers un équilibre. L’article est conclu par un exemple, celui du problème d’allocation distribuée de puissance pour les scénarios de communications modéli- sables par un canal à accès multiple à plusieurs sous-canaux orthogonaux. Représentation mathématique d’un jeu et une classification des principaux types de jeux Forme stratégique d’un jeu Il existe trois représentations mathématiques domi- nantes d’un jeu : la forme normale ou stratégique, la forme extensive et la forme en coalition. Nous ne décrirons que la première de ces formes, la forme stratégique étant la plus utilisée dans la littérature de la radio cognitive et en théorie des jeux non-coopératifs ; un jeu est dit non- coopératif si chaque joueur a son propre objectif encore appelé fonction de coût ou d’utilité individuelle. Une des raisons expliquant cette prédominance est la facilité d’uti- lisation de la forme stratégique. Pour plus de détails sur les deux autres formes, le lecteur peut par exemple se référer à [1]. Un jeu sous forme stratégique est un triplet ordonné qui comprend l’ensemble (discret le plus souvent) de joueurs , les ensembles de stratégies de ces joueurs et les fonctions d’utilité de cha- cun de ces joueurs . Mathématiquement, un jeu sous forme stratégique est donc un ensemble ou collection de K fonctions à K variables : . En radio cognitive, le plus souvent les joueurs sont les émetteurs ra- dio-cognitifs. Les fonctions d’utilité représentent les critères de performance des émetteurs. Il peut s’agir, par exemple, d’un débit de communication, d’une efficacité énergétique à maximiser ou d’un retard, d’une énergie à minimiser. Un ensemble de stratégies simple pourrait être l’ensemble des niveaux de puissance qu’un émetteur peut utiliser. Une classification simplifiée des types de jeux Dans les paragraphes précédents nous avons mentionné les jeux non-coopératifs qui sont l’objet de cet article. Pour ce type de jeux, chaque joueur a son objectif individuel. Pour les jeux coopératifs, il existe des ensembles de joueurs qui ont le même objectif. Le type dominant des jeux coopératifs est donné par les jeux de coalitions [6] dans lesquels se posent des questions quant à savoir quelles coalitions vont se former, comment vont être répartis les gains de coopération, etc. Une autre manière de distinguer un modèle de jeu consiste à le qualifier de jeu statique (en un coup) ou de jeu dyna- mique. Dans un jeu statique, chaque joueur doit prendre une décision, choisir une stratégie une fois pour toutes. Un jeu dynamique est joué plusieurs fois, les joueurs font des obser- vations au cours du jeu, par exemple sur les actions jouées par les autres et des états du jeu, et s’en servent pour agir. Si l’on se réfère à la forme stratégique donnée précédemment, une stratégie dans un jeu statique est une simple action, par exemple le choix d’un niveau de puissance d’émission. Dans un jeu dynamique, la stratégie est un objet plus complexe, ce peut être par exemple une suite de fonctions causales qui permet de générer, à partir de ses arguments information- nels (connaissance, observations) une suite d’actions telle une séquence de niveaux de puissance. Il existe d’autres manières de caractériser un jeu. Par exemple, on peut distinguer les jeux à somme nulle (la somme des utilités vaut zéro) des jeux à somme non-nulle, les jeux avec information parfaite (toute l’histoire du jeu est observée par tous les joueurs), les jeux avec information complète (chaque joueur possède la connaissance de tous les paramètres du jeu), etc. Pour plus de détails, le lecteur peut se référer à [1]. En radio cognitive, le modèle le plus utilisé à ce jour semble être le modèle de jeu statique et non-coopératif. Ce modèle permet d’étudier les points de convergence de procédures itératives telles que celles dé- crites informellement dans la section précédente et que nous décrirons plus loin avec plus de précision. Un exemple très simple de jeu Considérons deux émetteurs en liaison avec leur récep- teur respectif et supposons que les deux communications interfèrent. Supposons que chaque émetteur a deux actions, choix, configurations ou options possibles : émettre avec une bande de fréquences étroite ou émettre avec une bande de fréquences large. Quatre cas apparaissent alors et en connaissant la traduction quantitative pour chaque émetteur REE N°1/2013 105REE N°1/2013 105REE N°1/2013 105REE N°1/2013 105REE N°1/2013 105REE N°1/2013 105 Théorie des jeux non-coopératifs et radio cognitive des quatre scénarios possibles, on peut représenter ce jeu sous forme stratégique à l’aide du tableau 1. Dans l’exemple ci-dessus, l’ensemble des joueurs est l’en- semble des émetteurs, l’ensemble des stratégies d’un joueur est l’ensemble {large bande, bande étroite} et les utilités associées aux vecteurs de stratégies possibles sont les com- posantes des couples indiqués dans le tableau. Le joueur 1 choisit la ligne, le joueur 2 choisit la colonne et l’utilité du joueur 1 (resp. 2) est la composante 1 (resp. 2) du couple. L’utilité peut par exemple être un débit en Mbit/s. Dans ce jeu, on observe qu’un émetteur égoïste a intérêt à utiliser l’action large bande car 1>0 et 4>3. Ceci conduit à l’issue du jeu (1,1) qui est l’unique équilibre de Nash du jeu. Cette notion est traitée dans la partie qui suit. Un concept fondamental de solutions d’un jeu : l’équilibre de Nash En optimisation classique, les notions de majorant, de mini- mum, de minorant et de maximum sont parfaitement définies. En théorie des jeux non-coopératifs, il est nécessaire de définir le concept de solution du jeu avant de résoudre le jeu, c’est-à-dire mener l’analyse de cette solution (l’existence par exemple). En ef- fet, dans un jeu non-coopératif, un joueur ne contrôle qu’une seule des variables (sa stratégie ou son action) qui détermine sa fonction d’utilité. La notion de décision optimale n’est donc a priori pas claire puisque le degré d’optimalité dépend des stratégies ou actions choisies par les autres joueurs. Il faut donc définir la solution du problème avant de le résoudre. Un des concepts majeurs de solu- tions d’un jeu est l’équilibre de Nash. Un équilibre ou point de Nash est un vecteur de stratégies tel que si on évalue la fonction d’uti- lité de n’importe quel joueur en changeant uniquement la variable , alors la valeur de l’utilité de ce joueur est au plus égale à celle obtenue pour le vecteur dit d’équilibre. Ceci se traduit mathématiquement par les inégalités suivantes. Le vecteur de stra- tégies est un point de Nash (en stratégies pures) de la collection de fonctions si et seulement si : où la notation indique les stratégies des joueurs autres que le joueur . Le concept d’équilibre de Nash est une pierre angulaire de la théorie des jeux. L’équilibre de Nash possède notam- ment trois caractéristiques remarquables. Par définition, un système opérant à un point d’équilibre possède une forme de stabilité : toute déviation unilatérale n’est pas profitable au déviateur. Dans un système impliquant des objets communi- cants très hétérogènes conçus par diverses entités, cela as- sure que sans coordination entre les entités potentiellement égoïstes, aucune entité ne déviera du point d’équilibre (pen- ser à une recommandation quant à la manière d’utiliser le spectre). Un deuxième aspect fondamental que nous avions déjà souligné précédemment est qu’il existe des procé- dures itératives distribuées qui conduisent à un équilibre de Nash : l’équilibre de Nash peut donc être un point attracteur pour des dynamiques connues et importantes. Le troisième aspect que nous soulignerons ici est que si l’on considère l’extension du jeu initial pour laquelle chaque joueur choi- sit une distribution de probabilité sur ses options possibles (extension dite mixte), alors il existe très souvent un équilibre de Nash au sens des utilités moyennes engendrées par ces distributions. En effet, il existe toujours un équilibre de Nash en distribution (équilibre mixte) pour n’importe quel jeu où à la fois le nombre de joueurs et leur ensemble des stratégies sont finis. De même, dans un jeu dont les utilités sont conti- nues par rapport au vecteur de stratégies sur des ensembles de stratégies compacts, l’existence au sens des distributions est garantie [1] [7]. Par exemple, quels que soient les critères de performances individuels considérés, il existe toujours un équilibre de Nash pour un jeu où un ensemble d’émet- teurs cognitifs sélectionnent un canal parmi plusieurs pour émettre ou bien choisir une stratégie de codage-modulation (dite MCS en anglais pour “modulation coding scheme”) parmi plusieurs. Il existe d’autres concepts de solutions de jeu. Si l’on veut une stabilité plus forte, une stabilité stratégique à plusieurs déviations par exemple, on pourra exploiter la notion d’équi- libre fort, pourvu que celui-ci existe dans le jeu considéré [1]. Si l’objectif d’un joueur n’est pas de maximiser son utilité mais d’atteindre une valeur seuil minimale, on pourra exploi- ter la notion d’équilibre de Nash généralisé ou d’équilibre de satisfaction [8]. Il existe ainsi de nombreux autres concepts de solutions qui peuvent être exploités dans le contexte de la radio cognitive, beaucoup d’entre eux étant bâtis sur l’équi- libre de Nash. Tableau 1 : Exemple d’un jeu sous forme stratégique. L’émetteur 1 (resp. 2) choisit la ligne conduit à un couple (resp. la colonne). Le couple de choix (ligne, colonne) conduit à couple de débits. Ce jeu illustre un paradoxe connu en théorie des jeux. Si les deux émetteurs ne peuvent émettre qu’en bande étroite (une seule option possible) ils obtiennent tous deux un débit supérieur à celui obtenu en leur rajoutant la possibilité d’émettre en bande large i.e., en ayant un ensemble d’optimisation plus grand. Large bande Bande étroite Large bande (1,1) (4,0) Bande étroite (0,4) (3,3) 106 REE N°1/2013106 REE N°1/2013 RADIO LOGICIELLE, RADIO COGNITIVE Deux exemples d’algorithmes convergeant vers un équilibre Il existe des conditions suffisantes simples sous lesquelles des algorithmes itératifs, tels que des algorithmes d’appren- tissage, convergent vers un équilibre de Nash. Une des plus connues d’entre elle est la propriété de potentiel d’un jeu [9]. La collection de fonctions possède la propriété de potentiel exact s’il existe une fonction telle que Le point important à noter est que cette fonction , appe- lée un potentiel exact du jeu, est indépendante de l’indice des joueurs. Il est ainsi possible d’évaluer la variation d’utilité d’un joueur donné à partir de cette fonction. Lorsqu’un jeu est de potentiel exact, l’existence d’un équilibre de Nash en stratégies pures est assurée. La convergence de nombreuses dynamiques de mise à jour de stratégies est également assurée. Voici deux exemples d’algorithmes importants qui convergent vers un équilibre de Nash dans un jeu de poten- tiel exact. Un algorithme d’apprentissage par renforcement Supposons que l’ensemble des stratégies ou configurations de l’émetteur soit discret et fini . Supposons que l’automate qui implante l’algorithme de mise à jour de la stratégie de l’émetteur cognitif ait un accès pério- dique à la réalisation de sa fonction d’utilité, la fonction d’utilité étant supposée inconnue. La règle suivante de mise à jour de la probabilité que l’émetteur k associe à la stratégie ou confi- guration converge vers un équilibre de Nash de la collection de fonc- tions lorsque celle-ci possède un potentiel exact. Plusieurs commentaires doivent être faits. Le temps est sup- posé discret ici : . Le vecteur représente la distribution de probabilité que l’émetteur k uti- lise pour sélectionner (au hasard donc) sa configuration ou stratégie = inutile ici à l’instant t. Le paramètre a le même rôle que le pas dans un algorithme de gradient. La quantité représente la valeur de l’utilité de l’émetteur k à l’instant t et la fonction est la fonction indicatrice (vaut donc 1 si et seulement si la condition est vraie). La dynamique séquentielle de meilleures réponses Dans sa version la plus classique, cette dynamique per- met de mettre à jour la stratégie ou l’action directement ; il existe des versions où, comme pour l’algorithme précé- dent, une distribution est mise à jour [1]. A l’instant initial, les émetteurs sont supposés faire un certain choix de stratégies : Selon un ordre (arbitraire) fixé par un coordinateur, les émetteurs mettent à jour leur stratégie. Sans perte de généralité supposons que l’émetteur 1 mette à jour en premier sa stratégie en maximisant son utilité, puis l’émet- teur 2 la met à jour, etc. Ceci induit la séquence suivante : La figure 1 illustre ce processus pour un cas impliquant deux joueurs choisissant leur action dans . La courbe en rouge/trait mixte (resp. bleue/trait plein) montre la meilleure action du joueur 2 (resp. 1) en fonction de l’action jouée par le joueur 1 (resp. 2), c’est pour cette raison que l’on parle de courbe de meilleure réponse (MR). L’intersection de ces courbes est un équilibre de Nash. Dans un jeu de potentiel, la dynamique séquentielle de meilleures réponses est assurée de converger vers un des points d’intersection de ces meil- leures réponses. Un exemple de jeu de potentiel : l’allocation de puissance dans les canaux à accès multiple à plusieurs sous-canaux orthogonaux Considérons K émetteurs cognitifs qui peuvent utiliser M bandes de fréquences qui ne se recouvrent pas (on parle Figure 1 : Convergence de la dynamique séquentielle de meilleures réponses pour un scénario avec deux émetteurs. Dans un jeu de potentiel, si ceux-ci mettent à jour tour à tour leur stratégie en maximisant leur utilité sachant la stratégie de l’autre, alors ils se dirigent vers un équilibre de Nash. REE N°1/2013 107REE N°1/2013 107REE N°1/2013 107REE N°1/2013 107REE N°1/2013 107REE N°1/2013 107 Théorie des jeux non-coopératifs et radio cognitive de canaux orthogonaux ou parallèles). Chaque émetteur doit décider lui-même comment allouer sa puissance d’émission entre les M bandes disponibles et ceci en vue de maximiser un critère de performance individuel que nous supposerons un débit ici. L’utilité de l’émetteur k s’exprime ainsi [10] : où représente le vecteur d’allo- cation de puissance de l’émetteur k entre les M bandes disponibles. L’expression du rapport signal à interférence plus bruit (RSIB) dépend du scénario de communication. Dans le cas où il existe un récepteur (réel ou virtuel) qui collecte tous les flux de transmission, une expression pos- sible pour le RSIB pour l’émetteur k sur la bande m est où représente la qualité (le gain) du lien de communica- tion avec le récepteur utilisé par l’émetteur k sur la bande m et la variance d’un bruit de communication non structuré. Le jeu sous forme stratégique défini par la collection de fonctions possède un potentiel exact qui est la fonction Conclusion Un axe de recherche important en radio cognitive est la conception d’algorithmes distribués d’allocation de ressources (spectrales en particulier) et de contrôle (de puissance, de niveau de la batterie d’un terminal, de la taille de file d’attentes de paquets, etc.). Il s’avère que la théorie des jeux offre un cadre naturel pour non seulement étudier les performances de tels algorithmes (naturellement multi-agents) mais aussi pour en concevoir. De plus, la théorie des jeux inclut la notion d’agent stratégique, ce que la radio cognitive n’inclut pas en- core vraiment à ce jour. Vu sous cet angle, de nouvelles ques- tions se posent sur le comportement des terminaux à radio cognitive et la radio cognitive pourrait être amenée à devenir la cyber radio (voir thèse d’HDR de l’auteur). Références [1] S. Lasaulce, H. Tembine, “Game Theory and Learning for Wireless Networks: Fundamentals and Applications”, Academic Press Elsevier, août 2011, pp. 1-336. [2] E. Hossain, D. Niyato & Z. Han, “Dynamic Spectrum Access in Cognitive Radio Networks”, Cambridge University Press, 2009. [3] J. Mitola, G. Maguire, “Cognitive Radio: Making Software Radios More Personal”, IEEE Personal Communications Magazine, vol. 6, n° 14, p. pp. 13-18, août 1999. [4] P. Sastry, V. Phansalkar & M. Thathachar, “Decentralized Learning of Nash Equilibria in Multi-Person Stochastic Games With Incomplete Information”,IEEE Trans. Sys., Man and Cybernetics, vol. 24, n° 15, p. 769-77., 1994. [5] W. Yu, G. Gini & J. Cioffi, “Distributed Multiuser Power Control for Digital Subscriber Lines”, IEEE J. Sel. Areas Commun, vol. 20, n° 15, pp. 1105-1115, mai 2002. [6] Z. Han, D. Niyato, W. Saad, T. Basar & A. Hjørungnes, “Game Theory in Wireless and Communication Networks: Theory, Models, and Applications”, Cambridge University Press, janvier 2012. [7] S. Lasaulce, M. Debbah & E. Altman, “Methodologies for Analyzing Equilibria in Wireless Games”, IEEE Signal Processing Magazine, Special issue on Game Theory for Signal Processing, vol. 26, n° 15, pp. 41-52, septembre 2009. [8] S. Perlaza, H. Tembiné, S. Lasaulce & M. Debbah, “A General Framework for Quality-of-Service Provisioning in Decentralized Networks”, IEEE Journal of Selected Topics in Signal Processing, vol. 6, n° 12, avril 2012. [9] D. Monderer, L. Shapley, “Potential Games”, Games and Economic Behavior, vol. 14, n° 11, p. 124-143, 1996. [10] P. Mertikopoulos, E. Belmega, A. Moustakas & S. Lasaulce, “Distributed Learning Policies for Power Allocation in Multiple Access Channels”, IEEE Journal of Selected Areas in Communications (JSAC), vol. 30, n° 11, pp. 96-106, janvier 2012. Samson Lasaulce est actuellement directeur de Recherche CNRS au Laboratoire des Signaux et Systèmes (Gif-sur-Yvette). Avant de rejoindre le CNRS, il était ingénieur R&D, d’abord à Motorola Labs (1999-2001) puis chez France Télécom (2002-2003). Ses travaux de recherche actuels portent sur les réseaux distribués de com- munications et d’énergie pour lesquels il utilise des outils tels que la théorie des jeux et la théorie de l’information. L'AUTEUR