Jeux répétés avec signaux et théorème Folk

La théorie des jeux fournit un ensemble d’outils mathématiques qui permet d’étudier les situations dans lesquelles des preneurs de décisions interagissent. Un jeu est composé de joueurs, chacun ayant à sa disposition plusieurs actions et un ensemble de gains, appelé fonction d’utilité. Une telle situation est dite « stratégique » puisque les gains d’un joueur dépendent des actions de tous les autres joueurs. Chacun des joueurs choisit habilement l’action qu’il va jouer, en tenant compte des intérêts et des gains des autres joueurs. L’objectif est de choisir l’action qui confère un gain maximal. La solution d’un jeu que propose Nash dans [54] est celle de l’équilibre. Les actions des joueurs forment un équilibre de Nash si aucun des joueurs ne peut augmenter son utilité en choisissant unilatéralement une action différente de celle de l’équilibre. L’équilibre de Nash garantit une propriété de stabilité et nous permet de prédire le comportement des joueurs, de caractériser l’issue d’un jeu.

Un jeu répété est défini par la répétition sur le long terme du même jeu d’étape. Dans ce cas, les stratégies des joueurs dépendent des actions choisies aux étapes précédentes. Les gains d’un jeu répété sont définis par une moyenne sur les gains de chaque étape du jeu. La notion d’équilibre s’étend au jeu répété en considérant les stratégies dépendantes du passé et les gains moyennés. La répétition introduit de l’information supplémentaire et permet d’augmenter les espaces de stratégies et les ensembles d’équilibre. Les solutions d’équilibre que propose la théorie des jeux répétés sont étroitement reliées aux hypothèses sur l’information dont disposent les joueurs au moment de choisir leur action. Ces informations concernent le nombre de joueurs, la durée du jeu, les espaces d’actions, les fonctions d’utilité et les actions passées. Lorsque les joueurs ne connaissent pas exactement les fonctions d’utilité, le jeu est appelé « jeu à information incomplète ». Lorsque les joueurs n’observent pas parfaitement les actions choisies précédemment par les autres joueurs, le jeu est appelé « jeu à observation imparfaite ». Les résultats d’équilibre proposés par la théorie des jeux diffèrent totalement suivant l’information que possèdent les joueurs avant de jouer. Lorsque l’observation des actions passées n’est pas parfaite, les stratégies d’équilibre sont difficiles à construire et l’ensemble des utilités correspondantes reste inconnu à ce jour.

La théorie de l’information étudie les performances d’un système communicant. Un tel système est composé de sources d’informations, d’émetteurs, de canaux de transmission et de destinataires. Pour les communications sans-fil, les techniques d’émission dépendent des paramètres physiques tels que l’amplitude, la fréquence, la phase et la superposition des ondes électromagnétiques. Les communications sont rendues possibles en utilisant ces paramètres de manière appropriée pour transporter de l’information. De nos jours, la quantité des données traitées par les systèmes de communication est de plus en plus importante et l’ensemble des utilisateurs des systèmes communicants est de plus en plus dense. Les futurs réseaux ne pourront plus s’organiser autour d’un unique opérateur central qui impose des techniques d’émissions à chaque appareil. La multiplication des paramètres et la complexité des solutions posent des problèmes d’optimisation difficiles à résoudre. Une idée pertinente pour remédier à ces problèmes est d’organiser le traitement de l’information localement.

Récemment, la théorie des jeux a permis d’apporter des réponses convaincantes aux problèmes rencontrés dans les communications sans-fil. Les modèles que propose la théorie des jeux considèrent que les paramètres techniques tels que la puissance d’une onde, l’allocation de ressources ou les protocoles de réseaux, sont optimisés localement par les appareils communicants. Un réseau est dit « décentralisé » si les unités qui le constituent choisissent certains paramètres de manière autonome, afin d’améliorer l’efficacité locale de la communication. Nos recherches en télécommunication ont pour objectif de caractériser les comportements des appareils et du réseau qui sont fiables, prévisibles et qui garantissent un fonctionnement optimal. Le concept d’équilibre de Nash garantit une propriété de stabilité pour les réseaux de communication décentralisés. À l’équilibre, aucun appareil n’est incité à changer de stratégie d’émission afin d’augmenter la qualité ou la quantité de sa propre communication. À l’aide des différentes notions d’équilibre étudiées en théorie des jeux, un large panel de solutions permet de garantir une condition de stabilité et de prédire le comportement du système.

Cette thèse est consacrée à l’étude des interactions entre la théorie des jeux et la théorie de l’information, ainsi qu’à leurs applications aux réseaux de communication décentralisés. D’une part, la théorie des jeux apporte des réponses aux problèmes d’optimisation dans lesquels des agents interagissent. Dans un jeu, les joueurs choisissent des actions et obtiennent des gains appelés utilités. Les hypothèses sur l’information que possèdent les joueurs avant de jouer sont fondamentales pour déterminer l’issue d’un jeu, aussi appelée équilibre. Lorsque le même jeu est répété d’étape en étape et que les joueurs n’observent pas parfaitement les actions passées, alors les utilités d’équilibre ne sont pas connues. D’autre part, la théorie de l’information étudie les performances d’un système communicant. De nos jours, les réseaux de communication sont tellement denses qu’ils ne peuvent plus s’organiser autour d’un unique opérateur central. La théorie des jeux est appropriée pour étudier de nouvelles organisations du traitement de l’information dans lesquelles les décisions sont prises localement. , nous étudions le jeu du contrôle de puissance efficace du point de vue énergétique, grâce aux résultats existants pour les jeux répétés. Les émetteurs sont considérés comme des joueurs et choisissent la puissance d’émission du signal, considérée comme leur action. L’objectif d’un joueur est de choisir une puissance optimale pour la qualité de sa propre communication. Même si les joueurs n’observent pas les actions passées de manière parfaite, nous montrons que l’observation du « ratio signal sur interférence plus bruit » est suffisante pour garantir des résultats d’équilibre optimaux pour le réseau de communication.

Table des matières

1 Introduction
1.1 Point de vue
1.2 Objectifs de la thèse
1.3 Structure du manuscrit
1.4 Contributions
1.5 Publications
1.5.1 Revues internationales
1.5.2 Congrès internationaux avec comité de lecture et actes
1.5.3 Congrès nationaux avec comité de lecture et actes
2 Jeux répétés avec signaux et théorème Folk
2.1 Description et résultats principaux
2.2 Théorème Folk pour le « dilemme du prisonnier »
2.3 Modèle du jeu en un coup
2.3.1 Équilibre de Nash du jeu en un coup G
2.4 Jeu répété avec observation parfaite
2.4.1 Modèle du jeu répété Γ avec observation parfaite
2.4.2 Jeu répété infini Γ∞
2.4.2.1 Théorème Folk infini avec observation parfaite
2.4.3 Jeu répété escompté Γλ
2.4.3.1 Théorème Folk escompté avec observation parfaite
2.4.4 Jeu répété fini ΓT
2.4.4.1 Théorème Folk fini avec observation parfaite
2.5 Jeu répété avec observation imparfaite
2.5.1 Modèle de jeu répété avec observation imparfaite
2.5.2 Le problème du théorème Folk avec observation imparfaite
2.5.2.1 Structure d’observation semi-standard
2.5.2.2 Structure d’observation sur un graphe 2-connexe
2.5.2.3 Structure d’observation presque parfaite
2.5.2.4 Structure d’observation publique
2.6 Démonstration des théorèmes Folk avec observation parfaite
2.6.1 Théorème 2.8 Folk infini avec observation parfaite
2.6.2 Théorème 2.10 Folk escompté avec observation parfaite
2.6.3 Théorème 2.13 Folk fini avec observation parfaite
2.7 Conclusion et perspectives
3 Jeu du contrôle de puissance
3.1 Description et résultats principaux
3.2 Modèle de canal
3.3 Jeu du contrôle de puissance en un coup
3.4 Jeu du contrôle de puissance avec hiérarchie
3.5 Jeu du contrôle de puissance répété
3.5.1 Hypothèses d’information stratégique
3.5.2 Jeu répété pour le jeu du contrôle du puissance
3.5.3 Point de coopération intéressant pour le jeu en un coup G
3.5.4 Stratégies d’équilibre du jeu répété
3.6 Le théorème Folk et le contrôle de puissance
3.6.1 Contrôle de puissance lent
3.6.2 Contrôle de puissance rapide
3.6.2.1 Déroulement du jeu
3.6.2.2 Propriété d’irréductibilité et indépendance de l’état initial
3.6.2.3 Résultat principal : le théorème Folk
3.7 Résultats numériques
3.8 Démonstrations
3.8.1 Démonstration de la proposition 3.9
3.8.2 Démonstration de la proposition 3.10
3.8.3 Démonstration des théorèmes 3.11 et 3.12
3.8.4 Démonstration du théorème 3.14
3.8.5 Démonstration du théorème 3.18
3.9 Conclusion et perspectives
Conclusion