La fonctionnalité de recherche est en construction.
La fonctionnalité de recherche est en construction.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Model-Based Reinforcement Learning in Multiagent Systems with Sequential Action Selection Apprentissage par renforcement basé sur un modèle dans les systèmes multi-agents avec sélection d'actions séquentielles

Ali AKRAMIZADEH, Ahmad AFSHAR, Mohammad Bagher MENHAJ, Samira JAFARI

  • Vues en texte intégral

    0

  • Citer

Résumé:

L'apprentissage par renforcement basé sur un modèle utilise les informations recueillies, au cours de chaque expérience, plus efficacement que l'apprentissage par renforcement sans modèle. Ceci est particulièrement intéressant dans les systèmes multiagents, puisqu’un grand nombre d’expériences sont nécessaires pour obtenir une bonne performance. Dans cet article, l'apprentissage par renforcement basé sur un modèle est développé pour un groupe d'agents intéressés avec une sélection d'actions séquentielles basée sur un balayage hiérarchisé traditionnel. Chaque situation de prise de décision dans ce processus d’apprentissage, appelé jeu de Markov étendu, est modélisée comme suit : n-Jeu de forme étendue à somme générale et à information parfaite. Une version modifiée de l'induction rétrospective est proposée pour la sélection d'actions, qui ajuste le compromis entre la sélection des points d'équilibre parfait du sous-jeu, comme actions conjointes optimales, et l'apprentissage de nouvelles actions conjointes. L'algorithme s'est révélé convergent et discuté sur la base des nouveaux résultats sur la convergence du balayage priorisé traditionnel.

Publication
IEICE TRANSACTIONS on Information Vol.E94-D No.2 pp.255-263
Date de publication
2011/02/01
Publicisé
ISSN en ligne
1745-1361
DOI
10.1587/transinf.E94.D.255
Type de manuscrit
PAPER
Catégories
Fondamentaux des Systèmes d'Information

Auteurs

Mots-clés

Table des matières