La fonctionnalité de recherche est en construction.
La fonctionnalité de recherche est en construction.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Hybrid of Reinforcement and Imitation Learning for Human-Like Agents Hybride d'apprentissage par renforcement et par imitation pour les agents de type humain

Rousslan F. J. DOSSA, Xinyu LIAN, Hirokazu NOMOTO, Takashi MATSUBARA, Kuniaki UEHARA

  • Vues en texte intégral

    0

  • Citer

Résumé:

Les méthodes d’apprentissage par renforcement atteignent des performances supérieures à celles des humains dans un large éventail de tâches complexes et d’environnements incertains. Cependant, les hautes performances ne sont pas la seule mesure d’utilisation pratique, comme dans un jeu d’IA ou de conduite autonome. Un agent très efficace agit de manière cupide et égoïste, et est donc peu pratique pour les utilisateurs environnants, d'où une demande pour des agents de type humain. L'apprentissage par imitation reproduit le comportement d'un expert humain et construit un agent semblable à un humain. Cependant, ses performances sont limitées à celles des experts. Dans cette étude, nous proposons un programme de formation pour construire un agent efficace et semblable à un humain en mélangeant l'apprentissage par renforcement et par imitation pour des problèmes d'espace d'action discrets et continus. L'agent hybride proposé atteint des performances supérieures à celles d'un agent d'apprentissage par imitation stricte et présente un comportement plus humain, mesuré via un test de sensibilité humaine.

Publication
IEICE TRANSACTIONS on Information Vol.E103-D No.9 pp.1960-1970
Date de publication
2020/09/01
Publicisé
2020/06/15
ISSN en ligne
1745-1361
DOI
10.1587/transinf.2019EDP7298
Type de manuscrit
PAPER
Catégories
Intelligence artificielle, exploration de données

Auteurs

Rousslan F. J. DOSSA
  Kobe University
Xinyu LIAN
  Kobe University
Hirokazu NOMOTO
  EQUOS RESEARCH Co., Ltd.
Takashi MATSUBARA
  Osaka University
Kuniaki UEHARA
  Osaka Gakuin University

Mots-clés

Table des matières