Learning by Demonstration in Repeated Stochastic Games

Juin 2018

Learning by Demonstration in Repeated Stochastic Games

Juin 2018

Malgré de nombreuses recherches au cours des dernières années, les algorithmes d’apprentissage multi-agents (MAL) nouvellement créés continuent d’avoir une ou plusieurs faiblesses fatales. Ces faiblesses incluent les taux d’apprentissage lents, l’incapacité à apprendre des solutions non-myopes et l’incapacité de passer aux domaines comportant de nombreuses actions, états et associés. Pour surmonter ces faiblesses, nous soutenons que des approches fondamentalement différentes du MAL devraient être développées. Une possibilité est de développer des méthodes permettant aux gens d’enseigner des agents d’apprentissage. Pour commencer à déterminer l’utilité de cette approche, nous explorons l’efficacité de l’apprentissage par démonstration (LbD) dans des jeux stochastiques répétés.

Reference

[Aigaion][AAMAS '11]

Learning by Demonstration in Repeated Stochastic Games

Learning by Demonstration in Repeated Stochastic Games

Reference

Linked Profiles

Malik H. Altakrori