TarMAC: Targeted Multi-Agent Communication

Oct 2018

TarMAC: Targeted Multi-Agent Communication

Oct 2018

Nous explorons un environnement d’apprentissage par renforcement multi-agents collaboratif dans lequel une équipe d’agents tente de résoudre des tâches coopératives dans des environnements partiellement observables. Dans ce scénario, l’apprentissage d’un protocole de communication efficace est essentiel. Nous proposons une architecture de communication permettant une communication ciblée, dans laquelle les agents apprennent à la fois quels messages envoyer et à qui les envoyer, uniquement à partir d’une récompense spécifique à une tâche en aval, sans aucune supervision de la communication. De plus, nous introduisons une approche de communication multi-étapes dans laquelle les agents se coordonnent via plusieurs tours de communication avant de prendre des mesures dans l’environnement. Nous évaluons notre approche sur un ensemble diversifié de tâches multi-agents coopératifs, de difficultés variées, avec un nombre variable d’agents, dans une variété d’environnements allant des configurations de grille 2D de formes et des jonctions de trafic simulées aux environnements intérieurs 3D complexes. Nous démontrons les avantages d’une communication ciblée et multi-étapes. De plus, nous montrons que les stratégies de communication ciblées apprises par les agents sont à la fois interprétables et intuitives.

Reference

Linked Profiles