Unreproducible Research is Reproducible
Posted on02/03/2019
La contradiction apparente dans le titre est un jeu de mots sur les différentes significations attribuées au mot reproductible dans différents domaines... En savoir plus
Revisiting Reweighted Wake-Sleep for Models with Stochastic Control Flow
Posted on01/03/2019
Les modèles de flux de contrôle stochastiques (SCFMs) sont une classe de modèles génératifs qui impliquent de choisir des variables aléatoires discrètes.... En savoir plus
The Thermodynamic Variational Objective
Posted on01/03/2019
Nous introduisons l’objectif variationnel thermodynamique (TVO) pour l’apprentissage au sein des modèles génératifs continus et discrets. Le TVO découle d’un lien essentiel... En savoir plus
Hyperbolic Discounting and Learning over Multiple Horizons
Posted on19/02/2019
L’apprentissage par renforcement (RL) définit généralement un facteur de réduction dans le cadre du processus de décision de Markov. Le facteur d’escompte... En savoir plus
Separating value functions across time-scales
Posted on05/02/2019
Dans de nombreux paramètres d’apprentissage par renforcement épisodiques à horizon fini, il est souhaitable d’optimiser le retour non actualisé. Dans des paramètres... En savoir plus
Separating value functions across time-scales
Posted on05/02/2019
Dans de nombreux paramètres d’apprentissage par renforcement épisodique à horizon fini, il est souhaitable d’optimiser le retour non actualisé. Dans des paramètres... En savoir plus
Per-Decision Option Discounting
Posted on03/02/2019
Pour résoudre des problèmes complexes, un agent doit être capable de raisonner sur un horizon suffisamment long. Abstraction temporelle, couramment modelée à... En savoir plus
GEOMetrics: Exploiting Geometric Structure for Graph-Encoded Objects
Posted on31/01/2019
Les modèles de maillage constituent une approche prometteuse pour coder la structure des objets 3D. Les systèmes de reconstruction de maillage actuels... En savoir plus
The Value Function Polytope in Reinforcement Learning
Posted on31/01/2019
Nous établissons les propriétés géométriques et topologiques de l’espace des fonctions de valeur dans les processus de décision de Markov à états... En savoir plus
A Many-Objective Evolutionary Algorithm with Two Interacting Processes: Cascade Clustering and Reference Point Incremental Learning
Posted on30/01/2019
Les recherches ont montré des difficultés pour obtenir la proximité tout en maintenant la diversité pour résoudre des problèmes d’optimisation à objectifs... En savoir plus