Publication Archive - Page 5 sur 14

Unreproducible Research is Reproducible

Posted on02/03/2019

La contradiction apparente dans le titre est un jeu de mots sur les différentes significations attribuées au mot reproductible dans différents domaines...

Revisiting Reweighted Wake-Sleep for Models with Stochastic Control Flow

Posted on01/03/2019

Les modèles de flux de contrôle stochastiques (SCFMs) sont une classe de modèles génératifs qui impliquent de choisir des variables aléatoires discrètes....

The Thermodynamic Variational Objective

Posted on01/03/2019

Nous introduisons l’objectif variationnel thermodynamique (TVO) pour l’apprentissage au sein des modèles génératifs continus et discrets. Le TVO découle d’un lien essentiel...

Hyperbolic Discounting and Learning over Multiple Horizons

Posted on19/02/2019

L’apprentissage par renforcement (RL) définit généralement un facteur de réduction dans le cadre du processus de décision de Markov. Le facteur d’escompte...

Separating value functions across time-scales

Posted on05/02/2019

Dans de nombreux paramètres d’apprentissage par renforcement épisodiques à horizon fini, il est souhaitable d’optimiser le retour non actualisé. Dans des paramètres...

Separating value functions across time-scales

Posted on05/02/2019

Dans de nombreux paramètres d’apprentissage par renforcement épisodique à horizon fini, il est souhaitable d’optimiser le retour non actualisé. Dans des paramètres...

Per-Decision Option Discounting

Posted on03/02/2019

Pour résoudre des problèmes complexes, un agent doit être capable de raisonner sur un horizon suffisamment long. Abstraction temporelle, couramment modelée à...

GEOMetrics: Exploiting Geometric Structure for Graph-Encoded Objects

Posted on31/01/2019

Les modèles de maillage constituent une approche prometteuse pour coder la structure des objets 3D. Les systèmes de reconstruction de maillage actuels...

The Value Function Polytope in Reinforcement Learning

Posted on31/01/2019

Nous établissons les propriétés géométriques et topologiques de l’espace des fonctions de valeur dans les processus de décision de Markov à états...

A Many-Objective Evolutionary Algorithm with Two Interacting Processes: Cascade Clustering and Reference Point Incremental Learning

Posted on30/01/2019

Les recherches ont montré des difficultés pour obtenir la proximité tout en maintenant la diversité pour résoudre des problèmes d’optimisation à objectifs...