Portrait de Derek Nowrouzezahrai

Derek Nowrouzezahrai

Membre académique principal
Chaire en IA Canada-CIFAR
Professeur agrégé, McGill University, Département de génie électrique et informatique
Sujets de recherche
Apprentissage de représentations
Apprentissage par renforcement
Apprentissage profond
Modèles génératifs
Photographie computationnelle
Systèmes dynamiques
Vision par ordinateur

Biographie

Derek Nowrouzezahrai est professeur titulaire à l'Université McGill, directeur du Centre sur les machines intelligentes et codirecteur du Laboratoire de graphisme et d’imagerie de McGill (MGIL), ainsi que titulaire d’une chaire en IA Canada-CIFAR et de la chaire Ubisoft-Mila de mise à l'échelle des univers de jeux grâce à une IA responsable.

Ses recherches portent sur la simulation de divers phénomènes physiques - tels que la dynamique des objets en mouvement et l'éclairage pour la synthèse d'images réalistes - avec des applications dans les domaines de la réalité virtuelle, des jeux vidéo, de la simulation fluide et contrôlée, de la fabrication numérique, de l'optique augmentée par le calcul et du traitement de la géométrie. En outre, Derek s'intéresse au développement de simulateurs dérivables de ces systèmes dynamiques et à leurs applications aux problèmes inverses en robotique et dans le domaine de la vision.

Son travail repose sur le développement de méthodes Monte Carlo à haute performance et efficaces en matière d'échantillonnage (chaîne de Markov), de statistiques d'ordre élevé et de méthodes de calcul pour les problèmes d'intégration multidimensionnelle complexes, de simulateurs dérivables basés sur la physique et de méthodes numériques pour les systèmes dynamiques, ainsi que sur l'application de l'apprentissage automatique aux médias 3D, visuels et interactifs.

Étudiants actuels

Doctorat - McGill
Collaborateur·rice de recherche - McGill
Co-superviseur⋅e :
Maîtrise recherche - UdeM
Superviseur⋅e principal⋅e :
Doctorat - McGill
Maîtrise recherche - McGill
Doctorat - McGill
Doctorat - McGill
Superviseur⋅e principal⋅e :
Doctorat - McGill
Doctorat - McGill
Doctorat - McGill
Co-superviseur⋅e :
Maîtrise recherche - McGill

Publications

Adversarial Soft Advantage Fitting: Imitation Learning without Policy Optimization
Paul Barde
Julien Roy
Wonseok Jeon
Adversarial imitation learning alternates between learning a discriminator -- which tells apart expert's demonstrations from generated ones … (voir plus)-- and a generator's policy to produce trajectories that can fool this discriminator. This alternated optimization is known to be delicate in practice since it compounds unstable adversarial training with brittle and sample-inefficient reinforcement learning. We propose to remove the burden of the policy optimization steps by leveraging a novel discriminator formulation. Specifically, our discriminator is explicitly conditioned on two policies: the one from the previous generator's iteration and a learnable policy. When optimized, this discriminator directly learns the optimal generator's policy. Consequently, our discriminator's update solves the generator's optimization problem for free: learning a policy that imitates the expert does not require an additional optimization loop. This formulation effectively cuts by half the implementation and computational burden of adversarial imitation learning algorithms by removing the reinforcement learning phase altogether. We show on a variety of tasks that our simpler approach is competitive to prevalent imitation learning methods.