Publications

SAMSON: Sharpness-Aware Minimization Scaled by Outlier Normalization for Improving DNN Generalization and Robustness

Sébastien Henwood

A. Chandar

Franccois Leduc-Primeau

Energy-efficient deep neural network (DNN) accelerators are prone to non-idealities that degrade DNN performance at inference time. To mitig… (see more)ate such degradation, existing methods typically add perturbations to the DNN weights during training to simulate inference on noisy hardware. However, this often requires knowledge about the target hardware and leads to a trade-off between DNN performance and robustness, decreasing the former to increase the latter. In this work, we show that applying sharpness-aware training, by optimizing for both the loss value and loss sharpness, significantly improves robustness to noisy hardware at inference time without relying on any assumptions about the target hardware. In particular, we propose a new adaptive sharpness-aware method that conditions the worst-case perturbation of a given weight not only on its magnitude but also on the range of the weight distribution. This is achieved by performing sharpness-aware minimization scaled by outlier minimization (SAMSON). Our approach outperforms existing sharpness-aware training methods both in terms of model generalization performance in noiseless regimes and robustness in noisy settings, as measured on several architectures and datasets.

2022-11-17

ArXiv (preprint)

arxiv.org

APP: Anytime Progressive Pruning

Diganta Misra

Bharat Runwal

Tianlong Chen

Zhangyang Wang

Irina Rish

With the latest advances in deep learning, several methods have been investigated for optimal learning settings in scenarios where the data … (see more)stream is continuous over time. However, training sparse networks in such settings has often been overlooked. In this paper, we explore the problem of training a neural network with a target sparsity in a particular case of online learning: the anytime learning at macroscale paradigm (ALMA). We propose a novel way of progressive pruning, referred to as \textit{Anytime Progressive Pruning} (APP); the proposed approach significantly outperforms the baseline dense and Anytime OSP models across multiple architectures and datasets under short, moderate, and long-sequence training. Our method, for example, shows an improvement in accuracy of

2022-11-16

ACML.org/2022/Workshop/CLL (accepted)

doi.org

openreview.net

The Liver Tumor Segmentation Benchmark (LiTS)

Patrick Bilic

Patrick Christ

Eugene Vorontsov

Hongwei Bran Li

Grzegorz Chlebus

Hao Chen

Qi Dou

Chi-Wing Fu

Xu Han

Gabriel Efrain Humpire Mamani

Pheng Ann Heng

Jürgen Hesser

Samuel Kadoury

Julian Walter Holch

Tomasz Konopczynski

Miao Yue

Chunming Li

X. Li

Jana Lipková

John Lowengrub … (see 99 more)

Michal Marianne Amitai

Hans Meine

J. Moltz

Christopher Pal

Marie Piraud

Ivan Ezhov

Xiaojuan Qi

Fernando Navarro

Jin Qi

Florian Kofler

Markus Rempfler

Johannes C. Paetzold

Karsten Roth

Suprosanna Shit

Andrea Schenk

Xiaobin Hu

Anjany Sekuboyina

Ping Zhou

Christian Hülsemeyer

Marcel Beetz

Jan Kirschke

Florian Ettlinger

Felix Gruen

Benedikt Wiestler

Zhiheng Zhang

Georgios Kaissis

Fabian Lohöfer

Rickmer Braren

J. Holch

Michela Antonelli

Felix Hofmann

Woong Bae

Wieland Sommer

Míriam Bellver

Volker Heinemann

Lei Bi

Colin Jacobs

G. Mamani

Bram van Ginneken

Erik B. Dam

Gabriel Chartrand

An Tang

Michal Drozdzal

Bogdan Georgescu

Avi Ben-Cohen

Xavier Giró-i-Nieto

Eyal Klang

M. Amitai

E. Konen

Hayit Greenspan

Johan Moreau

Jan Hendrik Moltz

Alexandre Hostettler

Christian Igel

Luc Soler

Fabian Isensee

Refael Vivanti

Paul Jäger

Adi Szeskin

Fucang Jia

Naama Lev-Cohain

Krishna Chaitanya Kaluva

Jacob Sosna

Mahendra Khened

Leo Joskowicz

Ildoo Kim

Bjoern Menze

Jae-Hun Kim

Zengming Shen

Sungwoong Kim

Simon Kohl

Avinash Kori

Ganapathy Krishnamurthi

Fan Li

Hongchao Li

Junbo Li

Xiaomeng Li

Jun Ma

Klaus Maier-Hein

Kevis-Kokitsi Maninis

Dorit Merhof

Akshay Pai

Mathias Perslev

Jens Petersen

Jordi Pont-Tuset

Oliver Rippel

Ignacio Sarasua

Jordi Torres

Christian Wachinger

Chunliang Wang

Leon Weninger

Jianrong Wu

Daguang Xu

Xiaoping Yang

Simon Chun-Ho Yu

Yading Yuan

Liping Zhang

Jorge Cardoso

Spyridon Bakas

2022-11-16

Medical image analysis (published)

doi.org

arxiv.org

Clinically Plausible Pathology-Anatomy Disentanglement in Patient Brain MRI with Structured Variational Priors

Anjun Hu

Jean-Pierre R. Falet

Brennan Nichyporuk

Changjian Shui

Douglas Arnold

Sotirios A. Tsaftaris

Tal Arbel

We propose a hierarchically structured variational inference model for accurately disentangling observable evidence of disease (e.g. brain l… (see more)esions or atrophy) from subject-specific anatomy in brain MRIs. With flexible, partially autoregressive priors, our model (1) addresses the subtle and fine-grained dependencies that typically exist between anatomical and pathological generating factors of an MRI to ensure the clinical validity of generated samples; (2) preserves and disentangles finer pathological details pertaining to a patient's disease state. Additionally, we experiment with an alternative training configuration where we provide supervision to a subset of latent units. It is shown that (1) a partially supervised latent space achieves a higher degree of disentanglement between evidence of disease and subject-specific anatomy; (2) when the prior is formulated with an autoregressive structure, knowledge from the supervision can propagate to the unsupervised latent units, resulting in more informative latent representations capable of modelling anatomy-pathology interdependencies.

2022-11-14

ArXiv (preprint)

doi.org

arxiv.org

Teaching Algorithmic Reasoning via In-context Learning

Hattie Zhou

Azade Nova

Hugo Larochelle

Aaron Courville

Behnam Neyshabur

Hanie Sedghi

2022-11-14

ArXiv (preprint)

doi.org

openreview.net

On the Compositional Generalization Gap of In-Context Learning

Pretrained large generative language models have shown great performance on many tasks, but exhibit low compositional generalization abiliti… (see more)es. Scaling such models has been shown to improve their performance on various NLP tasks even just by conditioning them on a few examples to solve the task without any fine-tuning (also known as in-context learning). In this work, we look at the gap between the in-distribution (ID) and out-of-distribution (OOD) performance of such models in semantic parsing tasks with in-context learning. In the ID settings, the demonstrations are from the same split (test or train) that the model is being evaluated on, and in the OOD settings, they are from the other split. We look at how the relative generalization gap of in-context learning evolves as models are scaled up. We evaluate four model families, OPT, BLOOM, CodeGen and Codex on three semantic parsing datasets, CFQ, SCAN and GeoQuery with different number of exemplars, and observe a trend of decreasing relative generalization gap as models are scaled up.

2022-11-14

ArXiv (preprint)

doi.org

arxiv.org

NeurIPS 2022 Competition: Driving SMARTS

Amir Hossein Rasouli

R. Goebel

Matthew E. Taylor

Iuliia Kotseruba

Soheil Alizadeh

Tianpei Yang

Montgomery Alban

Florian Shkurti

Yuzheng Zhuang

Adam Ścibior

Kasra Rezaee

Animesh Garg

David Meger

Jun Luo

Liam Paull

Weinan Zhang

Xinyu Wang

Xiangshan Chen

2022-11-13

ArXiv (preprint)

doi.org

arxiv.org

PatchBlender: A Motion Prior for Video Transformers

Gabriele Prato

Yale Song

Janarthanan Rajendran

R Devon Hjelm

Neel Joshi

A. Chandar

2022-11-10

ArXiv (preprint)

doi.org

openreview.net

Global SARS-CoV-2 seroprevalence from January 2020 to April 2022: A systematic review and meta-analysis of standardized population-based studies

Isabel Bergeri

Mairead Whelan

Harriet Ware

Lorenzo Subissi

Anthony Nardone

Hannah C. Lewis

Zihan Li

Xiaomeng Ma

Marta Valenciano

Brianna Cheng

Lubna Al Ariqi

Arash Rashidian

Joseph Okeibunor

Tasnim Azim

Pushpa Wijesinghe

Linh-Vi Le

Aisling Vaughan

Richard Pebody

Andrea Vicari

Tingting Yan … (see 9 more)

Mercedes Yanes-Lane

Christian Cao

David A. Clifton

Matthew P. Cheng

Jesse Papenburg

David L Buckeridge

Niklas Bobrovitz

Rahul K. Arora

Maria D Van Kerkhove

2022-11-09

PLOS Medicine (published)

doi.org

SVRG meets AdaGrad: painless variance reduction

Benjamin Dubois-Taine

Sharan Vaswani

Reza Babanezhad Harikandeh

Mark Schmidt

Simon Lacoste-Julien

2022-11-09

Machine Learning (published)

doi.org

arxiv.org

BLOOM: A 176B-Parameter Open-Access Multilingual Language Model

Teven Le Scao

Angela Fan

Christopher Akiki

Ellie Pavlick

Suzana Ili'c

Daniel Hesslow

Roman Castagn'e

Alexandra Luccioni

François Yvon

Matthias Gall'e

J. Tow

Alexander M. Rush

Stella Biderman

Alex Webson

Pawan Sasanka Ammanamanchi

Thomas Wang

Benoı̂t Sagot

Niklas Muennighoff

Albert Villanova del Moral

Olatunji Ruwase … (see 372 more)

Rachel Bawden

Stas Bekman

Angelina McMillan-Major

Iz Beltagy

Huu Nguyen

Lucile Saulnier

Samson Tan

Pedro Ortiz Suarez

Victor Sanh

Hugo Laurençon

Yacine Jernite

Julien Launay

Margaret Mitchell

Colin Raffel

Aaron Gokaslan

Adi Simhi

Aitor Soroa

Alham Fikri Aji

Amit Alfassy

Anna Rogers

Ariel Kreisberg Nitzav

Canwen Xu

Chenghao Mou

Chris Emezue

Christopher Klamm

Colin D. Leong

Daniel Van Strien

David Ifeoluwa Adelani

Dragomir R. Radev

Eduardo González Ponferrada

Efrat Levkovizh

Ethan Kim

Eyal Bar Natan

Francesco De Toni

Gérard Dupont

Germán Kruszewski

Giada Pistilli

Hady Elsahar

Hamza Benyamina

Hieu Tran

Ian W. Yu

Idris Abdulmumin

Isaac L. Johnson

Itziar Gonzalez-Dios

Javier de la Rosa

Jenny Chim

Jesse Dodge

Jian Zhu

Jonathan Chang

Jörg Frohberg

Josephine L. Tobing

J. Bhattacharjee

Khalid Almubarak

Kimbo Chen

Kyle Lo

Leandro Von Werra

Leon Weber

Long Phan

Loubna Ben allal

Ludovic Tanguy

Manan Dey

Manuel Romero Muñoz

Maraim Masoud

Mar'ia Grandury

Mario Šaško

Max Huang

Maximin Coavoux

Mayank Singh

Mike Tian-Jian Jiang

Vu Minh Chien

Mohammad Ali Jauhar

Mustafa Ghaleb

Nishant Subramani

Nora Kassner

Nurulaqilla Khamis

Olivier Nguyen

Omar Espejel

Ona de Gibert

Paulo Villegas

Peter Henderson

Pierre Colombo

Priscilla A. Amuok

Quentin Lhoest

Rheza Harliman

Rishi Bommasani

Roberto Luis L'opez

Rui Ribeiro

Salomey Osei

Sampo Pyysalo

Sebastian Nagel

Shamik Bose

Shamsuddeen Hassan Muhammad

Shanya Sharma Sharma

Shayne Longpre

Somaieh Nikpoor

S. Silberberg

Suhas Pai

Sydney Zink

Tiago Timponi Torrent

Timo Schick

Tristan Thrush

Valentin Danchev

Vassilina Nikoulina

Veronika Laippala

Violette Lepercq

Vrinda Prabhu

Zaid Alyafeai

Zeerak Talat

Arun Raja

Benjamin Heinzerling

Chenglei Si

Elizabeth E Salesky

Sabrina J. Mielke

Wilson Y. Lee

Abheesht Sharma

Andrea Santilli

Antoine Chaffin

Arnaud Stiegler

Debajyoti Datta

Eliza Szczechla

Gunjan Chhablani

Han Wang

Harshit Pandey

Hendrik. Strobelt

Jason Alan Fries

Jos Rozen

Leo Gao

Lintang A. Sutawika

M. Saiful Bari

Maged S. Al-shaibani

Matteo Manica

Nihal V. Nayak

Ryan Teehan

Samuel Albanie

Sheng Shen

Srulik Ben-David

Stephen H. Bach

Taewoon Kim

T. Bers

Thibault F'evry

Trishala Neeraj

Urmish Thakker

Vikas Raunak

Xiang Tang

Zheng Xin Yong

Zhiqing Sun

Shaked Brody

Y. Uri

Hadar Tojarieh

Adam Roberts

Hyung Won Chung

Jaesung Tae

Jason Phang

Ofir Press

Conglong Li

D. Narayanan

Hatim Bourfoune

Jared Casper

Jeff Rasley

Max Ryabinin

Mayank Mishra

Minjia Zhang

Mohammad Shoeybi

Myriam Peyrounette

Nicolas Patry

Nouamane Tazi

Omar Sanseviero

Patrick von Platen

Pierre Cornette

Pierre Franccois Lavall'ee

R'emi Lacroix

Samyam Rajbhandari

Sanchit Gandhi

Shaden Smith

St'ephane Requena

Suraj Patil

Tim Dettmers

Ahmed Baruwa

Amanpreet Singh

Anastasia Cheveleva

Anne-Laure Ligozat

Arjun Subramonian

Aur'elie N'ev'eol

Charles Lovering

Dan Garrette

D. Tunuguntla

Ehud Reiter

Ekaterina Taktasheva

E. Voloshina

Eli Bogdanov

Genta Indra Winata

Hailey Schoelkopf

Jan-Christoph Kalo

Jekaterina Novikova

Jessica Zosa Forde

Xiangru Tang

Jungo Kasai

Ken Kawamura

Liam Hazan

Marine Carpuat

Miruna-adriana Clinciu

Najoung Kim

Newton Cheng

O. Serikov

Omer Antverg

Oskar van der Wal

Rui Zhang

Ruochen Zhang

Sebastian Gehrmann

Shachar Mirkin

S. Pais

Tatiana Shavrina

Thomas Scialom

Tian Yun

Tomasz Limisiewicz

Verena Teresa Rieser

Vitaly Protasov

V. Mikhailov

Yada Pruksachatkun

Yonatan Belinkov

Zachary Bamberger

Zdenˇek Kasner

Zdeněk Kasner

A. Pestana

Amir Feizpour

Ammar Khan

Amy Faranak

A. Santos

Anthony Hevia

Antigona Unldreaj

Arash Aghagol

Arezoo Abdollahi

Aycha Tammour

Azadeh Hajihosseini

Bahareh Behroozi

Benjamin A. Ajibade

B. Saxena

Carlos Muñoz Ferrandis

Danish Contractor

D. Lansky

Davis David

Douwe Kiela

Duong Anh Nguyen

Edward Chwee Kheng. Tan

Emi Baylor

Ezinwanne Ozoani

F. Mirza

Frankline Ononiwu

Habib Rezanejad

H.A. Jones

Indrani Bhattacharya

Irene Solaiman

Irina Sedenko

Isar Nejadgholi

J. Passmore

Joshua Seltzer

Julio Bonis Sanz

Karen Fort

Livia Macedo Dutra

Mairon Samagaio

Maraim Elbadri

Margot Mieskes

Marissa Kumar Gerchick

Martha Akinlolu

Michael McKenna

Mike Qiu

M. Ghauri

Mykola Burynok

Nafis Abrar

Nazneen Fatema Rajani

Nour Elkott

N. Fahmy

Olanrewaju Samuel

Ran An

R. Kromann

Ryan Hao

Samira Hassan Alizadeh

Sarmad Shubber

Silas L. Wang

Sourav Roy

Sylvain Viguier

Thanh-Cong Le

Tobi Oyebade

T. Le

Yoyo Yang

Zach Nguyen

Abhinav R. Kashyap

Alfredo Palasciano

Alison Callahan

Anima Shukla

Antonio Miranda-Escalada

Ayush Singh

Benjamin Beilharz

Bo Wang

Caio Matheus Fonseca De Brito

Chenxi Zhou

Chirag Jain

Chuxin Xu

Cl'ementine Fourrier

Daniel Le'on Perin'an

Daniel Molano

Dian Yu

Enrique Manjavacas

Fabio Barth

Florian Fuhrimann

Gabriel Altay

Giyaseddin Bayrak

Gully Burns

Helena U. Vrabec

I. Bello

Isha Dash

J. Kang

John Michael Giorgi

Jonas Golde

J. Posada

Karthi Sivaraman

Lokesh Bulchandani

Li Li

Luisa Shinzato

Madeleine Hahn de Bykhovetz

Maiko Takeuchi

Marc Pamies

M. A. Castillo

Marianna Nezhurina

Mario Sanger

Matthias Samwald

Michael Joseph Cullan

Michael Weinberg

Michiel De Wolf

Mina Mihaljcic

Minna Liu

Moritz Freidank

Myungsun Kang

Natasha Seelam

Nathan Dahlberg

Nicholas Michio Broad

Nikolaus Muellner

Pascale Fung

Patricia Haller

Ramya Chandrasekhar

Patrick Haller

Renata Eisenberg

Robert Martin

Rodrigo Canalli

Rosaline Su

Ruisi Su

Samuel Cahyawijaya

Samuele Garda

Shlok S Deshmukh

Shubhanshu Mishra

Sid Kiblawi

Simon Ott

Sinee Sang-aroonsiri

Srishti Kumar

Stefan Schweter

Sushil Pratap Bharati

Tanmay Laud

Th'eo Gigant

Tomoya Kainuma

Wojciech Kusa

Yanis Labrak

Yashasvi Bajaj

Yash Venkatraman

Yifan Xu

Ying Xu

Yu Xu

Zhijun Tan

Zhongli Xie

Zifan Ye

Mathilde Le Bras

Younes Belkada

Thomas Wolf

2022-11-08

ArXiv (preprint)

doi.org

arxiv.org

Flaky Performances when Pretraining on Relational Databases

Shengchao Liu

David Vázquez

Jian Tang

Pierre-Andre Noel

2022-11-08

ArXiv (preprint)

doi.org

arxiv.org

AI Policy Fellowship Publications

Mila Ventures Launchpad

AI Policy Compass

Publications

AI Policy Fellowship Publications

Mila Ventures Launchpad

AI Policy Compass

Popular keywords:

Publications