Un algorithme exa-informatique à la recherche de molécules

La mise au point de nouveaux médicaments est un processus de longue haleine qui coûte en moyenne 2,6 milliards de dollars par médicament homologué. Si le coût est aussi élevé, c’est parce que la découverte d’une minuscule molécule capable de se lier à une certaine cible est un processus hasardeux qui, dans bien des cas, prend une dizaine d’années avant d’aboutir. Et même advenant la découverte d’une molécule, il y a des risques que celle-ci ne fasse pas très bien son travail et qu’elle se révèle inefficace lors des étapes ultérieures des essais. On doit alors s’empresser de trouver une meilleure candidate au plus vite.

Il y a autant de molécules susceptibles d’avoir des propriétés pharmacologiques qu’il y a d’atomes dans l’univers.

Tous les remèdes découverts dans l’histoire de l’humanité sont le fruit de l’échantillonnage d’une infime fraction de cette multitude. Le reste recèle probablement des solutions thérapeutiques auxquelles nous aurions accès si nous savions mieux explorer l’éventail des possibilités.

C’est pourquoi nous cherchons à mettre au point une technique de recherche pouvant atteindre l’échelle exa, soit 10^18 molécules. Une recherche de cette ampleur prendrait 1 000 milliards d’années de processeur avec les méthodes existantes fondées sur les lois de la physique.

Les molécules s’apparentent à un ensemble de blocs de construction (pensez aux briques LEGO) pouvant être assemblés de mille et une façons. La recherche dans le monde moléculaire équivaut à trouver les innombrables combinaisons possibles de ces blocs.

Or, tout comme AlphaZero utilise la recherche arborescente Monte-Carlo (MCTS) pour maîtriser le jeu de Go, notre algorithme LambdaZero fait appel à la MCTS pour explorer le monde moléculaire.

Le récepteur de la dopamine D4 est une importante protéine du cerveau humain. Sonder le vaste domaine des molécules* permet de trouver des molécules dotées d’une énergie de liaison plus négative. Et qui dit énergie de liaison plus négative dit association plus efficace entre la minuscule molécule et la protéine, et donc meilleure liaison et meilleures propriétés pharmacologiques.

*Ultra-large Scale Docking for Discovering New Chemotypes, Wu at al. Nature, 2019. 

Best molecule

200M simulations

Binding Energy: -75.6

Best molecule

 LambdaZero

 Binding Energy: -85.1

Appliquée au récepteur de la dopamine D4, une importante protéine du cerveau humain, LambdaZero permettrait de découvrir une molécule plus efficace que ne l’a fait l’une des plus vastes simulations moléculaires fondées sur les lois de la physique* jamais réalisées.

*Ultra-large Scale Docking for Discovering New Chemotypes, Wu at al. Nature, 2019. 

Team

Maksym Korablyov

EngineerZero

Kostiantyn Lapchevskyi

Software Engineer

Sasha Luccioni

Project Manager

Sacha Leprêtre

HPC Specialist

Shenghao Liu

Software Engineer

John Bradshaw

Software Engineer

Shivam Patel

RL Engineer

Matt Kusner

Molecule Learning  Advisor

Marvin Segler

Molecule Learning Advisor

Will Hamilton

Graph Learning Advisor

Brooks Paige

Molecule Learning Advisor

Mike Tyers

Biomedical Assays

Jian Tang

Graph DL Advisor

Doina Precup

RL Advisor

Yoshua Bengio

Director, Advisor

Nous utilisons LambdaZero de toute urgence pour contribuer à la lutte contre la pandémie de COVID-19. Nous vous invitons à lire le message de Yoshua Bengio à ce sujet.

Mila is launching several research projects aimed to leveraging ML to fight COVID-19, e.g., see the preliminary list there, https://mila.quebec/en/mila-and-its-partners-rally-the-scientific-community-to-develop-novel-data-driven-solutions-to-assist-with-covid-19-outbreak/.

Today I am writing to ask for volunteers to work on our project on Deep RL for accelerated discovery of SARS-CoV-2 antiviral molecules. Because time is of the essence to fight COVID-19, the focus of the proposed research is on speeding up the training and optimization in molecular space in order to come up with candidate molecules to be tested by our biomedical partners in biological and biomedical assays (and if these work, in clinical trials). We already got very promising results,v’est p allowing us to screen orders of magnitude more molecules than existing techniques and obtain stronger binding to protein targets. We now want to focus on protein targets for COVID-19.

We need people to help on several fronts for about 4 months, including:

  • Running experiments with our current code, exploring hyper-parameter space

  • Improving the efficiency of the current code, in particular for parallelization on cloud or clusters

  • Improving the RL strategies used

  • Improving the deep learning architectures used.

Here are some slide-like descriptions of the approach, drafted by Maksym Korablyov, who is an MIT grad student who has been working for about a year with me at Mila, has a lot of chemistry experience and leads the underlying science with me:

https://mila.quebec/en/exascale-search-of-molecules/

If you are interested in helping or knowing more, please fill this form: https://docs.google.com/forms/d/e/1FAIpQLSe1VjWc2WOAybytRbYe6MxiVxBwT4IySSqG2FkehxIOo9Oa7Q/viewform

Mila professors who already want to contribute include: Doina Precup, Pierre-Luc Bacon and Jian Tang (plus me of course). We need dedicated people on this project. We are also going to ask for funding to help the project (mostly for the fabrication of the molecules) so we should also be able to provide funding to alternative students who may be diverted from other previously planned projects while being involved in this one.

I hope that I don’t need to tell anyone how important it is that we get involved to the extent we can to fight this war, which hopefully will unite all of humanity against the virus and against the incompetent actions which could leave millions dead unnecessarily. Hopefully that fight and those deaths will also leave something positive in the minds of as many people as possible:  the profound realization that we are all in it together on this planet, for this fight as well as for many others.

– Yoshua

array(1) { ["wp-wpml_current_language"]=> string(2) "fr" }

Mila passe en mode virtuel

À partir du 16 mars 2020, Mila redirige ses activités vers des plateformes virtuelles afin de minimiser la diffusion de COVID-19.

En savoir plus