Une collaboration entre Mila et Relation Therapeutics pour découvrir in vitro de nouvelles associations médicamenteuses synergiques

par
Jake P. Taylor-King

Mila et Relation Therapeutics ont engagé une collaboration fructueuse grâce au projet RECOVER, financé en partie par la Fondation Bill et Melinda Gates. Lancé en 2020, le projet initial visait à découvrir un traitement contre la COVID-19 en identifiant des associations de médicaments repositionnés qui, ensemble, peuvent limiter la pénétration du virus dans les cellules humaines et ralentir sa réplication. Pour découvrir rapidement un nouveau traitement, nous avons proposé d’explorer efficacement l’espace des associations médicamenteuses à l’aide d’un pipeline d’apprentissage actif et d’optimisation séquentielle de modèles. Afin de démontrer la faisabilité de notre approche, nous l’avons appliquée à la découverte de nouvelles associations médicamenteuses efficaces contre le cancer, en raison de la disponibilité de données publiques dans ce domaine.

La combinaison des expertises en apprentissage automatique et en conception expérimentale a été essentielle pour élaborer et mettre en œuvre notre nouvelle méthodologie. Le pipeline d’apprentissage automatique prédit la réponse des cellules cancéreuses à des associations de médicaments et propose des expériences à effectuer en laboratoire dans l’objectif de découvrir de nouvelles associations qui présentent des synergies entre les différents médicaments. Une telle approche constitue un outil puissant qui pourrait permettre de réagir rapidement lors de futures crises de santé publique.

 

Explorer l’espace des associations médicamenteuses

Les associations de médicaments constituent une stratégie thérapeutique de choix pour traiter les maladies soumises à une dynamique évolutive, en particulier les cancers et les maladies infectieuses [1, 2]. D’un point de vue conceptuel, les tumeurs et les virus peuvent évoluer ou muter au fil du temps et développer une résistance à un médicament unique [3]. Les multithérapies pourraient jouer un rôle important dans l’issue de la maladie en augmentant l’efficacité des médicaments et en réduisant leur toxicité, tout en ciblant simultanément plusieurs mécanismes biologiques [4]. Cela réduit le risque de mutation par un agent pathogène qui serait simultanément résistant à tous les médicaments présents dans l’association. Cependant, l’espace des associations médicamenteuses est encore largement inexploré en raison du grand nombre d’expériences possibles, qui est une fonction exponentielle du nombre de médicaments pris en compte. Ceci limite la capacité des ensembles de données actuels à couvrir toutes les régions de cet espace et, en fin de compte, impacte la qualité des prédictions reposant sur l’apprentissage automatique. Une solution rentable est d’avoir recours à l’optimisation séquentielle de modèles (OSM), qui consiste à réaliser à la fois des expériences informatives (« exploration ») et des expériences s’appuyant sur une hypothèse prometteuse (« exploitation ») [5], le compromis classique de l’apprentissage par renforcement. La mise en œuvre d’une telle approche pourrait accélérer la découverte d’associations prometteuses pour un ensemble donné de médicaments tout en nécessitant beaucoup moins d’expérimentation.

Dans le cadre de ce travail, nous nous concentrons sur les indices de synergie entre paires de médicaments, et plus précisément sur l’indice de Bliss, qui compare l’effet conjugué des deux médicaments au résultat attendu étant donné l’effet individuel de chaque médicament. Notre objectif est de découvrir des associations médicamenteuses hautement synergiques capables d’activer le programme de mort cellulaire dans des cellules cancéreuses humaines cultivées in vitro. Bien que l’OSM ait déjà été appliquée aux levures [6] et aux bactéries [7], le fait de se concentrer sur les cellules humaines présentait des défis techniques majeurs, comme la variabilité d’un lot d’expériences à l’autre.

 

RECOVER : une plateforme d’optimisation séquentielle de modèles

Notre outil d’OSM (voir la figure 1) génère des recommandations d’associations médicamenteuses qui sont testées in vitro à intervalles réguliers. À chaque étape, notre modèle est entraîné sur toutes les données déjà acquises. Une fonction d’acquisition prend en entrée les prédictions et les incertitudes du modèle et calcule un score favorisant les associations candidates qui devraient bien fonctionner et pour lesquelles une expérience serait instructive (le modèle est incertain du résultat). Les associations présentant les scores les plus élevés, selon la fonction d’acquisition, sont ensuite envoyées en tant que recommandations pour être testées in vitro. Les résultats des expériences sont ensuite ajoutés aux données d’entraînement pour la prochaine série d’expériences, et tout le processus se répète.

Figure 1. Vue d’ensemble de l’approche RECOVER qui fait itérativement appel à un nouveau pipeline d’apprentissage automatique et à une phase d’évaluation en laboratoire
Figure 1. Vue d’ensemble de l’approche RECOVER qui fait itérativement appel à un nouveau pipeline d’apprentissage automatique et à une phase d’évaluation en laboratoire.

 

Bien que nous ayons d’abord travaillé sur des modèles avancés reposant sur des bases de données d’interactions protéiques et des signatures transcriptionnelles, nous avons finalement privilégié un modèle plus simple offrant une performance très semblable en vue de de faciliter l’adoption du pipeline par d’autres praticien(ne)s. Les paires de vecteurs d’attributs des médicaments sont présentées à un réseau de neurones profond, qui sert à prédire l’indice de synergie. Ces vecteurs d’attributs comprennent des empreintes de structure moléculaires et des encodages one-hot (avec une entrée à 1 et les autres à 0) des médicaments.

 

La nécessité d’une approche séquentielle est confirmée par une évaluation in silico

Notre modèle a été évalué sur différentes tâches, présentées dans la figure 2, afin d’évaluer ses capacités de généralisation. Bien que ses performances puissent sembler modestes, nous avons montré qu’elles sont raisonnablement proches du maximum hypothétique compte tenu de la quantité de bruit expérimental. Comme le montre le tableau 1, nous avons constaté une baisse considérable de la performance lorsque nous avons essayé de généraliser aux associations de nouveaux médicaments. Cependant, la performance est toujours supérieure à celle d’une sélection aléatoire. Deuxièmement, nous avons remarqué que la prise en compte de plusieurs populations distinctes de cellules cancéreuses (appelées lignées cellulaires) améliore les performances sur les cellules cancéreuses d’intérêt, en termes de R2. Enfin, nous avons remarqué que le modèle généralise mal à un nouveau cadre expérimental.

Concernant les expériences in vitro prospectives, cette analyse suggère qu’une approche séquentielle est nécessaire afin d’adapter notre modèle à un nouveau laboratoire, puis à de nouveaux composés chimiques. Il est ainsi possible de trouver une bonne association beaucoup plus rapidement que si nous avions suivi la pratique traditionnelle de l’apprentissage automatique consistant à collecter des données, à entraîner un modèle, puis à utiliser le modèle entraîné pour filtrer un grand nombre d’associations candidates.

Figure 2. Vue d’ensemble des différentes tâches sur lesquelles RECOVER a été évalué
Figure 2. Vue d’ensemble des différentes tâches sur lesquelles RECOVER a été évalué. Chaque tâche correspond à une manière différente de diviser les ensembles d’entraînement, de validation et de test. Elle vise à évaluer une capacité de généralisation précise du modèle.

 

Tableau 1. Performance de RECOVER pour les différentes tâches, comme détaillé dans la figure 2
Tableau 1. Performance de RECOVER pour les différentes tâches, comme détaillé dans la figure 2. Écart-type calculé sur trois graines aléatoires.

 

Les tests in silico de RECOVER permettent de prédire et de redécouvrir rapidement des associations médicamenteuses synergiques

Nos expériences in silico ont tenté de reproduire aussi fidèlement que possible les paramètres des expériences in vitro. Nous comparons plusieurs stratégies de recherche en fonction de la vitesse à laquelle elles découvrent les associations qui sont parmi le 1% les plus synergiques au sein de notre ensemble de données. La proportion d’associations qui ont déjà été découvertes parmi le premier percentile est calculée à chaque cycle expérimental synthétique (ou itération). Comme le montre la figure 3, les fonctions d’acquisition de type glouton et de limite de confiance supérieure (Upper Confidence Bound abrégé UCB), deux stratégies s’appuyant sur les prédictions du modèle, affichent des performances comparables et qui surpassent de loin celles d’une recherche aléatoire.

Dans d’autres expériences in silico (ne correspondant pas exactement à notre cadre in vitro), la fonction d’acquisition UCB surpasse celle de type glouton. Voir la figure 5 (encadré). Cela démontre que, dans certains cas, la prise en compte de l’incertitude pour guider les expériences peut augmenter la performance du pipeline par rapport à une stratégie d’acquisition élémentaire de type glouton.

Figure 3. Proportion cumulée des 1 % d’associations les plus synergiques qui ont été redécouvertes par RECOVER
Figure 3. Proportion cumulée des 1 % d’associations les plus synergiques qui ont été redécouvertes par RECOVER. (encadré) La fonction d’acquisition UCB peut surpasser la fonction d’acquisition de type glouton dans certaines configurations. Écart-type calculé sur trois graines aléatoires.

 

L’utilisation prospective de RECOVER permet de découvrir et de redécouvrir de nouvelles associations synergiques

Après notre étude in silico, nous avons testé RECOVER de manière prospective avec le laboratoire Lairson au Scripps Research Institute. Nous avons effectué trois cycles d’expériences en laboratoire guidées par RECOVER et avons observé que les performances s’amélioraient à chaque itération. Alors que les deux premiers cycles étaient axés sur le calibrage du modèle et veillaient à s’assurer qu’une proportion raisonnable de l’espace des associations était observée, le dernier cycle de recommandations reflétait un cas d’utilisation réel presque entièrement automatisé.

L’espace de recherche comprenait 2 916 associations médicamenteuses (voir figure 4A). À chaque itération, les synergies de 30 associations ont été évaluées. Dans la figure 4B, nous reportons la fonction de répartition pour chaque cycle expérimental. Nous remarquons que la distribution commence à développer une queue plus lourde dans les synergies positives. Cette queue lourde émergente apparaît significative lorsqu’on compare la distribution du dernier cycle expérimental à la distribution dans les données publiques (test de Kolmogorov-Smirnov, p < 0,025). Enfin, la plus haute synergie de Bliss observée augmente à chaque itération.

Figure 4. Utilisation prospective de RECOVER pour l’évaluation in vitro
Figure 4. Utilisation prospective de RECOVER pour l’évaluation in vitro. (A.) Schéma représentant les associations médicamenteuses utilisées lors du préentraînement et dans trois cycles d’expériences ultérieures, ainsi que celles qui ont été exclues de l’analyse. Les associations de médicaments qui n’étaient pas disponibles pour le préentraînement ou qui n’ont pas été sélectionnées pour les expériences sont représentées en blanc. (B.) Fonction de répartition des synergies de Bliss pour chaque cycle expérimental.

 

Conclusion

Nous avons présenté le pipeline d’optimisation séquentielle de modèles RECOVER pour la sélection d’associations médicamenteuses. Nous présentons une méthodologie générale, qui consiste à analyser minutieusement certaines propriétés du pipeline d’apprentissage automatique – comme ses capacités de généralisation hors distribution – pour nous aider à concevoir certains aspects des expériences in vitro, et en définitive assurer une interaction fluide et réussie entre le pipeline d’apprentissage automatique et le laboratoire.

Après seulement trois cycles d’expérimentations in vitro guidés par l’apprentissage automatique, nous avons constaté que l’ensemble des associations recommandées par notre modèle était enrichi en associations hautement synergiques. De façon remarquable, nous avons redécouvert une association synergique médicamenteuse dont il a été confirmé par la suite qu’elle était à l’étude dans le cadre d’essais cliniques [8].

Ce billet de blogue s’appuie sur notre récente prépublication (en anglais): https://arxiv.org/pdf/2202.04202.pdf
Code: https://github.com/RECOVERcoalition/Recover

 

Remerciements

Cette recherche est financée en partie par la Fondation Bill et Melinda Gates. Les résultats et les conclusions qu’il contient sont ceux des auteurs et ne reflètent pas nécessairement les positions ou les politiques de la Fondation Bill et Melinda Gates. Les auteurs tiennent également à remercier Isabelle Lacroix pour son soutien.

 

Auteur·trice·s de l’article

Paul Bertin, Mila

Jarrid Rector-Brooks, Mila

Deepak Sharma, Mila

Thomas Gaudelet, Relation Therapeutics

Andrew Anighoro, Relation Therapeutics

Torsten Gross, Relation Therapeutics

Francisco Martínez-Peña, Department of Chemistry, The Scripps Research Institute

Eileen Tang, Department de Chemistry, The Scripps Research Institute

Suraj M S, Relation Therapeutics

Christian Regep, Relation Therapeutics

Jeremy Hayter, Relation Therapeutics

Maksym Korablyov, Mila

Nicholas Valiante, Glyde Bio, Inc.

Almer van der Sloot, Institute for Research in Immunology and Cancer (IRIC)

Mike Tyers, Institute for Research in Immunology and Cancer (IRIC)

Charles Roberts, Relation Therapeutics

Michael Bronstein, Department of Computer Science, Université d’Oxford, Twitter

Luke Lairson, Department of Chemistry, The Scripps Research Institute

Jake Taylor-King, Relation Therapeutics

Yoshua Bengio, Mila

 

Références

[1] Adrian Schmid, Aline Wolfensberger, Johannes Nemeth, Peter W Schreiber, Hugo Sax, and Stefan P Kuster. Monotherapy versus combination therapy for multidrug-resistant gram-negative infections: Systematic review and meta-analysis. Scientific reports, 9(1):1–11, 2019.

[2] Reza Bayat Mokhtari,Tina S Homayouni, Narges Baluch, Evgeniya Morgatskaya, Sushil Kumar, Bikul Das, and Herman Yeger. Combination therapy in combating cancer. Oncotarget, 8(23):38022, 2017.

[3] João Delou, Alana SO Souza, Leonel Souza, and Helena L Borges. Highlights in resistance mechanism pathways for combination therapy. Cells, 8(9):1013, 2019.

[4] Bissan Al-Lazikani, Udai Banerji, and Paul Workman. Combinatorial drug therapy for cancer in the post-genomic era. Nature Biotechnology, 30(7):679-692, July 2012.

[5] Yuriy Sverchkov and Mark Craven. A review of active learning approaches to experimental design for uncovering biological networks. PLoS computational biology, 13(6):e1005466, 2017.

[6] Ross D. King, Kenneth E. Whelan, Ffion M. Jones, Philip G. K. Reiser, Christopher H. Bryant, Stephen H. Muggleton, Douglas B. Kell, and Stephen G. Oliver. Functional genomic hypothesis generation and experimentation by a robot scientist. Nature, 427(6971):247–252, Jan 2004.

[7] Pablo Carbonell, Adrian J. Jervis, Christopher J. Robinson, Cunyu Yan, Mark Dunstan, Neil Swainston, Maria Vinaixa, Katherine A. Hollywood, Andrew Currin, Nicholas J. W. Rattray, Sandra Taylor, Reynard Spiess, Rehana Sung, Alan R. Williams, Donal Fellows, Natalie J. Stanford, Paul Mulherin, Rosalind Le Feuvre, Perdita Barran, Royston Goodacre, Nicholas J. Turner, Carole Goble, George Guoqiang Chen, Douglas B. Kell, Jason Micklefield, Rainer Breitling, Eriko Takano, Jean-Loup Faulon, and Nigel S. Scrutton. An automated design-build-test-learn pipeline for enhanced microbial production of fine chemicals. Communications Biology, 1(1):66, Dec 2018.

[8] Hiral A Shah, James H Fischer, Neeta K Venepalli, Oana C Danciu, Sonia Christian, Meredith J Russell, Li C Liu, James P Zacny, and Arkadiusz Z Dudek. Phase i study of aurora a kinase inhibitor alisertib (mln8237) in combination with selective vegfr inhibitor pazopanib for therapy of advanced solid tumors. American journal of clinical oncology, 42(5):413–420, 2019.