Portrait de Jacques Corbeil

Jacques Corbeil

Membre affilié
Professeur titulaire, Université Laval
Linearis Venture and Labs
Sujets de recherche
Apprentissage automatique appliqué
Biologie computationnelle
IA et santé

Biographie

Le Dr Jacques Corbeil se concentre sur l'utilisation des dernières techniques de bio-informatique et d'apprentissage automatique pour faciliter le diagnostic, le pronostic et la réponse au traitement. Les techniques modernes de génomique et de métabolomique génèrent un déluge de données qui doivent être interprétées à l'aide de nouvelles approches informatiques. Le Dr Corbeil utilise des instruments et des méthodologies de pointe pour faciliter l'interprétation de données complexes, y compris la spectrométrie de masse à haut débit, en particulier la métabolomique et le séquençage next-gen.

Les recherches du Dr Corbeil portent notamment sur la manière dont les micro-organismes infectieux interagissent avec leur hôte, sur les effets des antibiotiques sur notre flore microbienne et sur l'environnement, et sur la manière de concevoir de petites molécules et des médicaments pour interférer avec des fonctions microbiennes spécifiques et avec la progression du cancer. Travaillant à l'interface de l'apprentissage automatique et des sciences omiques, il possède une expertise dans l'intégration des données omiques et se spécialise dans l'analyse de données massives appliquée aux maladies infectieuses et au cancer. Le Dr Corbeil collabore avec de nombreuses industries pour améliorer leurs processus et mettre en œuvre des stratégies d'intelligence artificielle. Depuis 2004, le Dr Corbeil est titulaire de la Chaire de recherche du Canada en génomique médicale (niveau 1).

Publications

QMAP: A Benchmark for Standardized Evaluation of Antimicrobial Peptide MIC and Hemolytic Activity Regression
Anthony Lavertu
Pascal Germain
Antimicrobial peptides (AMPs) are promising alternatives to conventional antibiotics, but progress in computational AMP discovery has been d… (voir plus)ifficult to quantify due to inconsistent datasets and evaluation protocols. We introduce QMAP, a domain-specific benchmark for predicting AMP antimicrobial potency (MIC) and hemolytic toxicity (HC50) with homology-aware, predefined test sets. QMAP enforces strict sequence homology constraints between training and test data, ensuring that model performance reflects true generalization rather than overfitting. Applying QMAP, we reassess existing MIC models and establish baselines for MIC and HC50 regression. Results show limited progress over six years, poor performance for high-potency MIC regression, and low predictability for hemolytic activity, emphasizing the need for standardized evaluation and improved modeling approaches for highly potent peptides. We release a Python package facilitating practical adoption, and with a Rust-accelerated engine enabling efficient data manipulation, installable with pip install qmap-benchmark.
Extracting a COVID-19 signature from a multi-omic dataset
Baptiste Bauvin
Guillaume Bachelot
Claudia Carpentier
Riikka Huusaari
Maxime Déraspe
Juho Rousu
Caroline Quach
The complexity of COVID-19 requires approaches that extend beyond symptom-based descriptors. Multi-omic data, combining clinical, proteomic,… (voir plus) and metabolomic information, offer a more detailed view of disease mechanisms and biomarker discovery. As part of a large-scale Quebec initiative, we collected extensive datasets from COVID-19 positive and negative patient samples. Using a multi-view machine learning framework with ensemble methods, we integrated thousands of features across clinical, proteomic, and metabolomic domains to classify COVID-19 status. We further applied a novel feature relevance methodology to identify condensed signatures. Our models achieved a balanced accuracy of 89% ± 5% despite the high-dimensional nature of the data. Feature selection yielded 12- and 50-feature signatures that improved classification accuracy by at least 3% compared to the full feature set. These signatures were both accurate and interpretable. This work demonstrates that multi-omic integration, combined with advanced machine learning, enables the extraction of robust COVID-19 signatures from complex datasets. The condensed biomarker sets provide a practical path toward improved diagnosis and precision medicine, representing a significant advancement in COVID-19 biomarker discovery.