Archer Yang

Membre académique associé

Professeur agréré, McGill University, Département de mathématiques et statistiques

Sujets de recherche

Apprentissage automatique en génomique et en santé

Apprentissage profond

Apprentissage sur graphes

Découverte de médicaments

Méthodes de réduction de la dimensionnalité

Modèles probabilistes

Statistiques en haute dimension

Théorie de l'apprentissage automatique

Site web

Biographie

Je suis professeur agrégé au Département de mathématiques et de statistiques de l'Université McGill et membre associé de l'École d'informatique et du programme des Sciences quantitatives de la vie.

Mes recherches portent sur trois thèmes interconnectés : l'apprentissage automatique statistique, les applications dans la découverte de médicaments et la génomique computationnelle et les soins de santé. Dans le domaine de l'apprentissage automatique statistique, je me concentre sur le développement de méthodes inspirées par la causalité, la réduction de la dimensionnalité et les modèles probabilistes afin de relever les défis posés par les données complexes à haute dimension. Dans le domaine de la découverte de médicaments, mon travail consiste à développer des modèles d'apprentissage automatique pour accélérer l'identification des médicaments candidats et améliorer la compréhension de l'efficacité et de la sécurité des médicaments. Dans le domaine de la génomique computationnelle et des soins de santé, je développe des techniques pour analyser les données génomiques, identifier les biomarqueurs et explorer la base génétique des maladies, dans le but d'améliorer la médecine de précision et de prédire les résultats pour les patients. Mon principal objectif est de faire le lien entre les méthodologies avancées basées sur les données et les applications ayant un impact sur la pharmacologie, la génomique et les soins de santé.

Les étudiants diplômés intéressés à travailler avec moi sont priés de s'adresser à Mila - Institut québécois d'intelligence artificielle et au Département de mathématiques et de statistique de l'Université McGill. Les candidats peuvent également envisager des possibilités de co-supervision avec des membres du corps professoral du programme d'informatique de McGill.

Étudiants actuels

Yixuan Li

Doctorat - McGill

Co-superviseur⋅e :

Yue Li

Marshall Meng

Maîtrise recherche - McGill

Co-superviseur⋅e :

Yue Li

Xiaoxiao Shang

Doctorat - McGill

Weihua Shi

Doctorat - McGill

Github

Chi-Kuang Yeh

Postdoctorat - McGill

Site web

Github

Google Scholar

Publications

Structured Learning in Time-dependent Cox Models

Guanbo Wang

Yi Lian

Archer Yang

Robert W. Platt

Rui Wang

Sylvie Perreault

Marc Dorais

Mireille E. Schnitzer

2024-05-28

Statistics in Medicine (publié)

doi.org

arxiv.org

Machine Learning Informed Diagnosis for Congenital Heart Disease in Large Claims Data Source

Ariane Marelli

Chao Li

Aihua Liu

Hanh Nguyen

Harry Moroz

James M. Brophy

Liming Guo

2024-02-01

JACC: Advances (publié)

doi.org

Privacy-preserving analysis of time-to-event data under nested case-control sampling

Lamin Juwara

Archer Yang

Ana M Velly

Paramita Saha-Chaudhuri

2023-12-13

Statistical Methods in Medical Research (publié)

doi.org

Accelerating Generalized Random Forests with Fixed-Point Trees

David L. Fleischer

David A. Stephens

Archer Yang

2023-06-20

ArXiv (prépublication)

doi.org

arxiv.org

A Tweedie Compound Poisson Model in Reproducing Kernel Hilbert Space

Yi Lian

Archer Yang

Boxiang Wang

Peng Shi

Robert William Platt

Abstract Tweedie models can be used to analyze nonnegative continuous data with a probability mass at zero. There have been wide application… (voir plus)s in natural science, healthcare research, actuarial science, and other fields. The performance of existing Tweedie models can be limited on today’s complex data problems with challenging characteristics such as nonlinear effects, high-order interactions, high-dimensionality and sparsity. In this article, we propose a kernel Tweedie model, Ktweedie, and its sparse variant, SKtweedie, that can simultaneously address the above challenges. Specifically, nonlinear effects and high-order interactions can be flexibly represented through a wide range of kernel functions, which is fully learned from the data; In addition, while the Ktweedie can handle high-dimensional data, the SKtweedie with integrated variable selection can further improve the interpretability. We perform extensive simulation studies to justify the prediction and variable selection accuracy of our method, and demonstrate the applications in ratemaking and loss-reserving in general insurance. Overall, the Ktweedie and SKtweedie outperform existing Tweedie models when there exist nonlinear effects and high-order interactions, particularly when the dimensionality is high relative to the sample size. The model is implemented in an efficient and user-friendly R package ktweedie (https://cran.r-project.org/package=ktweedie).

2022-12-13

Technometrics (publié)

doi.org

Peu importe la taille : démocratiser la découverte de protéines avec l'IA

Boussole des politiques en IA

Demandes de supervision

Archer Yang

Biographie

Étudiants actuels

Publications

Peu importe la taille : démocratiser la découverte de protéines avec l'IA

Boussole des politiques en IA

Demandes de supervision

Mots-clés populaires:

Archer Yang

Biographie

Étudiants actuels

Publications