Fernando Diaz
Membre associé, Microsoft

Mon principal intérêt de recherche est la recherche d’information, c’est-à-dire l’étude formelle de la recherche de petits fragments d’information dans de grandes collections de données. L’exemple le plus familier de recherche d’information est la recherche sur le Web où les utilisateurs recherchent une collection de pages Web pour une ou quelques pages Web pertinentes. Cependant, la recherche d’information va au-delà de la recherche sur le Web et comprend des sujets tels que la recherche multilingue, la personnalisation, la recherche sur le bureau et la recherche interactive. Mon expérience de recherche comprend des approches distribuées de recherche d’information pour la recherche sur le Web, la recherche interactive et à facettes, l’exploration de modèles temporels à partir de journaux de nouvelles et de requêtes, la recherche d’information multilingue, les méthodes de recherche basées sur des graphiques et l’exploitation d’information à partir de multiples corpora. Dans mon travail de thèse, j’ai étudié la relation entre le regroupement de documents et la notation des documents en vue de leur extraction à l’aide de méthodes d’apprentissage automatique et de statistiques. J’ai donc mis au point un algorithme d’auto-évaluation et d’auto-ajustement du système qui améliore considérablement la performance des algorithmes de récupération dans une variété de corpus.