Une équipe de chercheurs de Mila/l’Université McGill et de Carnegie Mellon University (CMU) a conçu un algorithme capable d’identifier les activités de traite des personnes dans les annonces d'escorte en ligne. La publicité en ligne est l'une des utilisations les plus courantes de la technologie à des fins de traite des personnes.
La croissance du marché de la publicité en ligne offre aux criminels œuvrant dans le trafic de personnes une plateforme anonyme et à faible risque pour vendre leurs victimes grâce à des millions d'annonces d'escortes. « La majorité des victimes sont annoncées en ligne et n'ont aucune influence sur la formulation des annonces publiées par leur exploiteur, qui contrôle généralement quatre à six victimes à la fois », explique pour sa part Reihaneh Rabbany, membre académique principal de Mila, professeure adjointe à l'école d'informatique de McGill et titulaire de la Chaire en IA-Canada CIFAR. Ainsi, les activités organisées en ligne peuvent être détectées en raison des formulations similaires et des doublons parmi les annonces.
Or, l’équipe de recherche a baptisé l’algorithme InfoShield, qui est « capable de repérer des millions de publicités et de mettre en évidence les points communs entre les annonces, a ajouté Christos Faloutsos, professeur à l’école d’informatique de CMU. « Il n’y a pas de garantie, mais si les groupes d'annonces contiennent un libellé similaire, il est fort probable qu’il s’agit d’activité suspecte ». L’algorithme pourrait donc aider les autorités policières à relier les points pour mieux identifier les trafiquants et leurs victimes.
« Le trafic d’êtres humains est un grave problème sociétal et difficile à surmonter », indiquent les auteurs de l’étude, Catalina Vajiac et Meng-Chieh Lee. En cherchant de petits groupes d'annonces qui contiennent du texte similaire plutôt que d'analyser des annonces autonomes, nous sommes en mesure de localiser les groupes d’annonces qui sont les plus susceptibles de correspondre à des activités organisées, à savoir un signal fort de trafic humain ».
Pour tester InfoShield, l’équipe a appliqué l’algorithme à un ensemble d’annonces d’escortes identifiées au préalable par des experts pour la présence d’annonces de trafic humain. Ainsi, l’algorithme a réussi à signaler les annonces proposant du trafic avec une précision de 85 %. Dans la mesure où l'ensemble de données d'entraînement contenait des annonces réelles placées par des trafiquants d'êtres humains, l'équipe ne pouvait pas partager des exemples des similitudes identifiées ou les données elles-mêmes par souci de protection des victimes. En revanche, les chercheurs ont utilisé des ensembles de données publiques qu’ils pouvaient utiliser pour entraîner InfoShield et qui ressemblaient à ce que l'algorithme recherchait dans les données relatives à la traite des êtres humains, comme des textes contenant des formulations similaires. Ils se sont alors tournés vers Twitter, où ils ont trouvé une mine de textes et de formulations similaires générés par des «bots».
Les bots tweetent souvent les mêmes informations de manière similaire. À l'instar d'une annonce pour la traite des êtres humains, un tweet provenant d’un bot peut être repris en apportant de légères modifications à leur contenu. Selon la professeure Rabbany, dans les deux cas, soit les bots sur Twitter ou les publicités pour le trafic des personnes, l'objectif est de repérer les activités organisées. Ainsi parmi les tweets, InfoShield a obtenu de meilleurs résultats que les autres algorithmes de pointe pour la détection des bots.
L’IA pour lutter contre le trafic des personnes au Canada à Mila
Selon l’Organisation internationale du Travail, environ 4,8 millions de personnes sont victimes de la traite à des fins d’exploitation sexuelle, une industrie mondiale dont la valeur est estimée à 99 milliards de dollars. Au cours de la dernière décennie, les cas de trafic d’êtres humains ont augmenté de façon importante au Canada. Du côté de Statistique Canada, plus de 1 700 cas de trafic d’êtres humains ont été signalés par les services de police canadiens entre 2009 et 2016, dont la quasi-totalité des victimes est formée de femmes et de filles (97 %). Pour répondre à cette crise, le gouvernement canadien (en collaboration avec la GRC) a dévoilé la Stratégie nationale de la lutte contre la traite des personnes 2019-2024, dont l’un des piliers vise à mobiliser la technologie et la recherche. L'algorithme InfoShield s'inscrit dans le cadre des efforts plus larges déployés à Mila pour concevoir les algorithmes nécessaires à la lutte contre la traite des personnes au Canada.
Les auteurs de cette publication sont Christos Faloutsos, Catalina Vajiac et Namyong Park de Carnegie Mellon University ; Reihaneh Rabbany, Aayushi Kulshrestha et Sacha Levy de McGill University et Mila ; Meng-Chieh Lee de National Chiao Tung University ; et Cara Jones de Marinus Analytics.
L’IA pour l’humanité
Le développement socialement responsable et bénéfique de l’intelligence artificielle est une dimension fondamentale de Mila. En tant que chef de fil, Mila et ses chercheur.e.s visent à contribuer au développement d’applications bénéfiques à la société. Ce projet de recherche a un potentiel d’impact important pour aider les victimes de trafic de personnes au Canada et partout sur la planète.
Découvrez InfoShield sur GitHub.
Pour en savoir plus sur le projet à Mila, visitez la page Web.