RNNs for Emotion Recognition

Deep Learning for Video
Nov 2015

Recurrent Neural Networks for Emotion Recognition in Video

Nov 2015

Les approches de l’analyse faciale et de l’analyse vidéo, basées sur l’apprentissage profond, ont récemment démontré des performances élevées dans une variété de tâches clés telles que la reconnaissance faciale, la reconnaissance émotionnelle et la reconnaissance d’activité. Dans le cas de la vidéo, les informations doivent souvent être agrégées sur une séquence d’images de longueur variable pour produire un résultat de classification. Des travaux antérieurs utilisant des réseaux de neurones convolutionnels (CNN) pour la reconnaissance des émotions en vidéo reposaient sur des opérations de moyenne temporel et de mise en commun rappelant les approches largement utilisées pour l’agrégation spatiale d’informations. Les réseaux de neurones récurrents (RNN) ont récemment connu une explosion d’intérêt, car ils offrent des performances de pointe dans diverses tâches d’analyse de séquence. Les RNN fournissent un cadre attrayant pour la propagation d’informations sur une séquence en utilisant une représentation de couche cachée à valeur continue. Dans ce travail, nous présentons un système complet pour le défi EmotiW (Emotion Recognition in the Wild) 2015. Notre présentation et notre analyse expérimentale sont axées sur une architecture hybride CNN-RNN pour l’analyse de l’expression faciale, capable de surpasser une approche CNN précédemment appliquée utilisant une moyenne temporelle pour l’agrégation.

Reference

Samira E. Kahou, Vincent Michalski, Kishore Konda, Roland Memisevic, Christopher Pal, Recurrent Neural Networks for Emotion Recognition in Video, in: Proceedings of the 2015 ACM on International Conference on Multimodal Interaction, Pages 467-474, 2015

Linked Profiles