[Seminar] Representation Learning for Vision and Language

Le travail de Samira couvre plusieurs domaines de la recherche en apprentissage profond, notamment l'apprentissage multimodal, la distillation des connaissances, l'apprentissage par renforcement profond et les applications. Elle a apporté des contributions significatives au domaine de l'interaction homme-machine avec son travail sur l'apprentissage multimodal pour la reconnaissance des émotions dans les vidéos. Elle a également travaillé sur le raisonnement visuel à l'intersection de la vision et du texte. Elle a contribué à la création de plusieurs benchmarks à grande échelle, notamment FigureQA (raisonnement visuel sur des parcelles mathématiques), Something-Something (sous-titrage vidéo fin) et ReDial (recommandation de films conversationnels). Du côté des applications, elle travaille sur l'apprentissage automatique pour la réponse aux catastrophes en mettant l'accent sur la modélisation des événements météorologiques extrêmes.