[Seminar] Negative evidence for weakly supervised learning

Le prochain séminaire LIVIA se tiendra le Jeudi 3 mars à 12h00 par Zoom.

Titre: Preuve négative d'un apprentissage faiblement supervisé
par Soufiane Belhabi, post-doctorant au LIVIA

Résumé:
Les méthodes de mappage d'activation de classe (CAM) ont récemment attiré beaucoup d'attention pour les tâches de localisation d'objet faiblement supervisé (WSOL). Ils permettent la visualisation et l'interprétation CNN sans formation sur des ensembles de données d'images entièrement annotées. Les méthodes CAM sont généralement intégrées dans des dorsales CNN prêtes à l'emploi, telles que ResNet50. En raison des opérations de convolution et de mise en commun, ces dorsales produisent des CAM à faible résolution avec un facteur de réduction d'échelle allant jusqu'à 32, ce qui contribue à des localisations inexactes. L'interpolation est nécessaire pour restaurer les CAM en taille réelle, mais elle ne tient pas compte des propriétés statistiques des objets, telles que la couleur et la texture, ce qui entraîne des activations avec des limites incohérentes et des localisations inexactes. Comme alternative, nous introduisons une méthode générique pour la mise à l'échelle paramétrique des CAM qui permet de construire des CAM pleine résolution précises (FCAM). En particulier, nous proposons une architecture de décodage entraînable qui peut être connectée à n'importe quel classificateur CNN pour produire des localisations CAM très précises. Étant donné une CAM basse résolution originale, les pixels de premier plan et d'arrière-plan sont échantillonnés de manière aléatoire pour affiner le décodeur. Des priors supplémentaires tels que les statistiques d'image et les contraintes de taille sont également pris en compte pour étendre et affiner les limites de l'objet. Des expériences approfondies1, sur trois dorsales CNN et six lignes de base WSOL sur les ensembles de données CUB-200-2011 et OpenImages, indiquent que notre méthode F-CAM améliore considérablement la précision de la localisation CAM. Les performances de F-CAM sont compétitives avec les méthodes WSOL de pointe, mais elles nécessitent moins de calculs lors de l'inférence. Des expériences et des ablations supplémentaires ont été menées sur des ensembles de données histologiques en mettant l'accent sur les preuves négatives. Les résultats ont montré les avantages de notre méthode par rapport aux méthodes de pointe.

Documents:
https://arxiv.org/abs/2109.07069
https://arxiv.org/abs/2201.02445