Progressive boosting for class imbalance and its application to face re-identification

Augmentation progressive du déséquilibre de classe et son application pour faire face à la ré-identification

Soleymani, Roghayeh et Granger, Eric et Fumera, Giorgio

Systèmes experts avec applications 2018

Résumé: En pratique, les applications de reconnaissance de formes souffrent souvent de distributions de données déséquilibrées entre les classes, qui peuvent varier pendant les opérations avec les données de conception. Par exemple, dans de nombreuses applications de vidéosurveillance, par exemple la ré-identification du visage, les individus du visage doivent être reconnus sur un réseau distribué de caméras vidéo. Un défi important dans de telles applications est le déséquilibre de classe, car le nombre de visages capturés d'un individu d'intérêt est largement dépassé par celui des autres. Les systèmes de classification à deux classes conçus à partir de données déséquilibrées ont tendance à mieux reconnaître la classe majoritaire (négative), tandis que la classe d'intérêt (classe positive) a souvent le plus petit nombre d'échantillons. Plusieurs techniques au niveau des données ont été proposées pour atténuer ce problème, où les ensembles de classificateurs sont conçus avec des sous-ensembles de données équilibrés par sur-échantillonnage d'échantillons positifs ou sous-échantillonnage d'échantillons négatifs. Cependant, certains échantillons informatifs peuvent être négligés par le sous-échantillonnage aléatoire et l'ajout d'échantillons positifs synthétiques par sur-échantillonnage ajoute à la complexité de la formation. Dans cet article, un nouvel algorithme d'apprentissage d'ensemble appelé Progressive Boosting (PBoost) est proposé qui insère progressivement des groupes d'échantillons non corrélés dans une procédure de Boosting pour éviter de perdre des informations tout en générant un pool diversifié de classificateurs. Dans de nombreux problèmes de reconnaissance du monde réel, les échantillons peuvent être regroupés en utilisant certaines informations contextuelles basées sur l'application. Par exemple, dans les applications de ré-identification de visage, les régions faciales d'une même personne apparaissant dans un champ de vision de caméra peuvent être regroupées sur la base de leurs trajectoires trouvées par le traqueur de visage. D'une itération à l'autre, l'algorithme PBoost accumule ces groupes d'échantillons non corrélés dans un ensemble qui croît progressivement en taille et en déséquilibre. Les classificateurs de base sont formés sur des échantillons sélectionnés dans cet ensemble et validés sur l'ensemble. Par conséquent, PBoost est plus robuste lorsque les données opérationnelles peuvent avoir des niveaux de biais inconnus et variables. En outre, la complexité de calcul de PBoost est inférieure à celle des ensembles Boosting de la littérature qui utilisent le sous-échantillonnage pour apprendre à partir de données déséquilibrées car tous les classificateurs de base ne sont pas validés sur tous les échantillons négatifs. Le nouveau facteur de perte utilisé dans PBoost évite de polariser les performances vers la classe négative. En utilisant ce facteur de perte, la mise à jour du poids des échantillons et la contribution du classificateur dans les prédictions finales sont définies en fonction de la capacité des classificateurs à reconnaître les deux classes. L'approche proposée a été validée et comparée à l'aide de données synthétiques et de vidéos provenant de Faces In Action et d'un jeu de données COX qui émulent des applications de ré-identification de visage. Les résultats montrent que PBoost surpasse les techniques de pointe en termes de précision et de complexité sur différents niveaux de déséquilibre et de chevauchement entre les classes.