Détection d'objets sombres par AET multitâche avec régularité tangente orthogonale

L’environnement sombre constitue un défi pour les algorithmes de vision par ordinateur en raison du manque de photons et de la présence de bruit indésirable. Pour améliorer la détection d’objets dans des conditions d’éclairage faible, nous proposons un nouveau modèle de transformation auto-encodeur multitâche (MAET), capable d’explorer les motifs intrinsèques sous-jacents à la transformation d’éclairage. Dans un cadre d’apprentissage auto-supervisé, le MAET apprend la structure visuelle intrinsèque en codant et décodant la transformation réaliste de dégradation de l’éclairage, en tenant compte du modèle physique de bruit et du traitement du signal d’image (ISP).À partir de cette représentation, nous réalisons la tâche de détection d’objets en décodant les coordonnées des boîtes englobantes et les classes d’objets. Pour éviter un entrelacement excessif entre les deux tâches, notre modèle MAET sépare les caractéristiques des objets de celles liées à la dégradation en imposant une régularité tangente orthogonale. Cette approche forme une variété paramétrique le long de laquelle les prédictions multitâches peuvent être formulées de manière géométrique en maximisant l’orthogonalité entre les tangentes des sorties respectives des tâches. Notre cadre peut être mis en œuvre à partir des architectures principales de détection d’objets et entraîné de manière end-to-end directe à l’aide de jeux de données standards de détection d’objets, tels que VOC et COCO. Nous avons atteint des performances de pointe sur des jeux de données synthétiques et réels. Le code est disponible à l’adresse suivante : https://github.com/cuiziteng/MAET.