Amélioration de la diversité des détecteurs de flou de mise au point par réseau croisé-ensemble

La détection du flou de défocalisation (DBD) constitue un sujet fondamental mais difficile, en raison de la présence de régions homogènes peu distinctes et de la transition progressive entre les zones bien cadrées et celles floues. Les méthodes récentes de DBD ont progressé en exploitant des réseaux plus profonds ou plus larges, au prix d’une consommation élevée de mémoire et de ressources computationnelles. Dans cet article, nous proposons une nouvelle stratégie d’apprentissage en décomposant le problème de DBD en plusieurs détecteurs de flou de défocalisation plus petits, permettant ainsi que les erreurs individuelles s’annulent mutuellement. Notre approche met l’accent sur l’amélioration de la diversité via un réseau croisé d’ensembles (cross-ensemble network). Plus précisément, nous concevons un réseau end-to-end composé de deux parties logiques : un réseau extracteur de caractéristiques (FENet) et un réseau croisé d’ensembles pour la détection du flou de défocalisation (DBD-CENet). Le FENet est conçu pour extraire des caractéristiques de bas niveau. Ces caractéristiques sont ensuite transmises au DBD-CENet, qui comporte deux branches parallèles afin d’apprendre deux groupes distincts de détecteurs de flou de défocalisation. Pour chaque détecteur individuel, nous introduisons des corrélations croisées négatives et des corrélations négatives internes, ainsi qu’une fonction d’erreur visant à renforcer la diversité de l’ensemble tout en équilibrant la précision de chaque composant. Enfin, les multiples détecteurs de flou de défocalisation sont combinés par une moyenne pondérée uniforme afin d’obtenir la carte finale de DBD. Les résultats expérimentaux démontrent l’avantage de notre méthode en termes de précision et de vitesse par rapport à plusieurs méthodes de pointe.