Décorrélation locale pour une détection améliorée de piétons

Malgré l’émergence de méthodes plus sophistiquées et exigeantes en données, les arbres de décision boostés restent extrêmement efficaces pour la détection rapide d’objets rigides, atteignant des performances de précision optimales sur de nombreux jeux de données. Bien que performants, la plupart des détecteurs boostés utilisent des arbres de décision avec des séparations orthogonales (à une seule caractéristique), dont la topologie de la frontière de décision peut ne pas correspondre efficacement à la topologie naturelle des données. En présence de données fortement corrélées, des arbres de décision avec des séparations obliques (impliquant plusieurs caractéristiques) peuvent s’avérer plus efficaces. Toutefois, l’utilisation de séparations obliques entraîne un coût computationnel important. Inspirés par des travaux récents sur la décorrélation discriminante des caractéristiques HOG, nous proposons plutôt une transformation de caractéristiques efficace, qui élimine les corrélations au sein des voisinages locaux. Le résultat est une représentation surcomplète mais localement décorrélée, particulièrement adaptée à l’usage avec des arbres de décision orthogonaux. En réalité, les arbres orthogonaux utilisant nos caractéristiques décorrélées localement surpassent les arbres obliques entraînés sur les caractéristiques d’origine, à un coût computationnel réduit d’un ordre de grandeur. L’amélioration globale de la précision est marquée : sur le Caltech Pedestrian Dataset, nous réduisons presque d’un facteur dix les faux positifs par rapport à l’état de l’art précédent.