Command Palette
Search for a command to run...
R-CNNs par parties pour la détection de catégories fines
R-CNNs par parties pour la détection de catégories fines
Ning Zhang Jeff Donahue Ross Girshick Trevor Darrell
Résumé
La localisation sémantique des parties peut faciliter la catégorisation fine en isolant explicitement les différences subtiles d'apparence associées à des parties spécifiques d'un objet. Des méthodes pour des représentations normalisées par la posture ont été proposées, mais elles supposent généralement des annotations de boîtes englobantes lors de l'évaluation en raison de la difficulté de la détection d'objets. Nous proposons un modèle de catégorisation fine qui surmonte ces limitations en exploitant les caractéristiques convolutives profondes calculées sur des propositions de régions basées sur le fondamental. Notre méthode apprend à détecter l'objet entier et ses parties, impose des contraintes géométriques apprises entre eux, et prédit une catégorie fine à partir d'une représentation normalisée par la posture. Les expériences menées sur le jeu de données Caltech-UCSD Birds confirment que notre méthode surpassent les méthodes actuelles de catégorisation fine dans une évaluation bout-à-bout sans nécessiter une boîte englobante lors de l'évaluation.Note: The term "bottom-up" is translated as "basée sur le fondamental" to maintain the technical meaning while ensuring it is understood in a French context. However, if you prefer a more literal translation, you can use "ascendante" instead.