Command Palette
Search for a command to run...
Part-based R-CNNs für die feingranulare Kategoriedetektion
Part-based R-CNNs für die feingranulare Kategoriedetektion
Ning Zhang Jeff Donahue Ross Girshick Trevor Darrell
Zusammenfassung
Die semantische Teillokalisierung kann die feingranulare Kategorisierung durch explizite Isolierung subtiler Erscheinungsunterschiede, die mit bestimmten Objektteilen verbunden sind, erleichtern. Es wurden Methoden für pose-normalisierte Darstellungen vorgeschlagen, die jedoch im Allgemeinen aufgrund der Schwierigkeiten bei der Objekterkennung Annotationen von Begrenzungsrahmen zur Testzeit voraussetzen. Wir schlagen ein Modell für feingranulare Kategorisierung vor, das diese Einschränkungen überwindet, indem es tiefgreifende Faltungsmerkmale nutzt, die auf bottom-up Regionenvorschlägen berechnet werden. Unsere Methode lernt Ganzobjekt- und Teildetektoren, setzt gelernte geometrische Restriktionen zwischen ihnen durch und prognostiziert eine feingranulare Kategorie aus einer pose-normalisierten Darstellung. Experimente am Caltech-UCSD Vogeldatensatz bestätigen, dass unsere Methode in einer end-to-end Bewertung ohne den Bedarf an einem Begrenzungsrahmen zur Testzeit den aktuellen Stand der Technik in der feingranularen Kategorisierung übertreffen kann.