HyperAIHyperAI
vor 2 Monaten

You Only Look Once: Vereinte, Echtzeit-Objekterkennung

Joseph Redmon; Santosh Divvala; Ross Girshick; Ali Farhadi
You Only Look Once: Vereinte, Echtzeit-Objekterkennung
Abstract

Wir stellen YOLO (You Only Look Once) vor, einen neuen Ansatz für die Objekterkennung. Vorherige Arbeiten im Bereich der Objekterkennung haben Klassifikatoren zur Durchführung der Erkennung umfunktioniert. Im Gegensatz dazu formulieren wir die Objekterkennung als ein Regressionsproblem zu räumlich getrennten Begrenzungsboxen und zugehörigen Klassenwahrscheinlichkeiten. Ein einzelnes neuronales Netzwerk prognostiziert direkt aus vollständigen Bildern in einer Evaluierung sowohl Begrenzungsboxen als auch Klassenwahrscheinlichkeiten. Da der gesamte Erkennungspipeline ein einziges Netzwerk ist, kann es direkt auf die Erkennungsleistung hin optimiert werden.Unsere vereinte Architektur ist extrem schnell. Unser Basis-YOLO-Modell verarbeitet Bilder in Echtzeit mit 45 Bildern pro Sekunde. Eine kleinere Version des Netzes, Fast YOLO, verarbeitet erstaunliche 155 Bilder pro Sekunde und erreicht dabei immer noch das doppelte mAP (mean Average Precision) anderer Echtzeit-Detektoren. Verglichen mit den besten aktuellen Erkennungssystemen macht YOLO mehr Lokalisierungsfehler, ist aber viel weniger wahrscheinlich, Fehlalarme vorherzusagen, wo实际上没有物体。最后,YOLO学习了非常通用的物体表示。在从自然图像到艺术品的泛化方面,无论是Picasso数据集还是People-Art数据集,YOLO都远远优于所有其他检测方法,包括DPM和R-CNN。请注意,最后一段中有一部分中文未被翻译成德语。以下是完整的德语翻译:Im Vergleich zu den besten aktuellen Erkennungssystemen macht YOLO mehr Lokalisierungsfehler, ist aber viel weniger wahrscheinlich, Fehlalarme vorherzusagen, wo实际上没有物体(where nothing exists)。Schließlich lernt YOLO sehr allgemeine Darstellungen von Objekten. Bei der Generalisierung von natürlichen Bildern zu Kunstwerken übertrifft es alle anderen Detektionsmethoden – einschließlich DPM und R-CNN – deutlich sowohl im Picasso-Datensatz als auch im People-Art-Datensatz.为了确保完全符合德语的表达习惯,这里是对最后一句的进一步优化:Im Vergleich zu den besten aktuellen Erkennungssystemen macht YOLO mehr Lokalisierungsfehler, ist aber viel weniger wahrscheinlich, Fehlalarme vorherzusagen, wo nichts existiert. Schließlich lernt YOLO sehr allgemeine Darstellungen von Objekten. Bei der Generalisierung von natürlichen Bildern zu Kunstwerken übertrifft es alle anderen Detektionsmethoden – einschließlich DPM und R-CNN – deutlich sowohl im Picasso-Datensatz als auch im People-Art-Datensatz.

You Only Look Once: Vereinte, Echtzeit-Objekterkennung | Neueste Forschungsarbeiten | HyperAI