Command Palette
Search for a command to run...
Präzise Detektion in dicht gepackten Szenen
Präzise Detektion in dicht gepackten Szenen
Eran Goldman extsuperscript1,3∗ Roei Herzig extsuperscript2∗ Aviv Eisenschtat extsuperscript3∗ Oria Ratzon extsuperscript3 Itsik Levi extsuperscript3 Jacob Goldberger extsuperscript1 Tal Hassner extsuperscript4†
Zusammenfassung
Menschliche Szenen können dicht besetzt sein und zahlreiche Objekte enthalten, die oft identisch sind und in enger Nachbarschaft positioniert werden. Wir zeigen, dass präzise Objekterkennung in solchen Szenen selbst für die modernsten Objekterkennungsverfahren eine herausfordernde Aufgabe darstellt. Wir schlagen eine neue, auf tiefem Lernen basierende Methode zur präzisen Objekterkennung vor, die für solche anspruchsvolle Situationen entwickelt wurde. Unsere Beiträge umfassen:(1) Eine Schicht zur Schätzung des Jaccard-Index als Erkennungsqualitätsscore;(2) eine neuartige EM-Fusionskomponente (EM merging unit), die unsere Qualitätsbewertungen verwendet, um Überlappungen bei der Erkennung aufzulösen;(3) einen umfangreichen, annotierten Datensatz, SKU-110K, der dicht besetzte Einzelhandelsumgebungen repräsentiert und für das Training und Testen unter extremen Bedingungen freigegeben wurde.Erkennungstests auf SKU-110K und Zähltests auf den Datensätzen CARPK und PUCPR+ zeigen, dass unsere Methode bestehende Top-Verfahren erheblich übertrifft. Der Code und die Daten werden unter \url{www.github.com/eg4000/SKU110K_CVPR19} zur Verfügung gestellt.