vor 8 Monaten

Zusammenfassung

Alle Instanzwahrnehmungsaufgaben zielen darauf ab, bestimmte Objekte zu finden, die durch einige Anfragen wie Kategorienamen, Sprachausdrücke und Zielannotationen spezifiziert sind. Dieses gesamte Feld wurde jedoch in mehrere unabhängige Teilbereiche aufgeteilt. In dieser Arbeit präsentieren wir ein universelles Instanzwahrnehmungsmodell der nächsten Generation, das UNINEXT genannt wird. UNINEXT reformuliert verschiedene Instanzwahrnehmungsaufgaben in ein einheitliches Paradigma der Objekterkennung und -abruf und kann unterschiedliche Arten von Objekten flexibel wahrnehmen, indem man einfach die Eingabetipps ändert. Diese einheitliche Formulierung bringt folgende Vorteile: (1) riesige Datenmengen aus verschiedenen Aufgaben und Label-Vokabularien können für die gemeinsame Schulung allgemeiner instanzbasierter Repräsentationen genutzt werden, was insbesondere für Aufgaben mit mangelnden Trainingsdaten vorteilhaft ist. (2) Das einheitliche Modell ist parameter-effizient und kann redundante Berechnungen sparen, wenn es gleichzeitig mehrere Aufgaben bearbeitet. UNINEXT zeigt überlegene Leistungen auf 20 anspruchsvollen Benchmarks aus 10 instanzbasierten Aufgaben, darunter klassische bildbasierte Aufgaben (Objekterkennung und Instanzsegmentierung), visuelle-linguistische Aufgaben (Verstehen von Referenzausdrücken und Segmentierung) sowie sechs videobasierte Objektverfolgungsaufgaben. Der Quellcode ist unter https://github.com/MasterBin-IIAU/UNINEXT verfügbar.

Quell-PDF Code anzeigen

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

vor 8 Monaten

Bin Yan Yi Jiang Jiannan Wu Dong Wang Ping Luo Zehuan Yuan Huchuan Lu

Zusammenfassung

Quell-PDF Code anzeigen

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

vor 8 Monaten

Bin Yan Yi Jiang Jiannan Wu Dong Wang Ping Luo Zehuan Yuan Huchuan Lu

Zusammenfassung

Quell-PDF Code anzeigen

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

Universelle Instanzwahrnehmung als Objekterkennung und -abruf

Bin Yan Yi Jiang Jiannan Wu Dong Wang Ping Luo Zehuan Yuan Huchuan Lu

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Universelle Instanzwahrnehmung als Objekterkennung und -abruf

Bin Yan Yi Jiang Jiannan Wu Dong Wang Ping Luo Zehuan Yuan Huchuan Lu

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Universelle Instanzwahrnehmung als Objekterkennung und -abruf

Bin Yan Yi Jiang Jiannan Wu Dong Wang Ping Luo Zehuan Yuan Huchuan Lu

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters