HyperAIHyperAI

Command Palette

Search for a command to run...

TallyQA: Beantwortung komplexer Zählfragen

Manoj Acharya; Kushal Kafle; Christopher Kanan

Zusammenfassung

Die meisten Zählfragen in visuellen Frage-Antwort-Datensätzen (VQA) sind einfach und erfordern nicht mehr als die Objekterkennung. In dieser Studie untersuchen wir Algorithmen für komplexe Zählfragen, die Beziehungen zwischen Objekten, Attributidentifikation, Schlussfolgerung und mehr umfassen. Dazu haben wir TallyQA erstellt, den größten Datensatz für offene Zählfragen weltweit. Wir schlagen einen neuen Algorithmus vor, der Relation Networks mit Region Proposal verwendet. Unsere Methode ermöglicht es, Relation Networks effizient bei hochaufgelösten Bildern einzusetzen. Sie erzielt verglichen mit Baseline- und aktuellen Systemen sowohl auf TallyQA als auch auf dem HowMany-QA-Benchmark standesüberragende Ergebnisse.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp