vor 6 Monaten

Zusammenfassung

Mit der kontinuierlichen Verbesserung der Computer Vision wird ein höherer Verständnisgrad benötigt, um komplexere Aufgaben wie semantische Bildretrieval, Bildbeschreibung (Image Captioning) und Szenenverstehen zu lösen. Das Szenenverstehen stellt aufgrund seiner Komplexität und des Mangels an geeigneten Datenrepräsentationen ein seit langem untersuchtes Problem dar. Ein Szenengraph ist eine der leistungsfähigsten Datenrepräsentationen, die ein besseres Verständnis des Szenenkontexts ermöglicht. Die Aufgabe eines Szenengraphen besteht darin, die in einer Szene enthaltenen Objekte, deren Attribute sowie die zwischen diesen Objekten bestehenden Beziehungen zu kodieren. Da sich der Szenengraph bei anspruchsvollen Aufgaben als leistungsfähig erwiesen hat, ist die Automatisierung der Szenengraph-Erzeugung zu einer zwingenden Notwendigkeit geworden. Um präzise Szenengraphen zu generieren, wurden zahlreiche Forschungsarbeiten unternommen, die unterschiedliche Architekturen des tiefen Lernens nutzen. Gemeinsamer Bestandteil all dieser Architekturen ist die Objekterkennungsmodul, das zunächst die Objekte in dem Eingabebild lokalisiert. In dieser Arbeit schlagen wir die Verwendung der neuesten Objektdetektoren der YOLOv5-Familie für die Aufgabe der Szenengraph-Erzeugung vor. Der vorgeschlagene YOLOv5x6 erreicht mit 32,7 Prozent mittlerer Genauigkeit (mean average precision, mAP) einen State-of-the-Art-Wert im Vergleich zu früheren Arbeiten. Zudem bietet der Artikel eine Übersicht über die verschiedenen Objektdetektoren, die in der Literatur für die Szenengraph-Erzeugung eingesetzt wurden.

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

vor 6 Monaten

Mohamed F. Tolba Howida A. Shedeed Dina Khattab Mohammad Essam

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

vor 6 Monaten

Mohamed F. Tolba Howida A. Shedeed Dina Khattab Mohammad Essam

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

Ein verbesserter Objekterkennungsmodell für die Generierung von Szenengraphen

Mohamed F. Tolba Howida A. Shedeed Dina Khattab Mohammad Essam

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Ein verbesserter Objekterkennungsmodell für die Generierung von Szenengraphen

Mohamed F. Tolba Howida A. Shedeed Dina Khattab Mohammad Essam

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Ein verbesserter Objekterkennungsmodell für die Generierung von Szenengraphen

Mohamed F. Tolba Howida A. Shedeed Dina Khattab Mohammad Essam

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters