HyperAIHyperAI

Command Palette

Search for a command to run...

Bildkomposition für Fernerkundung

Bill Psomas Ioannis Kakogeorgiou Nikos Efthymiadis Giorgos Tolias Ondřej Chum Yannis Avrithis Konstantinos Karantzalos

Zusammenfassung

Diese Arbeit führt die zusammengesetzte Bildsuche in der Fernerkundung ein. Sie ermöglicht es, eine große Bildarchiv durch abwechselnde Anfragen mit Bildbeispielen und textueller Beschreibung zu durchsuchen, was die beschreibende Kraft gegenüber unimodalen Abfragen, sei es visuell oder textuell, erheblich steigert. Die textuelle Komponente kann verschiedene Attribute wie Form, Farbe oder Kontext modifizieren. Eine neuartige Methode zur Fusion von Bild-zu-Bild- und Text-zu-Bild-Ähnlichkeit wird vorgestellt. Wir zeigen, dass ein Vision-Language-Modell über ausreichende beschreibende Kraft verfügt und keine zusätzlichen Lernschritte oder Trainingsdaten erforderlich sind. Wir präsentieren einen neuen Evaluationsbenchmark, der sich auf Modifikationen von Farbe, Kontext, Dichte, Existenz, Menge und Form konzentriert. Unsere Arbeit setzt nicht nur den Stand der Technik für diese Aufgabe neu, sondern stellt auch einen grundlegenden Schritt dar, um eine Lücke im Bereich der Fernerkundungsbildsuche zu schließen. Quellcode: https://github.com/billpsomas/rscir


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp