vor 6 Monaten

Zusammenfassung

Bedingte und zusammengesetzte Bildretrieval-Systeme erweitern CBIR-Systeme, indem sie eine Abfragebild mit einem zusätzlichen Text kombinieren, der die Absicht des Nutzers ausdrückt und ergänzende Anforderungen bezüglich des visuellen Inhalts des Abfragebilds beschreibt. Diese Suchform ist besonders interessant für Anwendungen im E-Commerce, beispielsweise zur Entwicklung interaktiver multimodaler Suchsysteme und Chatbots. In dieser Demonstration präsentieren wir ein interaktives System, das auf einem Kombinierungsnetzwerk basiert, das mittels kontrastiver Lernverfahren trainiert wurde und visuelle sowie textuelle Merkmale aus dem OpenAI CLIP-Netzwerk integriert, um bedingte CBIR zu realisieren. Das System kann zur Verbesserung von E-Shop-Suchmaschinen eingesetzt werden. So ermöglicht es beispielsweise im Bereich Mode, Kleider, Hemden oder Oberteile anhand eines Ausgangsbilds zu suchen und dabei visuelle Unterschiede hinsichtlich Farbe, Muster oder Form anzugeben. Das vorgeschlagene Netzwerk erreicht state-of-the-art-Leistungen auf dem FashionIQ-Datensatz sowie auf dem jüngeren CIRR-Datensatz und zeigt damit seine Anwendbarkeit für die bedingte Recherche im Modebereich sowie für allgemeinere Inhalte im Rahmen der zusammengesetzten Bildretrieval-Aufgabe.

Quell-PDF Code anzeigen

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 6 Monaten

Multimodal

Multimodale Darstellung

Bild-zu-Bild

Multimodal

Aufgabe

Alberto del Bimbo Tiberio Uricchio Marco Bertini Alberto Baldrati

Zusammenfassung

Quell-PDF Code anzeigen

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 6 Monaten

Multimodal

Multimodale Darstellung

Bild-zu-Bild

Multimodal

Aufgabe

Alberto del Bimbo Tiberio Uricchio Marco Bertini Alberto Baldrati

Zusammenfassung

Quell-PDF Code anzeigen

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

Effektive konditionierte und zusammengesetzte Bildretrieval-Methoden durch Kombination von CLIP-basierten Merkmalen

Alberto del Bimbo Tiberio Uricchio Marco Bertini Alberto Baldrati

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Effektive konditionierte und zusammengesetzte Bildretrieval-Methoden durch Kombination von CLIP-basierten Merkmalen

Alberto del Bimbo Tiberio Uricchio Marco Bertini Alberto Baldrati

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Effektive konditionierte und zusammengesetzte Bildretrieval-Methoden durch Kombination von CLIP-basierten Merkmalen

Alberto del Bimbo Tiberio Uricchio Marco Bertini Alberto Baldrati

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters