vor 8 Monaten

Aditya Kusupati Gantavya Bhatt Aniket Rege Matthew Wallingford Aditya Sinha Vivek Ramanujan William Howard-Snyder Kaifeng Chen Sham Kakade Prateek Jain

Zusammenfassung

Gelernte Darstellungen sind ein zentraler Bestandteil moderner maschineller Lernsysteme und dienen einer Vielzahl nachgeschalteter Aufgaben. Bei der Ausbildung solcher Darstellungen sind die rechnerischen und statistischen Beschränkungen für jede nachgeschaltete Aufgabe oft unbekannt. In diesem Kontext können starre, festgelegte Kapazitätsdarstellungen entweder über- oder unterdimensioniert für die jeweilige Aufgabe sein. Dies führt uns zur Frage: Können wir eine flexible Darstellung entwerfen, die sich an mehrere nachgeschaltete Aufgaben mit unterschiedlichen rechnerischen Ressourcen anpassen kann? Unser Hauptbeitrag ist die Matryoshka-Darstellungslernung (Matryoshka Representation Learning, MRL), die Informationen auf unterschiedlichen Granularitätsstufen kodiert und es einer einzigen Embedding-Darstellung ermöglicht, sich an die rechnerischen Beschränkungen nachgeschalteter Aufgaben anzupassen. MRL modifiziert bestehende Darstellungslernpipelines minimal und verursacht während Inferenz und Bereitstellung keinerlei zusätzliche Kosten. MRL lernt grob-zu-fein-Darstellungen, die mindestens genauso genau und informativ sind wie unabhängig trainierte, niedrigdimensionale Darstellungen. Die Flexibilität der gelernten Matryoshka-Darstellungen bietet folgende Vorteile: (a) bis zu 14-fach kleinere Embedding-Größe bei der Klassifikation auf ImageNet-1K bei gleichbleibender Genauigkeit; (b) bis zu 14-fach höhere Geschwindigkeit im realen Einsatz bei großskaliger Recherche auf ImageNet-1K und ImageNet-4K; sowie (c) bis zu 2 Prozentpunkte höhere Genauigkeit bei der Long-Tail Few-Shot-Klassifikation – alles unter Beibehaltung der Robustheit der ursprünglichen Darstellungen. Schließlich zeigen wir, dass MRL nahtlos auf web-skalige Datensätze (ImageNet, JFT) verschiedener Modalitäten übertragbar ist – sowohl für Vision (ViT, ResNet), Vision + Sprache (ALIGN) als auch für Sprache (BERT). Der MRL-Code und vortrainierte Modelle sind unter https://github.com/RAIVNLab/MRL öffentlich zugänglich.

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

vor 8 Monaten

Aditya Kusupati Gantavya Bhatt Aniket Rege Matthew Wallingford Aditya Sinha Vivek Ramanujan William Howard-Snyder Kaifeng Chen Sham Kakade Prateek Jain

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

vor 8 Monaten

Aditya Kusupati Gantavya Bhatt Aniket Rege Matthew Wallingford Aditya Sinha Vivek Ramanujan William Howard-Snyder Kaifeng Chen Sham Kakade Prateek Jain

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

Matryoshka-Darstellungslernen

Aditya Kusupati Gantavya Bhatt Aniket Rege Matthew Wallingford Aditya Sinha Vivek Ramanujan William Howard-Snyder Kaifeng Chen Sham Kakade Prateek Jain1 more

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Matryoshka-Darstellungslernen

Aditya Kusupati Gantavya Bhatt Aniket Rege Matthew Wallingford Aditya Sinha Vivek Ramanujan William Howard-Snyder Kaifeng Chen Sham Kakade Prateek Jain1 more

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Matryoshka-Darstellungslernen

Aditya Kusupati Gantavya Bhatt Aniket Rege Matthew Wallingford Aditya Sinha Vivek Ramanujan William Howard-Snyder Kaifeng Chen Sham Kakade Prateek Jain1 more

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Aditya Kusupati Gantavya Bhatt Aniket Rege Matthew Wallingford Aditya Sinha Vivek Ramanujan William Howard-Snyder Kaifeng Chen Sham Kakade Prateek Jain

Aditya Kusupati Gantavya Bhatt Aniket Rege Matthew Wallingford Aditya Sinha Vivek Ramanujan William Howard-Snyder Kaifeng Chen Sham Kakade Prateek Jain

Aditya Kusupati Gantavya Bhatt Aniket Rege Matthew Wallingford Aditya Sinha Vivek Ramanujan William Howard-Snyder Kaifeng Chen Sham Kakade Prateek Jain