HyperAIHyperAI

Command Palette

Search for a command to run...

vor 7 Tagen

GroupRank: Ein gruppenweiser Neuordnungsansatz, getrieben durch Verstärkungslernen

GroupRank: Ein gruppenweiser Neuordnungsansatz, getrieben durch Verstärkungslernen

Abstract

Große Sprachmodelle haben ein hohes Potenzial als Reranker zur Verbesserung der Gesamtleistung von RAG-Systemen gezeigt. Allerdings sind bestehende Reranking-Paradigmen durch ein zentrales theoretisches und praktisches Dilemma eingeschränkt: Pointwise-Methoden, obwohl einfach und äußerst flexibel, bewerten Dokumente unabhängig voneinander und sind daher anfällig für die „Ranking Myopia Trap“, bei der relative Bedeutungsunterschiede zwischen Dokumenten übersehen werden. Im Gegensatz dazu können Listwise-Methoden den globalen Rangkontext wahrnehmen, leiden jedoch unter inhärenter „List Rigidity“, was zu gravierenden Skalierbarkeits- und Flexibilitätsproblemen führt, wenn große Kandidatensets verarbeitet werden müssen. Um diese Herausforderungen zu bewältigen, schlagen wir Groupwise, ein neuartiges Reranking-Paradigma, vor. Bei diesem Ansatz werden die Abfrage und eine Gruppe von Kandidatendokumenten gemeinsam in das Modell eingespeist, das innerhalb der Gruppe Vergleiche durchführt, um jedem Dokument eine individuelle Relevanzbewertung zuzuweisen. Diese Architektur bewahrt die Flexibilität von Pointwise-Methoden, ermöglicht aber gleichzeitig die Vergleichsfähigkeit von Listwise-Methoden. Zur Modelltrainierung verwenden wir GRPO mit einer heterogenen Belohnungsfunktion, die Ranking-Metriken mit einer verteilungsorientierten Belohnung kombiniert, um die Score-Verteilungen über Gruppen hinweg auszurichten. Um den Engpass durch die Knappheit hochwertiger gelabelter Daten zu überwinden, schlagen wir außerdem eine innovative Pipeline zur Synthese hochwertiger Retrieval- und Ranking-Daten vor. Die resultierenden Daten können nicht nur zum Training des Rerankers, sondern auch zum Training des Retrievers genutzt werden. Umfassende Experimente bestätigen die Wirksamkeit unseres Ansatzes. Auf zwei auf Schlussfolgerungsfähigkeit ausgerichteten Retrieval-Benchmarks, BRIGHT und R2MED, zeigt sich eine signifikante Leistungssteigerung.

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
GroupRank: Ein gruppenweiser Neuordnungsansatz, getrieben durch Verstärkungslernen | Forschungsarbeiten | HyperAI