HyperAIHyperAI

Command Palette

Search for a command to run...

CapRL Beschreibt Reinforcement Learning

Datum

vor 2 Monaten

Organisation

Die Chinesische Universität von Hongkong
Universität für Wissenschaft und Technologie von China
Shanghaier Labor für künstliche Intelligenz

Paper-URL

2509.22647

CapRL wurde im September 2025 von einem Forschungsteam der Universität für Wissenschaft und Technologie Chinas, der Chinesischen Universität Hongkong und des Shanghai Artificial Intelligence Laboratory sowie weiterer Universitäten und Institutionen vorgeschlagen. Die entsprechenden Forschungsergebnisse wurden in der Publikation „…“ veröffentlicht.CapRL: Förderung dichter Bildbeschreibungsfähigkeiten durch Reinforcement Learning".

CapRL ist ein neuartiges Trainingsframework, das die Qualität von Beschreibungen durch seine Praxistauglichkeit neu definiert: Hochwertige Beschreibungen sollen es nicht-visuellen Sprachmodellen ermöglichen, Fragen zum zugehörigen Bild präzise zu beantworten. Es verwendet einen entkoppelten zweistufigen Prozess, bei dem ein großes visuelles Sprachmodell (LVLM) die Beschreibung generiert, während die Zielfunktion auf der Genauigkeit eines separaten, nicht-visuellen großen Sprachmodells (LLM) basiert, das Multiple-Choice-Fragen anhand dieser Beschreibung beantwortet. Vortrainiert auf dem mit CapRL-3B annotierten Beschreibungsdatensatz CapRL-5M, erzielt CapRL signifikante Verbesserungen in 12 Benchmarks. Darüber hinaus ist seine Leistung im Prism-Framework zur Bewertung der Beschreibungsqualität vergleichbar mit Qwen2.5-VL-72B und übertrifft die Baseline um durchschnittlich 8,41 TP3T.

CapRL-Methode

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
CapRL Beschreibt Reinforcement Learning | Wiki | HyperAI