Command Palette
Search for a command to run...
CapRL Beschreibt Reinforcement Learning
CapRL wurde im September 2025 von einem Forschungsteam der Universität für Wissenschaft und Technologie Chinas, der Chinesischen Universität Hongkong und des Shanghai Artificial Intelligence Laboratory sowie weiterer Universitäten und Institutionen vorgeschlagen. Die entsprechenden Forschungsergebnisse wurden in der Publikation „…“ veröffentlicht.CapRL: Förderung dichter Bildbeschreibungsfähigkeiten durch Reinforcement Learning".
CapRL ist ein neuartiges Trainingsframework, das die Qualität von Beschreibungen durch seine Praxistauglichkeit neu definiert: Hochwertige Beschreibungen sollen es nicht-visuellen Sprachmodellen ermöglichen, Fragen zum zugehörigen Bild präzise zu beantworten. Es verwendet einen entkoppelten zweistufigen Prozess, bei dem ein großes visuelles Sprachmodell (LVLM) die Beschreibung generiert, während die Zielfunktion auf der Genauigkeit eines separaten, nicht-visuellen großen Sprachmodells (LLM) basiert, das Multiple-Choice-Fragen anhand dieser Beschreibung beantwortet. Vortrainiert auf dem mit CapRL-3B annotierten Beschreibungsdatensatz CapRL-5M, erzielt CapRL signifikante Verbesserungen in 12 Benchmarks. Darüber hinaus ist seine Leistung im Prism-Framework zur Bewertung der Beschreibungsqualität vergleichbar mit Qwen2.5-VL-72B und übertrifft die Baseline um durchschnittlich 8,41 TP3T.

Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.