Command Palette
Search for a command to run...
CapRLは強化学習を説明する
CapRLは、中国科学技術大学、香港中文大学、上海人工知能研究所などの研究チームによって2025年9月に提案されました。関連する研究成果は論文「…」に掲載されました。CapRL: 強化学習による高密度画像キャプション機能の刺激”。
CapRLは、実用性を通して記述品質を再定義する、革新的なトレーニングフレームワークです。高品質な記述は、非視覚言語モデルが対応する画像に関する質問に正確に答えられることを可能にします。CapRLは、大規模視覚言語モデル(LVLM)が記述を生成する一方で、別の非視覚大規模言語モデル(LLM)がその記述に基づく多肢選択式質問に回答する際の精度から客観的な報酬を得るという、分離された2段階プロセスを採用しています。CapRLは、CapRL-3BでアノテーションされたCapRL-5M記述データセットで事前トレーニングされており、12のベンチマークで大幅な改善を達成しています。さらに、記述品質評価のためのPrismフレームワークにおいて、そのパフォーマンスはQwen2.5-VL-72Bに匹敵し、ベースラインを平均8.41 TP3T上回ります。

Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.