HyperAIHyperAI

Command Palette

Search for a command to run...

CapRLは強化学習を説明する

Date

2ヶ月前

Organization

香港中文大学
中国科学技術大学
上海人工知能研究所

Paper URL

2509.22647

CapRLは、中国科学技術大学、香港中文大学、上海人工知能研究所などの研究チームによって2025年9月に提案されました。関連する研究成果は論文「…」に掲載されました。CapRL: 強化学習による高密度画像キャプション機能の刺激”。

CapRLは、実用性を通して記述品質を再定義する、革新的なトレーニングフレームワークです。高品質な記述は、非視覚言語モデルが対応する画像に関する質問に正確に答えられることを可能にします。CapRLは、大規模視覚言語モデル(LVLM)が記述を生成する一方で、別の非視覚大規模言語モデル(LLM)がその記述に基づく多肢選択式質問に回答する際の精度から客観的な報酬を得るという、分離された2段階プロセスを採用しています。CapRLは、CapRL-3BでアノテーションされたCapRL-5M記述データセットで事前トレーニングされており、12のベンチマークで大幅な改善を達成しています。さらに、記述品質評価のためのPrismフレームワークにおいて、そのパフォーマンスはQwen2.5-VL-72Bに匹敵し、ベースラインを平均8.41 TP3T上回ります。

CapRL法

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています