Command Palette
Search for a command to run...
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

言語モデルエージェントのエンパワーメントの推定

言語モデルはスカラー報酬なしで言語的フィードバックから学習できる































言語モデルエージェントのエンパワーメントの推定

言語モデルはスカラー報酬なしで言語的フィードバックから学習できる






























変分推論による言語モデル
EPO:大規模言語モデルエージェント向けエントロピー正則化政策最適化 強化学習
MinerU2.5:効率的な高解像度ドキュメント解析のための分離型視覚言語モデル
エントロピー安全推論のための分位数アドバンテージ推定
LongLive:リアルタイム対応の長時間動画生成
組み合わせ的創造性:一般化能力における新たなフロンティア
因果的時空間予測:効果的かつ効率的なマルチモーダルアプローチ
Hunyuan3D-Omni:3Dアセットの制御可能生成のための統一フレームワーク
Seedream 4.0:次世代マルチモーダル画像生成へ
LLMエージェント強化学習のための木探索
SciReasoner:分野を越えた科学的推論の基盤を構築する
MMR1:分散に配慮したサンプリングおよびオープンリソースを活用したマルチモーダル推論の向上
VCRL:大規模言語モデル向けの分散に基づくカリキュラム強化学習
MultiEdit:多様で困難なタスクにおける指示に基づく画像編集の進展
BRISC:Swin-HAFNetを用いた脳腫瘍セグメンテーションおよび分類のためのアノテーション付きデータセット
EmoBench-M:マルチモーダル大規模言語モデルの感情知能のベンチマーク評価
FDABench:異種データ上の分析クエリ向けデータエージェントのベンチマーク
思考するより絵を描くほうが簡単:テキストから画像を生成するモデルは舞台を設定できるが、演出まではできないか?
UniVerse-1:エキスパートのステッチングによる統合型音声・映像生成
基礎モデルは段階的エムボディド推論においてどれほど優れているか?
スパイキングブレイン技術報告書:スパイキングブレインをインスパイアした大規模モデル
SAGE:意味理解のための現実的なベンチマーク
WAVECLIP:適応的解像度CLIPのためのウェーブレットトークナイゼーション
EmbeddingGemma:強力で軽量なテキスト表現
GRPOを用いた音声認識言語モデルにおける音声理解の進展
VLMが視覚空間的知能からどれほど離れているのか? ベンチマーク駆動型の視点から
SIM-CoT:教師付き暗黙的チェーン・オブ・シンキング
SWE-QA:言語モデルはリポジトリレベルのコード質問に答えられるか?
動画モデルはゼロショット学習者かつ推論者である。
機械工学解析問題の重要課題に対するN-Plus-1 GPTエージェンシー
変分推論による言語モデル
EPO:大規模言語モデルエージェント向けエントロピー正則化政策最適化 強化学習
MinerU2.5:効率的な高解像度ドキュメント解析のための分離型視覚言語モデル
エントロピー安全推論のための分位数アドバンテージ推定
LongLive:リアルタイム対応の長時間動画生成
組み合わせ的創造性:一般化能力における新たなフロンティア
因果的時空間予測:効果的かつ効率的なマルチモーダルアプローチ
Hunyuan3D-Omni:3Dアセットの制御可能生成のための統一フレームワーク
Seedream 4.0:次世代マルチモーダル画像生成へ
LLMエージェント強化学習のための木探索
SciReasoner:分野を越えた科学的推論の基盤を構築する
MMR1:分散に配慮したサンプリングおよびオープンリソースを活用したマルチモーダル推論の向上
VCRL:大規模言語モデル向けの分散に基づくカリキュラム強化学習
MultiEdit:多様で困難なタスクにおける指示に基づく画像編集の進展
BRISC:Swin-HAFNetを用いた脳腫瘍セグメンテーションおよび分類のためのアノテーション付きデータセット
EmoBench-M:マルチモーダル大規模言語モデルの感情知能のベンチマーク評価
FDABench:異種データ上の分析クエリ向けデータエージェントのベンチマーク
思考するより絵を描くほうが簡単:テキストから画像を生成するモデルは舞台を設定できるが、演出まではできないか?
UniVerse-1:エキスパートのステッチングによる統合型音声・映像生成
基礎モデルは段階的エムボディド推論においてどれほど優れているか?
スパイキングブレイン技術報告書:スパイキングブレインをインスパイアした大規模モデル
SAGE:意味理解のための現実的なベンチマーク
WAVECLIP:適応的解像度CLIPのためのウェーブレットトークナイゼーション
EmbeddingGemma:強力で軽量なテキスト表現
GRPOを用いた音声認識言語モデルにおける音声理解の進展
VLMが視覚空間的知能からどれほど離れているのか? ベンチマーク駆動型の視点から
SIM-CoT:教師付き暗黙的チェーン・オブ・シンキング
SWE-QA:言語モデルはリポジトリレベルのコード質問に答えられるか?
動画モデルはゼロショット学習者かつ推論者である。
機械工学解析問題の重要課題に対するN-Plus-1 GPTエージェンシー