Command Palette
Search for a command to run...
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

マップを用いた思考:強化型並列マップ拡張エージェントによる地理局所化

順序付けの障壁を打ち破った指向性単一始点最短経路問題































マップを用いた思考:強化型並列マップ拡張エージェントによる地理局所化

順序付けの障壁を打ち破った指向性単一始点最短経路問題






























GR-Dexter 技術報告
VideoAuto-R1:一度の思考で済ませ、二度の回答を行うことで実現する動画自動推論
RelayLLM:協調デコードによる効率的な推論
トークンレベルにおけるLLM協働のためのFusionRoute
RL-AWB:低照度夜間シーンにおける自動ホワイトバランス補正のためのディープ強化学習
学習可能なマルチプライヤー:言語モデル行列層のスケーリングを解放する
GDPO:マルチリワードRL最適化のためのグループ報酬分解型正規化ポリシー最適化
MemRL:エピソード記憶上のランタイム強化学習を用いた自己進化型エージェント
失敗から習得へ:ツール利用エージェント向けハードサンプルの生成
動的オブジェクトの世界を巧みに編み込む
Klear:統合型マルチタスク音声・映像共同生成
Atlas:マルチドメイン複雑推論のための異種モデルおよびツールのオーケストレーション
Benchmark^2:LLMベンチマークの体系的評価
MindWatcher:よりスマートなマルチモーダルツール統合推論への道
エントロピー適応型ファインチューニング:確信した矛盾の解消による忘却の軽減
多様性か精度か?次トークン予測の深い考察
孔子コードエージェント:現実世界のコードベースにおけるスケーラブルなエージェント構造
DreamStyle:ビデオスタイル化のための統合枠組み
UniCorn:自己生成された教師信号を用いた自己改善型統合型マルチモーダルモデルへの道
LTX-2:効率的な共同音声視覚基盤モデル
SciEvalKit:科学一般知能向けオープンソース評価ツールキット
MOSS Transcribe Diarize:発話者分離を伴う高精度な音声認識
InfiniDepth:ニューラルインプリシットフィールドを用いた任意解像度・細粒度深度推定
エージェント型AIの適応
大規模なビデオ計画が汎用的なロボット制御を可能にする
InfiniteVGGT:無限ストリーム向け視覚幾何学に基づくトランスフォーマー
GARDO:報酬ハッキングを伴わずに拡散モデルを強化する
VAR RLの正しさ:視覚的自己回帰生成における非同期な方策の衝突への対処
DreamID-V:拡散トランスフォーマーを活用した高忠実度顔交換における画像から動画へのギャップの橋渡し
NextFlow:統一された順序モデリングがマルチモーダル理解および生成を活性化する
GR-Dexter 技術報告
VideoAuto-R1:一度の思考で済ませ、二度の回答を行うことで実現する動画自動推論
RelayLLM:協調デコードによる効率的な推論
トークンレベルにおけるLLM協働のためのFusionRoute
RL-AWB:低照度夜間シーンにおける自動ホワイトバランス補正のためのディープ強化学習
学習可能なマルチプライヤー:言語モデル行列層のスケーリングを解放する
GDPO:マルチリワードRL最適化のためのグループ報酬分解型正規化ポリシー最適化
MemRL:エピソード記憶上のランタイム強化学習を用いた自己進化型エージェント
失敗から習得へ:ツール利用エージェント向けハードサンプルの生成
動的オブジェクトの世界を巧みに編み込む
Klear:統合型マルチタスク音声・映像共同生成
Atlas:マルチドメイン複雑推論のための異種モデルおよびツールのオーケストレーション
Benchmark^2:LLMベンチマークの体系的評価
MindWatcher:よりスマートなマルチモーダルツール統合推論への道
エントロピー適応型ファインチューニング:確信した矛盾の解消による忘却の軽減
多様性か精度か?次トークン予測の深い考察
孔子コードエージェント:現実世界のコードベースにおけるスケーラブルなエージェント構造
DreamStyle:ビデオスタイル化のための統合枠組み
UniCorn:自己生成された教師信号を用いた自己改善型統合型マルチモーダルモデルへの道
LTX-2:効率的な共同音声視覚基盤モデル
SciEvalKit:科学一般知能向けオープンソース評価ツールキット
MOSS Transcribe Diarize:発話者分離を伴う高精度な音声認識
InfiniDepth:ニューラルインプリシットフィールドを用いた任意解像度・細粒度深度推定
エージェント型AIの適応
大規模なビデオ計画が汎用的なロボット制御を可能にする
InfiniteVGGT:無限ストリーム向け視覚幾何学に基づくトランスフォーマー
GARDO:報酬ハッキングを伴わずに拡散モデルを強化する
VAR RLの正しさ:視覚的自己回帰生成における非同期な方策の衝突への対処
DreamID-V:拡散トランスフォーマーを活用した高忠実度顔交換における画像から動画へのギャップの橋渡し
NextFlow:統一された順序モデリングがマルチモーダル理解および生成を活性化する