最新論文
日々更新される最先端AI研究論文、人工知能の最新動向を把握

階層的な予算ポリシー最適化による適応的推論
Shangke Lyu; Linjuan Wu; Yuchen Yan; Xingyu Wu; Hao Li; Yongliang Shen; Peisheng Jiang; Weiming Lu; Jun Xiao; Yueting Zhuang
3日前

キャプテン・シネマ:ショートムービー生成に向けて
Junfei Xiao, Ceyuan Yang, Lvmin Zhang, et al.
3日前

LAPO:長さ適応型ポリシー最適化による推論効率の内面化
Xingyu Wu; Yuchen Yan; Shangke Lyu; Linjuan Wu; Yiwen Qiu; Yongliang Shen; Weiming Lu; Jian Shao; Jun Xiao; Yueting Zhuang
3日前

MUR:大規模言語モデルにおけるモーメント不確実性を用いた推論
Hang Yan; Fangzhi Xu; Rongman Xu; Yifei Li; Jian Zhang; Haoran Luo; Xiaobao Wu; Luu Anh Tuan; Haiteng Zhao; Qika Lin; Jun Liu
3日前

∇NABLA:近隣適応ブロックレベルアテンション
Dmitrii Mikhailov; Aleksey Letunovskiy; Maria Kovaleva; Vladimir Arkhipkin; Vladimir Korviakov; Vladimir Polovnikov; Viacheslav Vasilev; Evelina Sidorova; Denis Dimitrov
3日前

グループシーケンスポリシーオプティマイゼーション
Chujie Zheng, Shixuan Liu, Mingze Li, et al.
3日前

SafeWork-R1:AI-45法下における安全と知能の共進化
Yicheng Bao, Guanxu Chen, Mingkang Chen, et al.
6日前

LLMsにおける知識と推論の分離:認知二重システム理論を用いた探求
Mutian Yang, Jiandong Gao, Ji Wu
6日前

Re:Form -- LLMsにおけるRLを用いたスケーラブルな形式的ソフトウェア検証における人間の事前知識の削減:Dafnyに関する予備的研究
Chuanhao Yan; Fengdi Che; Xuhan Huang; Xu Xu; Xin Li; Yizhi Li; Xingwei Qu; Jingzhe Shi; Zhuangzhuang He; Chenghua Lin; Yaodong Yang; Binhang Yuan; Hang Zhao; Yu Qiao; Bowen Zhou; Jie Fu
6日前

RAVine:エージェンティック検索におけるリアリティ対応評価
Yilong Xu; Xiang Long; Zhi Zheng; Jinhua Gao
6日前