HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
JudgeRLVR:効率的な推論のための最初に判断し、次に生成するアプローチ
強化学習
Reasoning
Jiangshan Duo, Hanyu Li, Hailin Zhang, et al.
SnapGen++:エッジデバイスにおける効率的で高忠実度の画像生成のためのDiffusion Transformersの活用
拡散モデル
画像生成
Dongting Hu, Aarush Gupta, Magzhan Gabidolla, et al.
動画生成におけるモーションアトリビューション
動画生成
テキストから動画
Xindi Wu, Despoina Paschalidou, Jun Gao, et al.
VLingNav:適応型推論と視覚支援言語記憶を活用したエンボディドナビゲーション
通義千問
エムボディドインテリジェンス
Shaoan Wang, Yuanfei Luo, Xingyu Chen, et al.
ミニストラル3
LLM
テキスト生成
Alexander H. Liu, Kartik Khandelwal, Sandeep Subramanian, et al.
信頼度の二律背反:ツール利用エージェントにおける誤補正の分析と軽減
強化学習
エージェント
Weihao Xuan, Qingcheng Zeng, Heli Qi, et al.
ShowUI-π:GUIに適したドexterousなハンドを備えたフローベースの生成モデル
通義千問
人間-コンピュータインタラクション
Siyuan Hu, Kevin Qinghong Lin, Mike Zheng Shou
野生における潜在行動世界モデルの学習
エムボディドインテリジェンス
テキストから動画
Quentin Garrido, Tushar Nagarajan, Basile Terver, et al.
ドクター・ゼロ:学習データを必要としない自己進化型検索エージェント
エージェント
Reasoning
Zhenrui Yue, Kartikeya Upasani, Xianjun Yang, et al.
MHLA:トークンレベル多頭による線形アテンションの表現力の回復
Transformer
画像生成
Kewei Zhang, Ye Huang, Yufan Deng, et al.
GlimpRouter:思考の一トークンを覗くことで実現する効率的な協調推論
Reasoning
インテリジェントな質問応答
Wenhao Zeng, Xuteng Zhang, Yuling Shi, et al.
X-Coder:完全に合成されたタスク、ソリューション、テストによる競技プログラミングの進展
コード生成
Reasoning
Jie Wu, Haoling Li, Xin Zhang, et al.
PaCoRe:並列協調推論を用いたテスト時計算資源のスケーラビリティ学習
Reasoning
インテリジェントな質問応答
Jingcheng Hu, Yinmin Zhang, Shijie Shang, et al.
BabyVision:言語を越える視覚的推論
視覚質問応答
画像理解
Liang Chen, Weichu Xie, Yiyan Liang, et al.
視聴、推論、探索:エージェント型動画推論のためのオープンWeb上での動画ディープリサーチベンチマーク
ビデオ理解
エージェント
Chengwen Liu, Xiaomin Yu, Zhuoyue Chang, et al.
スケーラブルなルックアップを用いた条件付きメモリ:大規模言語モデルにおけるスパース性の新たな軸
LLM
検索拡張生成
Xin Cheng, Wangding Zeng, Damai Dai, et al.
EnvScaler:プログラム合成によるLLMエージェント向けツール対話型環境のスケーリング
エージェント
LLM
Xiaoshuai Song, Haofei Chang, Guanting Dong, et al.
証拠のチェーン化:引用を意識したルーブリック報酬を用いた深層検索エージェントに対するロバストな強化学習
強化学習
エージェント
Jiajie Zhang, Xin Lv, Ling Feng, et al.
カリカチャGS:ガウス曲率を用いた3Dガウススプラッティング顔の誇張
3D生成
3Dモデル
Eldad Matmon, Amit Bracha, Noam Rotstein, et al.
思考の分子構造:長距離チェーン・オブ・シンキングのトポロジーをマッピングする
LLM
Reasoning
Qiguang Chen, Yantao Du, Ziniu Li, et al.
MMFormalizer:ワイルドな状況におけるマルチモーダル自動形式化
Reasoning
Any-to-Any
Jing Xiong, Qi Han, Yunta Hsieh, et al.
マップを用いた思考:強化型並列マップ拡張エージェントによる地理局所化
地理情報
LLM
Yuxiang Ji, Yong Wang, Ziyu Ma, et al.
順序付けの障壁を打ち破った指向性単一始点最短経路問題
アルゴリズム
高性能計算
Ran Duan, Jiayi Mao, Xiao Mao, et al.
GR-Dexter 技術報告
ロボティクス
エムボディドインテリジェンス
Ruoshi Wen, Guangzeng Chen, Zhongren Cui, et al.
VideoAuto-R1:一度の思考で済ませ、二度の回答を行うことで実現する動画自動推論
ビデオ理解
Reasoning
Shuming Liu, Mingchen Zhuge, Changsheng Zhao, et al.
RelayLLM:協調デコードによる効率的な推論
Reasoning
テキスト生成
Chengsong Huang, Tong Zheng, Langlin Huang, et al.
トークンレベルにおけるLLM協働のためのFusionRoute
LLM
テキスト生成
Nuoya Xiong, Yuhang Zhou, Hanqing Zeng, et al.
RL-AWB:低照度夜間シーンにおける自動ホワイトバランス補正のためのディープ強化学習
画像処理
マシンビジョン
Yuan-Kang Lee, Kuan-Lin Chen, Chia-Che Chang, et al.
学習可能なマルチプライヤー:言語モデル行列層のスケーリングを解放する
Transformer
機械学習
Maksim Velikanov, Ilyas Chahed, Jingwei Zuo, et al.
GDPO:マルチリワードRL最適化のためのグループ報酬分解型正規化ポリシー最適化
強化学習
Preference Modeling
Shih-Yang Liu, Xin Dong, Ximing Lu, et al.
MemRL:エピソード記憶上のランタイム強化学習を用いた自己進化型エージェント
強化学習
エージェント
Shengtao Zhang, Jiaqian Wang, Ruiwen Zhou, et al.
失敗から習得へ:ツール利用エージェント向けハードサンプルの生成
エージェント
Reasoning
Bingguang Hao, Zengzhuang Xu, Yuntao Wen, et al.
1
2
3
4
5
6
7
47
JudgeRLVR:効率的な推論のための最初に判断し、次に生成するアプローチ
強化学習
Reasoning
Jiangshan Duo, Hanyu Li, Hailin Zhang, et al.
SnapGen++:エッジデバイスにおける効率的で高忠実度の画像生成のためのDiffusion Transformersの活用
拡散モデル
画像生成
Dongting Hu, Aarush Gupta, Magzhan Gabidolla, et al.
動画生成におけるモーションアトリビューション
動画生成
テキストから動画
Xindi Wu, Despoina Paschalidou, Jun Gao, et al.
VLingNav:適応型推論と視覚支援言語記憶を活用したエンボディドナビゲーション
通義千問
エムボディドインテリジェンス
Shaoan Wang, Yuanfei Luo, Xingyu Chen, et al.
ミニストラル3
LLM
テキスト生成
Alexander H. Liu, Kartik Khandelwal, Sandeep Subramanian, et al.
信頼度の二律背反:ツール利用エージェントにおける誤補正の分析と軽減
強化学習
エージェント
Weihao Xuan, Qingcheng Zeng, Heli Qi, et al.
ShowUI-π:GUIに適したドexterousなハンドを備えたフローベースの生成モデル
通義千問
人間-コンピュータインタラクション
Siyuan Hu, Kevin Qinghong Lin, Mike Zheng Shou
野生における潜在行動世界モデルの学習
エムボディドインテリジェンス
テキストから動画
Quentin Garrido, Tushar Nagarajan, Basile Terver, et al.
ドクター・ゼロ:学習データを必要としない自己進化型検索エージェント
エージェント
Reasoning
Zhenrui Yue, Kartikeya Upasani, Xianjun Yang, et al.
MHLA:トークンレベル多頭による線形アテンションの表現力の回復
Transformer
画像生成
Kewei Zhang, Ye Huang, Yufan Deng, et al.
GlimpRouter:思考の一トークンを覗くことで実現する効率的な協調推論
Reasoning
インテリジェントな質問応答
Wenhao Zeng, Xuteng Zhang, Yuling Shi, et al.
X-Coder:完全に合成されたタスク、ソリューション、テストによる競技プログラミングの進展
コード生成
Reasoning
Jie Wu, Haoling Li, Xin Zhang, et al.
PaCoRe:並列協調推論を用いたテスト時計算資源のスケーラビリティ学習
Reasoning
インテリジェントな質問応答
Jingcheng Hu, Yinmin Zhang, Shijie Shang, et al.
BabyVision:言語を越える視覚的推論
視覚質問応答
画像理解
Liang Chen, Weichu Xie, Yiyan Liang, et al.
視聴、推論、探索:エージェント型動画推論のためのオープンWeb上での動画ディープリサーチベンチマーク
ビデオ理解
エージェント
Chengwen Liu, Xiaomin Yu, Zhuoyue Chang, et al.
スケーラブルなルックアップを用いた条件付きメモリ:大規模言語モデルにおけるスパース性の新たな軸
LLM
検索拡張生成
Xin Cheng, Wangding Zeng, Damai Dai, et al.
EnvScaler:プログラム合成によるLLMエージェント向けツール対話型環境のスケーリング
エージェント
LLM
Xiaoshuai Song, Haofei Chang, Guanting Dong, et al.
証拠のチェーン化:引用を意識したルーブリック報酬を用いた深層検索エージェントに対するロバストな強化学習
強化学習
エージェント
Jiajie Zhang, Xin Lv, Ling Feng, et al.
カリカチャGS:ガウス曲率を用いた3Dガウススプラッティング顔の誇張
3D生成
3Dモデル
Eldad Matmon, Amit Bracha, Noam Rotstein, et al.
思考の分子構造:長距離チェーン・オブ・シンキングのトポロジーをマッピングする
LLM
Reasoning
Qiguang Chen, Yantao Du, Ziniu Li, et al.
MMFormalizer:ワイルドな状況におけるマルチモーダル自動形式化
Reasoning
Any-to-Any
Jing Xiong, Qi Han, Yunta Hsieh, et al.
マップを用いた思考:強化型並列マップ拡張エージェントによる地理局所化
地理情報
LLM
Yuxiang Ji, Yong Wang, Ziyu Ma, et al.
順序付けの障壁を打ち破った指向性単一始点最短経路問題
アルゴリズム
高性能計算
Ran Duan, Jiayi Mao, Xiao Mao, et al.
GR-Dexter 技術報告
ロボティクス
エムボディドインテリジェンス
Ruoshi Wen, Guangzeng Chen, Zhongren Cui, et al.
VideoAuto-R1:一度の思考で済ませ、二度の回答を行うことで実現する動画自動推論
ビデオ理解
Reasoning
Shuming Liu, Mingchen Zhuge, Changsheng Zhao, et al.
RelayLLM:協調デコードによる効率的な推論
Reasoning
テキスト生成
Chengsong Huang, Tong Zheng, Langlin Huang, et al.
トークンレベルにおけるLLM協働のためのFusionRoute
LLM
テキスト生成
Nuoya Xiong, Yuhang Zhou, Hanqing Zeng, et al.
RL-AWB:低照度夜間シーンにおける自動ホワイトバランス補正のためのディープ強化学習
画像処理
マシンビジョン
Yuan-Kang Lee, Kuan-Lin Chen, Chia-Che Chang, et al.
学習可能なマルチプライヤー:言語モデル行列層のスケーリングを解放する
Transformer
機械学習
Maksim Velikanov, Ilyas Chahed, Jingwei Zuo, et al.
GDPO:マルチリワードRL最適化のためのグループ報酬分解型正規化ポリシー最適化
強化学習
Preference Modeling
Shih-Yang Liu, Xin Dong, Ximing Lu, et al.
MemRL:エピソード記憶上のランタイム強化学習を用いた自己進化型エージェント
強化学習
エージェント
Shengtao Zhang, Jiaqian Wang, Ruiwen Zhou, et al.
失敗から習得へ:ツール利用エージェント向けハードサンプルの生成
エージェント
Reasoning
Bingguang Hao, Zengzhuang Xu, Yuntao Wen, et al.
1
2
3
4
5
6
7
47