HyperAI
HyperAI超神経
ホーム
プラットフォーム
ドキュメント
ニュース
論文
Notebooks
データセット
百科事典
SOTA
LLMモデル
GPU ランキング
学会
検索
サイトについて
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
サイトを検索…
⌘
K
Command Palette
Search for a command to run...
Console
サインイン
ホーム
論文
論文
日々更新される最先端AI研究論文、人工知能の最新動向を把握
HyperAI
HyperAI超神経
ホーム
プラットフォーム
ドキュメント
ニュース
論文
Notebooks
データセット
百科事典
SOTA
LLMモデル
GPU ランキング
学会
検索
サイトについて
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
サイトを検索…
⌘
K
Command Palette
Search for a command to run...
Console
サインイン
ホーム
論文
論文
日々更新される最先端AI研究論文、人工知能の最新動向を把握
Console
Console
論文 | HyperAI超神経
$π_ exttt{RL}$:フローに基づく視覚言語行動モデルに対するオンラインRLファインチューニング
Kang Chen, Zhihao Liu, Tonghe Zhang, et al.
INTとFPの比較:微細な低ビット量子化フォーマットに関する包括的研究
Mengzhao Chen, Meng Wu, Hui Jin, et al.
ThinkMorph:マルチモーダル交差連鎖推論における出現的性質
Jiawei Gu, Yunzhuo Hao, Huichen Will Wang, et al.
OS-Sentinel:現実的なワークフローにおけるハイブリッド検証を活用した安全強化型モバイルGUIエージェントの実現
Qiushi Sun, Mukai Li, Zhoumianze Liu, et al.
エージェント組織の時代:言語モデルによる組織化の学び
Zewen Chi, Li Dong, Qingxiu Dong, et al.
SPICE:コーパス環境下における自己対戦が推論能力を向上させる
Bo Liu, Chuanyang Jin, Seungone Kim, et al.
Surfer 2:次世代のクロスプラットフォームコンピュータ利用エージェント
Mathieu Andreux, Märt Bakler, Yanael Barbier, et al.
ロボット制御における拡散モデルの適用条件の探求
Heeseong Shin, Byeongho Heo, Dongyoon Han, et al.
エージェントはウェブを制覇できるか? ChatGPT Atlasエージェントのウェブゲームにおけるフロンティアを探る
Jingran Zhang, Ning Li, Justin Cui
Kimi Linear:表現力と効率性を兼ね備えたアテンションアーキテクチャ
Kimi Team, Yu Zhang, Zongyu Lin, et al.
Emu3.5:ネイティブなマルチモーダルモデルは世界の学習者である
Yufeng Cui, Honghao Chen, Haoge Deng, et al.
マニュアルデコードの終焉:本格的エンド・ツー・エンド言語モデルへ
Zhichao Wang, Dongyang Ma, Xinting Huang, et al.
人間とAIの補完性:拡張された監視のための目標
Rishub Jain, Sophie Bridgers, Lili Janzer, et al.
GPTOpt:効率的なLLMベースのブラックボックス最適化へ向けて
Jamison Meindl, Yunsheng Tian, Tony Cui, et al.
VFXMaster:文脈学習を活用した動的ビジュアルエフェクト生成の解明
Baolu Li, Yiming Zhang, Qinghe Wang, et al.
プロセスマイニングを用いた推論対応型GRPO
Taekhyun Park, Yongjae Lee, Hyerim Bae
ループ型言語モデルを用いた潜在的推論のスケーリング
Rui-Jie Zhu, Zixuan Wang, Kai Hua, et al.
ReForm:予測的有限列最適化を用いた反映型オートフォーマライゼーション
Guoxin Chen, Jing Wu, Xinjie Chen, et al.
Video-Thinker:強化学習を活用した「動画を用いた思考」の促進
Shijian Wang, Jiarui Jin, Xingjian Wang, et al.
JanusCoder:コードインテリジェンスのための基盤的視覚・プログラマティックインターフェースへ向けて
Qiushi Sun, Jingyang Gong, Yang Liu, et al.
MCP-Flow:大規模言語モデルエージェントが現実世界の多様でスケーラブルなMCPツールを習得するのを支援する
Wenhao Wang, Peizhi Niu, Zhao Xu, et al.
OmniCast:時間スケールにわたる気象予測のためのマスクされた潜在拡散モデル
Tung Nguyen, Tuan Pham, Troy Arcomano, et al.
動画生成のための均一離散拡散とメトリック経路
Haoge Deng, Ting Pan, Fan Zhang, et al.
Game-TARS:スケーラブルな汎用マルチモーダルゲームエージェントのための事前学習基盤モデル
Zihao Wang, Xujing Li, Yining Ye, et al.
ロボオムニ:オムニモーダルな文脈における能動的ロボット操作
Siyin Wang, Jinlan Fu, Feihong Liu, et al.
AgentFold:能動的コンテキスト管理を備えた長期予測Webエージェント
Rui Ye, Zhongwang Zhang, Kuan Li, et al.
通義ディープリサーチ 技術報告
Tongyi DeepResearch Team, Baixuan Li, Bo Zhang, et al.
InteractComp:曖昧なクエリを用いた検索エージェントの評価
Mingyi Deng, Lijun Huang, Yani Fan, et al.
VLM-SlideEval:PPTにおける構造的理解力および摂動感受性に関するVLMの評価
Hyeonsu Kang, Emily Bao, Anjan Goswami
TeraSim-World:エンドツーエンド自動運転向け世界規模の安全関連データ合成
Jiawei Wang, Haowei Sun, Xintao Yan, et al.
ラックヘッドアンカリング:音声駆動型人間アニメーションにおけるキャラクター個体性の保持
Junyoung Seo, Rodrigo Mira, Alexandros Haliassos, et al.
VITA-E:同時視覚、聴覚、発話および行動を伴う自然なエンボディドインタラクション
Xiaoyu Liu, Chaoyou Fu, Chi Yan, et al.
1
8
9
10
11
12
13
14
39
$π_ exttt{RL}$:フローに基づく視覚言語行動モデルに対するオンラインRLファインチューニング
Kang Chen, Zhihao Liu, Tonghe Zhang, et al.
INTとFPの比較:微細な低ビット量子化フォーマットに関する包括的研究
Mengzhao Chen, Meng Wu, Hui Jin, et al.
ThinkMorph:マルチモーダル交差連鎖推論における出現的性質
Jiawei Gu, Yunzhuo Hao, Huichen Will Wang, et al.
OS-Sentinel:現実的なワークフローにおけるハイブリッド検証を活用した安全強化型モバイルGUIエージェントの実現
Qiushi Sun, Mukai Li, Zhoumianze Liu, et al.
エージェント組織の時代:言語モデルによる組織化の学び
Zewen Chi, Li Dong, Qingxiu Dong, et al.
SPICE:コーパス環境下における自己対戦が推論能力を向上させる
Bo Liu, Chuanyang Jin, Seungone Kim, et al.
Surfer 2:次世代のクロスプラットフォームコンピュータ利用エージェント
Mathieu Andreux, Märt Bakler, Yanael Barbier, et al.
ロボット制御における拡散モデルの適用条件の探求
Heeseong Shin, Byeongho Heo, Dongyoon Han, et al.
エージェントはウェブを制覇できるか? ChatGPT Atlasエージェントのウェブゲームにおけるフロンティアを探る
Jingran Zhang, Ning Li, Justin Cui
Kimi Linear:表現力と効率性を兼ね備えたアテンションアーキテクチャ
Kimi Team, Yu Zhang, Zongyu Lin, et al.
Emu3.5:ネイティブなマルチモーダルモデルは世界の学習者である
Yufeng Cui, Honghao Chen, Haoge Deng, et al.
マニュアルデコードの終焉:本格的エンド・ツー・エンド言語モデルへ
Zhichao Wang, Dongyang Ma, Xinting Huang, et al.
人間とAIの補完性:拡張された監視のための目標
Rishub Jain, Sophie Bridgers, Lili Janzer, et al.
GPTOpt:効率的なLLMベースのブラックボックス最適化へ向けて
Jamison Meindl, Yunsheng Tian, Tony Cui, et al.
VFXMaster:文脈学習を活用した動的ビジュアルエフェクト生成の解明
Baolu Li, Yiming Zhang, Qinghe Wang, et al.
プロセスマイニングを用いた推論対応型GRPO
Taekhyun Park, Yongjae Lee, Hyerim Bae
ループ型言語モデルを用いた潜在的推論のスケーリング
Rui-Jie Zhu, Zixuan Wang, Kai Hua, et al.
ReForm:予測的有限列最適化を用いた反映型オートフォーマライゼーション
Guoxin Chen, Jing Wu, Xinjie Chen, et al.
Video-Thinker:強化学習を活用した「動画を用いた思考」の促進
Shijian Wang, Jiarui Jin, Xingjian Wang, et al.
JanusCoder:コードインテリジェンスのための基盤的視覚・プログラマティックインターフェースへ向けて
Qiushi Sun, Jingyang Gong, Yang Liu, et al.
MCP-Flow:大規模言語モデルエージェントが現実世界の多様でスケーラブルなMCPツールを習得するのを支援する
Wenhao Wang, Peizhi Niu, Zhao Xu, et al.
OmniCast:時間スケールにわたる気象予測のためのマスクされた潜在拡散モデル
Tung Nguyen, Tuan Pham, Troy Arcomano, et al.
動画生成のための均一離散拡散とメトリック経路
Haoge Deng, Ting Pan, Fan Zhang, et al.
Game-TARS:スケーラブルな汎用マルチモーダルゲームエージェントのための事前学習基盤モデル
Zihao Wang, Xujing Li, Yining Ye, et al.
ロボオムニ:オムニモーダルな文脈における能動的ロボット操作
Siyin Wang, Jinlan Fu, Feihong Liu, et al.
AgentFold:能動的コンテキスト管理を備えた長期予測Webエージェント
Rui Ye, Zhongwang Zhang, Kuan Li, et al.
通義ディープリサーチ 技術報告
Tongyi DeepResearch Team, Baixuan Li, Bo Zhang, et al.
InteractComp:曖昧なクエリを用いた検索エージェントの評価
Mingyi Deng, Lijun Huang, Yani Fan, et al.
VLM-SlideEval:PPTにおける構造的理解力および摂動感受性に関するVLMの評価
Hyeonsu Kang, Emily Bao, Anjan Goswami
TeraSim-World:エンドツーエンド自動運転向け世界規模の安全関連データ合成
Jiawei Wang, Haowei Sun, Xintao Yan, et al.
ラックヘッドアンカリング:音声駆動型人間アニメーションにおけるキャラクター個体性の保持
Junyoung Seo, Rodrigo Mira, Alexandros Haliassos, et al.
VITA-E:同時視覚、聴覚、発話および行動を伴う自然なエンボディドインタラクション
Xiaoyu Liu, Chaoyou Fu, Chi Yan, et al.
1
8
9
10
11
12
13
14
39