HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
Kimi Linear:表現力と効率性を兼ね備えたアテンションアーキテクチャ
Transformer
LLM
Kimi Team, Yu Zhang, Zongyu Lin, et al.
Emu3.5:ネイティブなマルチモーダルモデルは世界の学習者である
Any-to-Any
LLM
Yufeng Cui, Honghao Chen, Haoge Deng, et al.
マニュアルデコードの終焉:本格的エンド・ツー・エンド言語モデルへ
LLM
Transformer
Zhichao Wang, Dongyang Ma, Xinting Huang, et al.
人間とAIの補完性:拡張された監視のための目標
人間-コンピュータインタラクション
自然言語処理
Rishub Jain, Sophie Bridgers, Lili Janzer, et al.
GPTOpt:効率的なLLMベースのブラックボックス最適化へ向けて
LLM
監視付き微調整
Jamison Meindl, Yunsheng Tian, Tony Cui, et al.
VFXMaster:文脈学習を活用した動的ビジュアルエフェクト生成の解明
動画生成
画像から動画生成
Baolu Li, Yiming Zhang, Qinghe Wang, et al.
プロセスマイニングを用いた推論対応型GRPO
強化学習
Reasoning
Taekhyun Park, Yongjae Lee, Hyerim Bae
ループ型言語モデルを用いた潜在的推論のスケーリング
LLM
Reasoning
Rui-Jie Zhu, Zixuan Wang, Kai Hua, et al.
ReForm:予測的有限列最適化を用いた反映型オートフォーマライゼーション
LLM
ベンチマーク
Guoxin Chen, Jing Wu, Xinjie Chen, et al.
Video-Thinker:強化学習を活用した「動画を用いた思考」の促進
ビデオ理解
Reasoning
Shijian Wang, Jiarui Jin, Xingjian Wang, et al.
JanusCoder:コードインテリジェンスのための基盤的視覚・プログラマティックインターフェースへ向けて
コード生成
マルチモーダル
Qiushi Sun, Jingyang Gong, Yang Liu, et al.
MCP-Flow:大規模言語モデルエージェントが現実世界の多様でスケーラブルなMCPツールを習得するのを支援する
LLM
エージェント
Wenhao Wang, Peizhi Niu, Zhao Xu, et al.
OmniCast:時間スケールにわたる気象予測のためのマスクされた潜在拡散モデル
Transformer
拡散モデル
Tung Nguyen, Tuan Pham, Troy Arcomano, et al.
動画生成のための均一離散拡散とメトリック経路
画像から動画生成
拡散モデル
Haoge Deng, Ting Pan, Fan Zhang, et al.
Game-TARS:スケーラブルな汎用マルチモーダルゲームエージェントのための事前学習基盤モデル
Any-to-Any
エージェント
Zihao Wang, Xujing Li, Yining Ye, et al.
ロボオムニ:オムニモーダルな文脈における能動的ロボット操作
Any-to-Any
エムボディドインテリジェンス
Siyin Wang, Jinlan Fu, Feihong Liu, et al.
AgentFold:能動的コンテキスト管理を備えた長期予測Webエージェント
エージェント
LLM
Rui Ye, Zhongwang Zhang, Kuan Li, et al.
通義ディープリサーチ 技術報告
LLM
エージェント
Tongyi DeepResearch Team, Baixuan Li, Bo Zhang, et al.
InteractComp:曖昧なクエリを用いた検索エージェントの評価
ベンチマーク
エージェント
Mingyi Deng, Lijun Huang, Yani Fan, et al.
VLM-SlideEval:PPTにおける構造的理解力および摂動感受性に関するVLMの評価
ドキュメント理解
ベンチマーク
Hyeonsu Kang, Emily Bao, Anjan Goswami
TeraSim-World:エンドツーエンド自動運転向け世界規模の安全関連データ合成
自動運転
地理情報
Jiawei Wang, Haowei Sun, Xintao Yan, et al.
ラックヘッドアンカリング:音声駆動型人間アニメーションにおけるキャラクター個体性の保持
動画生成
マルチモーダル
Junyoung Seo, Rodrigo Mira, Alexandros Haliassos, et al.
VITA-E:同時視覚、聴覚、発話および行動を伴う自然なエンボディドインタラクション
エージェント
エムボディドインテリジェンス
Xiaoyu Liu, Chaoyou Fu, Chi Yan, et al.
FARMER:画素上におけるフロー自己回帰型トランスフォーマー
画像生成
Transformer
Guangting Zheng, Qinyu Zhao, Tao Yang, et al.
データエージェントに関する総説:新たなパラダイムか、過大評価されたブームか?
エージェント
LLM
Yizhang Zhu, Liangwei Wang, Chenyu Yang, et al.
ReCode:包括する粒度制御のための計画と実行の統一
言語
コード生成
Zhaoyang Yu, Jiayi Zhang, Huixue Su, et al.
コンチェルト:2次元-3次元連合自己教師学習が空間表現を生み出す
マルチモーダル表現
コンピュータビジョン
Yujia Zhang, Xiaoyang Wu, Yixing Lao, et al.
マゼラン:潜在空間探索および新規性生成のための誘導付きMCTS
LLM
テキスト生成
Lufan Chang
DEEDEE:分布外動態の高速かつスケーラブルな検出
強化学習
モデリング
Tala Aljaafari, Varun Kanade, Philip Torr, et al.
トークン順列を用いたスパーサーなブロックスパース注意力
Transformer
LLM
Xinghao Wang, Pengyu Wang, Dong Zhang, et al.
AGIの定義
ベンチマーク
Reasoning
Dan Hendrycks, Dawn Song, Christian Szegedy, et al.
ノイズ除去から精緻化へ:視覚言語拡散モデルのための補正フレームワーク
拡散モデル
マルチモーダル
Yatai Ji, Teng Wang, Yuying Ge, et al.
1
19
20
21
22
23
24
25
49
Kimi Linear:表現力と効率性を兼ね備えたアテンションアーキテクチャ
Transformer
LLM
Kimi Team, Yu Zhang, Zongyu Lin, et al.
Emu3.5:ネイティブなマルチモーダルモデルは世界の学習者である
Any-to-Any
LLM
Yufeng Cui, Honghao Chen, Haoge Deng, et al.
マニュアルデコードの終焉:本格的エンド・ツー・エンド言語モデルへ
LLM
Transformer
Zhichao Wang, Dongyang Ma, Xinting Huang, et al.
人間とAIの補完性:拡張された監視のための目標
人間-コンピュータインタラクション
自然言語処理
Rishub Jain, Sophie Bridgers, Lili Janzer, et al.
GPTOpt:効率的なLLMベースのブラックボックス最適化へ向けて
LLM
監視付き微調整
Jamison Meindl, Yunsheng Tian, Tony Cui, et al.
VFXMaster:文脈学習を活用した動的ビジュアルエフェクト生成の解明
動画生成
画像から動画生成
Baolu Li, Yiming Zhang, Qinghe Wang, et al.
プロセスマイニングを用いた推論対応型GRPO
強化学習
Reasoning
Taekhyun Park, Yongjae Lee, Hyerim Bae
ループ型言語モデルを用いた潜在的推論のスケーリング
LLM
Reasoning
Rui-Jie Zhu, Zixuan Wang, Kai Hua, et al.
ReForm:予測的有限列最適化を用いた反映型オートフォーマライゼーション
LLM
ベンチマーク
Guoxin Chen, Jing Wu, Xinjie Chen, et al.
Video-Thinker:強化学習を活用した「動画を用いた思考」の促進
ビデオ理解
Reasoning
Shijian Wang, Jiarui Jin, Xingjian Wang, et al.
JanusCoder:コードインテリジェンスのための基盤的視覚・プログラマティックインターフェースへ向けて
コード生成
マルチモーダル
Qiushi Sun, Jingyang Gong, Yang Liu, et al.
MCP-Flow:大規模言語モデルエージェントが現実世界の多様でスケーラブルなMCPツールを習得するのを支援する
LLM
エージェント
Wenhao Wang, Peizhi Niu, Zhao Xu, et al.
OmniCast:時間スケールにわたる気象予測のためのマスクされた潜在拡散モデル
Transformer
拡散モデル
Tung Nguyen, Tuan Pham, Troy Arcomano, et al.
動画生成のための均一離散拡散とメトリック経路
画像から動画生成
拡散モデル
Haoge Deng, Ting Pan, Fan Zhang, et al.
Game-TARS:スケーラブルな汎用マルチモーダルゲームエージェントのための事前学習基盤モデル
Any-to-Any
エージェント
Zihao Wang, Xujing Li, Yining Ye, et al.
ロボオムニ:オムニモーダルな文脈における能動的ロボット操作
Any-to-Any
エムボディドインテリジェンス
Siyin Wang, Jinlan Fu, Feihong Liu, et al.
AgentFold:能動的コンテキスト管理を備えた長期予測Webエージェント
エージェント
LLM
Rui Ye, Zhongwang Zhang, Kuan Li, et al.
通義ディープリサーチ 技術報告
LLM
エージェント
Tongyi DeepResearch Team, Baixuan Li, Bo Zhang, et al.
InteractComp:曖昧なクエリを用いた検索エージェントの評価
ベンチマーク
エージェント
Mingyi Deng, Lijun Huang, Yani Fan, et al.
VLM-SlideEval:PPTにおける構造的理解力および摂動感受性に関するVLMの評価
ドキュメント理解
ベンチマーク
Hyeonsu Kang, Emily Bao, Anjan Goswami
TeraSim-World:エンドツーエンド自動運転向け世界規模の安全関連データ合成
自動運転
地理情報
Jiawei Wang, Haowei Sun, Xintao Yan, et al.
ラックヘッドアンカリング:音声駆動型人間アニメーションにおけるキャラクター個体性の保持
動画生成
マルチモーダル
Junyoung Seo, Rodrigo Mira, Alexandros Haliassos, et al.
VITA-E:同時視覚、聴覚、発話および行動を伴う自然なエンボディドインタラクション
エージェント
エムボディドインテリジェンス
Xiaoyu Liu, Chaoyou Fu, Chi Yan, et al.
FARMER:画素上におけるフロー自己回帰型トランスフォーマー
画像生成
Transformer
Guangting Zheng, Qinyu Zhao, Tao Yang, et al.
データエージェントに関する総説:新たなパラダイムか、過大評価されたブームか?
エージェント
LLM
Yizhang Zhu, Liangwei Wang, Chenyu Yang, et al.
ReCode:包括する粒度制御のための計画と実行の統一
言語
コード生成
Zhaoyang Yu, Jiayi Zhang, Huixue Su, et al.
コンチェルト:2次元-3次元連合自己教師学習が空間表現を生み出す
マルチモーダル表現
コンピュータビジョン
Yujia Zhang, Xiaoyang Wu, Yixing Lao, et al.
マゼラン:潜在空間探索および新規性生成のための誘導付きMCTS
LLM
テキスト生成
Lufan Chang
DEEDEE:分布外動態の高速かつスケーラブルな検出
強化学習
モデリング
Tala Aljaafari, Varun Kanade, Philip Torr, et al.
トークン順列を用いたスパーサーなブロックスパース注意力
Transformer
LLM
Xinghao Wang, Pengyu Wang, Dong Zhang, et al.
AGIの定義
ベンチマーク
Reasoning
Dan Hendrycks, Dawn Song, Christian Szegedy, et al.
ノイズ除去から精緻化へ:視覚言語拡散モデルのための補正フレームワーク
拡散モデル
マルチモーダル
Yatai Ji, Teng Wang, Yuying Ge, et al.
1
19
20
21
22
23
24
25
49