HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
OmniCast:時間スケールにわたる気象予測のためのマスクされた潜在拡散モデル
Transformer
拡散モデル
Tung Nguyen, Tuan Pham, Troy Arcomano, et al.
動画生成のための均一離散拡散とメトリック経路
画像から動画生成
拡散モデル
Haoge Deng, Ting Pan, Fan Zhang, et al.
Game-TARS:スケーラブルな汎用マルチモーダルゲームエージェントのための事前学習基盤モデル
Any-to-Any
エージェント
Zihao Wang, Xujing Li, Yining Ye, et al.
ロボオムニ:オムニモーダルな文脈における能動的ロボット操作
Any-to-Any
エムボディドインテリジェンス
Siyin Wang, Jinlan Fu, Feihong Liu, et al.
AgentFold:能動的コンテキスト管理を備えた長期予測Webエージェント
エージェント
LLM
Rui Ye, Zhongwang Zhang, Kuan Li, et al.
通義ディープリサーチ 技術報告
LLM
エージェント
Tongyi DeepResearch Team, Baixuan Li, Bo Zhang, et al.
InteractComp:曖昧なクエリを用いた検索エージェントの評価
ベンチマーク
エージェント
Mingyi Deng, Lijun Huang, Yani Fan, et al.
VLM-SlideEval:PPTにおける構造的理解力および摂動感受性に関するVLMの評価
ドキュメント理解
ベンチマーク
Hyeonsu Kang, Emily Bao, Anjan Goswami
TeraSim-World:エンドツーエンド自動運転向け世界規模の安全関連データ合成
自動運転
地理情報
Jiawei Wang, Haowei Sun, Xintao Yan, et al.
ラックヘッドアンカリング:音声駆動型人間アニメーションにおけるキャラクター個体性の保持
動画生成
マルチモーダル
Junyoung Seo, Rodrigo Mira, Alexandros Haliassos, et al.
VITA-E:同時視覚、聴覚、発話および行動を伴う自然なエンボディドインタラクション
エージェント
エムボディドインテリジェンス
Xiaoyu Liu, Chaoyou Fu, Chi Yan, et al.
FARMER:画素上におけるフロー自己回帰型トランスフォーマー
画像生成
Transformer
Guangting Zheng, Qinyu Zhao, Tao Yang, et al.
データエージェントに関する総説:新たなパラダイムか、過大評価されたブームか?
エージェント
LLM
Yizhang Zhu, Liangwei Wang, Chenyu Yang, et al.
ReCode:包括する粒度制御のための計画と実行の統一
言語
コード生成
Zhaoyang Yu, Jiayi Zhang, Huixue Su, et al.
コンチェルト:2次元-3次元連合自己教師学習が空間表現を生み出す
マルチモーダル表現
コンピュータビジョン
Yujia Zhang, Xiaoyang Wu, Yixing Lao, et al.
マゼラン:潜在空間探索および新規性生成のための誘導付きMCTS
LLM
テキスト生成
Lufan Chang
DEEDEE:分布外動態の高速かつスケーラブルな検出
強化学習
モデリング
Tala Aljaafari, Varun Kanade, Philip Torr, et al.
トークン順列を用いたスパーサーなブロックスパース注意力
Transformer
LLM
Xinghao Wang, Pengyu Wang, Dong Zhang, et al.
AGIの定義
ベンチマーク
Reasoning
Dan Hendrycks, Dawn Song, Christian Szegedy, et al.
ノイズ除去から精緻化へ:視覚言語拡散モデルのための補正フレームワーク
拡散モデル
マルチモーダル
Yatai Ji, Teng Wang, Yuying Ge, et al.
ステップバイステップ、チャンクごとに最適化:テキストから画像生成におけるチャンクレベルGRPO
テキストから画像生成
画像生成
Yifu Luo, Penghui Du, Bo Li, et al.
ビデオ・アス・プロンプト:ビデオ生成における統一された意味制御
動画生成
画像から動画生成
Yuxuan Bian, Xin Chen, Zenan Li, et al.
DeepAgent:スケーラブルなツールセットを備えた汎用推論エージェント
エージェント
Reasoning
Xiaoxi Li, Wenxiang Jiao, Jiarui Jin, et al.
不確実性を考慮した多目的強化学習誘導型拡散モデルによる3Dデ・ノボ分子設計
拡散モデル
強化学習
Lianghong Chen, Dongkyu Eugene Kim, Mike Domaratzki, et al.
Reac-Discovery:連続Flow型触媒反応装置の発見および最適化をAIが駆動するプラットフォーム
サイエンスのためのAI
モデリング
Cristopher Tinajero, Marcileia Zanatta, Julián E. Sánchez-Velandia, et al.
BoltzGen:ユニバーサルな結合体設計への道
サイエンスのためのAI
ディープラーニング
Hannes Stark, Felix Faltings, MinGyu Choi, et al.
HSCodeComp:階層的ルール適用におけるディープサーチエージェント向けの現実的で専門的水準のベンチマーク
ベンチマーク
データセット
Yiqian Yang, Tian Lan, Qianghuai Jia, et al.
DyPE:超高解像度拡散における動的位置外挿
拡散モデル
Transformer
Noam Issachar, Guy Yariv, Sagie Benaim, et al.
HoloCine:映画的マルチショット長時間動画物語の包括的生成
テキストから動画
動画生成
Yihao Meng, Hao Ouyang, Yue Yu, et al.
Open-o3 Video:明示的な時空間証拠を用いた根拠のある動画推論
ビデオ理解
Reasoning
Jiahao Meng, Xiangtai Li, Haochen Wang, et al.
AdaSPEC:効率的な推測デコーダーのための選択的知識蒸留
LLM
Transformer
Yuezhou Hu, Jiaxin Guo, Xinyu Feng, et al.
0.1ドル未満での人間-エージェント協働型ペーパートゥーページ作成
エージェント
Any-to-Any
Qianli Ma, Siyu Wang, Yilin Chen, et al.
1
17
18
19
20
21
22
23
47
OmniCast:時間スケールにわたる気象予測のためのマスクされた潜在拡散モデル
Transformer
拡散モデル
Tung Nguyen, Tuan Pham, Troy Arcomano, et al.
動画生成のための均一離散拡散とメトリック経路
画像から動画生成
拡散モデル
Haoge Deng, Ting Pan, Fan Zhang, et al.
Game-TARS:スケーラブルな汎用マルチモーダルゲームエージェントのための事前学習基盤モデル
Any-to-Any
エージェント
Zihao Wang, Xujing Li, Yining Ye, et al.
ロボオムニ:オムニモーダルな文脈における能動的ロボット操作
Any-to-Any
エムボディドインテリジェンス
Siyin Wang, Jinlan Fu, Feihong Liu, et al.
AgentFold:能動的コンテキスト管理を備えた長期予測Webエージェント
エージェント
LLM
Rui Ye, Zhongwang Zhang, Kuan Li, et al.
通義ディープリサーチ 技術報告
LLM
エージェント
Tongyi DeepResearch Team, Baixuan Li, Bo Zhang, et al.
InteractComp:曖昧なクエリを用いた検索エージェントの評価
ベンチマーク
エージェント
Mingyi Deng, Lijun Huang, Yani Fan, et al.
VLM-SlideEval:PPTにおける構造的理解力および摂動感受性に関するVLMの評価
ドキュメント理解
ベンチマーク
Hyeonsu Kang, Emily Bao, Anjan Goswami
TeraSim-World:エンドツーエンド自動運転向け世界規模の安全関連データ合成
自動運転
地理情報
Jiawei Wang, Haowei Sun, Xintao Yan, et al.
ラックヘッドアンカリング:音声駆動型人間アニメーションにおけるキャラクター個体性の保持
動画生成
マルチモーダル
Junyoung Seo, Rodrigo Mira, Alexandros Haliassos, et al.
VITA-E:同時視覚、聴覚、発話および行動を伴う自然なエンボディドインタラクション
エージェント
エムボディドインテリジェンス
Xiaoyu Liu, Chaoyou Fu, Chi Yan, et al.
FARMER:画素上におけるフロー自己回帰型トランスフォーマー
画像生成
Transformer
Guangting Zheng, Qinyu Zhao, Tao Yang, et al.
データエージェントに関する総説:新たなパラダイムか、過大評価されたブームか?
エージェント
LLM
Yizhang Zhu, Liangwei Wang, Chenyu Yang, et al.
ReCode:包括する粒度制御のための計画と実行の統一
言語
コード生成
Zhaoyang Yu, Jiayi Zhang, Huixue Su, et al.
コンチェルト:2次元-3次元連合自己教師学習が空間表現を生み出す
マルチモーダル表現
コンピュータビジョン
Yujia Zhang, Xiaoyang Wu, Yixing Lao, et al.
マゼラン:潜在空間探索および新規性生成のための誘導付きMCTS
LLM
テキスト生成
Lufan Chang
DEEDEE:分布外動態の高速かつスケーラブルな検出
強化学習
モデリング
Tala Aljaafari, Varun Kanade, Philip Torr, et al.
トークン順列を用いたスパーサーなブロックスパース注意力
Transformer
LLM
Xinghao Wang, Pengyu Wang, Dong Zhang, et al.
AGIの定義
ベンチマーク
Reasoning
Dan Hendrycks, Dawn Song, Christian Szegedy, et al.
ノイズ除去から精緻化へ:視覚言語拡散モデルのための補正フレームワーク
拡散モデル
マルチモーダル
Yatai Ji, Teng Wang, Yuying Ge, et al.
ステップバイステップ、チャンクごとに最適化:テキストから画像生成におけるチャンクレベルGRPO
テキストから画像生成
画像生成
Yifu Luo, Penghui Du, Bo Li, et al.
ビデオ・アス・プロンプト:ビデオ生成における統一された意味制御
動画生成
画像から動画生成
Yuxuan Bian, Xin Chen, Zenan Li, et al.
DeepAgent:スケーラブルなツールセットを備えた汎用推論エージェント
エージェント
Reasoning
Xiaoxi Li, Wenxiang Jiao, Jiarui Jin, et al.
不確実性を考慮した多目的強化学習誘導型拡散モデルによる3Dデ・ノボ分子設計
拡散モデル
強化学習
Lianghong Chen, Dongkyu Eugene Kim, Mike Domaratzki, et al.
Reac-Discovery:連続Flow型触媒反応装置の発見および最適化をAIが駆動するプラットフォーム
サイエンスのためのAI
モデリング
Cristopher Tinajero, Marcileia Zanatta, Julián E. Sánchez-Velandia, et al.
BoltzGen:ユニバーサルな結合体設計への道
サイエンスのためのAI
ディープラーニング
Hannes Stark, Felix Faltings, MinGyu Choi, et al.
HSCodeComp:階層的ルール適用におけるディープサーチエージェント向けの現実的で専門的水準のベンチマーク
ベンチマーク
データセット
Yiqian Yang, Tian Lan, Qianghuai Jia, et al.
DyPE:超高解像度拡散における動的位置外挿
拡散モデル
Transformer
Noam Issachar, Guy Yariv, Sagie Benaim, et al.
HoloCine:映画的マルチショット長時間動画物語の包括的生成
テキストから動画
動画生成
Yihao Meng, Hao Ouyang, Yue Yu, et al.
Open-o3 Video:明示的な時空間証拠を用いた根拠のある動画推論
ビデオ理解
Reasoning
Jiahao Meng, Xiangtai Li, Haochen Wang, et al.
AdaSPEC:効率的な推測デコーダーのための選択的知識蒸留
LLM
Transformer
Yuezhou Hu, Jiaxin Guo, Xinyu Feng, et al.
0.1ドル未満での人間-エージェント協働型ペーパートゥーページ作成
エージェント
Any-to-Any
Qianli Ma, Siyu Wang, Yilin Chen, et al.
1
17
18
19
20
21
22
23
47