HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
トークン順列を用いたスパーサーなブロックスパース注意力
Transformer
LLM
Xinghao Wang, Pengyu Wang, Dong Zhang, et al.
AGIの定義
ベンチマーク
Reasoning
Dan Hendrycks, Dawn Song, Christian Szegedy, et al.
ノイズ除去から精緻化へ:視覚言語拡散モデルのための補正フレームワーク
拡散モデル
マルチモーダル
Yatai Ji, Teng Wang, Yuying Ge, et al.
ステップバイステップ、チャンクごとに最適化:テキストから画像生成におけるチャンクレベルGRPO
テキストから画像生成
画像生成
Yifu Luo, Penghui Du, Bo Li, et al.
ビデオ・アス・プロンプト:ビデオ生成における統一された意味制御
動画生成
画像から動画生成
Yuxuan Bian, Xin Chen, Zenan Li, et al.
DeepAgent:スケーラブルなツールセットを備えた汎用推論エージェント
エージェント
Reasoning
Xiaoxi Li, Wenxiang Jiao, Jiarui Jin, et al.
不確実性を考慮した多目的強化学習誘導型拡散モデルによる3Dデ・ノボ分子設計
拡散モデル
強化学習
Lianghong Chen, Dongkyu Eugene Kim, Mike Domaratzki, et al.
Reac-Discovery:連続Flow型触媒反応装置の発見および最適化をAIが駆動するプラットフォーム
サイエンスのためのAI
モデリング
Cristopher Tinajero, Marcileia Zanatta, Julián E. Sánchez-Velandia, et al.
BoltzGen:ユニバーサルな結合体設計への道
サイエンスのためのAI
ディープラーニング
Hannes Stark, Felix Faltings, MinGyu Choi, et al.
HSCodeComp:階層的ルール適用におけるディープサーチエージェント向けの現実的で専門的水準のベンチマーク
ベンチマーク
データセット
Yiqian Yang, Tian Lan, Qianghuai Jia, et al.
DyPE:超高解像度拡散における動的位置外挿
拡散モデル
Transformer
Noam Issachar, Guy Yariv, Sagie Benaim, et al.
HoloCine:映画的マルチショット長時間動画物語の包括的生成
テキストから動画
動画生成
Yihao Meng, Hao Ouyang, Yue Yu, et al.
Open-o3 Video:明示的な時空間証拠を用いた根拠のある動画推論
ビデオ理解
Reasoning
Jiahao Meng, Xiangtai Li, Haochen Wang, et al.
AdaSPEC:効率的な推測デコーダーのための選択的知識蒸留
LLM
Transformer
Yuezhou Hu, Jiaxin Guo, Xinyu Feng, et al.
0.1ドル未満での人間-エージェント協働型ペーパートゥーページ作成
エージェント
Any-to-Any
Qianli Ma, Siyu Wang, Yilin Chen, et al.
テキストを参照:トークン化から視覚的読解へ
マルチモーダル
OCR
Ling Xing, Alex Jinpeng Wang, Rui Yan, et al.
方向性推論注入によるMLLMのファインチューニング
視覚質問応答
Any-to-Any
Chao Huang, Zeliang Zhang, Jiang Liu, et al.
言語モデルは単射であり、したがって可逆である
Transformer
自然言語処理
Giorgos Nikolaou, Tommaso Mencattini, Donato Crisostomi, et al.
フリートランスフォーマー
Transformer
Any-to-Any
François Fleuret
機械学習を用いた量子処理ユニット(QPU)処理時間の予測
機械学習
モデル学習
Lucy Xing, Sanjay Vishwakarma, David Kremer, et al.
量子エルゴード性の端における建設的干渉の観測
サイエンスのためのAI
モデリング
Google Quantum AI and Collaborators
VideoAgentTrek:ラベルなし動画からのコンピュータ利用事前学習
行動認識
人間-コンピュータインタラクション
Dunjie Lu, Yiheng Xu, Junli Wang, et al.
GigaBrain-0:世界モデル駆動型の視覚言語行動モデル
エムボディドインテリジェンス
ロボティクス
GigaBrain Team, Angen Ye, Boyuan Wang, et al.
LoongRL:長文脈における高度な推論のための強化学習
LLM
Reasoning
Siyuan Wang, Gaokai Zhang, Li Lyna Zhang, et al.
BAPO:適応的クリッピングを用いたバランスの取れた方策最適化によるLLM向けオフポリシー強化学習の安定化
強化学習
LLM
Zhiheng Xi, Xin Guo, Yang Nan, et al.
すべての注目は重要である:長文脈推論のための効率的なハイブリッドアーキテクチャ
Transformer
モデル学習
Ling Team, Bin Han, Caizhi Tang, et al.
色を正しく表現する:知覚色空間とテキスト埋め込みを橋渡しすることで、拡散生成を改善する
画像修復
拡散モデル
Sung-Lin Tsai, Bo-Lun Huang, Yu Ting Shen, et al.
エゴセントリックなマルチビュー場面における視覚言語モデルを用いた空間推論
視覚質問応答
マルチモーダル
Mohsen Gholami, Ahmad Rezaei, Zhou Weimin, et al.
LoFT:開広世界シナリオにおける長尾半教師付き学習のためのパラメータ効率の良い微調整
監視付き微調整
画像認識
Jiahao Chen, Zhiyuan Huang, Yurou Liu, et al.
FLOWER:効率的な視覚-言語-行動フロー方策による汎用ロボット方策の民主化
LLM
Any-to-Any
Moritz Reuss, Hongyi Zhou, Marcel Rühle, et al.
拡散大規模言語モデルに対するインペイント誘導型ポリシー最適化
強化学習
拡散モデル
Siyan Zhao, Mengchen Liu, Jing Huang, et al.
MCP-AgentBench:MCPを介したツールを用いた現実世界の言語エージェント性能の評価
ベンチマーク
エージェント
Zikang Guo, Benfeng Xu, Chiwei Zhu, et al.
1
19
20
21
22
23
24
25
48
トークン順列を用いたスパーサーなブロックスパース注意力
Transformer
LLM
Xinghao Wang, Pengyu Wang, Dong Zhang, et al.
AGIの定義
ベンチマーク
Reasoning
Dan Hendrycks, Dawn Song, Christian Szegedy, et al.
ノイズ除去から精緻化へ:視覚言語拡散モデルのための補正フレームワーク
拡散モデル
マルチモーダル
Yatai Ji, Teng Wang, Yuying Ge, et al.
ステップバイステップ、チャンクごとに最適化:テキストから画像生成におけるチャンクレベルGRPO
テキストから画像生成
画像生成
Yifu Luo, Penghui Du, Bo Li, et al.
ビデオ・アス・プロンプト:ビデオ生成における統一された意味制御
動画生成
画像から動画生成
Yuxuan Bian, Xin Chen, Zenan Li, et al.
DeepAgent:スケーラブルなツールセットを備えた汎用推論エージェント
エージェント
Reasoning
Xiaoxi Li, Wenxiang Jiao, Jiarui Jin, et al.
不確実性を考慮した多目的強化学習誘導型拡散モデルによる3Dデ・ノボ分子設計
拡散モデル
強化学習
Lianghong Chen, Dongkyu Eugene Kim, Mike Domaratzki, et al.
Reac-Discovery:連続Flow型触媒反応装置の発見および最適化をAIが駆動するプラットフォーム
サイエンスのためのAI
モデリング
Cristopher Tinajero, Marcileia Zanatta, Julián E. Sánchez-Velandia, et al.
BoltzGen:ユニバーサルな結合体設計への道
サイエンスのためのAI
ディープラーニング
Hannes Stark, Felix Faltings, MinGyu Choi, et al.
HSCodeComp:階層的ルール適用におけるディープサーチエージェント向けの現実的で専門的水準のベンチマーク
ベンチマーク
データセット
Yiqian Yang, Tian Lan, Qianghuai Jia, et al.
DyPE:超高解像度拡散における動的位置外挿
拡散モデル
Transformer
Noam Issachar, Guy Yariv, Sagie Benaim, et al.
HoloCine:映画的マルチショット長時間動画物語の包括的生成
テキストから動画
動画生成
Yihao Meng, Hao Ouyang, Yue Yu, et al.
Open-o3 Video:明示的な時空間証拠を用いた根拠のある動画推論
ビデオ理解
Reasoning
Jiahao Meng, Xiangtai Li, Haochen Wang, et al.
AdaSPEC:効率的な推測デコーダーのための選択的知識蒸留
LLM
Transformer
Yuezhou Hu, Jiaxin Guo, Xinyu Feng, et al.
0.1ドル未満での人間-エージェント協働型ペーパートゥーページ作成
エージェント
Any-to-Any
Qianli Ma, Siyu Wang, Yilin Chen, et al.
テキストを参照:トークン化から視覚的読解へ
マルチモーダル
OCR
Ling Xing, Alex Jinpeng Wang, Rui Yan, et al.
方向性推論注入によるMLLMのファインチューニング
視覚質問応答
Any-to-Any
Chao Huang, Zeliang Zhang, Jiang Liu, et al.
言語モデルは単射であり、したがって可逆である
Transformer
自然言語処理
Giorgos Nikolaou, Tommaso Mencattini, Donato Crisostomi, et al.
フリートランスフォーマー
Transformer
Any-to-Any
François Fleuret
機械学習を用いた量子処理ユニット(QPU)処理時間の予測
機械学習
モデル学習
Lucy Xing, Sanjay Vishwakarma, David Kremer, et al.
量子エルゴード性の端における建設的干渉の観測
サイエンスのためのAI
モデリング
Google Quantum AI and Collaborators
VideoAgentTrek:ラベルなし動画からのコンピュータ利用事前学習
行動認識
人間-コンピュータインタラクション
Dunjie Lu, Yiheng Xu, Junli Wang, et al.
GigaBrain-0:世界モデル駆動型の視覚言語行動モデル
エムボディドインテリジェンス
ロボティクス
GigaBrain Team, Angen Ye, Boyuan Wang, et al.
LoongRL:長文脈における高度な推論のための強化学習
LLM
Reasoning
Siyuan Wang, Gaokai Zhang, Li Lyna Zhang, et al.
BAPO:適応的クリッピングを用いたバランスの取れた方策最適化によるLLM向けオフポリシー強化学習の安定化
強化学習
LLM
Zhiheng Xi, Xin Guo, Yang Nan, et al.
すべての注目は重要である:長文脈推論のための効率的なハイブリッドアーキテクチャ
Transformer
モデル学習
Ling Team, Bin Han, Caizhi Tang, et al.
色を正しく表現する:知覚色空間とテキスト埋め込みを橋渡しすることで、拡散生成を改善する
画像修復
拡散モデル
Sung-Lin Tsai, Bo-Lun Huang, Yu Ting Shen, et al.
エゴセントリックなマルチビュー場面における視覚言語モデルを用いた空間推論
視覚質問応答
マルチモーダル
Mohsen Gholami, Ahmad Rezaei, Zhou Weimin, et al.
LoFT:開広世界シナリオにおける長尾半教師付き学習のためのパラメータ効率の良い微調整
監視付き微調整
画像認識
Jiahao Chen, Zhiyuan Huang, Yurou Liu, et al.
FLOWER:効率的な視覚-言語-行動フロー方策による汎用ロボット方策の民主化
LLM
Any-to-Any
Moritz Reuss, Hongyi Zhou, Marcel Rühle, et al.
拡散大規模言語モデルに対するインペイント誘導型ポリシー最適化
強化学習
拡散モデル
Siyan Zhao, Mengchen Liu, Jing Huang, et al.
MCP-AgentBench:MCPを介したツールを用いた現実世界の言語エージェント性能の評価
ベンチマーク
エージェント
Zikang Guo, Benfeng Xu, Chiwei Zhu, et al.
1
19
20
21
22
23
24
25
48