HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
PHUMA:物理的基盤を有する人型歩行データセット
データセット
ロボティクス
Kyungmin Lee, Sibeen Kim, Minho Park, et al.
UniREditBench:統合的推論ベース画像編集ベンチマーク
ベンチマーク
画像間変換
Feng Han, Yibin Wang, Chenglin Li, et al.
テスト時計算最適スケーリングの一般化:最適化可能なグラフとして
LLM
アルゴリズム
Fali Wang, Jihai Chen, Shuhua Yang, et al.
UniLumos:物理的に妥当なフィードバックを用いた高速かつ統一的な画像・動画の再照明
拡散モデル
深度推定
Ropeway Liu, Hangjie Yuan, Bo Dong, et al.
視覚モデルがグラフ構造理解に持つ見過ごされている力
コンピュータビジョン
Transformer
Xinjian Zhao, Wei Pang, Zhongkai Xue, et al.
すべての活性化を強化:1兆規模のオープン言語基盤への汎用推論モデルのスケーリング
Reasoning
Transformer
Ling-Team, Ang Li, Ben Liu, et al.
NOBLE - 生物学的洞察を埋め込んだ潜在埋め込みを有するニューラルオペレーターによる生物学的ニューロンモデルにおける実験変動の捉え方
ディープラーニング
モデリング
Luca Ghafourpour, Valentin Duruisseaux, Bahareh Tolooshams, et al.
グリア:人間の知性を模倣した自動システム設計・最適化向けAI
DeepSeek
Reasoning
Pouya Hamadanian, Pantea Karimi, Arash Nasr-Esfahany, et al.
コンテキスト工学2.0:コンテキスト工学のコンテキスト
エージェント
人工知能
Qishuo Hua, Lyumanshan Ye, Dayuan Fu, et al.
空間的SSRL:自己教師付き強化学習を活用した空間理解の向上
画像理解
コンピュータビジョン
Yuhong Liu, Beichen Zhang, Yuhang Zang, et al.
連続型自己回帰言語モデル
LLM
テキスト生成
Chenze Shao, Darren Li, Fandong Meng, et al.
$π_ exttt{RL}$:フローに基づく視覚言語行動モデルに対するオンラインRLファインチューニング
強化学習
監視付き微調整
Kang Chen, Zhihao Liu, Tonghe Zhang, et al.
INTとFPの比較:微細な低ビット量子化フォーマットに関する包括的研究
LLM
Transformer
Mengzhao Chen, Meng Wu, Hui Jin, et al.
ThinkMorph:マルチモーダル交差連鎖推論における出現的性質
マルチモーダル
Reasoning
Jiawei Gu, Yunzhuo Hao, Huichen Will Wang, et al.
OS-Sentinel:現実的なワークフローにおけるハイブリッド検証を活用した安全強化型モバイルGUIエージェントの実現
エージェント
Security
Qiushi Sun, Mukai Li, Zhoumianze Liu, et al.
エージェント組織の時代:言語モデルによる組織化の学び
エージェント
LLM
Zewen Chi, Li Dong, Qingxiu Dong, et al.
SPICE:コーパス環境下における自己対戦が推論能力を向上させる
強化学習
LLM
Bo Liu, Chuanyang Jin, Seungone Kim, et al.
Surfer 2:次世代のクロスプラットフォームコンピュータ利用エージェント
エージェント
人間-コンピュータインタラクション
Mathieu Andreux, Märt Bakler, Yanael Barbier, et al.
ロボット制御における拡散モデルの適用条件の探求
拡散モデル
ロボティクス
Heeseong Shin, Byeongho Heo, Dongyoon Han, et al.
エージェントはウェブを制覇できるか? ChatGPT Atlasエージェントのウェブゲームにおけるフロンティアを探る
エージェント
LLM
Jingran Zhang, Ning Li, Justin Cui
Kimi Linear:表現力と効率性を兼ね備えたアテンションアーキテクチャ
Transformer
LLM
Kimi Team, Yu Zhang, Zongyu Lin, et al.
Emu3.5:ネイティブなマルチモーダルモデルは世界の学習者である
Any-to-Any
LLM
Yufeng Cui, Honghao Chen, Haoge Deng, et al.
マニュアルデコードの終焉:本格的エンド・ツー・エンド言語モデルへ
LLM
Transformer
Zhichao Wang, Dongyang Ma, Xinting Huang, et al.
人間とAIの補完性:拡張された監視のための目標
人間-コンピュータインタラクション
自然言語処理
Rishub Jain, Sophie Bridgers, Lili Janzer, et al.
GPTOpt:効率的なLLMベースのブラックボックス最適化へ向けて
LLM
監視付き微調整
Jamison Meindl, Yunsheng Tian, Tony Cui, et al.
VFXMaster:文脈学習を活用した動的ビジュアルエフェクト生成の解明
動画生成
画像から動画生成
Baolu Li, Yiming Zhang, Qinghe Wang, et al.
プロセスマイニングを用いた推論対応型GRPO
強化学習
Reasoning
Taekhyun Park, Yongjae Lee, Hyerim Bae
ループ型言語モデルを用いた潜在的推論のスケーリング
LLM
Reasoning
Rui-Jie Zhu, Zixuan Wang, Kai Hua, et al.
ReForm:予測的有限列最適化を用いた反映型オートフォーマライゼーション
LLM
ベンチマーク
Guoxin Chen, Jing Wu, Xinjie Chen, et al.
Video-Thinker:強化学習を活用した「動画を用いた思考」の促進
ビデオ理解
Reasoning
Shijian Wang, Jiarui Jin, Xingjian Wang, et al.
JanusCoder:コードインテリジェンスのための基盤的視覚・プログラマティックインターフェースへ向けて
コード生成
マルチモーダル
Qiushi Sun, Jingyang Gong, Yang Liu, et al.
MCP-Flow:大規模言語モデルエージェントが現実世界の多様でスケーラブルなMCPツールを習得するのを支援する
LLM
エージェント
Wenhao Wang, Peizhi Niu, Zhao Xu, et al.
1
16
17
18
19
20
21
22
47
PHUMA:物理的基盤を有する人型歩行データセット
データセット
ロボティクス
Kyungmin Lee, Sibeen Kim, Minho Park, et al.
UniREditBench:統合的推論ベース画像編集ベンチマーク
ベンチマーク
画像間変換
Feng Han, Yibin Wang, Chenglin Li, et al.
テスト時計算最適スケーリングの一般化:最適化可能なグラフとして
LLM
アルゴリズム
Fali Wang, Jihai Chen, Shuhua Yang, et al.
UniLumos:物理的に妥当なフィードバックを用いた高速かつ統一的な画像・動画の再照明
拡散モデル
深度推定
Ropeway Liu, Hangjie Yuan, Bo Dong, et al.
視覚モデルがグラフ構造理解に持つ見過ごされている力
コンピュータビジョン
Transformer
Xinjian Zhao, Wei Pang, Zhongkai Xue, et al.
すべての活性化を強化:1兆規模のオープン言語基盤への汎用推論モデルのスケーリング
Reasoning
Transformer
Ling-Team, Ang Li, Ben Liu, et al.
NOBLE - 生物学的洞察を埋め込んだ潜在埋め込みを有するニューラルオペレーターによる生物学的ニューロンモデルにおける実験変動の捉え方
ディープラーニング
モデリング
Luca Ghafourpour, Valentin Duruisseaux, Bahareh Tolooshams, et al.
グリア:人間の知性を模倣した自動システム設計・最適化向けAI
DeepSeek
Reasoning
Pouya Hamadanian, Pantea Karimi, Arash Nasr-Esfahany, et al.
コンテキスト工学2.0:コンテキスト工学のコンテキスト
エージェント
人工知能
Qishuo Hua, Lyumanshan Ye, Dayuan Fu, et al.
空間的SSRL:自己教師付き強化学習を活用した空間理解の向上
画像理解
コンピュータビジョン
Yuhong Liu, Beichen Zhang, Yuhang Zang, et al.
連続型自己回帰言語モデル
LLM
テキスト生成
Chenze Shao, Darren Li, Fandong Meng, et al.
$π_ exttt{RL}$:フローに基づく視覚言語行動モデルに対するオンラインRLファインチューニング
強化学習
監視付き微調整
Kang Chen, Zhihao Liu, Tonghe Zhang, et al.
INTとFPの比較:微細な低ビット量子化フォーマットに関する包括的研究
LLM
Transformer
Mengzhao Chen, Meng Wu, Hui Jin, et al.
ThinkMorph:マルチモーダル交差連鎖推論における出現的性質
マルチモーダル
Reasoning
Jiawei Gu, Yunzhuo Hao, Huichen Will Wang, et al.
OS-Sentinel:現実的なワークフローにおけるハイブリッド検証を活用した安全強化型モバイルGUIエージェントの実現
エージェント
Security
Qiushi Sun, Mukai Li, Zhoumianze Liu, et al.
エージェント組織の時代:言語モデルによる組織化の学び
エージェント
LLM
Zewen Chi, Li Dong, Qingxiu Dong, et al.
SPICE:コーパス環境下における自己対戦が推論能力を向上させる
強化学習
LLM
Bo Liu, Chuanyang Jin, Seungone Kim, et al.
Surfer 2:次世代のクロスプラットフォームコンピュータ利用エージェント
エージェント
人間-コンピュータインタラクション
Mathieu Andreux, Märt Bakler, Yanael Barbier, et al.
ロボット制御における拡散モデルの適用条件の探求
拡散モデル
ロボティクス
Heeseong Shin, Byeongho Heo, Dongyoon Han, et al.
エージェントはウェブを制覇できるか? ChatGPT Atlasエージェントのウェブゲームにおけるフロンティアを探る
エージェント
LLM
Jingran Zhang, Ning Li, Justin Cui
Kimi Linear:表現力と効率性を兼ね備えたアテンションアーキテクチャ
Transformer
LLM
Kimi Team, Yu Zhang, Zongyu Lin, et al.
Emu3.5:ネイティブなマルチモーダルモデルは世界の学習者である
Any-to-Any
LLM
Yufeng Cui, Honghao Chen, Haoge Deng, et al.
マニュアルデコードの終焉:本格的エンド・ツー・エンド言語モデルへ
LLM
Transformer
Zhichao Wang, Dongyang Ma, Xinting Huang, et al.
人間とAIの補完性:拡張された監視のための目標
人間-コンピュータインタラクション
自然言語処理
Rishub Jain, Sophie Bridgers, Lili Janzer, et al.
GPTOpt:効率的なLLMベースのブラックボックス最適化へ向けて
LLM
監視付き微調整
Jamison Meindl, Yunsheng Tian, Tony Cui, et al.
VFXMaster:文脈学習を活用した動的ビジュアルエフェクト生成の解明
動画生成
画像から動画生成
Baolu Li, Yiming Zhang, Qinghe Wang, et al.
プロセスマイニングを用いた推論対応型GRPO
強化学習
Reasoning
Taekhyun Park, Yongjae Lee, Hyerim Bae
ループ型言語モデルを用いた潜在的推論のスケーリング
LLM
Reasoning
Rui-Jie Zhu, Zixuan Wang, Kai Hua, et al.
ReForm:予測的有限列最適化を用いた反映型オートフォーマライゼーション
LLM
ベンチマーク
Guoxin Chen, Jing Wu, Xinjie Chen, et al.
Video-Thinker:強化学習を活用した「動画を用いた思考」の促進
ビデオ理解
Reasoning
Shijian Wang, Jiarui Jin, Xingjian Wang, et al.
JanusCoder:コードインテリジェンスのための基盤的視覚・プログラマティックインターフェースへ向けて
コード生成
マルチモーダル
Qiushi Sun, Jingyang Gong, Yang Liu, et al.
MCP-Flow:大規模言語モデルエージェントが現実世界の多様でスケーラブルなMCPツールを習得するのを支援する
LLM
エージェント
Wenhao Wang, Peizhi Niu, Zhao Xu, et al.
1
16
17
18
19
20
21
22
47