HyperAI
HyperAI超神経
ホーム
プラットフォーム
ドキュメント
ニュース
論文
Notebooks
データセット
百科事典
SOTA
LLMモデル
GPU ランキング
学会
検索
サイトについて
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
サイトを検索…
⌘
K
Command Palette
Search for a command to run...
Console
サインイン
ホーム
論文
論文
日々更新される最先端AI研究論文、人工知能の最新動向を把握
HyperAI
HyperAI超神経
ホーム
プラットフォーム
ドキュメント
ニュース
論文
Notebooks
データセット
百科事典
SOTA
LLMモデル
GPU ランキング
学会
検索
サイトについて
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
サイトを検索…
⌘
K
Command Palette
Search for a command to run...
Console
サインイン
ホーム
論文
論文
日々更新される最先端AI研究論文、人工知能の最新動向を把握
Console
Console
論文 | HyperAI超神経
OmniSVG:統合型スケーラブルベクターグラフィックス生成モデル
Yiying Yang, Wei Cheng, Sijin Chen, et al.
アルゴリズム的思考理論
MohammadHossein Bateni, Vincent Cohen-Addad, Yuzhou Gu, et al.
ロボットワールドモデル:ロボティクスにおけるロバストな方策最適化のためのニューラルネットワークシミュレータ
Chenhao Li, Andreas Krause, Marco Hutter
リワードフォースティング:リワードド分布マッチング蒸留を用いた効率的なストリーミング動画生成
Yunhong Lu, Yanhong Zeng, Haobo Li, et al.
意味が道を示す:非同期潜在拡散を用いた意味表現とテクスチャ表現の調和
Yueming Pan, Ruoyu Feng, Qi Dai, et al.
ARM-Thinker:エージェントによるツール利用と視覚的推論を活用したマルチモーダル生成型報酬モデルの強化
Shengyuan Ding, Xinyu Fang, Ziyu Liu, et al.
Nex-N1:大規模な環境構築を実現する統合エコシステムを用いたエージェントモデルの訓練
Nex-AGI Team, Yuxuan Cai, Lu Chen, et al.
DAComp:データインテリジェンスライフサイクル全体にわたるデータエージェントのベンチマーク
Fangyu Lei, Jinxiang Meng, Yiming Huang, et al.
ライブアバター:無限長のリアルタイム音声駆動型アバター生成
Yubo Huang, Hailong Guo, Fangtai Wu, et al.
F5-TTS:フローマッチングを用いた流暢かつ忠実な発話を偽造する童話作家
Yushen Chen, Zhikang Niu, Ziyang Ma, et al.
VOccl3D:現実の遮蔽下における3次元人体ポーズおよび形状推定のための動画ベンチマークデータセット
Yash Garg, Saketh Bachu, Arindam Dutta, et al.
アルパマヨ-R1:長尾領域における汎用的な自動運転のための推論と行動予測の統合
NVIDIA, Yulong Cao, Tong Che, et al.
すべてはつながっている:テスト時記憶化、注意バイアス、保持、オンライン最適化をめぐる旅
Ali Behrouz, Meisam Razaviyayn, Peilin Zhong, et al.
推論時スケーリングにおけるテキストから視覚生成へのプロンプト設計の再考
Subin Kim, Sangwoo Mo, Mamshad Nayeem Rizve, et al.
推論時スケーリングアプローチとしての視覚言語行動モデルのステアリング:探索の逆効果
Siyuan Yang, Yang Zhang, Haoran He, et al.
OneThinker:画像および動画向けの一体型推論モデル
Kaituo Feng, Manyuan Zhang, Hongyu Li, et al.
ViDiC:ビデオ差分キャプション
Jiangtao Wu, Shihao Li, Zhaozhou Bian, et al.
PretrainZero:強化学習を用いたアクティブ事前学習
Xingrun Xing, Zhiyuan Fan, Jie Lou, et al.
すべてのトークンが重要である:大規模言語モデルにおける1600万トークン超の長文脈の一般化
Xiang Hu, Zhanchao Zhou, Ruiqi Liang, et al.
SimScale:スケールにおける現実世界シミュレーションを用いたドライブ学習
Haochen Tian, Tianyu Li, Haochen Liu, et al.
Skywork-R1V4:画像とDeepResearchを用いたインタリーブド・シンキングによるエージェント型マルチモーダル知能への挑戦
Yifan Zhang, Liang Hu, Haofeng Sun, et al.
最小限の人的監視によるガイド付き自己進化型LLM
Wenhao Yu, Zhenwen Liang, Chengsong Huang, et al.
MultiShotMaster:制御可能なマルチショット動画生成フレームワーク
Qinghe Wang, Xiaoyu Shi, Baolu Li, et al.
MG-Nav:スパース空間記憶を用いたデュアルスケール視覚ナビゲーション
Bo Wang, Jiehong Lin, Chenzhi Liu, et al.
コンシステンシー・クリティック:リファレンス誘導型アテンティブアライメントを用いた生成画像内の不整合の修正
Ziheng Ouyang, Yiren Song, Yaoli Liu, et al.
深層学習を用いた実用的な研究エージェントは、果たしてどの程度現実のものに近づいているのか?
Dingling Zhang, He Zhu, Jincheng Ren, et al.
LLMを用いた強化学習の安定化:定式化と実践
Chujie Zheng, Kai Dang, Bowen Yu, et al.
Envision:因果的世界プロセスインサイトにおける統一的理解・生成のベンチマーク
Juanxi Tian, Siyuan Li, Conghui He, et al.
LongVT:ネイティブ・ツールコールによる「長時間動画を用いた思考」のインセンティブ化
Zuhao Yang, Sudong Wang, Kaichen Zhang, et al.
コード基盤モデルからエージェントおよびアプリケーションへ:コードインテリジェンス実践ガイド
Jian Yang, Wei Zhang, Shark Liu, et al.
物理駆動型時空間モデルによるAI生成動画検出
Shuhai Zhang, ZiHao Lian, Jiahao Yang, et al.
Mem-α:強化学習を用いたメモリ構築の学習
Yu Wang, Ryuichi Takanobu, Zhiqi Liang, et al.
1
2
3
4
5
6
39
OmniSVG:統合型スケーラブルベクターグラフィックス生成モデル
Yiying Yang, Wei Cheng, Sijin Chen, et al.
アルゴリズム的思考理論
MohammadHossein Bateni, Vincent Cohen-Addad, Yuzhou Gu, et al.
ロボットワールドモデル:ロボティクスにおけるロバストな方策最適化のためのニューラルネットワークシミュレータ
Chenhao Li, Andreas Krause, Marco Hutter
リワードフォースティング:リワードド分布マッチング蒸留を用いた効率的なストリーミング動画生成
Yunhong Lu, Yanhong Zeng, Haobo Li, et al.
意味が道を示す:非同期潜在拡散を用いた意味表現とテクスチャ表現の調和
Yueming Pan, Ruoyu Feng, Qi Dai, et al.
ARM-Thinker:エージェントによるツール利用と視覚的推論を活用したマルチモーダル生成型報酬モデルの強化
Shengyuan Ding, Xinyu Fang, Ziyu Liu, et al.
Nex-N1:大規模な環境構築を実現する統合エコシステムを用いたエージェントモデルの訓練
Nex-AGI Team, Yuxuan Cai, Lu Chen, et al.
DAComp:データインテリジェンスライフサイクル全体にわたるデータエージェントのベンチマーク
Fangyu Lei, Jinxiang Meng, Yiming Huang, et al.
ライブアバター:無限長のリアルタイム音声駆動型アバター生成
Yubo Huang, Hailong Guo, Fangtai Wu, et al.
F5-TTS:フローマッチングを用いた流暢かつ忠実な発話を偽造する童話作家
Yushen Chen, Zhikang Niu, Ziyang Ma, et al.
VOccl3D:現実の遮蔽下における3次元人体ポーズおよび形状推定のための動画ベンチマークデータセット
Yash Garg, Saketh Bachu, Arindam Dutta, et al.
アルパマヨ-R1:長尾領域における汎用的な自動運転のための推論と行動予測の統合
NVIDIA, Yulong Cao, Tong Che, et al.
すべてはつながっている:テスト時記憶化、注意バイアス、保持、オンライン最適化をめぐる旅
Ali Behrouz, Meisam Razaviyayn, Peilin Zhong, et al.
推論時スケーリングにおけるテキストから視覚生成へのプロンプト設計の再考
Subin Kim, Sangwoo Mo, Mamshad Nayeem Rizve, et al.
推論時スケーリングアプローチとしての視覚言語行動モデルのステアリング:探索の逆効果
Siyuan Yang, Yang Zhang, Haoran He, et al.
OneThinker:画像および動画向けの一体型推論モデル
Kaituo Feng, Manyuan Zhang, Hongyu Li, et al.
ViDiC:ビデオ差分キャプション
Jiangtao Wu, Shihao Li, Zhaozhou Bian, et al.
PretrainZero:強化学習を用いたアクティブ事前学習
Xingrun Xing, Zhiyuan Fan, Jie Lou, et al.
すべてのトークンが重要である:大規模言語モデルにおける1600万トークン超の長文脈の一般化
Xiang Hu, Zhanchao Zhou, Ruiqi Liang, et al.
SimScale:スケールにおける現実世界シミュレーションを用いたドライブ学習
Haochen Tian, Tianyu Li, Haochen Liu, et al.
Skywork-R1V4:画像とDeepResearchを用いたインタリーブド・シンキングによるエージェント型マルチモーダル知能への挑戦
Yifan Zhang, Liang Hu, Haofeng Sun, et al.
最小限の人的監視によるガイド付き自己進化型LLM
Wenhao Yu, Zhenwen Liang, Chengsong Huang, et al.
MultiShotMaster:制御可能なマルチショット動画生成フレームワーク
Qinghe Wang, Xiaoyu Shi, Baolu Li, et al.
MG-Nav:スパース空間記憶を用いたデュアルスケール視覚ナビゲーション
Bo Wang, Jiehong Lin, Chenzhi Liu, et al.
コンシステンシー・クリティック:リファレンス誘導型アテンティブアライメントを用いた生成画像内の不整合の修正
Ziheng Ouyang, Yiren Song, Yaoli Liu, et al.
深層学習を用いた実用的な研究エージェントは、果たしてどの程度現実のものに近づいているのか?
Dingling Zhang, He Zhu, Jincheng Ren, et al.
LLMを用いた強化学習の安定化:定式化と実践
Chujie Zheng, Kai Dang, Bowen Yu, et al.
Envision:因果的世界プロセスインサイトにおける統一的理解・生成のベンチマーク
Juanxi Tian, Siyuan Li, Conghui He, et al.
LongVT:ネイティブ・ツールコールによる「長時間動画を用いた思考」のインセンティブ化
Zuhao Yang, Sudong Wang, Kaichen Zhang, et al.
コード基盤モデルからエージェントおよびアプリケーションへ:コードインテリジェンス実践ガイド
Jian Yang, Wei Zhang, Shark Liu, et al.
物理駆動型時空間モデルによるAI生成動画検出
Shuhai Zhang, ZiHao Lian, Jiahao Yang, et al.
Mem-α:強化学習を用いたメモリ構築の学習
Yu Wang, Ryuichi Takanobu, Zhiqi Liang, et al.
1
2
3
4
5
6
39