HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
PretrainZero:強化学習を用いたアクティブ事前学習
強化学習
Reasoning
Xingrun Xing, Zhiyuan Fan, Jie Lou, et al.
すべてのトークンが重要である:大規模言語モデルにおける1600万トークン超の長文脈の一般化
LLM
Transformer
Xiang Hu, Zhanchao Zhou, Ruiqi Liang, et al.
SimScale:スケールにおける現実世界シミュレーションを用いたドライブ学習
自動運転
合成
Haochen Tian, Tianyu Li, Haochen Liu, et al.
Skywork-R1V4:画像とDeepResearchを用いたインタリーブド・シンキングによるエージェント型マルチモーダル知能への挑戦
エージェント
検索拡張生成
Yifan Zhang, Liang Hu, Haofeng Sun, et al.
最小限の人的監視によるガイド付き自己進化型LLM
LLM
Reasoning
Wenhao Yu, Zhenwen Liang, Chengsong Huang, et al.
MultiShotMaster:制御可能なマルチショット動画生成フレームワーク
動画生成
テキストから動画
Qinghe Wang, Xiaoyu Shi, Baolu Li, et al.
MG-Nav:スパース空間記憶を用いたデュアルスケール視覚ナビゲーション
コンピュータビジョン
オブジェクト検出
Bo Wang, Jiehong Lin, Chenzhi Liu, et al.
コンシステンシー・クリティック:リファレンス誘導型アテンティブアライメントを用いた生成画像内の不整合の修正
画像間変換
画像生成
Ziheng Ouyang, Yiren Song, Yaoli Liu, et al.
深層学習を用いた実用的な研究エージェントは、果たしてどの程度現実のものに近づいているのか?
ベンチマーク
データセット
Dingling Zhang, He Zhu, Jincheng Ren, et al.
LLMを用いた強化学習の安定化:定式化と実践
強化学習
LLM
Chujie Zheng, Kai Dang, Bowen Yu, et al.
Envision:因果的世界プロセスインサイトにおける統一的理解・生成のベンチマーク
テキストから画像生成
Any-to-Any
Juanxi Tian, Siyuan Li, Conghui He, et al.
LongVT:ネイティブ・ツールコールによる「長時間動画を用いた思考」のインセンティブ化
ビデオ理解
視覚質問応答
Zuhao Yang, Sudong Wang, Kaichen Zhang, et al.
コード基盤モデルからエージェントおよびアプリケーションへ:コードインテリジェンス実践ガイド
LLM
監視付き微調整
Jian Yang, Wei Zhang, Shark Liu, et al.
物理駆動型時空間モデルによるAI生成動画検出
ビデオ理解
動画生成
Shuhai Zhang, ZiHao Lian, Jiahao Yang, et al.
Mem-α:強化学習を用いたメモリ構築の学習
強化学習
エージェント
Yu Wang, Ryuichi Takanobu, Zhiqi Liang, et al.
自己対戦による探索:教師なしでエージェント能力の限界を押し広げる
強化学習
エージェント
Hongliang Lu, Yuhang Wen, Pengyu Cheng, et al.
CudaForge:ハードウェアフィードバックを活用したCUDAカーネル最適化向けエージェントフレームワーク
LLM
コード生成
Zijian Zhang, Rong Wang, Shiyang Li, et al.
ScaleNet:増分パラメータを用いた事前学習ニューラルネットワークのスケーリング
Transformer
ニューラルネットワーク
Zhiwei Hao, Jianyuan Guo, Li Shen, et al.
ブロック注意の混合最適化
LLM
Transformer
Guangxuan Xiao, Junxian Guo, Kasra Mazaheri, et al.
フラクタルフォレンジックス:フラクタルウォーターマークを用いたプロアクティブなディープフェイク検出と局所化
コンピュータビジョン
ディープラーニング
Tianyi Wang, Harry Cheng, Ming-Hui Liu, et al.
チェーン・オブ・シンク・ハイジャッキング
LLM
Reasoning
Jianli Zhao, Tingchen Fu, Rylan Schaeffer, et al.
InstanceAssemble:インスタンスアセンブリーアテンションを用いたレイアウト認識型画像生成
拡散モデル
テキストから画像生成
Qiang Xiang, Shuang Sun, Binglei Li, et al.
3EED:3次元空間におけるあらゆるものを基礎化する
3D マシンビジョン
マルチモーダル
Rong Li, Yuhao Dong, Tianshuai Hu, et al.
DetectiumFire:視覚と言語を橋渡しする火災理解のための包括的なマルチモーダルデータセット
マルチモーダル
ビデオ理解
Zixuan Liu, Siavash H. Khajavi, Guangkai Jiang
CHIP:産業現場における椅子の6次元姿勢推定のためのマルチセンサデータセット
3D マシンビジョン
ロボティクス
Mattia Nardon, Mikel Mujika Agirre, Ander González Tomé, et al.
幾何制約付きエージェントによる空間推論
エージェント
Reasoning
Zeren Chen, Xiaoya Lu, Zhijie Zheng, et al.
DeepSeek-V3.2:オープン型大規模言語モデルの限界を押し広げる
DeepSeek
Reasoning
DeepSeek-AI, Aixin Liu, Aoxue Mei, et al.
DiP:ピクセル空間における拡散モデルの制御
拡散モデル
画像生成
Zhennan Chen, Junwei Zhu, Xu Chen, et al.
アーキテクチャの分離は、統合型マルチモーダルモデルにとって必要なすべてではない
Any-to-Any
マルチタスク学習
Dian Zheng, Manyuan Zhang, Hongyu Li, et al.
スケールにおけるビジョンブリッジトランスフォーマー
Transformer
画像から動画生成
Zhenxiong Tan, Zeqing Wang, Xingyi Yang, et al.
AnyTalker:インタラクティビティ精 refinement を用いたマルチペルソントーキング動画生成のスケーラビリティ向上
動画生成
マルチモーダル
Zhizhou Zhong, Yicheng Ji, Zhe Kong, et al.
REASONEDIT:推論強化型画像編集モデルへの道標
テキストから画像生成
拡散モデル
Fukun Yin, Shiyu Liu, Yucheng Han, et al.
1
9
10
11
12
13
14
15
47
PretrainZero:強化学習を用いたアクティブ事前学習
強化学習
Reasoning
Xingrun Xing, Zhiyuan Fan, Jie Lou, et al.
すべてのトークンが重要である:大規模言語モデルにおける1600万トークン超の長文脈の一般化
LLM
Transformer
Xiang Hu, Zhanchao Zhou, Ruiqi Liang, et al.
SimScale:スケールにおける現実世界シミュレーションを用いたドライブ学習
自動運転
合成
Haochen Tian, Tianyu Li, Haochen Liu, et al.
Skywork-R1V4:画像とDeepResearchを用いたインタリーブド・シンキングによるエージェント型マルチモーダル知能への挑戦
エージェント
検索拡張生成
Yifan Zhang, Liang Hu, Haofeng Sun, et al.
最小限の人的監視によるガイド付き自己進化型LLM
LLM
Reasoning
Wenhao Yu, Zhenwen Liang, Chengsong Huang, et al.
MultiShotMaster:制御可能なマルチショット動画生成フレームワーク
動画生成
テキストから動画
Qinghe Wang, Xiaoyu Shi, Baolu Li, et al.
MG-Nav:スパース空間記憶を用いたデュアルスケール視覚ナビゲーション
コンピュータビジョン
オブジェクト検出
Bo Wang, Jiehong Lin, Chenzhi Liu, et al.
コンシステンシー・クリティック:リファレンス誘導型アテンティブアライメントを用いた生成画像内の不整合の修正
画像間変換
画像生成
Ziheng Ouyang, Yiren Song, Yaoli Liu, et al.
深層学習を用いた実用的な研究エージェントは、果たしてどの程度現実のものに近づいているのか?
ベンチマーク
データセット
Dingling Zhang, He Zhu, Jincheng Ren, et al.
LLMを用いた強化学習の安定化:定式化と実践
強化学習
LLM
Chujie Zheng, Kai Dang, Bowen Yu, et al.
Envision:因果的世界プロセスインサイトにおける統一的理解・生成のベンチマーク
テキストから画像生成
Any-to-Any
Juanxi Tian, Siyuan Li, Conghui He, et al.
LongVT:ネイティブ・ツールコールによる「長時間動画を用いた思考」のインセンティブ化
ビデオ理解
視覚質問応答
Zuhao Yang, Sudong Wang, Kaichen Zhang, et al.
コード基盤モデルからエージェントおよびアプリケーションへ:コードインテリジェンス実践ガイド
LLM
監視付き微調整
Jian Yang, Wei Zhang, Shark Liu, et al.
物理駆動型時空間モデルによるAI生成動画検出
ビデオ理解
動画生成
Shuhai Zhang, ZiHao Lian, Jiahao Yang, et al.
Mem-α:強化学習を用いたメモリ構築の学習
強化学習
エージェント
Yu Wang, Ryuichi Takanobu, Zhiqi Liang, et al.
自己対戦による探索:教師なしでエージェント能力の限界を押し広げる
強化学習
エージェント
Hongliang Lu, Yuhang Wen, Pengyu Cheng, et al.
CudaForge:ハードウェアフィードバックを活用したCUDAカーネル最適化向けエージェントフレームワーク
LLM
コード生成
Zijian Zhang, Rong Wang, Shiyang Li, et al.
ScaleNet:増分パラメータを用いた事前学習ニューラルネットワークのスケーリング
Transformer
ニューラルネットワーク
Zhiwei Hao, Jianyuan Guo, Li Shen, et al.
ブロック注意の混合最適化
LLM
Transformer
Guangxuan Xiao, Junxian Guo, Kasra Mazaheri, et al.
フラクタルフォレンジックス:フラクタルウォーターマークを用いたプロアクティブなディープフェイク検出と局所化
コンピュータビジョン
ディープラーニング
Tianyi Wang, Harry Cheng, Ming-Hui Liu, et al.
チェーン・オブ・シンク・ハイジャッキング
LLM
Reasoning
Jianli Zhao, Tingchen Fu, Rylan Schaeffer, et al.
InstanceAssemble:インスタンスアセンブリーアテンションを用いたレイアウト認識型画像生成
拡散モデル
テキストから画像生成
Qiang Xiang, Shuang Sun, Binglei Li, et al.
3EED:3次元空間におけるあらゆるものを基礎化する
3D マシンビジョン
マルチモーダル
Rong Li, Yuhao Dong, Tianshuai Hu, et al.
DetectiumFire:視覚と言語を橋渡しする火災理解のための包括的なマルチモーダルデータセット
マルチモーダル
ビデオ理解
Zixuan Liu, Siavash H. Khajavi, Guangkai Jiang
CHIP:産業現場における椅子の6次元姿勢推定のためのマルチセンサデータセット
3D マシンビジョン
ロボティクス
Mattia Nardon, Mikel Mujika Agirre, Ander González Tomé, et al.
幾何制約付きエージェントによる空間推論
エージェント
Reasoning
Zeren Chen, Xiaoya Lu, Zhijie Zheng, et al.
DeepSeek-V3.2:オープン型大規模言語モデルの限界を押し広げる
DeepSeek
Reasoning
DeepSeek-AI, Aixin Liu, Aoxue Mei, et al.
DiP:ピクセル空間における拡散モデルの制御
拡散モデル
画像生成
Zhennan Chen, Junwei Zhu, Xu Chen, et al.
アーキテクチャの分離は、統合型マルチモーダルモデルにとって必要なすべてではない
Any-to-Any
マルチタスク学習
Dian Zheng, Manyuan Zhang, Hongyu Li, et al.
スケールにおけるビジョンブリッジトランスフォーマー
Transformer
画像から動画生成
Zhenxiong Tan, Zeqing Wang, Xingyi Yang, et al.
AnyTalker:インタラクティビティ精 refinement を用いたマルチペルソントーキング動画生成のスケーラビリティ向上
動画生成
マルチモーダル
Zhizhou Zhong, Yicheng Ji, Zhe Kong, et al.
REASONEDIT:推論強化型画像編集モデルへの道標
テキストから画像生成
拡散モデル
Fukun Yin, Shiyu Liu, Yucheng Han, et al.
1
9
10
11
12
13
14
15
47