HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
ブラックボックス・オンポリシー distillation による大規模言語モデルの学習
LLM
Preference Modeling
Tianzhu Ye, Li Dong, Zewen Chi, et al.
UniVA:オープンソース次世代動画汎用型エージェントへの道
ビデオ理解
Any-to-Any
Zhengyang Liang, Daoan Zhang, Huichi Zhou, et al.
PAN:汎用的、インタラクティブな、長期ホライゾン世界シミュレーションを実現する世界モデル
動画生成
エージェント
PAN Team Institute of Foundation Models, Jiannan Xiang, Yi Gu, et al.
潜在空間における一歩、ピクセルにおける飛躍的進歩:あなたの拡散モデル向け高速潜在上位化アダプタ
拡散モデル
画像生成
Aleksandr Razin, Danil Kazantsev, Ilya Makarov
YOLOv13:ハイパーグラフ強化型適応型視覚認識を用いたリアルタイム物体検出
オブジェクト検出
オブジェクト追跡
Mengqi Lei, Siqi Li, Yihong Wu, et al.
MonkeyOCR:構造認識関係三重項パラダイムを用いたドキュメント解析
ドキュメント理解
OCR
Adam Tauman Kalai, Yael Tauman Kalai, Or Zamir
安全な生成AIのためのコンセンサスサンプリング
アルゴリズム
LLM
Adam Tauman Kalai, Yael Tauman Kalai, Or Zamir
Argus:エンドツーエンドADS向けレジリエンス指向型セーフティアサランスフレームワーク
自動運転
ベンチマーク
Dingji Wang, You Lu, Bihuan Chen, et al.
WMPO:視覚言語行動モデルにおける世界モデルに基づく方策最適化
強化学習
ロボティクス
Fangqi Zhu, Zhengyang Yan, Zicong Hong, et al.
LoopTool:堅牢なLLMツール呼び出しのためのデータ-トレーニングループの閉じ方
LLM
モデル学習
Kangning Zhang, Wenxiang Jiao, Kounianhua Du, et al.
事実検索を超えて:生成的意味空間を用いたRAGにおけるエピソード記憶
検索拡張生成
Reasoning
Shreyas Rajesh, Pavan Holur, Chenda Duan, et al.
TiDAR:拡散で考える、自己回帰で話す
拡散モデル
Transformer
Jingyu Liu, Xin Dong, Zhifan Ye, et al.
Time-to-Move:二時計同期ノイズ除去を用いた訓練不要なモーション制御動画生成
画像から動画生成
拡散モデル
Assaf Singer, Noam Rotstein, Amir Mann, et al.
ルミネ:3Dオープンワールドにおける汎用エージェント構築のためのオープンレシピ
エージェント
Reasoning
Weihao Tan, Xiangyang Li, Yunhao Fang, et al.
1,000語から画像を生成する:構造化キャプションを用いたテキストから画像生成の向上
テキストから画像生成
画像生成
Eyal Gutflaish, Eliran Kachlon, Hezi Zisman, et al.
KLASS:マスク付き拡散モデルにおけるKLガイド付き高速推論
拡散モデル
自然言語処理
Seo Hyun Kim, Sunwoo Hong, Hojung Jung, et al.
人間の示範に基づくコンピュータ利用エージェントの基盤化
データセット
ドキュメント理解
Aarash Feizi, Shravan Nayak, Xiangru Jian, et al.
Wasm:構造化アラビア語混合マルチモーダルコーパス構築のためのパイプライン
マルチモーダル
データセット
Khalil Hennara, Ahmad Bastati, Muhammad Hreden, et al.
会話システムにおける適応型マルチエージェント応答精緻化
エージェント
LLM
Soyeong Jeong, Aparna Elangovan, Emine Yilmaz, et al.
SPAN:モノクローラル3次元オブジェクト検出のための空間投影アライメント
オブジェクト検出
3D マシンビジョン
Yifan Wang, Yian Zhao, Fanqi Pu, et al.
高次元システムにおけるボルテラ級数の効率的近似
機械学習
モデリング
Navin Khoshnan, Claudia K Petritsch, Bryce-Allen Bagley
SofT-GRPO:Gumbel再パラメータ化によるソフト・シンキング方策最適化を用いた離散トークンLMM強化学習の超越
強化学習
Reasoning
Zhi Zheng, Wee Sun Lee
RedOne 2.0:ソーシャルネットワーキングサービスにおけるドメイン固有LLMのポストトレーニングの再考
監視付き微調整
LLM
Fei Zhao, Chonggang Lu, Haofu Qian, et al.
ステーション:AI駆動型発見のためのオープンワールド環境
エージェント
Reasoning
Stephen Chung, Wenyu Du
DRIVE:競争的コード生成における検証可能報酬を用いた強化学習のためのデータ管理最適実践
監視付き微調整
強化学習
Speed Zhu, Jianwei Cai, Guang Chen, et al.
IterResearch:マコフ型状態再構成による長期視野エージェントの再考
強化学習
Reasoning
Guoxin Chen, Zile Qiao, Xuanzhong Chen, et al.
HaluMem:エージェントの記憶システムにおける幻覚の評価
ベンチマーク
エージェント
Ding Chen, Simin Niu, Kehang Li, et al.
GVPO:大規模言語モデル微調整のためのグループ分散方策最適化
Preference Modeling
モデル学習
Kaichen Zhang, Yuzhong Hong, Junwei Bao, et al.
ReCA:リアルタイムかつ効率的な協調型身体的自律エージェントのための統合的加速手法
エムボディドインテリジェンス
ロボティクス
Zishen Wan, Yuhang Du, Mohamed Ibrahim, et al.
DexFlyWheel:多指灵巧操作向けスケーラブルかつ自己改善型データ生成フレームワーク
ロボティクス
強化学習
Kefei Zhu, Fengshuo Bai, YuanHao Xiang, et al.
NovaFlow:生成動画からの行動可能フローを用いたゼロショット操作
Any-to-Any
テキストから動画
Hongyu Li, Lingfeng Sun, Yafei Hu, et al.
TreeSynth:木構造を用いた部分空間分割による新規多様なデータの合成
合成
データセット
Sheng Wang, Pengan Chen, Jingqi Zhou, et al.
1
24
25
26
27
28
29
30
57
ブラックボックス・オンポリシー distillation による大規模言語モデルの学習
LLM
Preference Modeling
Tianzhu Ye, Li Dong, Zewen Chi, et al.
UniVA:オープンソース次世代動画汎用型エージェントへの道
ビデオ理解
Any-to-Any
Zhengyang Liang, Daoan Zhang, Huichi Zhou, et al.
PAN:汎用的、インタラクティブな、長期ホライゾン世界シミュレーションを実現する世界モデル
動画生成
エージェント
PAN Team Institute of Foundation Models, Jiannan Xiang, Yi Gu, et al.
潜在空間における一歩、ピクセルにおける飛躍的進歩:あなたの拡散モデル向け高速潜在上位化アダプタ
拡散モデル
画像生成
Aleksandr Razin, Danil Kazantsev, Ilya Makarov
YOLOv13:ハイパーグラフ強化型適応型視覚認識を用いたリアルタイム物体検出
オブジェクト検出
オブジェクト追跡
Mengqi Lei, Siqi Li, Yihong Wu, et al.
MonkeyOCR:構造認識関係三重項パラダイムを用いたドキュメント解析
ドキュメント理解
OCR
Adam Tauman Kalai, Yael Tauman Kalai, Or Zamir
安全な生成AIのためのコンセンサスサンプリング
アルゴリズム
LLM
Adam Tauman Kalai, Yael Tauman Kalai, Or Zamir
Argus:エンドツーエンドADS向けレジリエンス指向型セーフティアサランスフレームワーク
自動運転
ベンチマーク
Dingji Wang, You Lu, Bihuan Chen, et al.
WMPO:視覚言語行動モデルにおける世界モデルに基づく方策最適化
強化学習
ロボティクス
Fangqi Zhu, Zhengyang Yan, Zicong Hong, et al.
LoopTool:堅牢なLLMツール呼び出しのためのデータ-トレーニングループの閉じ方
LLM
モデル学習
Kangning Zhang, Wenxiang Jiao, Kounianhua Du, et al.
事実検索を超えて:生成的意味空間を用いたRAGにおけるエピソード記憶
検索拡張生成
Reasoning
Shreyas Rajesh, Pavan Holur, Chenda Duan, et al.
TiDAR:拡散で考える、自己回帰で話す
拡散モデル
Transformer
Jingyu Liu, Xin Dong, Zhifan Ye, et al.
Time-to-Move:二時計同期ノイズ除去を用いた訓練不要なモーション制御動画生成
画像から動画生成
拡散モデル
Assaf Singer, Noam Rotstein, Amir Mann, et al.
ルミネ:3Dオープンワールドにおける汎用エージェント構築のためのオープンレシピ
エージェント
Reasoning
Weihao Tan, Xiangyang Li, Yunhao Fang, et al.
1,000語から画像を生成する:構造化キャプションを用いたテキストから画像生成の向上
テキストから画像生成
画像生成
Eyal Gutflaish, Eliran Kachlon, Hezi Zisman, et al.
KLASS:マスク付き拡散モデルにおけるKLガイド付き高速推論
拡散モデル
自然言語処理
Seo Hyun Kim, Sunwoo Hong, Hojung Jung, et al.
人間の示範に基づくコンピュータ利用エージェントの基盤化
データセット
ドキュメント理解
Aarash Feizi, Shravan Nayak, Xiangru Jian, et al.
Wasm:構造化アラビア語混合マルチモーダルコーパス構築のためのパイプライン
マルチモーダル
データセット
Khalil Hennara, Ahmad Bastati, Muhammad Hreden, et al.
会話システムにおける適応型マルチエージェント応答精緻化
エージェント
LLM
Soyeong Jeong, Aparna Elangovan, Emine Yilmaz, et al.
SPAN:モノクローラル3次元オブジェクト検出のための空間投影アライメント
オブジェクト検出
3D マシンビジョン
Yifan Wang, Yian Zhao, Fanqi Pu, et al.
高次元システムにおけるボルテラ級数の効率的近似
機械学習
モデリング
Navin Khoshnan, Claudia K Petritsch, Bryce-Allen Bagley
SofT-GRPO:Gumbel再パラメータ化によるソフト・シンキング方策最適化を用いた離散トークンLMM強化学習の超越
強化学習
Reasoning
Zhi Zheng, Wee Sun Lee
RedOne 2.0:ソーシャルネットワーキングサービスにおけるドメイン固有LLMのポストトレーニングの再考
監視付き微調整
LLM
Fei Zhao, Chonggang Lu, Haofu Qian, et al.
ステーション:AI駆動型発見のためのオープンワールド環境
エージェント
Reasoning
Stephen Chung, Wenyu Du
DRIVE:競争的コード生成における検証可能報酬を用いた強化学習のためのデータ管理最適実践
監視付き微調整
強化学習
Speed Zhu, Jianwei Cai, Guang Chen, et al.
IterResearch:マコフ型状態再構成による長期視野エージェントの再考
強化学習
Reasoning
Guoxin Chen, Zile Qiao, Xuanzhong Chen, et al.
HaluMem:エージェントの記憶システムにおける幻覚の評価
ベンチマーク
エージェント
Ding Chen, Simin Niu, Kehang Li, et al.
GVPO:大規模言語モデル微調整のためのグループ分散方策最適化
Preference Modeling
モデル学習
Kaichen Zhang, Yuzhong Hong, Junwei Bao, et al.
ReCA:リアルタイムかつ効率的な協調型身体的自律エージェントのための統合的加速手法
エムボディドインテリジェンス
ロボティクス
Zishen Wan, Yuhang Du, Mohamed Ibrahim, et al.
DexFlyWheel:多指灵巧操作向けスケーラブルかつ自己改善型データ生成フレームワーク
ロボティクス
強化学習
Kefei Zhu, Fengshuo Bai, YuanHao Xiang, et al.
NovaFlow:生成動画からの行動可能フローを用いたゼロショット操作
Any-to-Any
テキストから動画
Hongyu Li, Lingfeng Sun, Yafei Hu, et al.
TreeSynth:木構造を用いた部分空間分割による新規多様なデータの合成
合成
データセット
Sheng Wang, Pengan Chen, Jingqi Zhou, et al.
1
24
25
26
27
28
29
30
57