HyperAI

メイン

GPU

コンソール
Studio
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

人工知能の未来を築く

概要

当社についてサポートデータセットのヘルプ

製品

ニュース論文ノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

メイン

GPU

コンソール
Studio
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

人工知能の未来を築く

概要

当社についてサポートデータセットのヘルプ

製品

ニュース論文ノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)

SAC Flow：速度再パラメータ化による逐次モデル化を用いたサンプル効率の良い流れに基づく方策の強化学習

SAC Flow：速度再パラメータ化による逐次モデル化を用いたサンプル効率の良い流れに基づく方策の強化学習

モデル学習

Yixian Zhang, Shu'ang Yu, Tonghe Zhang, et al.

特徴最適アライメントを用いたクローズドソースMLLMに対する敵対的攻撃

特徴最適アライメントを用いたクローズドソースMLLMに対する敵対的攻撃

マルチモーダル表現

Xiaojun Jia, Sensen Gao, Simeng Qin, et al.

Hail to the Thief: 分散型GRPOにおける攻撃と防御の探求

Nikolay Blagoev, Oğuzhan Ersoy, Lydia Yiyu Chen

ブラックボックス・オンポリシー distillation による大規模言語モデルの学習

Preference Modeling

Tianzhu Ye, Li Dong, Zewen Chi, et al.

UniVA：オープンソース次世代動画汎用型エージェントへの道

ビデオ理解

Zhengyang Liang, Daoan Zhang, Huichi Zhou, et al.

PAN：汎用的、インタラクティブな、長期ホライゾン世界シミュレーションを実現する世界モデル

エージェント

PAN Team Institute of Foundation Models, Jiannan Xiang, Yi Gu, et al.

潜在空間における一歩、ピクセルにおける飛躍的進歩：あなたの拡散モデル向け高速潜在上位化アダプタ

拡散モデル

Aleksandr Razin, Danil Kazantsev, Ilya Makarov

YOLOv13：ハイパーグラフ強化型適応型視覚認識を用いたリアルタイム物体検出

オブジェクト検出

オブジェクト追跡

Mengqi Lei, Siqi Li, Yihong Wu, et al.

MonkeyOCR：構造認識関係三重項パラダイムを用いたドキュメント解析

ドキュメント理解

Adam Tauman Kalai, Yael Tauman Kalai, Or Zamir

安全な生成AIのためのコンセンサスサンプリング

アルゴリズム

Adam Tauman Kalai, Yael Tauman Kalai, Or Zamir

Argus：エンドツーエンドADS向けレジリエンス指向型セーフティアサランスフレームワーク

ベンチマーク

Dingji Wang, You Lu, Bihuan Chen, et al.

WMPO：視覚言語行動モデルにおける世界モデルに基づく方策最適化

ロボティクス

Fangqi Zhu, Zhengyang Yan, Zicong Hong, et al.

LoopTool：堅牢なLLMツール呼び出しのためのデータ-トレーニングループの閉じ方

モデル学習

Kangning Zhang, Wenxiang Jiao, Kounianhua Du, et al.

事実検索を超えて：生成的意味空間を用いたRAGにおけるエピソード記憶

検索拡張生成

Shreyas Rajesh, Pavan Holur, Chenda Duan, et al.

TiDAR：拡散で考える、自己回帰で話す

拡散モデル

Jingyu Liu, Xin Dong, Zhifan Ye, et al.

Time-to-Move：二時計同期ノイズ除去を用いた訓練不要なモーション制御動画生成

画像から動画生成

拡散モデル

Assaf Singer, Noam Rotstein, Amir Mann, et al.

ルミネ：3Dオープンワールドにおける汎用エージェント構築のためのオープンレシピ

エージェント

Weihao Tan, Xiangyang Li, Yunhao Fang, et al.

1,000語から画像を生成する：構造化キャプションを用いたテキストから画像生成の向上

テキストから画像生成

Eyal Gutflaish, Eliran Kachlon, Hezi Zisman, et al.

KLASS：マスク付き拡散モデルにおけるKLガイド付き高速推論

拡散モデル

自然言語処理

Seo Hyun Kim, Sunwoo Hong, Hojung Jung, et al.

人間の示範に基づくコンピュータ利用エージェントの基盤化

データセット

ドキュメント理解

Aarash Feizi, Shravan Nayak, Xiangru Jian, et al.

Wasm：構造化アラビア語混合マルチモーダルコーパス構築のためのパイプライン

マルチモーダル

データセット

Khalil Hennara, Ahmad Bastati, Muhammad Hreden, et al.

会話システムにおける適応型マルチエージェント応答精緻化

エージェント

Soyeong Jeong, Aparna Elangovan, Emine Yilmaz, et al.

SPAN：モノクローラル3次元オブジェクト検出のための空間投影アライメント

オブジェクト検出

3D マシンビジョン

Yifan Wang, Yian Zhao, Fanqi Pu, et al.

高次元システムにおけるボルテラ級数の効率的近似

モデリング

Navin Khoshnan, Claudia K Petritsch, Bryce-Allen Bagley

SofT-GRPO：Gumbel再パラメータ化によるソフト・シンキング方策最適化を用いた離散トークンLMM強化学習の超越

Zhi Zheng, Wee Sun Lee

RedOne 2.0：ソーシャルネットワーキングサービスにおけるドメイン固有LLMのポストトレーニングの再考

監視付き微調整

Fei Zhao, Chonggang Lu, Haofu Qian, et al.

ステーション：AI駆動型発見のためのオープンワールド環境

エージェント

Stephen Chung, Wenyu Du

DRIVE：競争的コード生成における検証可能報酬を用いた強化学習のためのデータ管理最適実践

監視付き微調整

Speed Zhu, Jianwei Cai, Guang Chen, et al.

IterResearch：マコフ型状態再構成による長期視野エージェントの再考

Guoxin Chen, Zile Qiao, Xuanzhong Chen, et al.

HaluMem：エージェントの記憶システムにおける幻覚の評価

ベンチマーク

エージェント

Ding Chen, Simin Niu, Kehang Li, et al.

GVPO：大規模言語モデル微調整のためのグループ分散方策最適化

Preference Modeling

モデル学習

Kaichen Zhang, Yuzhong Hong, Junwei Bao, et al.

ReCA：リアルタイムかつ効率的な協調型身体的自律エージェントのための統合的加速手法

エムボディドインテリジェンス

ロボティクス

Zishen Wan, Yuhang Du, Mohamed Ibrahim, et al.

SAC Flow：速度再パラメータ化による逐次モデル化を用いたサンプル効率の良い流れに基づく方策の強化学習

SAC Flow：速度再パラメータ化による逐次モデル化を用いたサンプル効率の良い流れに基づく方策の強化学習

モデル学習

Yixian Zhang, Shu'ang Yu, Tonghe Zhang, et al.

特徴最適アライメントを用いたクローズドソースMLLMに対する敵対的攻撃

特徴最適アライメントを用いたクローズドソースMLLMに対する敵対的攻撃

マルチモーダル表現

Xiaojun Jia, Sensen Gao, Simeng Qin, et al.

Hail to the Thief: 分散型GRPOにおける攻撃と防御の探求

Nikolay Blagoev, Oğuzhan Ersoy, Lydia Yiyu Chen

ブラックボックス・オンポリシー distillation による大規模言語モデルの学習

Preference Modeling

Tianzhu Ye, Li Dong, Zewen Chi, et al.

UniVA：オープンソース次世代動画汎用型エージェントへの道

ビデオ理解

Zhengyang Liang, Daoan Zhang, Huichi Zhou, et al.

PAN：汎用的、インタラクティブな、長期ホライゾン世界シミュレーションを実現する世界モデル

エージェント

PAN Team Institute of Foundation Models, Jiannan Xiang, Yi Gu, et al.

潜在空間における一歩、ピクセルにおける飛躍的進歩：あなたの拡散モデル向け高速潜在上位化アダプタ

拡散モデル

Aleksandr Razin, Danil Kazantsev, Ilya Makarov

YOLOv13：ハイパーグラフ強化型適応型視覚認識を用いたリアルタイム物体検出

オブジェクト検出

オブジェクト追跡

Mengqi Lei, Siqi Li, Yihong Wu, et al.

MonkeyOCR：構造認識関係三重項パラダイムを用いたドキュメント解析

ドキュメント理解

Adam Tauman Kalai, Yael Tauman Kalai, Or Zamir

安全な生成AIのためのコンセンサスサンプリング

アルゴリズム

Adam Tauman Kalai, Yael Tauman Kalai, Or Zamir

Argus：エンドツーエンドADS向けレジリエンス指向型セーフティアサランスフレームワーク

ベンチマーク

Dingji Wang, You Lu, Bihuan Chen, et al.

WMPO：視覚言語行動モデルにおける世界モデルに基づく方策最適化

ロボティクス

Fangqi Zhu, Zhengyang Yan, Zicong Hong, et al.

LoopTool：堅牢なLLMツール呼び出しのためのデータ-トレーニングループの閉じ方

モデル学習

Kangning Zhang, Wenxiang Jiao, Kounianhua Du, et al.

事実検索を超えて：生成的意味空間を用いたRAGにおけるエピソード記憶

検索拡張生成

Shreyas Rajesh, Pavan Holur, Chenda Duan, et al.

TiDAR：拡散で考える、自己回帰で話す

拡散モデル

Jingyu Liu, Xin Dong, Zhifan Ye, et al.

Time-to-Move：二時計同期ノイズ除去を用いた訓練不要なモーション制御動画生成

画像から動画生成

拡散モデル

Assaf Singer, Noam Rotstein, Amir Mann, et al.

ルミネ：3Dオープンワールドにおける汎用エージェント構築のためのオープンレシピ

エージェント

Weihao Tan, Xiangyang Li, Yunhao Fang, et al.

1,000語から画像を生成する：構造化キャプションを用いたテキストから画像生成の向上

テキストから画像生成

Eyal Gutflaish, Eliran Kachlon, Hezi Zisman, et al.

KLASS：マスク付き拡散モデルにおけるKLガイド付き高速推論

拡散モデル

自然言語処理

Seo Hyun Kim, Sunwoo Hong, Hojung Jung, et al.

人間の示範に基づくコンピュータ利用エージェントの基盤化

データセット

ドキュメント理解

Aarash Feizi, Shravan Nayak, Xiangru Jian, et al.

Wasm：構造化アラビア語混合マルチモーダルコーパス構築のためのパイプライン

マルチモーダル

データセット

Khalil Hennara, Ahmad Bastati, Muhammad Hreden, et al.

会話システムにおける適応型マルチエージェント応答精緻化

エージェント

Soyeong Jeong, Aparna Elangovan, Emine Yilmaz, et al.

SPAN：モノクローラル3次元オブジェクト検出のための空間投影アライメント

オブジェクト検出

3D マシンビジョン

Yifan Wang, Yian Zhao, Fanqi Pu, et al.

高次元システムにおけるボルテラ級数の効率的近似

モデリング

Navin Khoshnan, Claudia K Petritsch, Bryce-Allen Bagley

SofT-GRPO：Gumbel再パラメータ化によるソフト・シンキング方策最適化を用いた離散トークンLMM強化学習の超越

Zhi Zheng, Wee Sun Lee

RedOne 2.0：ソーシャルネットワーキングサービスにおけるドメイン固有LLMのポストトレーニングの再考

監視付き微調整

Fei Zhao, Chonggang Lu, Haofu Qian, et al.

ステーション：AI駆動型発見のためのオープンワールド環境

エージェント

Stephen Chung, Wenyu Du

DRIVE：競争的コード生成における検証可能報酬を用いた強化学習のためのデータ管理最適実践

監視付き微調整

Speed Zhu, Jianwei Cai, Guang Chen, et al.

IterResearch：マコフ型状態再構成による長期視野エージェントの再考

Guoxin Chen, Zile Qiao, Xuanzhong Chen, et al.

HaluMem：エージェントの記憶システムにおける幻覚の評価

ベンチマーク

エージェント

Ding Chen, Simin Niu, Kehang Li, et al.

GVPO：大規模言語モデル微調整のためのグループ分散方策最適化

Preference Modeling

モデル学習

Kaichen Zhang, Yuzhong Hong, Junwei Bao, et al.

ReCA：リアルタイムかつ効率的な協調型身体的自律エージェントのための統合的加速手法

エムボディドインテリジェンス

ロボティクス

Zishen Wan, Yuhang Du, Mohamed Ibrahim, et al.

Hail to the Thief: 分散型GRPOにおける攻撃と防御の探求

ブラックボックス・オンポリシー distillation による大規模言語モデルの学習

UniVA：オープンソース次世代動画汎用型エージェントへの道

PAN：汎用的、インタラクティブな、長期ホライゾン世界シミュレーションを実現する世界モデル

潜在空間における一歩、ピクセルにおける飛躍的進歩：あなたの拡散モデル向け高速潜在上位化アダプタ

YOLOv13：ハイパーグラフ強化型適応型視覚認識を用いたリアルタイム物体検出

MonkeyOCR：構造認識関係三重項パラダイムを用いたドキュメント解析

安全な生成AIのためのコンセンサスサンプリング

Argus：エンドツーエンドADS向けレジリエンス指向型セーフティアサランスフレームワーク

WMPO：視覚言語行動モデルにおける世界モデルに基づく方策最適化

LoopTool：堅牢なLLMツール呼び出しのためのデータ-トレーニングループの閉じ方

事実検索を超えて：生成的意味空間を用いたRAGにおけるエピソード記憶

TiDAR：拡散で考える、自己回帰で話す

Time-to-Move：二時計同期ノイズ除去を用いた訓練不要なモーション制御動画生成

ルミネ：3Dオープンワールドにおける汎用エージェント構築のためのオープンレシピ

1,000語から画像を生成する：構造化キャプションを用いたテキストから画像生成の向上

KLASS：マスク付き拡散モデルにおけるKLガイド付き高速推論

人間の示範に基づくコンピュータ利用エージェントの基盤化

Wasm：構造化アラビア語混合マルチモーダルコーパス構築のためのパイプライン

会話システムにおける適応型マルチエージェント応答精緻化

SPAN：モノクローラル3次元オブジェクト検出のための空間投影アライメント

高次元システムにおけるボルテラ級数の効率的近似

SofT-GRPO：Gumbel再パラメータ化によるソフト・シンキング方策最適化を用いた離散トークンLMM強化学習の超越

RedOne 2.0：ソーシャルネットワーキングサービスにおけるドメイン固有LLMのポストトレーニングの再考

ステーション：AI駆動型発見のためのオープンワールド環境

DRIVE：競争的コード生成における検証可能報酬を用いた強化学習のためのデータ管理最適実践

IterResearch：マコフ型状態再構成による長期視野エージェントの再考

HaluMem：エージェントの記憶システムにおける幻覚の評価

GVPO：大規模言語モデル微調整のためのグループ分散方策最適化

ReCA：リアルタイムかつ効率的な協調型身体的自律エージェントのための統合的加速手法

Hail to the Thief: 分散型GRPOにおける攻撃と防御の探求

ブラックボックス・オンポリシー distillation による大規模言語モデルの学習

UniVA：オープンソース次世代動画汎用型エージェントへの道

PAN：汎用的、インタラクティブな、長期ホライゾン世界シミュレーションを実現する世界モデル

潜在空間における一歩、ピクセルにおける飛躍的進歩：あなたの拡散モデル向け高速潜在上位化アダプタ

YOLOv13：ハイパーグラフ強化型適応型視覚認識を用いたリアルタイム物体検出

MonkeyOCR：構造認識関係三重項パラダイムを用いたドキュメント解析

安全な生成AIのためのコンセンサスサンプリング

Argus：エンドツーエンドADS向けレジリエンス指向型セーフティアサランスフレームワーク

WMPO：視覚言語行動モデルにおける世界モデルに基づく方策最適化

LoopTool：堅牢なLLMツール呼び出しのためのデータ-トレーニングループの閉じ方

事実検索を超えて：生成的意味空間を用いたRAGにおけるエピソード記憶

TiDAR：拡散で考える、自己回帰で話す

Time-to-Move：二時計同期ノイズ除去を用いた訓練不要なモーション制御動画生成

ルミネ：3Dオープンワールドにおける汎用エージェント構築のためのオープンレシピ

1,000語から画像を生成する：構造化キャプションを用いたテキストから画像生成の向上

KLASS：マスク付き拡散モデルにおけるKLガイド付き高速推論

人間の示範に基づくコンピュータ利用エージェントの基盤化

Wasm：構造化アラビア語混合マルチモーダルコーパス構築のためのパイプライン

会話システムにおける適応型マルチエージェント応答精緻化

SPAN：モノクローラル3次元オブジェクト検出のための空間投影アライメント

高次元システムにおけるボルテラ級数の効率的近似

SofT-GRPO：Gumbel再パラメータ化によるソフト・シンキング方策最適化を用いた離散トークンLMM強化学習の超越

RedOne 2.0：ソーシャルネットワーキングサービスにおけるドメイン固有LLMのポストトレーニングの再考

ステーション：AI駆動型発見のためのオープンワールド環境

DRIVE：競争的コード生成における検証可能報酬を用いた強化学習のためのデータ管理最適実践

IterResearch：マコフ型状態再構成による長期視野エージェントの再考

HaluMem：エージェントの記憶システムにおける幻覚の評価

GVPO：大規模言語モデル微調整のためのグループ分散方策最適化

ReCA：リアルタイムかつ効率的な協調型身体的自律エージェントのための統合的加速手法