HyperAI

メイン

GPU

コンソール
Studio
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

人工知能の未来を築く

概要

当社についてサポートデータセットのヘルプ

製品

ニュース論文ノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

メイン

GPU

コンソール
Studio
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

人工知能の未来を築く

概要

当社についてサポートデータセットのヘルプ

製品

ニュース論文ノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)

GroupRank：強化学習によって駆動されるグループワイドな再ランク付け枠組み

GroupRank：強化学習によって駆動されるグループワイドな再ランク付け枠組み

検索拡張生成

Duolin Sun, Meixiu Long, Dan Yang, et al.

MMaDA-Parallel：思考認識型編集・生成のためのマルチモーダル大規模拡散言語モデル

MMaDA-Parallel：思考認識型編集・生成のためのマルチモーダル大規模拡散言語モデル

拡散モデル

Ye Tian, Ling Yang, Jiongfan Yang, et al.

TiViBench：Video生成モデルにおけるThink-in-Video推論のベンチマーク

Harold Haodong Chen, Disen Lan, Wen-Jie Shu, et al.

Part-X-MLLM：部位認識型3Dマルチモーダル大規模言語モデル

Chunshi Wang, Junliang Ye, Yunhan Yang, et al.

Uni-MoE-2.0-Omni：高度なMoE、トレーニングおよびデータを用いた言語中心型オムニモーダル大規模モデルのスケーリング

Yunxin Li, Xinyu Chen, Shenyuan Jiang, et al.

P1：強化学習を用いた物理学オリンピックの習得

Jiacheng Chen, Qianjia Cheng, Fangchen Yu, et al.

ランスロット：完全準同型暗号内における効率的かつプライバシー保護型のバシニンス耐性フェデレーテッドラーニングのためのアプローチ

コンピュータビジョン

ニューラルネットワーク

Siyang Jiang, Hao Yang, Qipeng Xie, et al.

変分自己符号化器を用いない潜在拡散モデル

拡散モデル

Minglei Shi, Haolin Wang, Wenzhao Zheng, et al.

RewardMap：マルチステージ強化学習を活用した詳細視覚推論におけるスパース報酬の克服

視覚質問応答

Sicheng Feng, Kaiwen Tuo, Song Wang, et al.

ReinFlow：オンライン強化学習を用いたフローマッチング方策のファインチューニング

拡散モデル

Tonghe Zhang, Chao Yu, Sichang Su, et al.

推論能力の音声評価：モダリティに起因するパフォーマンス格差の診断

ベンチマーク

音声および音声処理

Yueqian Lin, Zhengmian Hu, Qinsi Wang, et al.

MarsRL：エージェントパイプライン並列化を用いた強化学習によるマルチエージェント推論システムの進展

エージェント

Shulin Liu, Dong Du, Tao Yang, et al.

バーチャル幅ネットワーク

モデル学習

Seed, Baisheng Li, Banggu Wu, et al.

AIonopedia：マルチモーダル学習を統合するLLMエージェントによるイオン液体の発見

マルチモーダル

Yuqi Yin, Yibo Fu, Siyuan Wang, et al.

UI2Code$^ ext{N}$：テスト時スケーラビリティを備えたインタラクティブなUIからCode生成のための視覚言語モデル

コード生成

Zhen Yang, Wenyi Hong, Mingde Xu, et al.

GGBench：統一型マルチモーダルモデル向けの幾何学的生成推論ベンチマーク

マルチモーダル

Jingxuan Wei, Caijun Jia, Xi Bai, et al.

WEAVE：文脈内インタリーブド理解および生成の解放とベンチマーク

Wei Chow, Jiachun Pan, Yongyuan Liang, et al.

DoPE：ノイズ除去回転位置埋め込み

Jing Xiong, Liyang Fan, Hui Shen, et al.

BRFL：ブロックチェーンベースのバジリスク耐性ファederated学習モデル

モデル学習

Yang Li, Chunhe Xia, Chang Li, et al.

指数ガウス混合ネットワークを用いた動画視聴時間予測のためのマルチグレイン分布モデリング

ビデオ理解

ビデオ処理

Xu Zhao, Ruibo Ma, Jiaqi Chen, et al.

SAC Flow：速度再パラメータ化による逐次モデル化を用いたサンプル効率の良い流れに基づく方策の強化学習

モデル学習

Yixian Zhang, Shu'ang Yu, Tonghe Zhang, et al.

特徴最適アライメントを用いたクローズドソースMLLMに対する敵対的攻撃

マルチモーダル表現

Xiaojun Jia, Sensen Gao, Simeng Qin, et al.

Hail to the Thief: 分散型GRPOにおける攻撃と防御の探求

Nikolay Blagoev, Oğuzhan Ersoy, Lydia Yiyu Chen

ブラックボックス・オンポリシー distillation による大規模言語モデルの学習

Preference Modeling

Tianzhu Ye, Li Dong, Zewen Chi, et al.

UniVA：オープンソース次世代動画汎用型エージェントへの道

ビデオ理解

Zhengyang Liang, Daoan Zhang, Huichi Zhou, et al.

PAN：汎用的、インタラクティブな、長期ホライゾン世界シミュレーションを実現する世界モデル

エージェント

PAN Team Institute of Foundation Models, Jiannan Xiang, Yi Gu, et al.

潜在空間における一歩、ピクセルにおける飛躍的進歩：あなたの拡散モデル向け高速潜在上位化アダプタ

拡散モデル

Aleksandr Razin, Danil Kazantsev, Ilya Makarov

YOLOv13：ハイパーグラフ強化型適応型視覚認識を用いたリアルタイム物体検出

オブジェクト検出

オブジェクト追跡

Mengqi Lei, Siqi Li, Yihong Wu, et al.

MonkeyOCR：構造認識関係三重項パラダイムを用いたドキュメント解析

ドキュメント理解

Adam Tauman Kalai, Yael Tauman Kalai, Or Zamir

安全な生成AIのためのコンセンサスサンプリング

アルゴリズム

Adam Tauman Kalai, Yael Tauman Kalai, Or Zamir

Argus：エンドツーエンドADS向けレジリエンス指向型セーフティアサランスフレームワーク

ベンチマーク

Dingji Wang, You Lu, Bihuan Chen, et al.

WMPO：視覚言語行動モデルにおける世界モデルに基づく方策最適化

ロボティクス

Fangqi Zhu, Zhengyang Yan, Zicong Hong, et al.

GroupRank：強化学習によって駆動されるグループワイドな再ランク付け枠組み

GroupRank：強化学習によって駆動されるグループワイドな再ランク付け枠組み

検索拡張生成

Duolin Sun, Meixiu Long, Dan Yang, et al.

MMaDA-Parallel：思考認識型編集・生成のためのマルチモーダル大規模拡散言語モデル

MMaDA-Parallel：思考認識型編集・生成のためのマルチモーダル大規模拡散言語モデル

拡散モデル

Ye Tian, Ling Yang, Jiongfan Yang, et al.

TiViBench：Video生成モデルにおけるThink-in-Video推論のベンチマーク

Harold Haodong Chen, Disen Lan, Wen-Jie Shu, et al.

Part-X-MLLM：部位認識型3Dマルチモーダル大規模言語モデル

Chunshi Wang, Junliang Ye, Yunhan Yang, et al.

Uni-MoE-2.0-Omni：高度なMoE、トレーニングおよびデータを用いた言語中心型オムニモーダル大規模モデルのスケーリング

Yunxin Li, Xinyu Chen, Shenyuan Jiang, et al.

P1：強化学習を用いた物理学オリンピックの習得

Jiacheng Chen, Qianjia Cheng, Fangchen Yu, et al.

ランスロット：完全準同型暗号内における効率的かつプライバシー保護型のバシニンス耐性フェデレーテッドラーニングのためのアプローチ

コンピュータビジョン

ニューラルネットワーク

Siyang Jiang, Hao Yang, Qipeng Xie, et al.

変分自己符号化器を用いない潜在拡散モデル

拡散モデル

Minglei Shi, Haolin Wang, Wenzhao Zheng, et al.

RewardMap：マルチステージ強化学習を活用した詳細視覚推論におけるスパース報酬の克服

視覚質問応答

Sicheng Feng, Kaiwen Tuo, Song Wang, et al.

ReinFlow：オンライン強化学習を用いたフローマッチング方策のファインチューニング

拡散モデル

Tonghe Zhang, Chao Yu, Sichang Su, et al.

推論能力の音声評価：モダリティに起因するパフォーマンス格差の診断

ベンチマーク

音声および音声処理

Yueqian Lin, Zhengmian Hu, Qinsi Wang, et al.

MarsRL：エージェントパイプライン並列化を用いた強化学習によるマルチエージェント推論システムの進展

エージェント

Shulin Liu, Dong Du, Tao Yang, et al.

バーチャル幅ネットワーク

モデル学習

Seed, Baisheng Li, Banggu Wu, et al.

AIonopedia：マルチモーダル学習を統合するLLMエージェントによるイオン液体の発見

マルチモーダル

Yuqi Yin, Yibo Fu, Siyuan Wang, et al.

UI2Code$^ ext{N}$：テスト時スケーラビリティを備えたインタラクティブなUIからCode生成のための視覚言語モデル

コード生成

Zhen Yang, Wenyi Hong, Mingde Xu, et al.

GGBench：統一型マルチモーダルモデル向けの幾何学的生成推論ベンチマーク

マルチモーダル

Jingxuan Wei, Caijun Jia, Xi Bai, et al.

WEAVE：文脈内インタリーブド理解および生成の解放とベンチマーク

Wei Chow, Jiachun Pan, Yongyuan Liang, et al.

DoPE：ノイズ除去回転位置埋め込み

Jing Xiong, Liyang Fan, Hui Shen, et al.

BRFL：ブロックチェーンベースのバジリスク耐性ファederated学習モデル

モデル学習

Yang Li, Chunhe Xia, Chang Li, et al.

指数ガウス混合ネットワークを用いた動画視聴時間予測のためのマルチグレイン分布モデリング

ビデオ理解

ビデオ処理

Xu Zhao, Ruibo Ma, Jiaqi Chen, et al.

SAC Flow：速度再パラメータ化による逐次モデル化を用いたサンプル効率の良い流れに基づく方策の強化学習

モデル学習

Yixian Zhang, Shu'ang Yu, Tonghe Zhang, et al.

特徴最適アライメントを用いたクローズドソースMLLMに対する敵対的攻撃

マルチモーダル表現

Xiaojun Jia, Sensen Gao, Simeng Qin, et al.

Hail to the Thief: 分散型GRPOにおける攻撃と防御の探求

Nikolay Blagoev, Oğuzhan Ersoy, Lydia Yiyu Chen

ブラックボックス・オンポリシー distillation による大規模言語モデルの学習

Preference Modeling

Tianzhu Ye, Li Dong, Zewen Chi, et al.

UniVA：オープンソース次世代動画汎用型エージェントへの道

ビデオ理解

Zhengyang Liang, Daoan Zhang, Huichi Zhou, et al.

PAN：汎用的、インタラクティブな、長期ホライゾン世界シミュレーションを実現する世界モデル

エージェント

PAN Team Institute of Foundation Models, Jiannan Xiang, Yi Gu, et al.

潜在空間における一歩、ピクセルにおける飛躍的進歩：あなたの拡散モデル向け高速潜在上位化アダプタ

拡散モデル

Aleksandr Razin, Danil Kazantsev, Ilya Makarov

YOLOv13：ハイパーグラフ強化型適応型視覚認識を用いたリアルタイム物体検出

オブジェクト検出

オブジェクト追跡

Mengqi Lei, Siqi Li, Yihong Wu, et al.

MonkeyOCR：構造認識関係三重項パラダイムを用いたドキュメント解析

ドキュメント理解

Adam Tauman Kalai, Yael Tauman Kalai, Or Zamir

安全な生成AIのためのコンセンサスサンプリング

アルゴリズム

Adam Tauman Kalai, Yael Tauman Kalai, Or Zamir

Argus：エンドツーエンドADS向けレジリエンス指向型セーフティアサランスフレームワーク

ベンチマーク

Dingji Wang, You Lu, Bihuan Chen, et al.

WMPO：視覚言語行動モデルにおける世界モデルに基づく方策最適化

ロボティクス

Fangqi Zhu, Zhengyang Yan, Zicong Hong, et al.

TiViBench：Video生成モデルにおけるThink-in-Video推論のベンチマーク

Part-X-MLLM：部位認識型3Dマルチモーダル大規模言語モデル

Uni-MoE-2.0-Omni：高度なMoE、トレーニングおよびデータを用いた言語中心型オムニモーダル大規模モデルのスケーリング

P1：強化学習を用いた物理学オリンピックの習得

ランスロット：完全準同型暗号内における効率的かつプライバシー保護型のバシニンス耐性フェデレーテッドラーニングのためのアプローチ

変分自己符号化器を用いない潜在拡散モデル

RewardMap：マルチステージ強化学習を活用した詳細視覚推論におけるスパース報酬の克服

ReinFlow：オンライン強化学習を用いたフローマッチング方策のファインチューニング

推論能力の音声評価：モダリティに起因するパフォーマンス格差の診断

MarsRL：エージェントパイプライン並列化を用いた強化学習によるマルチエージェント推論システムの進展

バーチャル幅ネットワーク

AIonopedia：マルチモーダル学習を統合するLLMエージェントによるイオン液体の発見

UI2Code $^ ext{N}$ ：テスト時スケーラビリティを備えたインタラクティブなUIからCode生成のための視覚言語モデル

GGBench：統一型マルチモーダルモデル向けの幾何学的生成推論ベンチマーク

WEAVE：文脈内インタリーブド理解および生成の解放とベンチマーク

DoPE：ノイズ除去回転位置埋め込み

BRFL：ブロックチェーンベースのバジリスク耐性ファederated学習モデル

指数ガウス混合ネットワークを用いた動画視聴時間予測のためのマルチグレイン分布モデリング

SAC Flow：速度再パラメータ化による逐次モデル化を用いたサンプル効率の良い流れに基づく方策の強化学習

特徴最適アライメントを用いたクローズドソースMLLMに対する敵対的攻撃

Hail to the Thief: 分散型GRPOにおける攻撃と防御の探求

ブラックボックス・オンポリシー distillation による大規模言語モデルの学習

UniVA：オープンソース次世代動画汎用型エージェントへの道

PAN：汎用的、インタラクティブな、長期ホライゾン世界シミュレーションを実現する世界モデル

潜在空間における一歩、ピクセルにおける飛躍的進歩：あなたの拡散モデル向け高速潜在上位化アダプタ

YOLOv13：ハイパーグラフ強化型適応型視覚認識を用いたリアルタイム物体検出

MonkeyOCR：構造認識関係三重項パラダイムを用いたドキュメント解析

安全な生成AIのためのコンセンサスサンプリング

Argus：エンドツーエンドADS向けレジリエンス指向型セーフティアサランスフレームワーク

WMPO：視覚言語行動モデルにおける世界モデルに基づく方策最適化

TiViBench：Video生成モデルにおけるThink-in-Video推論のベンチマーク

Part-X-MLLM：部位認識型3Dマルチモーダル大規模言語モデル

Uni-MoE-2.0-Omni：高度なMoE、トレーニングおよびデータを用いた言語中心型オムニモーダル大規模モデルのスケーリング

P1：強化学習を用いた物理学オリンピックの習得

ランスロット：完全準同型暗号内における効率的かつプライバシー保護型のバシニンス耐性フェデレーテッドラーニングのためのアプローチ

変分自己符号化器を用いない潜在拡散モデル

RewardMap：マルチステージ強化学習を活用した詳細視覚推論におけるスパース報酬の克服

ReinFlow：オンライン強化学習を用いたフローマッチング方策のファインチューニング

推論能力の音声評価：モダリティに起因するパフォーマンス格差の診断

MarsRL：エージェントパイプライン並列化を用いた強化学習によるマルチエージェント推論システムの進展

バーチャル幅ネットワーク

AIonopedia：マルチモーダル学習を統合するLLMエージェントによるイオン液体の発見

UI2Code $^ ext{N}$ ：テスト時スケーラビリティを備えたインタラクティブなUIからCode生成のための視覚言語モデル

GGBench：統一型マルチモーダルモデル向けの幾何学的生成推論ベンチマーク

WEAVE：文脈内インタリーブド理解および生成の解放とベンチマーク

DoPE：ノイズ除去回転位置埋め込み

BRFL：ブロックチェーンベースのバジリスク耐性ファederated学習モデル

指数ガウス混合ネットワークを用いた動画視聴時間予測のためのマルチグレイン分布モデリング

SAC Flow：速度再パラメータ化による逐次モデル化を用いたサンプル効率の良い流れに基づく方策の強化学習

特徴最適アライメントを用いたクローズドソースMLLMに対する敵対的攻撃

Hail to the Thief: 分散型GRPOにおける攻撃と防御の探求

ブラックボックス・オンポリシー distillation による大規模言語モデルの学習

UniVA：オープンソース次世代動画汎用型エージェントへの道

PAN：汎用的、インタラクティブな、長期ホライゾン世界シミュレーションを実現する世界モデル

潜在空間における一歩、ピクセルにおける飛躍的進歩：あなたの拡散モデル向け高速潜在上位化アダプタ

YOLOv13：ハイパーグラフ強化型適応型視覚認識を用いたリアルタイム物体検出

MonkeyOCR：構造認識関係三重項パラダイムを用いたドキュメント解析

安全な生成AIのためのコンセンサスサンプリング

Argus：エンドツーエンドADS向けレジリエンス指向型セーフティアサランスフレームワーク

WMPO：視覚言語行動モデルにおける世界モデルに基づく方策最適化