HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
Part-X-MLLM:部位認識型3Dマルチモーダル大規模言語モデル
Any-to-Any
3D生成
Chunshi Wang, Junliang Ye, Yunhan Yang, et al.
Uni-MoE-2.0-Omni:高度なMoE、トレーニングおよびデータを用いた言語中心型オムニモーダル大規模モデルのスケーリング
Any-to-Any
LLM
Yunxin Li, Xinyu Chen, Shenyuan Jiang, et al.
P1:強化学習を用いた物理学オリンピックの習得
Reasoning
LLM
Jiacheng Chen, Qianjia Cheng, Fangchen Yu, et al.
ランスロット:完全準同型暗号内における効率的かつプライバシー保護型のバシニンス耐性フェデレーテッドラーニングのためのアプローチ
コンピュータビジョン
ニューラルネットワーク
Siyang Jiang, Hao Yang, Qipeng Xie, et al.
変分自己符号化器を用いない潜在拡散モデル
拡散モデル
画像生成
Minglei Shi, Haolin Wang, Wenzhao Zheng, et al.
RewardMap:マルチステージ強化学習を活用した詳細視覚推論におけるスパース報酬の克服
視覚質問応答
強化学習
Sicheng Feng, Kaiwen Tuo, Song Wang, et al.
ReinFlow:オンライン強化学習を用いたフローマッチング方策のファインチューニング
強化学習
拡散モデル
Tonghe Zhang, Chao Yu, Sichang Su, et al.
推論能力の音声評価:モダリティに起因するパフォーマンス格差の診断
ベンチマーク
音声および音声処理
Yueqian Lin, Zhengmian Hu, Qinsi Wang, et al.
MarsRL:エージェントパイプライン並列化を用いた強化学習によるマルチエージェント推論システムの進展
強化学習
エージェント
Shulin Liu, Dong Du, Tao Yang, et al.
バーチャル幅ネットワーク
Transformer
モデル学習
Seed, Baisheng Li, Banggu Wu, et al.
AIonopedia:マルチモーダル学習を統合するLLMエージェントによるイオン液体の発見
LLM
マルチモーダル
Yuqi Yin, Yibo Fu, Siyuan Wang, et al.
UI2Code$^ ext{N}$:テスト時スケーラビリティを備えたインタラクティブなUIからCode生成のための視覚言語モデル
コード生成
LLM
Zhen Yang, Wenyi Hong, Mingde Xu, et al.
GGBench:統一型マルチモーダルモデル向けの幾何学的生成推論ベンチマーク
マルチモーダル
Any-to-Any
Jingxuan Wei, Caijun Jia, Xi Bai, et al.
WEAVE:文脈内インタリーブド理解および生成の解放とベンチマーク
Any-to-Any
画像生成
Wei Chow, Jiachun Pan, Yongyuan Liang, et al.
DoPE:ノイズ除去回転位置埋め込み
Transformer
LLM
Jing Xiong, Liyang Fan, Hui Shen, et al.
BRFL:ブロックチェーンベースのバジリスク耐性ファederated学習モデル
モデル学習
Security
Yang Li, Chunhe Xia, Chang Li, et al.
指数ガウス混合ネットワークを用いた動画視聴時間予測のためのマルチグレイン分布モデリング
ビデオ理解
ビデオ処理
Xu Zhao, Ruibo Ma, Jiaqi Chen, et al.
SAC Flow:速度再パラメータ化による逐次モデル化を用いたサンプル効率の良い流れに基づく方策の強化学習
強化学習
モデル学習
Yixian Zhang, Shu'ang Yu, Tonghe Zhang, et al.
特徴最適アライメントを用いたクローズドソースMLLMに対する敵対的攻撃
Transformer
マルチモーダル表現
Xiaojun Jia, Sensen Gao, Simeng Qin, et al.
Hail to the Thief: 分散型GRPOにおける攻撃と防御の探求
LLM
強化学習
Nikolay Blagoev, Oğuzhan Ersoy, Lydia Yiyu Chen
ブラックボックス・オンポリシー distillation による大規模言語モデルの学習
LLM
Preference Modeling
Tianzhu Ye, Li Dong, Zewen Chi, et al.
UniVA:オープンソース次世代動画汎用型エージェントへの道
ビデオ理解
Any-to-Any
Zhengyang Liang, Daoan Zhang, Huichi Zhou, et al.
PAN:汎用的、インタラクティブな、長期ホライゾン世界シミュレーションを実現する世界モデル
動画生成
エージェント
PAN Team Institute of Foundation Models, Jiannan Xiang, Yi Gu, et al.
潜在空間における一歩、ピクセルにおける飛躍的進歩:あなたの拡散モデル向け高速潜在上位化アダプタ
拡散モデル
画像生成
Aleksandr Razin, Danil Kazantsev, Ilya Makarov
YOLOv13:ハイパーグラフ強化型適応型視覚認識を用いたリアルタイム物体検出
オブジェクト検出
オブジェクト追跡
Mengqi Lei, Siqi Li, Yihong Wu, et al.
MonkeyOCR:構造認識関係三重項パラダイムを用いたドキュメント解析
ドキュメント理解
OCR
Adam Tauman Kalai, Yael Tauman Kalai, Or Zamir
安全な生成AIのためのコンセンサスサンプリング
アルゴリズム
LLM
Adam Tauman Kalai, Yael Tauman Kalai, Or Zamir
Argus:エンドツーエンドADS向けレジリエンス指向型セーフティアサランスフレームワーク
自動運転
ベンチマーク
Dingji Wang, You Lu, Bihuan Chen, et al.
WMPO:視覚言語行動モデルにおける世界モデルに基づく方策最適化
強化学習
ロボティクス
Fangqi Zhu, Zhengyang Yan, Zicong Hong, et al.
LoopTool:堅牢なLLMツール呼び出しのためのデータ-トレーニングループの閉じ方
LLM
モデル学習
Kangning Zhang, Wenxiang Jiao, Kounianhua Du, et al.
事実検索を超えて:生成的意味空間を用いたRAGにおけるエピソード記憶
検索拡張生成
Reasoning
Shreyas Rajesh, Pavan Holur, Chenda Duan, et al.
TiDAR:拡散で考える、自己回帰で話す
拡散モデル
Transformer
Jingyu Liu, Xin Dong, Zhifan Ye, et al.
1
13
14
15
16
17
18
19
47
Part-X-MLLM:部位認識型3Dマルチモーダル大規模言語モデル
Any-to-Any
3D生成
Chunshi Wang, Junliang Ye, Yunhan Yang, et al.
Uni-MoE-2.0-Omni:高度なMoE、トレーニングおよびデータを用いた言語中心型オムニモーダル大規模モデルのスケーリング
Any-to-Any
LLM
Yunxin Li, Xinyu Chen, Shenyuan Jiang, et al.
P1:強化学習を用いた物理学オリンピックの習得
Reasoning
LLM
Jiacheng Chen, Qianjia Cheng, Fangchen Yu, et al.
ランスロット:完全準同型暗号内における効率的かつプライバシー保護型のバシニンス耐性フェデレーテッドラーニングのためのアプローチ
コンピュータビジョン
ニューラルネットワーク
Siyang Jiang, Hao Yang, Qipeng Xie, et al.
変分自己符号化器を用いない潜在拡散モデル
拡散モデル
画像生成
Minglei Shi, Haolin Wang, Wenzhao Zheng, et al.
RewardMap:マルチステージ強化学習を活用した詳細視覚推論におけるスパース報酬の克服
視覚質問応答
強化学習
Sicheng Feng, Kaiwen Tuo, Song Wang, et al.
ReinFlow:オンライン強化学習を用いたフローマッチング方策のファインチューニング
強化学習
拡散モデル
Tonghe Zhang, Chao Yu, Sichang Su, et al.
推論能力の音声評価:モダリティに起因するパフォーマンス格差の診断
ベンチマーク
音声および音声処理
Yueqian Lin, Zhengmian Hu, Qinsi Wang, et al.
MarsRL:エージェントパイプライン並列化を用いた強化学習によるマルチエージェント推論システムの進展
強化学習
エージェント
Shulin Liu, Dong Du, Tao Yang, et al.
バーチャル幅ネットワーク
Transformer
モデル学習
Seed, Baisheng Li, Banggu Wu, et al.
AIonopedia:マルチモーダル学習を統合するLLMエージェントによるイオン液体の発見
LLM
マルチモーダル
Yuqi Yin, Yibo Fu, Siyuan Wang, et al.
UI2Code$^ ext{N}$:テスト時スケーラビリティを備えたインタラクティブなUIからCode生成のための視覚言語モデル
コード生成
LLM
Zhen Yang, Wenyi Hong, Mingde Xu, et al.
GGBench:統一型マルチモーダルモデル向けの幾何学的生成推論ベンチマーク
マルチモーダル
Any-to-Any
Jingxuan Wei, Caijun Jia, Xi Bai, et al.
WEAVE:文脈内インタリーブド理解および生成の解放とベンチマーク
Any-to-Any
画像生成
Wei Chow, Jiachun Pan, Yongyuan Liang, et al.
DoPE:ノイズ除去回転位置埋め込み
Transformer
LLM
Jing Xiong, Liyang Fan, Hui Shen, et al.
BRFL:ブロックチェーンベースのバジリスク耐性ファederated学習モデル
モデル学習
Security
Yang Li, Chunhe Xia, Chang Li, et al.
指数ガウス混合ネットワークを用いた動画視聴時間予測のためのマルチグレイン分布モデリング
ビデオ理解
ビデオ処理
Xu Zhao, Ruibo Ma, Jiaqi Chen, et al.
SAC Flow:速度再パラメータ化による逐次モデル化を用いたサンプル効率の良い流れに基づく方策の強化学習
強化学習
モデル学習
Yixian Zhang, Shu'ang Yu, Tonghe Zhang, et al.
特徴最適アライメントを用いたクローズドソースMLLMに対する敵対的攻撃
Transformer
マルチモーダル表現
Xiaojun Jia, Sensen Gao, Simeng Qin, et al.
Hail to the Thief: 分散型GRPOにおける攻撃と防御の探求
LLM
強化学習
Nikolay Blagoev, Oğuzhan Ersoy, Lydia Yiyu Chen
ブラックボックス・オンポリシー distillation による大規模言語モデルの学習
LLM
Preference Modeling
Tianzhu Ye, Li Dong, Zewen Chi, et al.
UniVA:オープンソース次世代動画汎用型エージェントへの道
ビデオ理解
Any-to-Any
Zhengyang Liang, Daoan Zhang, Huichi Zhou, et al.
PAN:汎用的、インタラクティブな、長期ホライゾン世界シミュレーションを実現する世界モデル
動画生成
エージェント
PAN Team Institute of Foundation Models, Jiannan Xiang, Yi Gu, et al.
潜在空間における一歩、ピクセルにおける飛躍的進歩:あなたの拡散モデル向け高速潜在上位化アダプタ
拡散モデル
画像生成
Aleksandr Razin, Danil Kazantsev, Ilya Makarov
YOLOv13:ハイパーグラフ強化型適応型視覚認識を用いたリアルタイム物体検出
オブジェクト検出
オブジェクト追跡
Mengqi Lei, Siqi Li, Yihong Wu, et al.
MonkeyOCR:構造認識関係三重項パラダイムを用いたドキュメント解析
ドキュメント理解
OCR
Adam Tauman Kalai, Yael Tauman Kalai, Or Zamir
安全な生成AIのためのコンセンサスサンプリング
アルゴリズム
LLM
Adam Tauman Kalai, Yael Tauman Kalai, Or Zamir
Argus:エンドツーエンドADS向けレジリエンス指向型セーフティアサランスフレームワーク
自動運転
ベンチマーク
Dingji Wang, You Lu, Bihuan Chen, et al.
WMPO:視覚言語行動モデルにおける世界モデルに基づく方策最適化
強化学習
ロボティクス
Fangqi Zhu, Zhengyang Yan, Zicong Hong, et al.
LoopTool:堅牢なLLMツール呼び出しのためのデータ-トレーニングループの閉じ方
LLM
モデル学習
Kangning Zhang, Wenxiang Jiao, Kounianhua Du, et al.
事実検索を超えて:生成的意味空間を用いたRAGにおけるエピソード記憶
検索拡張生成
Reasoning
Shreyas Rajesh, Pavan Holur, Chenda Duan, et al.
TiDAR:拡散で考える、自己回帰で話す
拡散モデル
Transformer
Jingyu Liu, Xin Dong, Zhifan Ye, et al.
1
13
14
15
16
17
18
19
47