HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
MarsRL:エージェントパイプライン並列化を用いた強化学習によるマルチエージェント推論システムの進展
強化学習
エージェント
Shulin Liu, Dong Du, Tao Yang, et al.
バーチャル幅ネットワーク
Transformer
モデル学習
Seed, Baisheng Li, Banggu Wu, et al.
AIonopedia:マルチモーダル学習を統合するLLMエージェントによるイオン液体の発見
LLM
マルチモーダル
Yuqi Yin, Yibo Fu, Siyuan Wang, et al.
UI2Code$^ ext{N}$:テスト時スケーラビリティを備えたインタラクティブなUIからCode生成のための視覚言語モデル
コード生成
LLM
Zhen Yang, Wenyi Hong, Mingde Xu, et al.
GGBench:統一型マルチモーダルモデル向けの幾何学的生成推論ベンチマーク
マルチモーダル
Any-to-Any
Jingxuan Wei, Caijun Jia, Xi Bai, et al.
WEAVE:文脈内インタリーブド理解および生成の解放とベンチマーク
Any-to-Any
画像生成
Wei Chow, Jiachun Pan, Yongyuan Liang, et al.
DoPE:ノイズ除去回転位置埋め込み
Transformer
LLM
Jing Xiong, Liyang Fan, Hui Shen, et al.
BRFL:ブロックチェーンベースのバジリスク耐性ファederated学習モデル
モデル学習
Security
Yang Li, Chunhe Xia, Chang Li, et al.
指数ガウス混合ネットワークを用いた動画視聴時間予測のためのマルチグレイン分布モデリング
ビデオ理解
ビデオ処理
Xu Zhao, Ruibo Ma, Jiaqi Chen, et al.
SAC Flow:速度再パラメータ化による逐次モデル化を用いたサンプル効率の良い流れに基づく方策の強化学習
強化学習
モデル学習
Yixian Zhang, Shu'ang Yu, Tonghe Zhang, et al.
特徴最適アライメントを用いたクローズドソースMLLMに対する敵対的攻撃
Transformer
マルチモーダル表現
Xiaojun Jia, Sensen Gao, Simeng Qin, et al.
Hail to the Thief: 分散型GRPOにおける攻撃と防御の探求
LLM
強化学習
Nikolay Blagoev, Oğuzhan Ersoy, Lydia Yiyu Chen
ブラックボックス・オンポリシー distillation による大規模言語モデルの学習
LLM
Preference Modeling
Tianzhu Ye, Li Dong, Zewen Chi, et al.
UniVA:オープンソース次世代動画汎用型エージェントへの道
ビデオ理解
Any-to-Any
Zhengyang Liang, Daoan Zhang, Huichi Zhou, et al.
PAN:汎用的、インタラクティブな、長期ホライゾン世界シミュレーションを実現する世界モデル
動画生成
エージェント
PAN Team Institute of Foundation Models, Jiannan Xiang, Yi Gu, et al.
潜在空間における一歩、ピクセルにおける飛躍的進歩:あなたの拡散モデル向け高速潜在上位化アダプタ
拡散モデル
画像生成
Aleksandr Razin, Danil Kazantsev, Ilya Makarov
YOLOv13:ハイパーグラフ強化型適応型視覚認識を用いたリアルタイム物体検出
オブジェクト検出
オブジェクト追跡
Mengqi Lei, Siqi Li, Yihong Wu, et al.
MonkeyOCR:構造認識関係三重項パラダイムを用いたドキュメント解析
ドキュメント理解
OCR
Adam Tauman Kalai, Yael Tauman Kalai, Or Zamir
安全な生成AIのためのコンセンサスサンプリング
アルゴリズム
LLM
Adam Tauman Kalai, Yael Tauman Kalai, Or Zamir
Argus:エンドツーエンドADS向けレジリエンス指向型セーフティアサランスフレームワーク
自動運転
ベンチマーク
Dingji Wang, You Lu, Bihuan Chen, et al.
WMPO:視覚言語行動モデルにおける世界モデルに基づく方策最適化
強化学習
ロボティクス
Fangqi Zhu, Zhengyang Yan, Zicong Hong, et al.
LoopTool:堅牢なLLMツール呼び出しのためのデータ-トレーニングループの閉じ方
LLM
モデル学習
Kangning Zhang, Wenxiang Jiao, Kounianhua Du, et al.
事実検索を超えて:生成的意味空間を用いたRAGにおけるエピソード記憶
検索拡張生成
Reasoning
Shreyas Rajesh, Pavan Holur, Chenda Duan, et al.
TiDAR:拡散で考える、自己回帰で話す
拡散モデル
Transformer
Jingyu Liu, Xin Dong, Zhifan Ye, et al.
Time-to-Move:二時計同期ノイズ除去を用いた訓練不要なモーション制御動画生成
画像から動画生成
拡散モデル
Assaf Singer, Noam Rotstein, Amir Mann, et al.
ルミネ:3Dオープンワールドにおける汎用エージェント構築のためのオープンレシピ
エージェント
Reasoning
Weihao Tan, Xiangyang Li, Yunhao Fang, et al.
1,000語から画像を生成する:構造化キャプションを用いたテキストから画像生成の向上
テキストから画像生成
画像生成
Eyal Gutflaish, Eliran Kachlon, Hezi Zisman, et al.
KLASS:マスク付き拡散モデルにおけるKLガイド付き高速推論
拡散モデル
自然言語処理
Seo Hyun Kim, Sunwoo Hong, Hojung Jung, et al.
人間の示範に基づくコンピュータ利用エージェントの基盤化
データセット
ドキュメント理解
Aarash Feizi, Shravan Nayak, Xiangru Jian, et al.
Wasm:構造化アラビア語混合マルチモーダルコーパス構築のためのパイプライン
マルチモーダル
データセット
Khalil Hennara, Ahmad Bastati, Muhammad Hreden, et al.
会話システムにおける適応型マルチエージェント応答精緻化
エージェント
LLM
Soyeong Jeong, Aparna Elangovan, Emine Yilmaz, et al.
SPAN:モノクローラル3次元オブジェクト検出のための空間投影アライメント
オブジェクト検出
3D マシンビジョン
Yifan Wang, Yian Zhao, Fanqi Pu, et al.
1
15
16
17
18
19
20
21
49
MarsRL:エージェントパイプライン並列化を用いた強化学習によるマルチエージェント推論システムの進展
強化学習
エージェント
Shulin Liu, Dong Du, Tao Yang, et al.
バーチャル幅ネットワーク
Transformer
モデル学習
Seed, Baisheng Li, Banggu Wu, et al.
AIonopedia:マルチモーダル学習を統合するLLMエージェントによるイオン液体の発見
LLM
マルチモーダル
Yuqi Yin, Yibo Fu, Siyuan Wang, et al.
UI2Code$^ ext{N}$:テスト時スケーラビリティを備えたインタラクティブなUIからCode生成のための視覚言語モデル
コード生成
LLM
Zhen Yang, Wenyi Hong, Mingde Xu, et al.
GGBench:統一型マルチモーダルモデル向けの幾何学的生成推論ベンチマーク
マルチモーダル
Any-to-Any
Jingxuan Wei, Caijun Jia, Xi Bai, et al.
WEAVE:文脈内インタリーブド理解および生成の解放とベンチマーク
Any-to-Any
画像生成
Wei Chow, Jiachun Pan, Yongyuan Liang, et al.
DoPE:ノイズ除去回転位置埋め込み
Transformer
LLM
Jing Xiong, Liyang Fan, Hui Shen, et al.
BRFL:ブロックチェーンベースのバジリスク耐性ファederated学習モデル
モデル学習
Security
Yang Li, Chunhe Xia, Chang Li, et al.
指数ガウス混合ネットワークを用いた動画視聴時間予測のためのマルチグレイン分布モデリング
ビデオ理解
ビデオ処理
Xu Zhao, Ruibo Ma, Jiaqi Chen, et al.
SAC Flow:速度再パラメータ化による逐次モデル化を用いたサンプル効率の良い流れに基づく方策の強化学習
強化学習
モデル学習
Yixian Zhang, Shu'ang Yu, Tonghe Zhang, et al.
特徴最適アライメントを用いたクローズドソースMLLMに対する敵対的攻撃
Transformer
マルチモーダル表現
Xiaojun Jia, Sensen Gao, Simeng Qin, et al.
Hail to the Thief: 分散型GRPOにおける攻撃と防御の探求
LLM
強化学習
Nikolay Blagoev, Oğuzhan Ersoy, Lydia Yiyu Chen
ブラックボックス・オンポリシー distillation による大規模言語モデルの学習
LLM
Preference Modeling
Tianzhu Ye, Li Dong, Zewen Chi, et al.
UniVA:オープンソース次世代動画汎用型エージェントへの道
ビデオ理解
Any-to-Any
Zhengyang Liang, Daoan Zhang, Huichi Zhou, et al.
PAN:汎用的、インタラクティブな、長期ホライゾン世界シミュレーションを実現する世界モデル
動画生成
エージェント
PAN Team Institute of Foundation Models, Jiannan Xiang, Yi Gu, et al.
潜在空間における一歩、ピクセルにおける飛躍的進歩:あなたの拡散モデル向け高速潜在上位化アダプタ
拡散モデル
画像生成
Aleksandr Razin, Danil Kazantsev, Ilya Makarov
YOLOv13:ハイパーグラフ強化型適応型視覚認識を用いたリアルタイム物体検出
オブジェクト検出
オブジェクト追跡
Mengqi Lei, Siqi Li, Yihong Wu, et al.
MonkeyOCR:構造認識関係三重項パラダイムを用いたドキュメント解析
ドキュメント理解
OCR
Adam Tauman Kalai, Yael Tauman Kalai, Or Zamir
安全な生成AIのためのコンセンサスサンプリング
アルゴリズム
LLM
Adam Tauman Kalai, Yael Tauman Kalai, Or Zamir
Argus:エンドツーエンドADS向けレジリエンス指向型セーフティアサランスフレームワーク
自動運転
ベンチマーク
Dingji Wang, You Lu, Bihuan Chen, et al.
WMPO:視覚言語行動モデルにおける世界モデルに基づく方策最適化
強化学習
ロボティクス
Fangqi Zhu, Zhengyang Yan, Zicong Hong, et al.
LoopTool:堅牢なLLMツール呼び出しのためのデータ-トレーニングループの閉じ方
LLM
モデル学習
Kangning Zhang, Wenxiang Jiao, Kounianhua Du, et al.
事実検索を超えて:生成的意味空間を用いたRAGにおけるエピソード記憶
検索拡張生成
Reasoning
Shreyas Rajesh, Pavan Holur, Chenda Duan, et al.
TiDAR:拡散で考える、自己回帰で話す
拡散モデル
Transformer
Jingyu Liu, Xin Dong, Zhifan Ye, et al.
Time-to-Move:二時計同期ノイズ除去を用いた訓練不要なモーション制御動画生成
画像から動画生成
拡散モデル
Assaf Singer, Noam Rotstein, Amir Mann, et al.
ルミネ:3Dオープンワールドにおける汎用エージェント構築のためのオープンレシピ
エージェント
Reasoning
Weihao Tan, Xiangyang Li, Yunhao Fang, et al.
1,000語から画像を生成する:構造化キャプションを用いたテキストから画像生成の向上
テキストから画像生成
画像生成
Eyal Gutflaish, Eliran Kachlon, Hezi Zisman, et al.
KLASS:マスク付き拡散モデルにおけるKLガイド付き高速推論
拡散モデル
自然言語処理
Seo Hyun Kim, Sunwoo Hong, Hojung Jung, et al.
人間の示範に基づくコンピュータ利用エージェントの基盤化
データセット
ドキュメント理解
Aarash Feizi, Shravan Nayak, Xiangru Jian, et al.
Wasm:構造化アラビア語混合マルチモーダルコーパス構築のためのパイプライン
マルチモーダル
データセット
Khalil Hennara, Ahmad Bastati, Muhammad Hreden, et al.
会話システムにおける適応型マルチエージェント応答精緻化
エージェント
LLM
Soyeong Jeong, Aparna Elangovan, Emine Yilmaz, et al.
SPAN:モノクローラル3次元オブジェクト検出のための空間投影アライメント
オブジェクト検出
3D マシンビジョン
Yifan Wang, Yian Zhao, Fanqi Pu, et al.
1
15
16
17
18
19
20
21
49