HyperAI
HyperAI超神経
ホーム
プラットフォーム
ドキュメント
ニュース
論文
Notebooks
データセット
百科事典
SOTA
LLMモデル
GPU ランキング
学会
検索
サイトについて
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
サイトを検索…
⌘
K
Command Palette
Search for a command to run...
Console
サインイン
ホーム
論文
論文
日々更新される最先端AI研究論文、人工知能の最新動向を把握
HyperAI
HyperAI超神経
ホーム
プラットフォーム
ドキュメント
ニュース
論文
Notebooks
データセット
百科事典
SOTA
LLMモデル
GPU ランキング
学会
検索
サイトについて
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
サイトを検索…
⌘
K
Command Palette
Search for a command to run...
Console
サインイン
ホーム
論文
論文
日々更新される最先端AI研究論文、人工知能の最新動向を把握
Console
Console
論文 | HyperAI超神経
推論能力の音声評価:モダリティに起因するパフォーマンス格差の診断
Yueqian Lin, Zhengmian Hu, Qinsi Wang, et al.
MarsRL:エージェントパイプライン並列化を用いた強化学習によるマルチエージェント推論システムの進展
Shulin Liu, Dong Du, Tao Yang, et al.
バーチャル幅ネットワーク
Seed, Baisheng Li, Banggu Wu, et al.
AIonopedia:マルチモーダル学習を統合するLLMエージェントによるイオン液体の発見
Yuqi Yin, Yibo Fu, Siyuan Wang, et al.
UI2Code$^ ext{N}$:テスト時スケーラビリティを備えたインタラクティブなUIからCode生成のための視覚言語モデル
Zhen Yang, Wenyi Hong, Mingde Xu, et al.
GGBench:統一型マルチモーダルモデル向けの幾何学的生成推論ベンチマーク
Jingxuan Wei, Caijun Jia, Xi Bai, et al.
WEAVE:文脈内インタリーブド理解および生成の解放とベンチマーク
Wei Chow, Jiachun Pan, Yongyuan Liang, et al.
DoPE:ノイズ除去回転位置埋め込み
Jing Xiong, Liyang Fan, Hui Shen, et al.
BRFL:ブロックチェーンベースのバジリスク耐性ファederated学習モデル
Yang Li, Chunhe Xia, Chang Li, et al.
指数ガウス混合ネットワークを用いた動画視聴時間予測のためのマルチグレイン分布モデリング
Xu Zhao, Ruibo Ma, Jiaqi Chen, et al.
SAC Flow:速度再パラメータ化による逐次モデル化を用いたサンプル効率の良い流れに基づく方策の強化学習
Yixian Zhang, Shu'ang Yu, Tonghe Zhang, et al.
特徴最適アライメントを用いたクローズドソースMLLMに対する敵対的攻撃
Xiaojun Jia, Sensen Gao, Simeng Qin, et al.
Hail to the Thief: 分散型GRPOにおける攻撃と防御の探求
Nikolay Blagoev, Oğuzhan Ersoy, Lydia Yiyu Chen
Depth Anything 3:あらゆる視点から視覚空間を回復する
Haotong Lin, Sili Chen, Junhao Liew, et al.
ブラックボックス・オンポリシー distillation による大規模言語モデルの学習
Tianzhu Ye, Li Dong, Zewen Chi, et al.
UniVA:オープンソース次世代動画汎用型エージェントへの道
Zhengyang Liang, Daoan Zhang, Huichi Zhou, et al.
PAN:汎用的、インタラクティブな、長期ホライゾン世界シミュレーションを実現する世界モデル
PAN Team Institute of Foundation Models, Jiannan Xiang, Yi Gu, et al.
潜在空間における一歩、ピクセルにおける飛躍的進歩:あなたの拡散モデル向け高速潜在上位化アダプタ
Aleksandr Razin, Danil Kazantsev, Ilya Makarov
YOLOv13:ハイパーグラフ強化型適応型視覚認識を用いたリアルタイム物体検出
Mengqi Lei, Siqi Li, Yihong Wu, et al.
MonkeyOCR:構造認識関係三重項パラダイムを用いたドキュメント解析
Adam Tauman Kalai, Yael Tauman Kalai, Or Zamir
安全な生成AIのためのコンセンサスサンプリング
Adam Tauman Kalai, Yael Tauman Kalai, Or Zamir
Argus:エンドツーエンドADS向けレジリエンス指向型セーフティアサランスフレームワーク
Dingji Wang, You Lu, Bihuan Chen, et al.
WMPO:視覚言語行動モデルにおける世界モデルに基づく方策最適化
Fangqi Zhu, Zhengyang Yan, Zicong Hong, et al.
LoopTool:堅牢なLLMツール呼び出しのためのデータ-トレーニングループの閉じ方
Kangning Zhang, Wenxiang Jiao, Kounianhua Du, et al.
事実検索を超えて:生成的意味空間を用いたRAGにおけるエピソード記憶
Shreyas Rajesh, Pavan Holur, Chenda Duan, et al.
TiDAR:拡散で考える、自己回帰で話す
Jingyu Liu, Xin Dong, Zhifan Ye, et al.
Time-to-Move:二時計同期ノイズ除去を用いた訓練不要なモーション制御動画生成
Assaf Singer, Noam Rotstein, Amir Mann, et al.
ルミネ:3Dオープンワールドにおける汎用エージェント構築のためのオープンレシピ
Weihao Tan, Xiangyang Li, Yunhao Fang, et al.
1,000語から画像を生成する:構造化キャプションを用いたテキストから画像生成の向上
Eyal Gutflaish, Eliran Kachlon, Hezi Zisman, et al.
KLASS:マスク付き拡散モデルにおけるKLガイド付き高速推論
Seo Hyun Kim, Sunwoo Hong, Hojung Jung, et al.
人間の示範に基づくコンピュータ利用エージェントの基盤化
Aarash Feizi, Shravan Nayak, Xiangru Jian, et al.
Wasm:構造化アラビア語混合マルチモーダルコーパス構築のためのパイプライン
Khalil Hennara, Ahmad Bastati, Muhammad Hreden, et al.
1
5
6
7
8
9
10
11
39
推論能力の音声評価:モダリティに起因するパフォーマンス格差の診断
Yueqian Lin, Zhengmian Hu, Qinsi Wang, et al.
MarsRL:エージェントパイプライン並列化を用いた強化学習によるマルチエージェント推論システムの進展
Shulin Liu, Dong Du, Tao Yang, et al.
バーチャル幅ネットワーク
Seed, Baisheng Li, Banggu Wu, et al.
AIonopedia:マルチモーダル学習を統合するLLMエージェントによるイオン液体の発見
Yuqi Yin, Yibo Fu, Siyuan Wang, et al.
UI2Code$^ ext{N}$:テスト時スケーラビリティを備えたインタラクティブなUIからCode生成のための視覚言語モデル
Zhen Yang, Wenyi Hong, Mingde Xu, et al.
GGBench:統一型マルチモーダルモデル向けの幾何学的生成推論ベンチマーク
Jingxuan Wei, Caijun Jia, Xi Bai, et al.
WEAVE:文脈内インタリーブド理解および生成の解放とベンチマーク
Wei Chow, Jiachun Pan, Yongyuan Liang, et al.
DoPE:ノイズ除去回転位置埋め込み
Jing Xiong, Liyang Fan, Hui Shen, et al.
BRFL:ブロックチェーンベースのバジリスク耐性ファederated学習モデル
Yang Li, Chunhe Xia, Chang Li, et al.
指数ガウス混合ネットワークを用いた動画視聴時間予測のためのマルチグレイン分布モデリング
Xu Zhao, Ruibo Ma, Jiaqi Chen, et al.
SAC Flow:速度再パラメータ化による逐次モデル化を用いたサンプル効率の良い流れに基づく方策の強化学習
Yixian Zhang, Shu'ang Yu, Tonghe Zhang, et al.
特徴最適アライメントを用いたクローズドソースMLLMに対する敵対的攻撃
Xiaojun Jia, Sensen Gao, Simeng Qin, et al.
Hail to the Thief: 分散型GRPOにおける攻撃と防御の探求
Nikolay Blagoev, Oğuzhan Ersoy, Lydia Yiyu Chen
Depth Anything 3:あらゆる視点から視覚空間を回復する
Haotong Lin, Sili Chen, Junhao Liew, et al.
ブラックボックス・オンポリシー distillation による大規模言語モデルの学習
Tianzhu Ye, Li Dong, Zewen Chi, et al.
UniVA:オープンソース次世代動画汎用型エージェントへの道
Zhengyang Liang, Daoan Zhang, Huichi Zhou, et al.
PAN:汎用的、インタラクティブな、長期ホライゾン世界シミュレーションを実現する世界モデル
PAN Team Institute of Foundation Models, Jiannan Xiang, Yi Gu, et al.
潜在空間における一歩、ピクセルにおける飛躍的進歩:あなたの拡散モデル向け高速潜在上位化アダプタ
Aleksandr Razin, Danil Kazantsev, Ilya Makarov
YOLOv13:ハイパーグラフ強化型適応型視覚認識を用いたリアルタイム物体検出
Mengqi Lei, Siqi Li, Yihong Wu, et al.
MonkeyOCR:構造認識関係三重項パラダイムを用いたドキュメント解析
Adam Tauman Kalai, Yael Tauman Kalai, Or Zamir
安全な生成AIのためのコンセンサスサンプリング
Adam Tauman Kalai, Yael Tauman Kalai, Or Zamir
Argus:エンドツーエンドADS向けレジリエンス指向型セーフティアサランスフレームワーク
Dingji Wang, You Lu, Bihuan Chen, et al.
WMPO:視覚言語行動モデルにおける世界モデルに基づく方策最適化
Fangqi Zhu, Zhengyang Yan, Zicong Hong, et al.
LoopTool:堅牢なLLMツール呼び出しのためのデータ-トレーニングループの閉じ方
Kangning Zhang, Wenxiang Jiao, Kounianhua Du, et al.
事実検索を超えて:生成的意味空間を用いたRAGにおけるエピソード記憶
Shreyas Rajesh, Pavan Holur, Chenda Duan, et al.
TiDAR:拡散で考える、自己回帰で話す
Jingyu Liu, Xin Dong, Zhifan Ye, et al.
Time-to-Move:二時計同期ノイズ除去を用いた訓練不要なモーション制御動画生成
Assaf Singer, Noam Rotstein, Amir Mann, et al.
ルミネ:3Dオープンワールドにおける汎用エージェント構築のためのオープンレシピ
Weihao Tan, Xiangyang Li, Yunhao Fang, et al.
1,000語から画像を生成する:構造化キャプションを用いたテキストから画像生成の向上
Eyal Gutflaish, Eliran Kachlon, Hezi Zisman, et al.
KLASS:マスク付き拡散モデルにおけるKLガイド付き高速推論
Seo Hyun Kim, Sunwoo Hong, Hojung Jung, et al.
人間の示範に基づくコンピュータ利用エージェントの基盤化
Aarash Feizi, Shravan Nayak, Xiangru Jian, et al.
Wasm:構造化アラビア語混合マルチモーダルコーパス構築のためのパイプライン
Khalil Hennara, Ahmad Bastati, Muhammad Hreden, et al.
1
5
6
7
8
9
10
11
39