HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
環境スケーリングによる汎用エージェント型知能の実現
エージェント
LLM
Runnan Fang, Shihao Cai, Baixuan Li, et al.
WebSailor-V2:合成データとスケーラブルな強化学習を活用した独自エージェントへの橋渡し
エージェント
強化学習
Kuan Li, Zhongwang Zhang, Huifeng Yin, et al.
継続的事前学習によるエージェントのスケーリング
エージェント
LLM
Liangcai Su, Zhen Zhang, Guangyu Li, et al.
WebWeaver:動的アウトラインを用いたスケールのWeb証拠の構造化による開かれた深層研究
検索拡張生成
エージェント
Zijian Li, Xin Guan, Bo Zhang, et al.
大規模言語モデルにおけるグリッチトークン:分類ファセットと効果的な検出
LLM
Transformer
Yuxi Li, Yi Liu, Gelei Deng, et al.
REFRAG:RAGに基づくデコードの再考
検索拡張生成
LLM
Xiaoqiang Lin, Aritra Ghosh, Bryan Kian Hsiang Low, et al.
アライン・セントゥスティア:統合潜在ガイドにより視覚言語行動モデルの適応
Any-to-Any
マルチタスク学習
Yang Zhang, Chenwei Wang, Ouyang Lu, et al.
SubLIME:データ効率的なLLM評価のためのランク相関予測によるサブセット選定
LLM
データセット
Gayathri Saranathan, Cong Xu, Mahammad Parwez Alam, et al.
長時間動画生成のためのコンテキスト混合
動画生成
Transformer
Shengqu Cai, Ceyuan Yang, Lvmin Zhang, et al.
MusicSwarm:音楽作曲のための生物学的インスパイアード・インテリジェンス
ディープラーニング
モデリング
Markus J. Buehler
LEGO:テンソル応用における空間的加速器生成と最適化
AI コンパイラ
LLM
Yujun Lin, Zhekai Zhang, Song Han
LazyDrag:明示的対応関係を用いたマルチモーダル拡散トランスフォーマーにおける安定なドラッグベース編集の実現
拡散モデル
マルチモーダル
Zixin Yin, Xili Dai, Duomin Wang, et al.
SearchInstruct:検索ベースの指示データセット作成によるドメイン適応の向上
監視付き微調整
検索拡張生成
Iman Barati, Mostafa Amiri, Heshaam Faili
解釈可能な物理学的推論と視覚言語モデルにおけるパフォーマンス分類
マルチモーダル
Reasoning
Pranav Pawar, Kavish Shah, Akshat Bhalani, et al.
InternScenes:現実的なレイアウトを備えた大規模なシミュラブルな屋内シーンデータセット
3Dモデル
データセット
Weipeng Zhong, Peizhou Cao, Yichen Jin, et al.
UI-S1:セミオンライン強化学習を活用したGUI自動化の進展
強化学習
エージェント
Zhengxi Lu, Jiabo Ye, Fei Tang, et al.
OmniWorld:4Dワールドモデリングのためのマルチドメイン・マルチモーダルデータセット
データセット
ビデオ理解
Yang Zhou, Yifan Wang, Jianjun Zhou, et al.
LAVa:階層別KVキャッシュ除外と動的予算割り当て
LLM
Transformer
Yiqun Shen, Song Yuan, Zhengze Zhang, et al.
確率構造統合を用いた世界モデリング
モデリング
ビデオ理解
Klemen Kotar, Wanhee Lee, Rahul Venkatesh, et al.
VStyle:音声スタイル適応のためのベンチマーク(口頭指示付き)
Text-to-Speech
Any-to-Any
Jun Zhan, Mingyang Han, Yuxuan Xie, et al.
HANRAG:ヒューリスティックかつ高精度・ノイズ耐性を備えたマルチホップ質問応答のためのリトリーブ増強生成
検索拡張生成
LLM
Duolin Sun, Dan Yang, Yue Shen, et al.
InfGen:スケーラビリティを考慮した解像度無差別な画像生成パラダイム
拡散モデル
画像生成
Tao Han, Wanghan Xu, Junchao Gong, et al.
X-Part:高忠実度かつ構造整合性を有する形状分解
3D生成
セマンティックセグメンテーション
Xinhao Yan, Jiachen Xu, Yang Li, et al.
リターンの逓減の錯覚:大規模言語モデルにおける長期的実行の測定
LLM
Reasoning
Akshit Sinha, Arvindh Arun, Shashwat Goel, et al.
IntrEx:教育的対話における関与をモデル化するためのデータセット
データセット
LLM
Xingwei Tan, Mahathi Parvatham, Chiara Gambi, et al.
Youtu-GraphRAG:グラフ検索拡張型複雑推論のための垂直統合型エージェント
検索拡張生成
LLM
Junnan Dong, Siyu An, Yifei Yu, et al.
SceneSplat:視覚言語事前学習を活用したガウシアンスプラッティングベースのシーン理解
3D マシンビジョン
マルチモーダル表現
Yue Li, Qi Ma, Runyi Yang, et al.
バーチャルエージェント経済
エージェント
Preference Modeling
Nenad Tomasev, Matija Franklin, Joel Z. Leibo, et al.
視覚言語モデルにおける視覚基盤の理解に向けて
マルチモーダル
マルチモーダル表現
Georgios Pantazopoulos, Eda B. Özyiğit
Kling-Avatar:段階的長時間アバターアニメーション合成のためのマルチモーダル指示の基盤化
Any-to-Any
マルチモーダル表現
Yikang Ding, Jiwen Liu, Wenyuan Zhang, et al.
機械学習LM:数百万の合成テーブル予測タスク上で継続的に事前学習された言語モデルが、文脈内機械学習をスケーリングする
LLM
機械学習
Haoyu Dong, Pengkun Zhang, Mingzhe Lu, et al.
エコーエックス:音声対音声LLMにおける音響的・意味的ギャップ低減のためのエコー学習へ
LLM
Text-to-Speech
Yuhao Zhang, Yuhao Du, Zhanchen Dai, et al.
1
27
28
29
30
31
32
33
49
環境スケーリングによる汎用エージェント型知能の実現
エージェント
LLM
Runnan Fang, Shihao Cai, Baixuan Li, et al.
WebSailor-V2:合成データとスケーラブルな強化学習を活用した独自エージェントへの橋渡し
エージェント
強化学習
Kuan Li, Zhongwang Zhang, Huifeng Yin, et al.
継続的事前学習によるエージェントのスケーリング
エージェント
LLM
Liangcai Su, Zhen Zhang, Guangyu Li, et al.
WebWeaver:動的アウトラインを用いたスケールのWeb証拠の構造化による開かれた深層研究
検索拡張生成
エージェント
Zijian Li, Xin Guan, Bo Zhang, et al.
大規模言語モデルにおけるグリッチトークン:分類ファセットと効果的な検出
LLM
Transformer
Yuxi Li, Yi Liu, Gelei Deng, et al.
REFRAG:RAGに基づくデコードの再考
検索拡張生成
LLM
Xiaoqiang Lin, Aritra Ghosh, Bryan Kian Hsiang Low, et al.
アライン・セントゥスティア:統合潜在ガイドにより視覚言語行動モデルの適応
Any-to-Any
マルチタスク学習
Yang Zhang, Chenwei Wang, Ouyang Lu, et al.
SubLIME:データ効率的なLLM評価のためのランク相関予測によるサブセット選定
LLM
データセット
Gayathri Saranathan, Cong Xu, Mahammad Parwez Alam, et al.
長時間動画生成のためのコンテキスト混合
動画生成
Transformer
Shengqu Cai, Ceyuan Yang, Lvmin Zhang, et al.
MusicSwarm:音楽作曲のための生物学的インスパイアード・インテリジェンス
ディープラーニング
モデリング
Markus J. Buehler
LEGO:テンソル応用における空間的加速器生成と最適化
AI コンパイラ
LLM
Yujun Lin, Zhekai Zhang, Song Han
LazyDrag:明示的対応関係を用いたマルチモーダル拡散トランスフォーマーにおける安定なドラッグベース編集の実現
拡散モデル
マルチモーダル
Zixin Yin, Xili Dai, Duomin Wang, et al.
SearchInstruct:検索ベースの指示データセット作成によるドメイン適応の向上
監視付き微調整
検索拡張生成
Iman Barati, Mostafa Amiri, Heshaam Faili
解釈可能な物理学的推論と視覚言語モデルにおけるパフォーマンス分類
マルチモーダル
Reasoning
Pranav Pawar, Kavish Shah, Akshat Bhalani, et al.
InternScenes:現実的なレイアウトを備えた大規模なシミュラブルな屋内シーンデータセット
3Dモデル
データセット
Weipeng Zhong, Peizhou Cao, Yichen Jin, et al.
UI-S1:セミオンライン強化学習を活用したGUI自動化の進展
強化学習
エージェント
Zhengxi Lu, Jiabo Ye, Fei Tang, et al.
OmniWorld:4Dワールドモデリングのためのマルチドメイン・マルチモーダルデータセット
データセット
ビデオ理解
Yang Zhou, Yifan Wang, Jianjun Zhou, et al.
LAVa:階層別KVキャッシュ除外と動的予算割り当て
LLM
Transformer
Yiqun Shen, Song Yuan, Zhengze Zhang, et al.
確率構造統合を用いた世界モデリング
モデリング
ビデオ理解
Klemen Kotar, Wanhee Lee, Rahul Venkatesh, et al.
VStyle:音声スタイル適応のためのベンチマーク(口頭指示付き)
Text-to-Speech
Any-to-Any
Jun Zhan, Mingyang Han, Yuxuan Xie, et al.
HANRAG:ヒューリスティックかつ高精度・ノイズ耐性を備えたマルチホップ質問応答のためのリトリーブ増強生成
検索拡張生成
LLM
Duolin Sun, Dan Yang, Yue Shen, et al.
InfGen:スケーラビリティを考慮した解像度無差別な画像生成パラダイム
拡散モデル
画像生成
Tao Han, Wanghan Xu, Junchao Gong, et al.
X-Part:高忠実度かつ構造整合性を有する形状分解
3D生成
セマンティックセグメンテーション
Xinhao Yan, Jiachen Xu, Yang Li, et al.
リターンの逓減の錯覚:大規模言語モデルにおける長期的実行の測定
LLM
Reasoning
Akshit Sinha, Arvindh Arun, Shashwat Goel, et al.
IntrEx:教育的対話における関与をモデル化するためのデータセット
データセット
LLM
Xingwei Tan, Mahathi Parvatham, Chiara Gambi, et al.
Youtu-GraphRAG:グラフ検索拡張型複雑推論のための垂直統合型エージェント
検索拡張生成
LLM
Junnan Dong, Siyu An, Yifei Yu, et al.
SceneSplat:視覚言語事前学習を活用したガウシアンスプラッティングベースのシーン理解
3D マシンビジョン
マルチモーダル表現
Yue Li, Qi Ma, Runyi Yang, et al.
バーチャルエージェント経済
エージェント
Preference Modeling
Nenad Tomasev, Matija Franklin, Joel Z. Leibo, et al.
視覚言語モデルにおける視覚基盤の理解に向けて
マルチモーダル
マルチモーダル表現
Georgios Pantazopoulos, Eda B. Özyiğit
Kling-Avatar:段階的長時間アバターアニメーション合成のためのマルチモーダル指示の基盤化
Any-to-Any
マルチモーダル表現
Yikang Ding, Jiwen Liu, Wenyuan Zhang, et al.
機械学習LM:数百万の合成テーブル予測タスク上で継続的に事前学習された言語モデルが、文脈内機械学習をスケーリングする
LLM
機械学習
Haoyu Dong, Pengkun Zhang, Mingzhe Lu, et al.
エコーエックス:音声対音声LLMにおける音響的・意味的ギャップ低減のためのエコー学習へ
LLM
Text-to-Speech
Yuhao Zhang, Yuhao Du, Zhanchen Dai, et al.
1
27
28
29
30
31
32
33
49