HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
MusicSwarm:音楽作曲のための生物学的インスパイアード・インテリジェンス
ディープラーニング
モデリング
Markus J. Buehler
LEGO:テンソル応用における空間的加速器生成と最適化
AI コンパイラ
LLM
Yujun Lin, Zhekai Zhang, Song Han
LazyDrag:明示的対応関係を用いたマルチモーダル拡散トランスフォーマーにおける安定なドラッグベース編集の実現
拡散モデル
マルチモーダル
Zixin Yin, Xili Dai, Duomin Wang, et al.
SearchInstruct:検索ベースの指示データセット作成によるドメイン適応の向上
監視付き微調整
検索拡張生成
Iman Barati, Mostafa Amiri, Heshaam Faili
解釈可能な物理学的推論と視覚言語モデルにおけるパフォーマンス分類
マルチモーダル
Reasoning
Pranav Pawar, Kavish Shah, Akshat Bhalani, et al.
InternScenes:現実的なレイアウトを備えた大規模なシミュラブルな屋内シーンデータセット
3Dモデル
データセット
Weipeng Zhong, Peizhou Cao, Yichen Jin, et al.
UI-S1:セミオンライン強化学習を活用したGUI自動化の進展
強化学習
エージェント
Zhengxi Lu, Jiabo Ye, Fei Tang, et al.
OmniWorld:4Dワールドモデリングのためのマルチドメイン・マルチモーダルデータセット
データセット
ビデオ理解
Yang Zhou, Yifan Wang, Jianjun Zhou, et al.
LAVa:階層別KVキャッシュ除外と動的予算割り当て
LLM
Transformer
Yiqun Shen, Song Yuan, Zhengze Zhang, et al.
確率構造統合を用いた世界モデリング
モデリング
ビデオ理解
Klemen Kotar, Wanhee Lee, Rahul Venkatesh, et al.
VStyle:音声スタイル適応のためのベンチマーク(口頭指示付き)
Text-to-Speech
Any-to-Any
Jun Zhan, Mingyang Han, Yuxuan Xie, et al.
HANRAG:ヒューリスティックかつ高精度・ノイズ耐性を備えたマルチホップ質問応答のためのリトリーブ増強生成
検索拡張生成
LLM
Duolin Sun, Dan Yang, Yue Shen, et al.
InfGen:スケーラビリティを考慮した解像度無差別な画像生成パラダイム
拡散モデル
画像生成
Tao Han, Wanghan Xu, Junchao Gong, et al.
X-Part:高忠実度かつ構造整合性を有する形状分解
3D生成
セマンティックセグメンテーション
Xinhao Yan, Jiachen Xu, Yang Li, et al.
リターンの逓減の錯覚:大規模言語モデルにおける長期的実行の測定
LLM
Reasoning
Akshit Sinha, Arvindh Arun, Shashwat Goel, et al.
IntrEx:教育的対話における関与をモデル化するためのデータセット
データセット
LLM
Xingwei Tan, Mahathi Parvatham, Chiara Gambi, et al.
Youtu-GraphRAG:グラフ検索拡張型複雑推論のための垂直統合型エージェント
検索拡張生成
LLM
Junnan Dong, Siyu An, Yifei Yu, et al.
SceneSplat:視覚言語事前学習を活用したガウシアンスプラッティングベースのシーン理解
3D マシンビジョン
マルチモーダル表現
Yue Li, Qi Ma, Runyi Yang, et al.
バーチャルエージェント経済
エージェント
Preference Modeling
Nenad Tomasev, Matija Franklin, Joel Z. Leibo, et al.
視覚言語モデルにおける視覚基盤の理解に向けて
マルチモーダル
マルチモーダル表現
Georgios Pantazopoulos, Eda B. Özyiğit
Kling-Avatar:段階的長時間アバターアニメーション合成のためのマルチモーダル指示の基盤化
Any-to-Any
マルチモーダル表現
Yikang Ding, Jiwen Liu, Wenyuan Zhang, et al.
機械学習LM:数百万の合成テーブル予測タスク上で継続的に事前学習された言語モデルが、文脈内機械学習をスケーリングする
LLM
機械学習
Haoyu Dong, Pengkun Zhang, Mingzhe Lu, et al.
エコーエックス:音声対音声LLMにおける音響的・意味的ギャップ低減のためのエコー学習へ
LLM
Text-to-Speech
Yuhao Zhang, Yuhao Du, Zhanchen Dai, et al.
SimpleVLA-RL:強化学習を活用したVLA学習のスケーリング
強化学習
監視付き微調整
Haozhan Li, Yuxin Zuo, Jiale Yu, et al.
VLA-Adapter:微小スケール視覚言語行動モデルにおける効果的なパラダイム
マルチモーダル
Any-to-Any
Yihao Wang, Pengxiang Ding, Lingxiao Li, et al.
scSiameseClu:単細胞RNAシークエンシングデータの解釈を目的としたシアメーズクラスタリングフレームワーク
ゲノミクス
ディープラーニング
Ping Xu, Zhiyuan Ning, Pengjiang Li, et al.
ST-Raptor:LLM駆動の準構造化テーブル質問応答
インテリジェントな質問応答
Reasoning
Zirui Tang, Boyu Niu, Xuanhe Zhou, et al.
OmniSpatial:視覚言語モデルにおける包括的な空間推論ベンチマークへ向けて
ベンチマーク
マルチモーダル
Mengdi Jia, Zekun Qi, Shaochen Zhang, et al.
交渉ゲームにおける人間エージェントとAIエージェント間の経済的トレードオフの理解
エージェント
Preference Modeling
Crystal Qian, Kehang Zhu, John Horton, et al.
ジュピター:ノートブックおよび推論時価値誘導型探索を活用したLLMデータ分析機能の向上
LLM
Reasoning
Shuocheng Li, Yihao Liu, Silin Du, et al.
フニエン-MT 技術報告
翻訳
LLM
Mao Zheng, Zheng Li, Bingxin Qu, et al.
P3-SAM:ネイティブ3Dパーツセグメンテーション
コンピュータビジョン
セマンティックセグメンテーション
Changfeng Ma, Yang Li, Xinhao Yan, et al.
1
27
28
29
30
31
32
33
48
MusicSwarm:音楽作曲のための生物学的インスパイアード・インテリジェンス
ディープラーニング
モデリング
Markus J. Buehler
LEGO:テンソル応用における空間的加速器生成と最適化
AI コンパイラ
LLM
Yujun Lin, Zhekai Zhang, Song Han
LazyDrag:明示的対応関係を用いたマルチモーダル拡散トランスフォーマーにおける安定なドラッグベース編集の実現
拡散モデル
マルチモーダル
Zixin Yin, Xili Dai, Duomin Wang, et al.
SearchInstruct:検索ベースの指示データセット作成によるドメイン適応の向上
監視付き微調整
検索拡張生成
Iman Barati, Mostafa Amiri, Heshaam Faili
解釈可能な物理学的推論と視覚言語モデルにおけるパフォーマンス分類
マルチモーダル
Reasoning
Pranav Pawar, Kavish Shah, Akshat Bhalani, et al.
InternScenes:現実的なレイアウトを備えた大規模なシミュラブルな屋内シーンデータセット
3Dモデル
データセット
Weipeng Zhong, Peizhou Cao, Yichen Jin, et al.
UI-S1:セミオンライン強化学習を活用したGUI自動化の進展
強化学習
エージェント
Zhengxi Lu, Jiabo Ye, Fei Tang, et al.
OmniWorld:4Dワールドモデリングのためのマルチドメイン・マルチモーダルデータセット
データセット
ビデオ理解
Yang Zhou, Yifan Wang, Jianjun Zhou, et al.
LAVa:階層別KVキャッシュ除外と動的予算割り当て
LLM
Transformer
Yiqun Shen, Song Yuan, Zhengze Zhang, et al.
確率構造統合を用いた世界モデリング
モデリング
ビデオ理解
Klemen Kotar, Wanhee Lee, Rahul Venkatesh, et al.
VStyle:音声スタイル適応のためのベンチマーク(口頭指示付き)
Text-to-Speech
Any-to-Any
Jun Zhan, Mingyang Han, Yuxuan Xie, et al.
HANRAG:ヒューリスティックかつ高精度・ノイズ耐性を備えたマルチホップ質問応答のためのリトリーブ増強生成
検索拡張生成
LLM
Duolin Sun, Dan Yang, Yue Shen, et al.
InfGen:スケーラビリティを考慮した解像度無差別な画像生成パラダイム
拡散モデル
画像生成
Tao Han, Wanghan Xu, Junchao Gong, et al.
X-Part:高忠実度かつ構造整合性を有する形状分解
3D生成
セマンティックセグメンテーション
Xinhao Yan, Jiachen Xu, Yang Li, et al.
リターンの逓減の錯覚:大規模言語モデルにおける長期的実行の測定
LLM
Reasoning
Akshit Sinha, Arvindh Arun, Shashwat Goel, et al.
IntrEx:教育的対話における関与をモデル化するためのデータセット
データセット
LLM
Xingwei Tan, Mahathi Parvatham, Chiara Gambi, et al.
Youtu-GraphRAG:グラフ検索拡張型複雑推論のための垂直統合型エージェント
検索拡張生成
LLM
Junnan Dong, Siyu An, Yifei Yu, et al.
SceneSplat:視覚言語事前学習を活用したガウシアンスプラッティングベースのシーン理解
3D マシンビジョン
マルチモーダル表現
Yue Li, Qi Ma, Runyi Yang, et al.
バーチャルエージェント経済
エージェント
Preference Modeling
Nenad Tomasev, Matija Franklin, Joel Z. Leibo, et al.
視覚言語モデルにおける視覚基盤の理解に向けて
マルチモーダル
マルチモーダル表現
Georgios Pantazopoulos, Eda B. Özyiğit
Kling-Avatar:段階的長時間アバターアニメーション合成のためのマルチモーダル指示の基盤化
Any-to-Any
マルチモーダル表現
Yikang Ding, Jiwen Liu, Wenyuan Zhang, et al.
機械学習LM:数百万の合成テーブル予測タスク上で継続的に事前学習された言語モデルが、文脈内機械学習をスケーリングする
LLM
機械学習
Haoyu Dong, Pengkun Zhang, Mingzhe Lu, et al.
エコーエックス:音声対音声LLMにおける音響的・意味的ギャップ低減のためのエコー学習へ
LLM
Text-to-Speech
Yuhao Zhang, Yuhao Du, Zhanchen Dai, et al.
SimpleVLA-RL:強化学習を活用したVLA学習のスケーリング
強化学習
監視付き微調整
Haozhan Li, Yuxin Zuo, Jiale Yu, et al.
VLA-Adapter:微小スケール視覚言語行動モデルにおける効果的なパラダイム
マルチモーダル
Any-to-Any
Yihao Wang, Pengxiang Ding, Lingxiao Li, et al.
scSiameseClu:単細胞RNAシークエンシングデータの解釈を目的としたシアメーズクラスタリングフレームワーク
ゲノミクス
ディープラーニング
Ping Xu, Zhiyuan Ning, Pengjiang Li, et al.
ST-Raptor:LLM駆動の準構造化テーブル質問応答
インテリジェントな質問応答
Reasoning
Zirui Tang, Boyu Niu, Xuanhe Zhou, et al.
OmniSpatial:視覚言語モデルにおける包括的な空間推論ベンチマークへ向けて
ベンチマーク
マルチモーダル
Mengdi Jia, Zekun Qi, Shaochen Zhang, et al.
交渉ゲームにおける人間エージェントとAIエージェント間の経済的トレードオフの理解
エージェント
Preference Modeling
Crystal Qian, Kehang Zhu, John Horton, et al.
ジュピター:ノートブックおよび推論時価値誘導型探索を活用したLLMデータ分析機能の向上
LLM
Reasoning
Shuocheng Li, Yihao Liu, Silin Du, et al.
フニエン-MT 技術報告
翻訳
LLM
Mao Zheng, Zheng Li, Bingxin Qu, et al.
P3-SAM:ネイティブ3Dパーツセグメンテーション
コンピュータビジョン
セマンティックセグメンテーション
Changfeng Ma, Yang Li, Xinhao Yan, et al.
1
27
28
29
30
31
32
33
48