HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
SceneSplat:視覚言語事前学習を活用したガウシアンスプラッティングベースのシーン理解
3D マシンビジョン
マルチモーダル表現
Yue Li, Qi Ma, Runyi Yang, et al.
バーチャルエージェント経済
エージェント
Preference Modeling
Nenad Tomasev, Matija Franklin, Joel Z. Leibo, et al.
視覚言語モデルにおける視覚基盤の理解に向けて
マルチモーダル
マルチモーダル表現
Georgios Pantazopoulos, Eda B. Özyiğit
Kling-Avatar:段階的長時間アバターアニメーション合成のためのマルチモーダル指示の基盤化
Any-to-Any
マルチモーダル表現
Yikang Ding, Jiwen Liu, Wenyuan Zhang, et al.
機械学習LM:数百万の合成テーブル予測タスク上で継続的に事前学習された言語モデルが、文脈内機械学習をスケーリングする
LLM
機械学習
Haoyu Dong, Pengkun Zhang, Mingzhe Lu, et al.
エコーエックス:音声対音声LLMにおける音響的・意味的ギャップ低減のためのエコー学習へ
LLM
Text-to-Speech
Yuhao Zhang, Yuhao Du, Zhanchen Dai, et al.
SimpleVLA-RL:強化学習を活用したVLA学習のスケーリング
強化学習
監視付き微調整
Haozhan Li, Yuxin Zuo, Jiale Yu, et al.
VLA-Adapter:微小スケール視覚言語行動モデルにおける効果的なパラダイム
マルチモーダル
Any-to-Any
Yihao Wang, Pengxiang Ding, Lingxiao Li, et al.
scSiameseClu:単細胞RNAシークエンシングデータの解釈を目的としたシアメーズクラスタリングフレームワーク
ゲノミクス
ディープラーニング
Ping Xu, Zhiyuan Ning, Pengjiang Li, et al.
ST-Raptor:LLM駆動の準構造化テーブル質問応答
インテリジェントな質問応答
Reasoning
Zirui Tang, Boyu Niu, Xuanhe Zhou, et al.
OmniSpatial:視覚言語モデルにおける包括的な空間推論ベンチマークへ向けて
ベンチマーク
マルチモーダル
Mengdi Jia, Zekun Qi, Shaochen Zhang, et al.
交渉ゲームにおける人間エージェントとAIエージェント間の経済的トレードオフの理解
エージェント
Preference Modeling
Crystal Qian, Kehang Zhu, John Horton, et al.
ジュピター:ノートブックおよび推論時価値誘導型探索を活用したLLMデータ分析機能の向上
LLM
Reasoning
Shuocheng Li, Yihao Liu, Silin Du, et al.
フニエン-MT 技術報告
翻訳
LLM
Mao Zheng, Zheng Li, Bingxin Qu, et al.
P3-SAM:ネイティブ3Dパーツセグメンテーション
コンピュータビジョン
セマンティックセグメンテーション
Changfeng Ma, Yang Li, Xinhao Yan, et al.
AgentGym-RL:マルチターン強化学習を用いた長期意思決定のためのLLMエージェントの訓練
エージェント
強化学習
Zhiheng Xi, Jixuan Huang, Chenyang Liao, et al.
3Dおよび4Dワールドモデリング:サーベイ
3Dモデル
モデリング
Lingdong Kong, Wesley Yang, Jianbiao Mei, et al.
RewardDance:視覚生成におけるリワードスケーリング
Preference Modeling
画像生成
Jie Wu, Yu Gao, Zilyu Ye, et al.
共有はケアを生む:集団強化学習による効率的な言語モデル後期訓練
強化学習
LLM
Jeffrey Amico, Gabriel Passamani Andrade, John Donaghy, et al.
FinReflectKG:金融知識グラフのエージェント型構築と評価
ドキュメント理解
データセット
Abhinav Arun, Fabrizio Dimino, Tejas Prakash Agarwal, et al.
大規模推論モデルにおける強化学習のサーベイ
強化学習
Reasoning
Kaiyan Zhang, Yuxin Zuo, Bingxiang He, et al.
過剰依存の測定と軽減は、人間と調和するAIを構築するために不可欠である
LLM
心理学
Lujain Ibrahim, Katherine M. Collins, Sunnie S. Y. Kim, et al.
F1:理解と生成を行動へとつなぐ視覚言語行動モデル
エムボディドインテリジェンス
エージェント
Qi Lv, Weijie Kong, Hao Li, et al.
UMO:マッチング報酬を用いた画像カスタマイズにおける多様なアイデンティティの一貫性拡張
拡散モデル
画像生成
Yufeng Cheng, Wenxu Wu, Shaojin Wu, et al.
再構成アライメントが統合型マルチモーダルモデルを改善する
マルチモーダル
画像生成
Ji Xie, Trevor Darrell, Luke Zettlemoyer, et al.
Mini-o3:視覚検索における推論パターンおよび対話ターンのスケーリングアップ
Reasoning
エージェント
Xin Lai, Junyi Li, Wei Li, et al.
マルチモーダル大規模言語モデルにおける視覚的表現のアライメント
マルチモーダル表現
マルチモーダル
Heeji Yoon, Jaewoo Jung, Junwan Kim, et al.
Parallel-R1:強化学習を活用した並列的思考の実現へ
強化学習
監視付き微調整
Tong Zheng, Hongming Zhang, Wenhao Yu, et al.
WenetSpeech-Yue:多次元アノテーションを備えた大規模広東語音声コーパス
Text-to-Speech
データセット
Longhao Li, Zhao Guo, Hongjie Chen, et al.
SheetDesigner:ルールベースおよびビジョンベースのリフレクションを活用したMLLM駆動型スプレッドシートレイアウト生成
マルチモーダル
ドキュメント理解
Qin Chen, Yuanyi Ren, Xiaojun Ma, et al.
自律的コード進化がNP完全性に直面する
LLM
エージェント
Cunxi Yu, Rongjian Liang, Chia-Tung Ho, et al.
深層研究システムのための強化学習の基礎:サーベイ
強化学習
エージェント
Wenjun Li, Zhi Chen, Jingru Lin, et al.
1
26
27
28
29
30
31
32
47
SceneSplat:視覚言語事前学習を活用したガウシアンスプラッティングベースのシーン理解
3D マシンビジョン
マルチモーダル表現
Yue Li, Qi Ma, Runyi Yang, et al.
バーチャルエージェント経済
エージェント
Preference Modeling
Nenad Tomasev, Matija Franklin, Joel Z. Leibo, et al.
視覚言語モデルにおける視覚基盤の理解に向けて
マルチモーダル
マルチモーダル表現
Georgios Pantazopoulos, Eda B. Özyiğit
Kling-Avatar:段階的長時間アバターアニメーション合成のためのマルチモーダル指示の基盤化
Any-to-Any
マルチモーダル表現
Yikang Ding, Jiwen Liu, Wenyuan Zhang, et al.
機械学習LM:数百万の合成テーブル予測タスク上で継続的に事前学習された言語モデルが、文脈内機械学習をスケーリングする
LLM
機械学習
Haoyu Dong, Pengkun Zhang, Mingzhe Lu, et al.
エコーエックス:音声対音声LLMにおける音響的・意味的ギャップ低減のためのエコー学習へ
LLM
Text-to-Speech
Yuhao Zhang, Yuhao Du, Zhanchen Dai, et al.
SimpleVLA-RL:強化学習を活用したVLA学習のスケーリング
強化学習
監視付き微調整
Haozhan Li, Yuxin Zuo, Jiale Yu, et al.
VLA-Adapter:微小スケール視覚言語行動モデルにおける効果的なパラダイム
マルチモーダル
Any-to-Any
Yihao Wang, Pengxiang Ding, Lingxiao Li, et al.
scSiameseClu:単細胞RNAシークエンシングデータの解釈を目的としたシアメーズクラスタリングフレームワーク
ゲノミクス
ディープラーニング
Ping Xu, Zhiyuan Ning, Pengjiang Li, et al.
ST-Raptor:LLM駆動の準構造化テーブル質問応答
インテリジェントな質問応答
Reasoning
Zirui Tang, Boyu Niu, Xuanhe Zhou, et al.
OmniSpatial:視覚言語モデルにおける包括的な空間推論ベンチマークへ向けて
ベンチマーク
マルチモーダル
Mengdi Jia, Zekun Qi, Shaochen Zhang, et al.
交渉ゲームにおける人間エージェントとAIエージェント間の経済的トレードオフの理解
エージェント
Preference Modeling
Crystal Qian, Kehang Zhu, John Horton, et al.
ジュピター:ノートブックおよび推論時価値誘導型探索を活用したLLMデータ分析機能の向上
LLM
Reasoning
Shuocheng Li, Yihao Liu, Silin Du, et al.
フニエン-MT 技術報告
翻訳
LLM
Mao Zheng, Zheng Li, Bingxin Qu, et al.
P3-SAM:ネイティブ3Dパーツセグメンテーション
コンピュータビジョン
セマンティックセグメンテーション
Changfeng Ma, Yang Li, Xinhao Yan, et al.
AgentGym-RL:マルチターン強化学習を用いた長期意思決定のためのLLMエージェントの訓練
エージェント
強化学習
Zhiheng Xi, Jixuan Huang, Chenyang Liao, et al.
3Dおよび4Dワールドモデリング:サーベイ
3Dモデル
モデリング
Lingdong Kong, Wesley Yang, Jianbiao Mei, et al.
RewardDance:視覚生成におけるリワードスケーリング
Preference Modeling
画像生成
Jie Wu, Yu Gao, Zilyu Ye, et al.
共有はケアを生む:集団強化学習による効率的な言語モデル後期訓練
強化学習
LLM
Jeffrey Amico, Gabriel Passamani Andrade, John Donaghy, et al.
FinReflectKG:金融知識グラフのエージェント型構築と評価
ドキュメント理解
データセット
Abhinav Arun, Fabrizio Dimino, Tejas Prakash Agarwal, et al.
大規模推論モデルにおける強化学習のサーベイ
強化学習
Reasoning
Kaiyan Zhang, Yuxin Zuo, Bingxiang He, et al.
過剰依存の測定と軽減は、人間と調和するAIを構築するために不可欠である
LLM
心理学
Lujain Ibrahim, Katherine M. Collins, Sunnie S. Y. Kim, et al.
F1:理解と生成を行動へとつなぐ視覚言語行動モデル
エムボディドインテリジェンス
エージェント
Qi Lv, Weijie Kong, Hao Li, et al.
UMO:マッチング報酬を用いた画像カスタマイズにおける多様なアイデンティティの一貫性拡張
拡散モデル
画像生成
Yufeng Cheng, Wenxu Wu, Shaojin Wu, et al.
再構成アライメントが統合型マルチモーダルモデルを改善する
マルチモーダル
画像生成
Ji Xie, Trevor Darrell, Luke Zettlemoyer, et al.
Mini-o3:視覚検索における推論パターンおよび対話ターンのスケーリングアップ
Reasoning
エージェント
Xin Lai, Junyi Li, Wei Li, et al.
マルチモーダル大規模言語モデルにおける視覚的表現のアライメント
マルチモーダル表現
マルチモーダル
Heeji Yoon, Jaewoo Jung, Junwan Kim, et al.
Parallel-R1:強化学習を活用した並列的思考の実現へ
強化学習
監視付き微調整
Tong Zheng, Hongming Zhang, Wenhao Yu, et al.
WenetSpeech-Yue:多次元アノテーションを備えた大規模広東語音声コーパス
Text-to-Speech
データセット
Longhao Li, Zhao Guo, Hongjie Chen, et al.
SheetDesigner:ルールベースおよびビジョンベースのリフレクションを活用したMLLM駆動型スプレッドシートレイアウト生成
マルチモーダル
ドキュメント理解
Qin Chen, Yuanyi Ren, Xiaojun Ma, et al.
自律的コード進化がNP完全性に直面する
LLM
エージェント
Cunxi Yu, Rongjian Liang, Chia-Tung Ho, et al.
深層研究システムのための強化学習の基礎:サーベイ
強化学習
エージェント
Wenjun Li, Zhi Chen, Jingru Lin, et al.
1
26
27
28
29
30
31
32
47