HyperAI
HyperAI超神経
ホーム
プラットフォーム
ドキュメント
ニュース
論文
Notebooks
データセット
百科事典
SOTA
LLMモデル
GPU ランキング
学会
検索
サイトについて
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
サイトを検索…
⌘
K
Command Palette
Search for a command to run...
Console
サインイン
ホーム
論文
論文
日々更新される最先端AI研究論文、人工知能の最新動向を把握
HyperAI
HyperAI超神経
ホーム
プラットフォーム
ドキュメント
ニュース
論文
Notebooks
データセット
百科事典
SOTA
LLMモデル
GPU ランキング
学会
検索
サイトについて
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
サイトを検索…
⌘
K
Command Palette
Search for a command to run...
Console
サインイン
ホーム
論文
論文
日々更新される最先端AI研究論文、人工知能の最新動向を把握
Console
Console
論文 | HyperAI超神経
SceneSplat:視覚言語事前学習を活用したガウシアンスプラッティングベースのシーン理解
Yue Li, Qi Ma, Runyi Yang, et al.
バーチャルエージェント経済
Nenad Tomasev, Matija Franklin, Joel Z. Leibo, et al.
視覚言語モデルにおける視覚基盤の理解に向けて
Georgios Pantazopoulos, Eda B. Özyiğit
Kling-Avatar:段階的長時間アバターアニメーション合成のためのマルチモーダル指示の基盤化
Yikang Ding, Jiwen Liu, Wenyuan Zhang, et al.
機械学習LM:数百万の合成テーブル予測タスク上で継続的に事前学習された言語モデルが、文脈内機械学習をスケーリングする
Haoyu Dong, Pengkun Zhang, Mingzhe Lu, et al.
エコーエックス:音声対音声LLMにおける音響的・意味的ギャップ低減のためのエコー学習へ
Yuhao Zhang, Yuhao Du, Zhanchen Dai, et al.
SimpleVLA-RL:強化学習を活用したVLA学習のスケーリング
Haozhan Li, Yuxin Zuo, Jiale Yu, et al.
HuMo:協調的マルチモーダル条件付きによる人間中心型動画生成
Liyang Chen, Tianxiang Ma, Jiawei Liu, et al.
VLA-Adapter:微小スケール視覚言語行動モデルにおける効果的なパラダイム
Yihao Wang, Pengxiang Ding, Lingxiao Li, et al.
scSiameseClu:単細胞RNAシークエンシングデータの解釈を目的としたシアメーズクラスタリングフレームワーク
Ping Xu, Zhiyuan Ning, Pengjiang Li, et al.
ST-Raptor:LLM駆動の準構造化テーブル質問応答
Zirui Tang, Boyu Niu, Xuanhe Zhou, et al.
OmniSpatial:視覚言語モデルにおける包括的な空間推論ベンチマークへ向けて
Mengdi Jia, Zekun Qi, Shaochen Zhang, et al.
交渉ゲームにおける人間エージェントとAIエージェント間の経済的トレードオフの理解
Crystal Qian, Kehang Zhu, John Horton, et al.
ジュピター:ノートブックおよび推論時価値誘導型探索を活用したLLMデータ分析機能の向上
Shuocheng Li, Yihao Liu, Silin Du, et al.
フニエン-MT 技術報告
Mao Zheng, Zheng Li, Bingxin Qu, et al.
P3-SAM:ネイティブ3Dパーツセグメンテーション
Changfeng Ma, Yang Li, Xinhao Yan, et al.
AgentGym-RL:マルチターン強化学習を用いた長期意思決定のためのLLMエージェントの訓練
Zhiheng Xi, Jixuan Huang, Chenyang Liao, et al.
3Dおよび4Dワールドモデリング:サーベイ
Lingdong Kong, Wesley Yang, Jianbiao Mei, et al.
RewardDance:視覚生成におけるリワードスケーリング
Jie Wu, Yu Gao, Zilyu Ye, et al.
共有はケアを生む:集団強化学習による効率的な言語モデル後期訓練
Jeffrey Amico, Gabriel Passamani Andrade, John Donaghy, et al.
FinReflectKG:金融知識グラフのエージェント型構築と評価
Abhinav Arun, Fabrizio Dimino, Tejas Prakash Agarwal, et al.
大規模推論モデルにおける強化学習のサーベイ
Kaiyan Zhang, Yuxin Zuo, Bingxiang He, et al.
過剰依存の測定と軽減は、人間と調和するAIを構築するために不可欠である
Lujain Ibrahim, Katherine M. Collins, Sunnie S. Y. Kim, et al.
F1:理解と生成を行動へとつなぐ視覚言語行動モデル
Qi Lv, Weijie Kong, Hao Li, et al.
UMO:マッチング報酬を用いた画像カスタマイズにおける多様なアイデンティティの一貫性拡張
Yufeng Cheng, Wenxu Wu, Shaojin Wu, et al.
再構成アライメントが統合型マルチモーダルモデルを改善する
Ji Xie, Trevor Darrell, Luke Zettlemoyer, et al.
Mini-o3:視覚検索における推論パターンおよび対話ターンのスケーリングアップ
Xin Lai, Junyi Li, Wei Li, et al.
マルチモーダル大規模言語モデルにおける視覚的表現のアライメント
Heeji Yoon, Jaewoo Jung, Junwan Kim, et al.
Parallel-R1:強化学習を活用した並列的思考の実現へ
Tong Zheng, Hongming Zhang, Wenhao Yu, et al.
WenetSpeech-Yue:多次元アノテーションを備えた大規模広東語音声コーパス
Longhao Li, Zhao Guo, Hongjie Chen, et al.
SheetDesigner:ルールベースおよびビジョンベースのリフレクションを活用したMLLM駆動型スプレッドシートレイアウト生成
Qin Chen, Yuanyi Ren, Xiaojun Ma, et al.
自律的コード進化がNP完全性に直面する
Cunxi Yu, Rongjian Liang, Chia-Tung Ho, et al.
1
18
19
20
21
22
23
24
39
SceneSplat:視覚言語事前学習を活用したガウシアンスプラッティングベースのシーン理解
Yue Li, Qi Ma, Runyi Yang, et al.
バーチャルエージェント経済
Nenad Tomasev, Matija Franklin, Joel Z. Leibo, et al.
視覚言語モデルにおける視覚基盤の理解に向けて
Georgios Pantazopoulos, Eda B. Özyiğit
Kling-Avatar:段階的長時間アバターアニメーション合成のためのマルチモーダル指示の基盤化
Yikang Ding, Jiwen Liu, Wenyuan Zhang, et al.
機械学習LM:数百万の合成テーブル予測タスク上で継続的に事前学習された言語モデルが、文脈内機械学習をスケーリングする
Haoyu Dong, Pengkun Zhang, Mingzhe Lu, et al.
エコーエックス:音声対音声LLMにおける音響的・意味的ギャップ低減のためのエコー学習へ
Yuhao Zhang, Yuhao Du, Zhanchen Dai, et al.
SimpleVLA-RL:強化学習を活用したVLA学習のスケーリング
Haozhan Li, Yuxin Zuo, Jiale Yu, et al.
HuMo:協調的マルチモーダル条件付きによる人間中心型動画生成
Liyang Chen, Tianxiang Ma, Jiawei Liu, et al.
VLA-Adapter:微小スケール視覚言語行動モデルにおける効果的なパラダイム
Yihao Wang, Pengxiang Ding, Lingxiao Li, et al.
scSiameseClu:単細胞RNAシークエンシングデータの解釈を目的としたシアメーズクラスタリングフレームワーク
Ping Xu, Zhiyuan Ning, Pengjiang Li, et al.
ST-Raptor:LLM駆動の準構造化テーブル質問応答
Zirui Tang, Boyu Niu, Xuanhe Zhou, et al.
OmniSpatial:視覚言語モデルにおける包括的な空間推論ベンチマークへ向けて
Mengdi Jia, Zekun Qi, Shaochen Zhang, et al.
交渉ゲームにおける人間エージェントとAIエージェント間の経済的トレードオフの理解
Crystal Qian, Kehang Zhu, John Horton, et al.
ジュピター:ノートブックおよび推論時価値誘導型探索を活用したLLMデータ分析機能の向上
Shuocheng Li, Yihao Liu, Silin Du, et al.
フニエン-MT 技術報告
Mao Zheng, Zheng Li, Bingxin Qu, et al.
P3-SAM:ネイティブ3Dパーツセグメンテーション
Changfeng Ma, Yang Li, Xinhao Yan, et al.
AgentGym-RL:マルチターン強化学習を用いた長期意思決定のためのLLMエージェントの訓練
Zhiheng Xi, Jixuan Huang, Chenyang Liao, et al.
3Dおよび4Dワールドモデリング:サーベイ
Lingdong Kong, Wesley Yang, Jianbiao Mei, et al.
RewardDance:視覚生成におけるリワードスケーリング
Jie Wu, Yu Gao, Zilyu Ye, et al.
共有はケアを生む:集団強化学習による効率的な言語モデル後期訓練
Jeffrey Amico, Gabriel Passamani Andrade, John Donaghy, et al.
FinReflectKG:金融知識グラフのエージェント型構築と評価
Abhinav Arun, Fabrizio Dimino, Tejas Prakash Agarwal, et al.
大規模推論モデルにおける強化学習のサーベイ
Kaiyan Zhang, Yuxin Zuo, Bingxiang He, et al.
過剰依存の測定と軽減は、人間と調和するAIを構築するために不可欠である
Lujain Ibrahim, Katherine M. Collins, Sunnie S. Y. Kim, et al.
F1:理解と生成を行動へとつなぐ視覚言語行動モデル
Qi Lv, Weijie Kong, Hao Li, et al.
UMO:マッチング報酬を用いた画像カスタマイズにおける多様なアイデンティティの一貫性拡張
Yufeng Cheng, Wenxu Wu, Shaojin Wu, et al.
再構成アライメントが統合型マルチモーダルモデルを改善する
Ji Xie, Trevor Darrell, Luke Zettlemoyer, et al.
Mini-o3:視覚検索における推論パターンおよび対話ターンのスケーリングアップ
Xin Lai, Junyi Li, Wei Li, et al.
マルチモーダル大規模言語モデルにおける視覚的表現のアライメント
Heeji Yoon, Jaewoo Jung, Junwan Kim, et al.
Parallel-R1:強化学習を活用した並列的思考の実現へ
Tong Zheng, Hongming Zhang, Wenhao Yu, et al.
WenetSpeech-Yue:多次元アノテーションを備えた大規模広東語音声コーパス
Longhao Li, Zhao Guo, Hongjie Chen, et al.
SheetDesigner:ルールベースおよびビジョンベースのリフレクションを活用したMLLM駆動型スプレッドシートレイアウト生成
Qin Chen, Yuanyi Ren, Xiaojun Ma, et al.
自律的コード進化がNP完全性に直面する
Cunxi Yu, Rongjian Liang, Chia-Tung Ho, et al.
1
18
19
20
21
22
23
24
39