HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
F1:理解と生成を行動へとつなぐ視覚言語行動モデル
エムボディドインテリジェンス
エージェント
Qi Lv, Weijie Kong, Hao Li, et al.
UMO:マッチング報酬を用いた画像カスタマイズにおける多様なアイデンティティの一貫性拡張
拡散モデル
画像生成
Yufeng Cheng, Wenxu Wu, Shaojin Wu, et al.
再構成アライメントが統合型マルチモーダルモデルを改善する
マルチモーダル
画像生成
Ji Xie, Trevor Darrell, Luke Zettlemoyer, et al.
Mini-o3:視覚検索における推論パターンおよび対話ターンのスケーリングアップ
Reasoning
エージェント
Xin Lai, Junyi Li, Wei Li, et al.
マルチモーダル大規模言語モデルにおける視覚的表現のアライメント
マルチモーダル表現
マルチモーダル
Heeji Yoon, Jaewoo Jung, Junwan Kim, et al.
Parallel-R1:強化学習を活用した並列的思考の実現へ
強化学習
監視付き微調整
Tong Zheng, Hongming Zhang, Wenhao Yu, et al.
WenetSpeech-Yue:多次元アノテーションを備えた大規模広東語音声コーパス
Text-to-Speech
データセット
Longhao Li, Zhao Guo, Hongjie Chen, et al.
SheetDesigner:ルールベースおよびビジョンベースのリフレクションを活用したMLLM駆動型スプレッドシートレイアウト生成
マルチモーダル
ドキュメント理解
Qin Chen, Yuanyi Ren, Xiaojun Ma, et al.
自律的コード進化がNP完全性に直面する
LLM
エージェント
Cunxi Yu, Rongjian Liang, Chia-Tung Ho, et al.
深層研究システムのための強化学習の基礎:サーベイ
強化学習
エージェント
Wenjun Li, Zhi Chen, Jingru Lin, et al.
ツールを用いた強化された視覚的認識
LLM
Reasoning
Zetong Zhou, Dongping Chen, Zixian Ma, et al.
DINOv3は新たな医療分野のビジョン基準を設定するか?
コンピュータビジョン
医療画像
Che Liu, Yinda Chen, Haoyuan Shi, et al.
拡散大規模言語モデル向け強化学習フレームワークの革新
LLM
監視付き微調整
Yinjie Wang, Ling Yang, Bowen Li, et al.
WebExplorer:長期ホライズンWebエージェントの訓練のための探索と進化
エージェント
監視付き微調整
Junteng Liu, Yunji Li, Chi Zhang, et al.
逆工程的手法による開放型生成のための推論
Reasoning
LLM
Haozhe Wang, Haoran Que, Qixin Xu, et al.
OSC:マルチエージェントLLM協働における動的知識整合による認知オーケストレーション
エージェント
LLM
Jusheng Zhang, Yijia Fan, Kaitong Cai, et al.
CURE:ロバストな埋め込みのための制御された忘却――事前学習された言語モデルにおける概念的ショートカットの軽減
自然言語処理
監視付き微調整
Aysenur Kocak, Shuo Yang, Bardh Prenkaj, et al.
MedVista3D:3次元CT疾患検出、理解および報告における診断エラー低減のための視覚言語モデリング
視覚質問応答
マルチモーダル
Yuheng Li, Yenho Chen, Yuxiang Lai, et al.
LuxDiT:ビデオ拡散トランスフォーマーを用いた照明推定
拡散モデル
画像間変換
Ruofan Liang, Kai He, Zan Gojcic, et al.
WildScore:現実世界における記号音楽推論のためのMLLMsベンチマーク
ベンチマーク
視覚質問応答
Gagan Mundada, Yash Vishe, Amit Namburi, et al.
セットブロックデコードは言語モデル推論を高速化するアクセラレータである。
LLM
テキスト生成
Itai Gat, Heli Ben-Hamu, Marton Havasi, et al.
大規模言語モデルを用いた記号的グラフィカルプログラミング
LLM
コード生成
Yamei Chen, Haoquan Zhang, Yangyi Huang, et al.
言語モデルが幻覚を生じる理由
LLM
Reasoning
Adam Tauman Kalai, Ofir Nachum, Santosh S. Vempala, et al.
LatticeWorld:マルチモーダル大規模言語モデルを活用したインタラクティブな複雑な世界生成フレームワーク
3D生成
エージェント
Yinglin Duan, Zhengxia Zou, Tongwei Gu, et al.
Recomposer:イベントロール誘導型の生成音声編集
Text-to-Audio
Text-to-Speech
Daniel P. W. Ellis, Eduardo Fonseca, Ron J. Weiss, et al.
遷移モデル:生成学習目的の再考
拡散モデル
モデリング
Zidong Wang, Yiyuan Zhang, Xiaoyu Yue, et al.
逆IIFEval:大規模言語モデルは、根強い学習規則を忘れて本物の指示に従うことができるか?
ベンチマーク
監視付き微調整
Qinyan Zhang, Xinping Lei, Ruijie Miao, et al.
DeepResearch Arena:セミナーを基盤とするタスクによる大規模言語モデルの研究能力の初の試験
LLM
エージェント
Haiyuan Wan, Chen Yang, Junchi Yu, et al.
大規模言語モデルの事後訓練に関する統一的視点へ
監視付き微調整
強化学習
Xingtai Lv, Yuxin Zuo, Youbang Sun, et al.
エディタから密集な幾何推定器へ
深度推定
拡散モデル
JiYuan Wang, Chunyu Lin, Lei Sun, et al.
ドリヴェルロジー:意味のない内容の深層的な解釈によってLLMに挑戦する
LLM
DeepSeek
Yang Wang, Chenghao Xiao, Chia-Yi Hsiao, et al.
ルオン:検証機を用いたスケールでの長鎖推論の合成
LLM
データセット
Xingyue Huang, Rishabh, Gregor Franke, et al.
1
29
30
31
32
33
34
35
49
F1:理解と生成を行動へとつなぐ視覚言語行動モデル
エムボディドインテリジェンス
エージェント
Qi Lv, Weijie Kong, Hao Li, et al.
UMO:マッチング報酬を用いた画像カスタマイズにおける多様なアイデンティティの一貫性拡張
拡散モデル
画像生成
Yufeng Cheng, Wenxu Wu, Shaojin Wu, et al.
再構成アライメントが統合型マルチモーダルモデルを改善する
マルチモーダル
画像生成
Ji Xie, Trevor Darrell, Luke Zettlemoyer, et al.
Mini-o3:視覚検索における推論パターンおよび対話ターンのスケーリングアップ
Reasoning
エージェント
Xin Lai, Junyi Li, Wei Li, et al.
マルチモーダル大規模言語モデルにおける視覚的表現のアライメント
マルチモーダル表現
マルチモーダル
Heeji Yoon, Jaewoo Jung, Junwan Kim, et al.
Parallel-R1:強化学習を活用した並列的思考の実現へ
強化学習
監視付き微調整
Tong Zheng, Hongming Zhang, Wenhao Yu, et al.
WenetSpeech-Yue:多次元アノテーションを備えた大規模広東語音声コーパス
Text-to-Speech
データセット
Longhao Li, Zhao Guo, Hongjie Chen, et al.
SheetDesigner:ルールベースおよびビジョンベースのリフレクションを活用したMLLM駆動型スプレッドシートレイアウト生成
マルチモーダル
ドキュメント理解
Qin Chen, Yuanyi Ren, Xiaojun Ma, et al.
自律的コード進化がNP完全性に直面する
LLM
エージェント
Cunxi Yu, Rongjian Liang, Chia-Tung Ho, et al.
深層研究システムのための強化学習の基礎:サーベイ
強化学習
エージェント
Wenjun Li, Zhi Chen, Jingru Lin, et al.
ツールを用いた強化された視覚的認識
LLM
Reasoning
Zetong Zhou, Dongping Chen, Zixian Ma, et al.
DINOv3は新たな医療分野のビジョン基準を設定するか?
コンピュータビジョン
医療画像
Che Liu, Yinda Chen, Haoyuan Shi, et al.
拡散大規模言語モデル向け強化学習フレームワークの革新
LLM
監視付き微調整
Yinjie Wang, Ling Yang, Bowen Li, et al.
WebExplorer:長期ホライズンWebエージェントの訓練のための探索と進化
エージェント
監視付き微調整
Junteng Liu, Yunji Li, Chi Zhang, et al.
逆工程的手法による開放型生成のための推論
Reasoning
LLM
Haozhe Wang, Haoran Que, Qixin Xu, et al.
OSC:マルチエージェントLLM協働における動的知識整合による認知オーケストレーション
エージェント
LLM
Jusheng Zhang, Yijia Fan, Kaitong Cai, et al.
CURE:ロバストな埋め込みのための制御された忘却――事前学習された言語モデルにおける概念的ショートカットの軽減
自然言語処理
監視付き微調整
Aysenur Kocak, Shuo Yang, Bardh Prenkaj, et al.
MedVista3D:3次元CT疾患検出、理解および報告における診断エラー低減のための視覚言語モデリング
視覚質問応答
マルチモーダル
Yuheng Li, Yenho Chen, Yuxiang Lai, et al.
LuxDiT:ビデオ拡散トランスフォーマーを用いた照明推定
拡散モデル
画像間変換
Ruofan Liang, Kai He, Zan Gojcic, et al.
WildScore:現実世界における記号音楽推論のためのMLLMsベンチマーク
ベンチマーク
視覚質問応答
Gagan Mundada, Yash Vishe, Amit Namburi, et al.
セットブロックデコードは言語モデル推論を高速化するアクセラレータである。
LLM
テキスト生成
Itai Gat, Heli Ben-Hamu, Marton Havasi, et al.
大規模言語モデルを用いた記号的グラフィカルプログラミング
LLM
コード生成
Yamei Chen, Haoquan Zhang, Yangyi Huang, et al.
言語モデルが幻覚を生じる理由
LLM
Reasoning
Adam Tauman Kalai, Ofir Nachum, Santosh S. Vempala, et al.
LatticeWorld:マルチモーダル大規模言語モデルを活用したインタラクティブな複雑な世界生成フレームワーク
3D生成
エージェント
Yinglin Duan, Zhengxia Zou, Tongwei Gu, et al.
Recomposer:イベントロール誘導型の生成音声編集
Text-to-Audio
Text-to-Speech
Daniel P. W. Ellis, Eduardo Fonseca, Ron J. Weiss, et al.
遷移モデル:生成学習目的の再考
拡散モデル
モデリング
Zidong Wang, Yiyuan Zhang, Xiaoyu Yue, et al.
逆IIFEval:大規模言語モデルは、根強い学習規則を忘れて本物の指示に従うことができるか?
ベンチマーク
監視付き微調整
Qinyan Zhang, Xinping Lei, Ruijie Miao, et al.
DeepResearch Arena:セミナーを基盤とするタスクによる大規模言語モデルの研究能力の初の試験
LLM
エージェント
Haiyuan Wan, Chen Yang, Junchi Yu, et al.
大規模言語モデルの事後訓練に関する統一的視点へ
監視付き微調整
強化学習
Xingtai Lv, Yuxin Zuo, Youbang Sun, et al.
エディタから密集な幾何推定器へ
深度推定
拡散モデル
JiYuan Wang, Chunyu Lin, Lei Sun, et al.
ドリヴェルロジー:意味のない内容の深層的な解釈によってLLMに挑戦する
LLM
DeepSeek
Yang Wang, Chenghao Xiao, Chia-Yi Hsiao, et al.
ルオン:検証機を用いたスケールでの長鎖推論の合成
LLM
データセット
Xingyue Huang, Rishabh, Gregor Franke, et al.
1
29
30
31
32
33
34
35
49