HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
テスト時に発見するための学習
強化学習
LLM
Mert Yuksekgonul, Daniel Koceja, Xinhao Li, et al.
保護された出力に対するファインチューニングによる有害な能力の引き出し
監視付き微調整
オープンソース
Jackson Kaunismaa, Avery Griffin, John Hughes, et al.
Memory-V2V:メモリを活用したビデオtoビデオ拡散モデルの拡張
拡散モデル
ビデオ処理
Dohun Lee, Chun-Hao Paul Huang, Xuelin Chen, et al.
推論時スケーリングによる検証:テスト時ルーブリックガイド付き検証を用いた自己進化型ディープリサーチエージェント
エージェント
LLM
Yuxuan Wan, Tianqing Fang, Zaitang Li, et al.
VisGym:多モーダルエージェント向けの多様性・カスタマイズ性・スケーラビリティを兼ね備えた環境
エージェント
エムボディドインテリジェンス
Zirui Wang, Junyi Zhang, Jiaxin Ge, et al.
TwinBrainVLA:非対称Mixture-of-Transformersを活用した汎用VLMの能力を体現型タスクに解放する
ロボティクス
エムボディドインテリジェンス
Bin Yu, Shijie Lian, Xiaopeng Lin, et al.
SWE-Pruner:コーディングエージェント向け自己適応的コンテキストプルーニング
エージェント
コード生成
Yuhang Wang, Yuling Shi, Mo Yang, et al.
LongCat-Flash-Thinking-2601 技術報告
エージェント
Reasoning
Meituan LongCat Team, Anchun Gui, Bei Li, et al.
言語モデルはスケーリング則を発見できるか?
エージェント
LLM
Haowei Lin, Haotian Ye, Wenzheng Feng, et al.
コスモス・ポリシー:視覚運動制御および計画のための動画モデルのファインチューニング
動画生成
ロボティクス
Moo Jin Kim, Yihuai Gao, Tsung-Yi Lin, et al.
表現自己符号化器を用いたテキストから画像への拡散Transformerのスケーリング
テキストから画像生成
拡散モデル
Shengbang Tong, Boyang Zheng, Ziteng Wang, et al.
BayesianVLA:潜在行動クエリを用いた視覚言語行動モデルのベイズ分解
ロボティクス
マルチモーダル表現
Shijie Lian, Bin Yu, Xiaopeng Lin, et al.
柔軟性の罠:拡散言語モデルにおける推論可能性を制限する任意の順序制限の理由
拡散モデル
Reasoning
Zanlin Ni, Shenzhi Wang, Yang Yue, et al.
LLM-in-Sandboxが汎用エージェント型知能を引き出す
エージェント
LLM
Daixuan Cheng, Shaohan Huang, Yuxian Gu, et al.
HERMES:効率的なストリーミング動画理解のためのKVキャッシュを階層的メモリとして活用する
ビデオ理解
ビデオ処理
Haowei Zhang, Shudong Yang, Jinlan Fu, et al.
EvoCUA:スケーラブルな合成経験からの学習を活用したコンピュータ利用エージェントの進化
エージェント
LLM
Taofeng Xue, Chong Peng, Mianqiu Huang, et al.
HY-MT1.5 技術報告
翻訳
LLM
Mao Zheng, Zheng Li, Tao Chen, et al.
コードのスケーリング則:すべてのプログラミング言語が重要である
LLM
コード生成
Jian Yang, Shawn Guo, Lin Jing, et al.
Qwen3-TTS技術報告
Text-to-Speech
音声および音声処理
Hangrui Hu, Xinfa Zhu, Ting He, et al.
小さなモデル、大きな成果:分解を用いた優れた意図抽出の実現
エージェント
人間-コンピュータインタラクション
Danielle Cohen, Yoni Halpern, Noam Kahlon, et al.
FinVault:実行に基づく環境における金融エージェントの安全性のベンチマーク
ベンチマーク
エージェント
Zhi Yang, Runguo Li, Qiqi Qiang, et al.
MMDeepResearch-Bench:マルチモーダル・ディープ・リサーチ・エージェント向けベンチマーク
ベンチマーク
エージェント
Peizhou Huang, Zixuan Zhong, Zhongwei Wan, et al.
DARC:LLM進化のための非対称推論カリキュラムの分離
LLM
Reasoning
Shengda Fan, Xuyan Ye, Yankai Lin
身体化された世界における動画生成モデルの再考
動画生成
エムボディドインテリジェンス
Yufan Deng, Zilin Pan, Hongyu Zhang, et al.
Paper2Rebuttal:透明な著者応答支援を実現するマルチエージェントフレームワーク
エージェント
検索拡張生成
Qianli Ma, Chang Guo, Zhiheng Tian, et al.
エージェンティック推論による大規模言語モデル
Reasoning
LLM
Tianxin Wei, Ting-Wei Li, Zhining Liu, et al.
PERSONAPLEX:フルデュプレックス会話型音声モデルにおけるボイスおよびロール制御
Text-to-Speech
音声および音声処理
Rajarshi Roy, Jonathan Raiman, Sang-gil Lee, et al.
FlashLabs Chroma 1.0:個別化ボイスクラウンニングを備えたリアルタイムエンドツーエンド音声対話モデル
LLM
Text-to-Speech
Tanyu Chen, Tairan Chen, Kai Shen, et al.
MemoryRewardBench:大規模言語モデルにおける長期記憶管理のためのリワードモデルのベンチマーク
ベンチマーク
Preference Modeling
Zecheng Tang, Baibei Ji, Ruoxi Sun, et al.
OmniTransfer:時空間動画転送のためのワンストップフレームワーク
動画生成
テキストから動画
Pengze Zhang, Yanze Wu, Mengtian Li, et al.
効率的なエージェントへの道:メモリ、ツール学習、計画
エージェント
LLM
Xiaofang Yang, Lijun Li, Heng Zhou, et al.
FutureOmni:マルチモーダルLLMにおけるオムニモーダルコンテキストからの将来予測の評価
Any-to-Any
LLM
Qian Chen, Jinlan Fu, Changsong Li, et al.
1
9
10
11
12
13
14
15
57
テスト時に発見するための学習
強化学習
LLM
Mert Yuksekgonul, Daniel Koceja, Xinhao Li, et al.
保護された出力に対するファインチューニングによる有害な能力の引き出し
監視付き微調整
オープンソース
Jackson Kaunismaa, Avery Griffin, John Hughes, et al.
Memory-V2V:メモリを活用したビデオtoビデオ拡散モデルの拡張
拡散モデル
ビデオ処理
Dohun Lee, Chun-Hao Paul Huang, Xuelin Chen, et al.
推論時スケーリングによる検証:テスト時ルーブリックガイド付き検証を用いた自己進化型ディープリサーチエージェント
エージェント
LLM
Yuxuan Wan, Tianqing Fang, Zaitang Li, et al.
VisGym:多モーダルエージェント向けの多様性・カスタマイズ性・スケーラビリティを兼ね備えた環境
エージェント
エムボディドインテリジェンス
Zirui Wang, Junyi Zhang, Jiaxin Ge, et al.
TwinBrainVLA:非対称Mixture-of-Transformersを活用した汎用VLMの能力を体現型タスクに解放する
ロボティクス
エムボディドインテリジェンス
Bin Yu, Shijie Lian, Xiaopeng Lin, et al.
SWE-Pruner:コーディングエージェント向け自己適応的コンテキストプルーニング
エージェント
コード生成
Yuhang Wang, Yuling Shi, Mo Yang, et al.
LongCat-Flash-Thinking-2601 技術報告
エージェント
Reasoning
Meituan LongCat Team, Anchun Gui, Bei Li, et al.
言語モデルはスケーリング則を発見できるか?
エージェント
LLM
Haowei Lin, Haotian Ye, Wenzheng Feng, et al.
コスモス・ポリシー:視覚運動制御および計画のための動画モデルのファインチューニング
動画生成
ロボティクス
Moo Jin Kim, Yihuai Gao, Tsung-Yi Lin, et al.
表現自己符号化器を用いたテキストから画像への拡散Transformerのスケーリング
テキストから画像生成
拡散モデル
Shengbang Tong, Boyang Zheng, Ziteng Wang, et al.
BayesianVLA:潜在行動クエリを用いた視覚言語行動モデルのベイズ分解
ロボティクス
マルチモーダル表現
Shijie Lian, Bin Yu, Xiaopeng Lin, et al.
柔軟性の罠:拡散言語モデルにおける推論可能性を制限する任意の順序制限の理由
拡散モデル
Reasoning
Zanlin Ni, Shenzhi Wang, Yang Yue, et al.
LLM-in-Sandboxが汎用エージェント型知能を引き出す
エージェント
LLM
Daixuan Cheng, Shaohan Huang, Yuxian Gu, et al.
HERMES:効率的なストリーミング動画理解のためのKVキャッシュを階層的メモリとして活用する
ビデオ理解
ビデオ処理
Haowei Zhang, Shudong Yang, Jinlan Fu, et al.
EvoCUA:スケーラブルな合成経験からの学習を活用したコンピュータ利用エージェントの進化
エージェント
LLM
Taofeng Xue, Chong Peng, Mianqiu Huang, et al.
HY-MT1.5 技術報告
翻訳
LLM
Mao Zheng, Zheng Li, Tao Chen, et al.
コードのスケーリング則:すべてのプログラミング言語が重要である
LLM
コード生成
Jian Yang, Shawn Guo, Lin Jing, et al.
Qwen3-TTS技術報告
Text-to-Speech
音声および音声処理
Hangrui Hu, Xinfa Zhu, Ting He, et al.
小さなモデル、大きな成果:分解を用いた優れた意図抽出の実現
エージェント
人間-コンピュータインタラクション
Danielle Cohen, Yoni Halpern, Noam Kahlon, et al.
FinVault:実行に基づく環境における金融エージェントの安全性のベンチマーク
ベンチマーク
エージェント
Zhi Yang, Runguo Li, Qiqi Qiang, et al.
MMDeepResearch-Bench:マルチモーダル・ディープ・リサーチ・エージェント向けベンチマーク
ベンチマーク
エージェント
Peizhou Huang, Zixuan Zhong, Zhongwei Wan, et al.
DARC:LLM進化のための非対称推論カリキュラムの分離
LLM
Reasoning
Shengda Fan, Xuyan Ye, Yankai Lin
身体化された世界における動画生成モデルの再考
動画生成
エムボディドインテリジェンス
Yufan Deng, Zilin Pan, Hongyu Zhang, et al.
Paper2Rebuttal:透明な著者応答支援を実現するマルチエージェントフレームワーク
エージェント
検索拡張生成
Qianli Ma, Chang Guo, Zhiheng Tian, et al.
エージェンティック推論による大規模言語モデル
Reasoning
LLM
Tianxin Wei, Ting-Wei Li, Zhining Liu, et al.
PERSONAPLEX:フルデュプレックス会話型音声モデルにおけるボイスおよびロール制御
Text-to-Speech
音声および音声処理
Rajarshi Roy, Jonathan Raiman, Sang-gil Lee, et al.
FlashLabs Chroma 1.0:個別化ボイスクラウンニングを備えたリアルタイムエンドツーエンド音声対話モデル
LLM
Text-to-Speech
Tanyu Chen, Tairan Chen, Kai Shen, et al.
MemoryRewardBench:大規模言語モデルにおける長期記憶管理のためのリワードモデルのベンチマーク
ベンチマーク
Preference Modeling
Zecheng Tang, Baibei Ji, Ruoxi Sun, et al.
OmniTransfer:時空間動画転送のためのワンストップフレームワーク
動画生成
テキストから動画
Pengze Zhang, Yanze Wu, Mengtian Li, et al.
効率的なエージェントへの道:メモリ、ツール学習、計画
エージェント
LLM
Xiaofang Yang, Lijun Li, Heng Zhou, et al.
FutureOmni:マルチモーダルLLMにおけるオムニモーダルコンテキストからの将来予測の評価
Any-to-Any
LLM
Qian Chen, Jinlan Fu, Changsong Li, et al.
1
9
10
11
12
13
14
15
57