HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
LongCat-Flash-Thinking-2601 技術報告
エージェント
Reasoning
Meituan LongCat Team, Anchun Gui, Bei Li, et al.
言語モデルはスケーリング則を発見できるか?
エージェント
LLM
Haowei Lin, Haotian Ye, Wenzheng Feng, et al.
コスモス・ポリシー:視覚運動制御および計画のための動画モデルのファインチューニング
動画生成
ロボティクス
Moo Jin Kim, Yihuai Gao, Tsung-Yi Lin, et al.
表現自己符号化器を用いたテキストから画像への拡散Transformerのスケーリング
テキストから画像生成
拡散モデル
Shengbang Tong, Boyang Zheng, Ziteng Wang, et al.
BayesianVLA:潜在行動クエリを用いた視覚言語行動モデルのベイズ分解
ロボティクス
マルチモーダル表現
Shijie Lian, Bin Yu, Xiaopeng Lin, et al.
柔軟性の罠:拡散言語モデルにおける推論可能性を制限する任意の順序制限の理由
拡散モデル
Reasoning
Zanlin Ni, Shenzhi Wang, Yang Yue, et al.
LLM-in-Sandboxが汎用エージェント型知能を引き出す
エージェント
LLM
Daixuan Cheng, Shaohan Huang, Yuxian Gu, et al.
HERMES:効率的なストリーミング動画理解のためのKVキャッシュを階層的メモリとして活用する
ビデオ理解
ビデオ処理
Haowei Zhang, Shudong Yang, Jinlan Fu, et al.
EvoCUA:スケーラブルな合成経験からの学習を活用したコンピュータ利用エージェントの進化
エージェント
LLM
Taofeng Xue, Chong Peng, Mianqiu Huang, et al.
HY-MT1.5 技術報告
翻訳
LLM
Mao Zheng, Zheng Li, Tao Chen, et al.
コードのスケーリング則:すべてのプログラミング言語が重要である
LLM
コード生成
Jian Yang, Shawn Guo, Lin Jing, et al.
Qwen3-TTS技術報告
Text-to-Speech
音声および音声処理
Hangrui Hu, Xinfa Zhu, Ting He, et al.
小さなモデル、大きな成果:分解を用いた優れた意図抽出の実現
エージェント
人間-コンピュータインタラクション
Danielle Cohen, Yoni Halpern, Noam Kahlon, et al.
LightOnOCR:最先端OCR向け10億パラメータのエンドツーエンド多言語視覚言語モデル
OCR
ドキュメント理解
Said Taghadouini, Adrien Cavaillès, Baptiste Aubertin
FinVault:実行に基づく環境における金融エージェントの安全性のベンチマーク
ベンチマーク
エージェント
Zhi Yang, Runguo Li, Qiqi Qiang, et al.
MMDeepResearch-Bench:マルチモーダル・ディープ・リサーチ・エージェント向けベンチマーク
ベンチマーク
エージェント
Peizhou Huang, Zixuan Zhong, Zhongwei Wan, et al.
DARC:LLM進化のための非対称推論カリキュラムの分離
LLM
Reasoning
Shengda Fan, Xuyan Ye, Yankai Lin
身体化された世界における動画生成モデルの再考
動画生成
エムボディドインテリジェンス
Yufan Deng, Zilin Pan, Hongyu Zhang, et al.
Paper2Rebuttal:透明な著者応答支援を実現するマルチエージェントフレームワーク
エージェント
検索拡張生成
Qianli Ma, Chang Guo, Zhiheng Tian, et al.
エージェンティック推論による大規模言語モデル
Reasoning
LLM
Tianxin Wei, Ting-Wei Li, Zhining Liu, et al.
PERSONAPLEX:フルデュプレックス会話型音声モデルにおけるボイスおよびロール制御
Text-to-Speech
音声および音声処理
Rajarshi Roy, Jonathan Raiman, Sang-gil Lee, et al.
FlashLabs Chroma 1.0:個別化ボイスクラウンニングを備えたリアルタイムエンドツーエンド音声対話モデル
LLM
Text-to-Speech
Tanyu Chen, Tairan Chen, Kai Shen, et al.
MemoryRewardBench:大規模言語モデルにおける長期記憶管理のためのリワードモデルのベンチマーク
ベンチマーク
Preference Modeling
Zecheng Tang, Baibei Ji, Ruoxi Sun, et al.
OmniTransfer:時空間動画転送のためのワンストップフレームワーク
動画生成
テキストから動画
Pengze Zhang, Yanze Wu, Mengtian Li, et al.
効率的なエージェントへの道:メモリ、ツール学習、計画
エージェント
LLM
Xiaofang Yang, Lijun Li, Heng Zhou, et al.
FutureOmni:マルチモーダルLLMにおけるオムニモーダルコンテキストからの将来予測の評価
Any-to-Any
LLM
Qian Chen, Jinlan Fu, Changsong Li, et al.
Being-H0.5:クロスエムボディメント一般化のためのヒューマンセントリックロボット学習のスケーリング
エムボディドインテリジェンス
ロボティクス
Hao Luo, Ye Wang, Wanpeng Zhang, et al.
LLMを活用したソフトウェア工学における問題解決の進展と先端的研究:包括的サーベイ
LLM
エージェント
Caihua Li, Lianghong Guo, Yanlin Wang, et al.
Nemotron-Math:マルチモード監視からの数学的推論の効率的長文脈蒸留
データセット
Reasoning
Wei Du, Shubham Toshniwal, Branislav Kisacanin, et al.
Gemini向けの本番環境対応プローブの構築
LLM
テキスト生成
János Kramár, Joshua Engels, Zheng Wang, et al.
LFM2 技術報告
LLM
検索拡張生成
Alexander Amini, Anna Banaszak, Harold Benoit, et al.
CoDance:ロバストなマルチサブジェクトアニメーションのためのアンバインド・リバインドパラダイム
画像から動画生成
画像間変換
Shuai Tan, Biao Gong, Ke Ma, et al.
1
2
3
4
5
47
LongCat-Flash-Thinking-2601 技術報告
エージェント
Reasoning
Meituan LongCat Team, Anchun Gui, Bei Li, et al.
言語モデルはスケーリング則を発見できるか?
エージェント
LLM
Haowei Lin, Haotian Ye, Wenzheng Feng, et al.
コスモス・ポリシー:視覚運動制御および計画のための動画モデルのファインチューニング
動画生成
ロボティクス
Moo Jin Kim, Yihuai Gao, Tsung-Yi Lin, et al.
表現自己符号化器を用いたテキストから画像への拡散Transformerのスケーリング
テキストから画像生成
拡散モデル
Shengbang Tong, Boyang Zheng, Ziteng Wang, et al.
BayesianVLA:潜在行動クエリを用いた視覚言語行動モデルのベイズ分解
ロボティクス
マルチモーダル表現
Shijie Lian, Bin Yu, Xiaopeng Lin, et al.
柔軟性の罠:拡散言語モデルにおける推論可能性を制限する任意の順序制限の理由
拡散モデル
Reasoning
Zanlin Ni, Shenzhi Wang, Yang Yue, et al.
LLM-in-Sandboxが汎用エージェント型知能を引き出す
エージェント
LLM
Daixuan Cheng, Shaohan Huang, Yuxian Gu, et al.
HERMES:効率的なストリーミング動画理解のためのKVキャッシュを階層的メモリとして活用する
ビデオ理解
ビデオ処理
Haowei Zhang, Shudong Yang, Jinlan Fu, et al.
EvoCUA:スケーラブルな合成経験からの学習を活用したコンピュータ利用エージェントの進化
エージェント
LLM
Taofeng Xue, Chong Peng, Mianqiu Huang, et al.
HY-MT1.5 技術報告
翻訳
LLM
Mao Zheng, Zheng Li, Tao Chen, et al.
コードのスケーリング則:すべてのプログラミング言語が重要である
LLM
コード生成
Jian Yang, Shawn Guo, Lin Jing, et al.
Qwen3-TTS技術報告
Text-to-Speech
音声および音声処理
Hangrui Hu, Xinfa Zhu, Ting He, et al.
小さなモデル、大きな成果:分解を用いた優れた意図抽出の実現
エージェント
人間-コンピュータインタラクション
Danielle Cohen, Yoni Halpern, Noam Kahlon, et al.
LightOnOCR:最先端OCR向け10億パラメータのエンドツーエンド多言語視覚言語モデル
OCR
ドキュメント理解
Said Taghadouini, Adrien Cavaillès, Baptiste Aubertin
FinVault:実行に基づく環境における金融エージェントの安全性のベンチマーク
ベンチマーク
エージェント
Zhi Yang, Runguo Li, Qiqi Qiang, et al.
MMDeepResearch-Bench:マルチモーダル・ディープ・リサーチ・エージェント向けベンチマーク
ベンチマーク
エージェント
Peizhou Huang, Zixuan Zhong, Zhongwei Wan, et al.
DARC:LLM進化のための非対称推論カリキュラムの分離
LLM
Reasoning
Shengda Fan, Xuyan Ye, Yankai Lin
身体化された世界における動画生成モデルの再考
動画生成
エムボディドインテリジェンス
Yufan Deng, Zilin Pan, Hongyu Zhang, et al.
Paper2Rebuttal:透明な著者応答支援を実現するマルチエージェントフレームワーク
エージェント
検索拡張生成
Qianli Ma, Chang Guo, Zhiheng Tian, et al.
エージェンティック推論による大規模言語モデル
Reasoning
LLM
Tianxin Wei, Ting-Wei Li, Zhining Liu, et al.
PERSONAPLEX:フルデュプレックス会話型音声モデルにおけるボイスおよびロール制御
Text-to-Speech
音声および音声処理
Rajarshi Roy, Jonathan Raiman, Sang-gil Lee, et al.
FlashLabs Chroma 1.0:個別化ボイスクラウンニングを備えたリアルタイムエンドツーエンド音声対話モデル
LLM
Text-to-Speech
Tanyu Chen, Tairan Chen, Kai Shen, et al.
MemoryRewardBench:大規模言語モデルにおける長期記憶管理のためのリワードモデルのベンチマーク
ベンチマーク
Preference Modeling
Zecheng Tang, Baibei Ji, Ruoxi Sun, et al.
OmniTransfer:時空間動画転送のためのワンストップフレームワーク
動画生成
テキストから動画
Pengze Zhang, Yanze Wu, Mengtian Li, et al.
効率的なエージェントへの道:メモリ、ツール学習、計画
エージェント
LLM
Xiaofang Yang, Lijun Li, Heng Zhou, et al.
FutureOmni:マルチモーダルLLMにおけるオムニモーダルコンテキストからの将来予測の評価
Any-to-Any
LLM
Qian Chen, Jinlan Fu, Changsong Li, et al.
Being-H0.5:クロスエムボディメント一般化のためのヒューマンセントリックロボット学習のスケーリング
エムボディドインテリジェンス
ロボティクス
Hao Luo, Ye Wang, Wanpeng Zhang, et al.
LLMを活用したソフトウェア工学における問題解決の進展と先端的研究:包括的サーベイ
LLM
エージェント
Caihua Li, Lianghong Guo, Yanlin Wang, et al.
Nemotron-Math:マルチモード監視からの数学的推論の効率的長文脈蒸留
データセット
Reasoning
Wei Du, Shubham Toshniwal, Branislav Kisacanin, et al.
Gemini向けの本番環境対応プローブの構築
LLM
テキスト生成
János Kramár, Joshua Engels, Zheng Wang, et al.
LFM2 技術報告
LLM
検索拡張生成
Alexander Amini, Anna Banaszak, Harold Benoit, et al.
CoDance:ロバストなマルチサブジェクトアニメーションのためのアンバインド・リバインドパラダイム
画像から動画生成
画像間変換
Shuai Tan, Biao Gong, Ke Ma, et al.
1
2
3
4
5
47