HyperAI

メイン

GPU

コンソール
Studio
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

人工知能の未来を築く

概要

当社についてサポートデータセットのヘルプ

製品

ニュース論文ノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

メイン

GPU

コンソール
Studio
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

人工知能の未来を築く

概要

当社についてサポートデータセットのヘルプ

製品

ニュース論文ノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)

テスト時に発見するための学習

テスト時に発見するための学習

Mert Yuksekgonul, Daniel Koceja, Xinhao Li, et al.

保護された出力に対するファインチューニングによる有害な能力の引き出し

保護された出力に対するファインチューニングによる有害な能力の引き出し

監視付き微調整

オープンソース

Jackson Kaunismaa, Avery Griffin, John Hughes, et al.

Memory-V2V：メモリを活用したビデオtoビデオ拡散モデルの拡張

拡散モデル

ビデオ処理

Dohun Lee, Chun-Hao Paul Huang, Xuelin Chen, et al.

推論時スケーリングによる検証：テスト時ルーブリックガイド付き検証を用いた自己進化型ディープリサーチエージェント

エージェント

Yuxuan Wan, Tianqing Fang, Zaitang Li, et al.

VisGym：多モーダルエージェント向けの多様性・カスタマイズ性・スケーラビリティを兼ね備えた環境

エージェント

エムボディドインテリジェンス

Zirui Wang, Junyi Zhang, Jiaxin Ge, et al.

TwinBrainVLA：非対称Mixture-of-Transformersを活用した汎用VLMの能力を体現型タスクに解放する

ロボティクス

エムボディドインテリジェンス

Bin Yu, Shijie Lian, Xiaopeng Lin, et al.

SWE-Pruner：コーディングエージェント向け自己適応的コンテキストプルーニング

エージェント

コード生成

Yuhang Wang, Yuling Shi, Mo Yang, et al.

LongCat-Flash-Thinking-2601 技術報告

エージェント

Meituan LongCat Team, Anchun Gui, Bei Li, et al.

言語モデルはスケーリング則を発見できるか？

エージェント

Haowei Lin, Haotian Ye, Wenzheng Feng, et al.

コスモス・ポリシー：視覚運動制御および計画のための動画モデルのファインチューニング

ロボティクス

Moo Jin Kim, Yihuai Gao, Tsung-Yi Lin, et al.

Triton-distributed: トライトンコンパイラを用いた分散AIシステムにおける重複するカーネルのプログラミング

Zheng Size, Wenlei Bao, Qi Hou, et al.

表現自己符号化器を用いたテキストから画像への拡散Transformerのスケーリング

テキストから画像生成

拡散モデル

Shengbang Tong, Boyang Zheng, Ziteng Wang, et al.

BayesianVLA：潜在行動クエリを用いた視覚言語行動モデルのベイズ分解

ロボティクス

マルチモーダル表現

Shijie Lian, Bin Yu, Xiaopeng Lin, et al.

柔軟性の罠：拡散言語モデルにおける推論可能性を制限する任意の順序制限の理由

拡散モデル

Zanlin Ni, Shenzhi Wang, Yang Yue, et al.

LLM-in-Sandboxが汎用エージェント型知能を引き出す

エージェント

Daixuan Cheng, Shaohan Huang, Yuxian Gu, et al.

HERMES：効率的なストリーミング動画理解のためのKVキャッシュを階層的メモリとして活用する

ビデオ理解

ビデオ処理

Haowei Zhang, Shudong Yang, Jinlan Fu, et al.

EvoCUA：スケーラブルな合成経験からの学習を活用したコンピュータ利用エージェントの進化

エージェント

Taofeng Xue, Chong Peng, Mianqiu Huang, et al.

HY-MT1.5 技術報告

Mao Zheng, Zheng Li, Tao Chen, et al.

コードのスケーリング則：すべてのプログラミング言語が重要である

コード生成

Jian Yang, Shawn Guo, Lin Jing, et al.

Qwen3-TTS技術報告

音声および音声処理

Hangrui Hu, Xinfa Zhu, Ting He, et al.

小さなモデル、大きな成果：分解を用いた優れた意図抽出の実現

エージェント

人間-コンピュータインタラクション

Danielle Cohen, Yoni Halpern, Noam Kahlon, et al.

FinVault：実行に基づく環境における金融エージェントの安全性のベンチマーク

ベンチマーク

エージェント

Zhi Yang, Runguo Li, Qiqi Qiang, et al.

MMDeepResearch-Bench：マルチモーダル・ディープ・リサーチ・エージェント向けベンチマーク

ベンチマーク

エージェント

Peizhou Huang, Zixuan Zhong, Zhongwei Wan, et al.

DARC：LLM進化のための非対称推論カリキュラムの分離

Shengda Fan, Xuyan Ye, Yankai Lin

身体化された世界における動画生成モデルの再考

エムボディドインテリジェンス

Yufan Deng, Zilin Pan, Hongyu Zhang, et al.

Paper2Rebuttal：透明な著者応答支援を実現するマルチエージェントフレームワーク

エージェント

検索拡張生成

Qianli Ma, Chang Guo, Zhiheng Tian, et al.

エージェンティック推論による大規模言語モデル

Tianxin Wei, Ting-Wei Li, Zhining Liu, et al.

PERSONAPLEX：フルデュプレックス会話型音声モデルにおけるボイスおよびロール制御

音声および音声処理

Rajarshi Roy, Jonathan Raiman, Sang-gil Lee, et al.

FlashLabs Chroma 1.0：個別化ボイスクラウンニングを備えたリアルタイムエンドツーエンド音声対話モデル

Tanyu Chen, Tairan Chen, Kai Shen, et al.

MemoryRewardBench：大規模言語モデルにおける長期記憶管理のためのリワードモデルのベンチマーク

ベンチマーク

Preference Modeling

Zecheng Tang, Baibei Ji, Ruoxi Sun, et al.

OmniTransfer：時空間動画転送のためのワンストップフレームワーク

テキストから動画

Pengze Zhang, Yanze Wu, Mengtian Li, et al.

効率的なエージェントへの道：メモリ、ツール学習、計画

エージェント

Xiaofang Yang, Lijun Li, Heng Zhou, et al.

テスト時に発見するための学習

テスト時に発見するための学習

Mert Yuksekgonul, Daniel Koceja, Xinhao Li, et al.

保護された出力に対するファインチューニングによる有害な能力の引き出し

保護された出力に対するファインチューニングによる有害な能力の引き出し

監視付き微調整

オープンソース

Jackson Kaunismaa, Avery Griffin, John Hughes, et al.

Memory-V2V：メモリを活用したビデオtoビデオ拡散モデルの拡張

拡散モデル

ビデオ処理

Dohun Lee, Chun-Hao Paul Huang, Xuelin Chen, et al.

推論時スケーリングによる検証：テスト時ルーブリックガイド付き検証を用いた自己進化型ディープリサーチエージェント

エージェント

Yuxuan Wan, Tianqing Fang, Zaitang Li, et al.

VisGym：多モーダルエージェント向けの多様性・カスタマイズ性・スケーラビリティを兼ね備えた環境

エージェント

エムボディドインテリジェンス

Zirui Wang, Junyi Zhang, Jiaxin Ge, et al.

TwinBrainVLA：非対称Mixture-of-Transformersを活用した汎用VLMの能力を体現型タスクに解放する

ロボティクス

エムボディドインテリジェンス

Bin Yu, Shijie Lian, Xiaopeng Lin, et al.

SWE-Pruner：コーディングエージェント向け自己適応的コンテキストプルーニング

エージェント

コード生成

Yuhang Wang, Yuling Shi, Mo Yang, et al.

LongCat-Flash-Thinking-2601 技術報告

エージェント

Meituan LongCat Team, Anchun Gui, Bei Li, et al.

言語モデルはスケーリング則を発見できるか？

エージェント

Haowei Lin, Haotian Ye, Wenzheng Feng, et al.

コスモス・ポリシー：視覚運動制御および計画のための動画モデルのファインチューニング

ロボティクス

Moo Jin Kim, Yihuai Gao, Tsung-Yi Lin, et al.

Triton-distributed: トライトンコンパイラを用いた分散AIシステムにおける重複するカーネルのプログラミング

Zheng Size, Wenlei Bao, Qi Hou, et al.

表現自己符号化器を用いたテキストから画像への拡散Transformerのスケーリング

テキストから画像生成

拡散モデル

Shengbang Tong, Boyang Zheng, Ziteng Wang, et al.

BayesianVLA：潜在行動クエリを用いた視覚言語行動モデルのベイズ分解

ロボティクス

マルチモーダル表現

Shijie Lian, Bin Yu, Xiaopeng Lin, et al.

柔軟性の罠：拡散言語モデルにおける推論可能性を制限する任意の順序制限の理由

拡散モデル

Zanlin Ni, Shenzhi Wang, Yang Yue, et al.

LLM-in-Sandboxが汎用エージェント型知能を引き出す

エージェント

Daixuan Cheng, Shaohan Huang, Yuxian Gu, et al.

HERMES：効率的なストリーミング動画理解のためのKVキャッシュを階層的メモリとして活用する

ビデオ理解

ビデオ処理

Haowei Zhang, Shudong Yang, Jinlan Fu, et al.

EvoCUA：スケーラブルな合成経験からの学習を活用したコンピュータ利用エージェントの進化

エージェント

Taofeng Xue, Chong Peng, Mianqiu Huang, et al.

HY-MT1.5 技術報告

Mao Zheng, Zheng Li, Tao Chen, et al.

コードのスケーリング則：すべてのプログラミング言語が重要である

コード生成

Jian Yang, Shawn Guo, Lin Jing, et al.

Qwen3-TTS技術報告

音声および音声処理

Hangrui Hu, Xinfa Zhu, Ting He, et al.

小さなモデル、大きな成果：分解を用いた優れた意図抽出の実現

エージェント

人間-コンピュータインタラクション

Danielle Cohen, Yoni Halpern, Noam Kahlon, et al.

FinVault：実行に基づく環境における金融エージェントの安全性のベンチマーク

ベンチマーク

エージェント

Zhi Yang, Runguo Li, Qiqi Qiang, et al.

MMDeepResearch-Bench：マルチモーダル・ディープ・リサーチ・エージェント向けベンチマーク

ベンチマーク

エージェント

Peizhou Huang, Zixuan Zhong, Zhongwei Wan, et al.

DARC：LLM進化のための非対称推論カリキュラムの分離

Shengda Fan, Xuyan Ye, Yankai Lin

身体化された世界における動画生成モデルの再考

エムボディドインテリジェンス

Yufan Deng, Zilin Pan, Hongyu Zhang, et al.

Paper2Rebuttal：透明な著者応答支援を実現するマルチエージェントフレームワーク

エージェント

検索拡張生成

Qianli Ma, Chang Guo, Zhiheng Tian, et al.

エージェンティック推論による大規模言語モデル

Tianxin Wei, Ting-Wei Li, Zhining Liu, et al.

PERSONAPLEX：フルデュプレックス会話型音声モデルにおけるボイスおよびロール制御

音声および音声処理

Rajarshi Roy, Jonathan Raiman, Sang-gil Lee, et al.

FlashLabs Chroma 1.0：個別化ボイスクラウンニングを備えたリアルタイムエンドツーエンド音声対話モデル

Tanyu Chen, Tairan Chen, Kai Shen, et al.

MemoryRewardBench：大規模言語モデルにおける長期記憶管理のためのリワードモデルのベンチマーク

ベンチマーク

Preference Modeling

Zecheng Tang, Baibei Ji, Ruoxi Sun, et al.

OmniTransfer：時空間動画転送のためのワンストップフレームワーク

テキストから動画

Pengze Zhang, Yanze Wu, Mengtian Li, et al.

効率的なエージェントへの道：メモリ、ツール学習、計画

エージェント

Xiaofang Yang, Lijun Li, Heng Zhou, et al.

Memory-V2V：メモリを活用したビデオtoビデオ拡散モデルの拡張

推論時スケーリングによる検証：テスト時ルーブリックガイド付き検証を用いた自己進化型ディープリサーチエージェント

VisGym：多モーダルエージェント向けの多様性・カスタマイズ性・スケーラビリティを兼ね備えた環境

TwinBrainVLA：非対称Mixture-of-Transformersを活用した汎用VLMの能力を体現型タスクに解放する

SWE-Pruner：コーディングエージェント向け自己適応的コンテキストプルーニング

LongCat-Flash-Thinking-2601 技術報告

言語モデルはスケーリング則を発見できるか？

コスモス・ポリシー：視覚運動制御および計画のための動画モデルのファインチューニング

Triton-distributed: トライトンコンパイラを用いた分散AIシステムにおける重複するカーネルのプログラミング

表現自己符号化器を用いたテキストから画像への拡散Transformerのスケーリング

BayesianVLA：潜在行動クエリを用いた視覚言語行動モデルのベイズ分解

柔軟性の罠：拡散言語モデルにおける推論可能性を制限する任意の順序制限の理由

LLM-in-Sandboxが汎用エージェント型知能を引き出す

HERMES：効率的なストリーミング動画理解のためのKVキャッシュを階層的メモリとして活用する

EvoCUA：スケーラブルな合成経験からの学習を活用したコンピュータ利用エージェントの進化

HY-MT1.5 技術報告

コードのスケーリング則：すべてのプログラミング言語が重要である

Qwen3-TTS技術報告

小さなモデル、大きな成果：分解を用いた優れた意図抽出の実現

FinVault：実行に基づく環境における金融エージェントの安全性のベンチマーク

MMDeepResearch-Bench：マルチモーダル・ディープ・リサーチ・エージェント向けベンチマーク

DARC：LLM進化のための非対称推論カリキュラムの分離

身体化された世界における動画生成モデルの再考

Paper2Rebuttal：透明な著者応答支援を実現するマルチエージェントフレームワーク

エージェンティック推論による大規模言語モデル

PERSONAPLEX：フルデュプレックス会話型音声モデルにおけるボイスおよびロール制御

FlashLabs Chroma 1.0：個別化ボイスクラウンニングを備えたリアルタイムエンドツーエンド音声対話モデル

MemoryRewardBench：大規模言語モデルにおける長期記憶管理のためのリワードモデルのベンチマーク

OmniTransfer：時空間動画転送のためのワンストップフレームワーク

効率的なエージェントへの道：メモリ、ツール学習、計画

Memory-V2V：メモリを活用したビデオtoビデオ拡散モデルの拡張

推論時スケーリングによる検証：テスト時ルーブリックガイド付き検証を用いた自己進化型ディープリサーチエージェント

VisGym：多モーダルエージェント向けの多様性・カスタマイズ性・スケーラビリティを兼ね備えた環境

TwinBrainVLA：非対称Mixture-of-Transformersを活用した汎用VLMの能力を体現型タスクに解放する

SWE-Pruner：コーディングエージェント向け自己適応的コンテキストプルーニング

LongCat-Flash-Thinking-2601 技術報告

言語モデルはスケーリング則を発見できるか？

コスモス・ポリシー：視覚運動制御および計画のための動画モデルのファインチューニング

Triton-distributed: トライトンコンパイラを用いた分散AIシステムにおける重複するカーネルのプログラミング

表現自己符号化器を用いたテキストから画像への拡散Transformerのスケーリング

BayesianVLA：潜在行動クエリを用いた視覚言語行動モデルのベイズ分解

柔軟性の罠：拡散言語モデルにおける推論可能性を制限する任意の順序制限の理由

LLM-in-Sandboxが汎用エージェント型知能を引き出す

HERMES：効率的なストリーミング動画理解のためのKVキャッシュを階層的メモリとして活用する

EvoCUA：スケーラブルな合成経験からの学習を活用したコンピュータ利用エージェントの進化

HY-MT1.5 技術報告

コードのスケーリング則：すべてのプログラミング言語が重要である

Qwen3-TTS技術報告

小さなモデル、大きな成果：分解を用いた優れた意図抽出の実現

FinVault：実行に基づく環境における金融エージェントの安全性のベンチマーク

MMDeepResearch-Bench：マルチモーダル・ディープ・リサーチ・エージェント向けベンチマーク

DARC：LLM進化のための非対称推論カリキュラムの分離

身体化された世界における動画生成モデルの再考

Paper2Rebuttal：透明な著者応答支援を実現するマルチエージェントフレームワーク

エージェンティック推論による大規模言語モデル

PERSONAPLEX：フルデュプレックス会話型音声モデルにおけるボイスおよびロール制御

FlashLabs Chroma 1.0：個別化ボイスクラウンニングを備えたリアルタイムエンドツーエンド音声対話モデル

MemoryRewardBench：大規模言語モデルにおける長期記憶管理のためのリワードモデルのベンチマーク

OmniTransfer：時空間動画転送のためのワンストップフレームワーク

効率的なエージェントへの道：メモリ、ツール学習、計画