HyperAI

メイン

GPU

コンソール
Studio
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

人工知能の未来を築く

概要

当社についてサポートデータセットのヘルプ

製品

ニュース論文ノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

メイン

GPU

コンソール
Studio
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

人工知能の未来を築く

概要

当社についてサポートデータセットのヘルプ

製品

ニュース論文ノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)

最後の人間による論文：エージェントネイティブな研究アーティファクト

最後の人間による論文：エージェントネイティブな研究アーティファクト

エージェント

サイエンスのためのAI

Jiachen Liu, Jiaxin Pei, Jintao Huang, et al.

FlashMemory-DeepSeek-V4: 先読みスパースアテンションによる超長コンテキスト用の超高速インデックス

FlashMemory-DeepSeek-V4: 先読みスパースアテンションによる超長コンテキスト用の超高速インデックス

Yan Wang, Qifan Zhang, Jiachen Yu, et al.

LatentSkill: コンテキスト内テキストスキルから重み内潜在スキルへ LLM Agents 向け

エージェント

Aofan Yu, Chenyu Zhou, Tianyi Xu, et al.

CoVEBench: 動画編集モデルは複雑な指示を処理できるか？

テキストから動画

Jiangtao Wu, Jiaming Wang, Yiwen He, et al.

動画世界モデルのための潜在空間記憶

拡散モデル

Weijie Wang, Haoyu Zhao, Yifan Yang, et al.

オンポリシー蒸留の幾何学について

モデル学習

Zhennan Shen, Yanshu Li, Qingyu Yin, et al.

SWE-Explore: コーディング agents がリポジトリを探索する方法のベンチマーク

エージェント

コード生成

Shaoqiu Zhang, Yuhang Wang, Jialiang Liang, et al.

VoxCPM2技術報告書

拡散モデル

マルチモーダル

Meituan LongCat Team

ChartNet: 堅牢なチャート理解のための百万規模・高品質マルチモーダルデータセット

マルチモーダル

視覚質問応答

Jovana Kondic, Pengyuan Li, Dhiraj Joshi, et al.

ACL-Verbatim: 研究におけるハルシネーションフリーの質問応答

検索拡張生成

インテリジェントな質問応答

Gábor Recski, Szilveszter Tóth, Nadia Verdha, et al.

静的対話を超える：現実的、多様で進化し続ける長期記憶のためのベンチマーク

ベンチマーク

Han Zhang, Zihao Tang, Xin Yu, et al.

ソフトウェアエンジニアリングの終焉：AIエージェントがどのようにソフトウェアのパラダイムを根本から再構築しているか

エージェント

なぜ大規模なモデルはより多くのことを学習するのか：容量、干渉、および稀なタスク保持の影響

ディープラーニング

マルチタスク学習

Jing Huang, Daniel Wurgaft, Rachit Bansal, et al.

ツールが失敗したとき：LLM Agentsにおける動的再計画と異常回復のベンチマーク

エージェント

Dongsheng Zhu, Xuchen Ma, Yucheng Shen, et al.

分解された視覚プロキシを用いた直接3D認識物体挿入

拡散モデル

Jingbo Gong, Yikai Wang, Yushi Lan, et al.

AnchorWorld: 視点に基づく進化カスタマイズを用いた具身自己中心世界シミュレーション

エムボディドインテリジェンス

Yu Li, Menghan Xia, Gongye Liu, et al.

SoCRATES: ドメインおよび社会認知の多様性にわたる能動的LLM仲介の信頼性の高い自動評価に向けて

エージェント

Taewon Yun, Hyeonseong Park, Jeonghwan Choi, et al.

MMAE: 大規模マルチタスクオーディオ編集ベンチマーク

音声および音声処理

マルチモーダル

Ziyang Ma, Ruiqi Yan, Ruiyang Xu, et al.

あなたのアンエンベディング行列は実はテキスト埋め込みのための特徴レンズである

Songhao Wu, Zhongxin Chen, Yuxuan Liu, et al.

ChordEdit：画像編集のためのワンステップ・低エネルギー輸送

拡散モデル

テキストから画像生成

Liangsi Lu, Xuhang Chen, Minzhe Guo, et al.

NitroGen: 汎用ゲームエージェントのためのオープンな基盤モデル

エージェント

マルチモーダル

Loïc Magne, Anas Awadalla, Guanzhi Wang, et al.

D4RTごとに動的シーンを効率的に再構築する

3D マシンビジョン

Chuhan Zhang, Guillaume Le Moing, Skanda Koppula, et al.

Continual Learning Bench：現実世界の状態保持環境における最先端AIシステムの評価

ベンチマーク

Parth Asawa, Christopher M. Glaze, Gabriel Orlanski, et al.

MEMORY CACHING: Growing Memoryを持つRNN

ディープラーニング

Ali Behrouz, Zeman Li, Yuan Deng, et al.

RobotValues: 人間の価値観が衝突する際の家庭用ロボットの評価

ロボティクス

ベンチマーク

Jongwook Han, Hyeongjin Kim, Yohan Jo

VideoKR: 知識・推論集中型の動画理解へ向けて

ビデオ理解

視覚質問応答

Lin Fu, Zheyuan Yang, Yang Wang, et al.

AdaPlanBench: 世界制約とユーザー制約下における大規模言語モデル Agents の適応的計画の評価

エージェント

Jiayu Liu, Cheng Qian, Zhenhailong Wang, et al.

TIDE: テンプレート誘導型反復による複数問題の先制的発見

エージェント

Soyeong Jeong, Jinheon Baek, Minki Kang, et al.

ArcANE: ロールプレイ言語Agentsは適切なタイミングでキャラクターを維持しているか？

エージェント

Woojung Song, Nalim Kim, Sangjun Song, et al.

Code2LoRA: ソフトウェア進化におけるコード言語モデル用のハイパーネットワーク生成アダプタ

コード生成

Liliana Hotsko, Yinxi Li, Yuntian Deng, et al.

自己蒸留型方策勾配

Yifeng Liu, Shiyouan Zhang, Yifan Zhang, et al.

最後の人間による論文：エージェントネイティブな研究アーティファクト

最後の人間による論文：エージェントネイティブな研究アーティファクト

エージェント

サイエンスのためのAI

Jiachen Liu, Jiaxin Pei, Jintao Huang, et al.

FlashMemory-DeepSeek-V4: 先読みスパースアテンションによる超長コンテキスト用の超高速インデックス

FlashMemory-DeepSeek-V4: 先読みスパースアテンションによる超長コンテキスト用の超高速インデックス

Yan Wang, Qifan Zhang, Jiachen Yu, et al.

LatentSkill: コンテキスト内テキストスキルから重み内潜在スキルへ LLM Agents 向け

エージェント

Aofan Yu, Chenyu Zhou, Tianyi Xu, et al.

CoVEBench: 動画編集モデルは複雑な指示を処理できるか？

テキストから動画

Jiangtao Wu, Jiaming Wang, Yiwen He, et al.

動画世界モデルのための潜在空間記憶

拡散モデル

Weijie Wang, Haoyu Zhao, Yifan Yang, et al.

オンポリシー蒸留の幾何学について

モデル学習

Zhennan Shen, Yanshu Li, Qingyu Yin, et al.

SWE-Explore: コーディング agents がリポジトリを探索する方法のベンチマーク

エージェント

コード生成

Shaoqiu Zhang, Yuhang Wang, Jialiang Liang, et al.

VoxCPM2技術報告書

拡散モデル

マルチモーダル

Meituan LongCat Team

ChartNet: 堅牢なチャート理解のための百万規模・高品質マルチモーダルデータセット

マルチモーダル

視覚質問応答

Jovana Kondic, Pengyuan Li, Dhiraj Joshi, et al.

ACL-Verbatim: 研究におけるハルシネーションフリーの質問応答

検索拡張生成

インテリジェントな質問応答

Gábor Recski, Szilveszter Tóth, Nadia Verdha, et al.

静的対話を超える：現実的、多様で進化し続ける長期記憶のためのベンチマーク

ベンチマーク

Han Zhang, Zihao Tang, Xin Yu, et al.

ソフトウェアエンジニアリングの終焉：AIエージェントがどのようにソフトウェアのパラダイムを根本から再構築しているか

エージェント

なぜ大規模なモデルはより多くのことを学習するのか：容量、干渉、および稀なタスク保持の影響

ディープラーニング

マルチタスク学習

Jing Huang, Daniel Wurgaft, Rachit Bansal, et al.

ツールが失敗したとき：LLM Agentsにおける動的再計画と異常回復のベンチマーク

エージェント

Dongsheng Zhu, Xuchen Ma, Yucheng Shen, et al.

分解された視覚プロキシを用いた直接3D認識物体挿入

拡散モデル

Jingbo Gong, Yikai Wang, Yushi Lan, et al.

AnchorWorld: 視点に基づく進化カスタマイズを用いた具身自己中心世界シミュレーション

エムボディドインテリジェンス

Yu Li, Menghan Xia, Gongye Liu, et al.

SoCRATES: ドメインおよび社会認知の多様性にわたる能動的LLM仲介の信頼性の高い自動評価に向けて

エージェント

Taewon Yun, Hyeonseong Park, Jeonghwan Choi, et al.

MMAE: 大規模マルチタスクオーディオ編集ベンチマーク

音声および音声処理

マルチモーダル

Ziyang Ma, Ruiqi Yan, Ruiyang Xu, et al.

あなたのアンエンベディング行列は実はテキスト埋め込みのための特徴レンズである

Songhao Wu, Zhongxin Chen, Yuxuan Liu, et al.

ChordEdit：画像編集のためのワンステップ・低エネルギー輸送

拡散モデル

テキストから画像生成

Liangsi Lu, Xuhang Chen, Minzhe Guo, et al.

NitroGen: 汎用ゲームエージェントのためのオープンな基盤モデル

エージェント

マルチモーダル

Loïc Magne, Anas Awadalla, Guanzhi Wang, et al.

D4RTごとに動的シーンを効率的に再構築する

3D マシンビジョン

Chuhan Zhang, Guillaume Le Moing, Skanda Koppula, et al.

Continual Learning Bench：現実世界の状態保持環境における最先端AIシステムの評価

ベンチマーク

Parth Asawa, Christopher M. Glaze, Gabriel Orlanski, et al.

MEMORY CACHING: Growing Memoryを持つRNN

ディープラーニング

Ali Behrouz, Zeman Li, Yuan Deng, et al.

RobotValues: 人間の価値観が衝突する際の家庭用ロボットの評価

ロボティクス

ベンチマーク

Jongwook Han, Hyeongjin Kim, Yohan Jo

VideoKR: 知識・推論集中型の動画理解へ向けて

ビデオ理解

視覚質問応答

Lin Fu, Zheyuan Yang, Yang Wang, et al.

AdaPlanBench: 世界制約とユーザー制約下における大規模言語モデル Agents の適応的計画の評価

エージェント

Jiayu Liu, Cheng Qian, Zhenhailong Wang, et al.

TIDE: テンプレート誘導型反復による複数問題の先制的発見

エージェント

Soyeong Jeong, Jinheon Baek, Minki Kang, et al.

ArcANE: ロールプレイ言語Agentsは適切なタイミングでキャラクターを維持しているか？

エージェント

Woojung Song, Nalim Kim, Sangjun Song, et al.

Code2LoRA: ソフトウェア進化におけるコード言語モデル用のハイパーネットワーク生成アダプタ

コード生成

Liliana Hotsko, Yinxi Li, Yuntian Deng, et al.

自己蒸留型方策勾配

Yifeng Liu, Shiyouan Zhang, Yifan Zhang, et al.

LatentSkill: コンテキスト内テキストスキルから重み内潜在スキルへ LLM Agents 向け

CoVEBench: 動画編集モデルは複雑な指示を処理できるか？

動画世界モデルのための潜在空間記憶

オンポリシー蒸留の幾何学について

SWE-Explore: コーディング agents がリポジトリを探索する方法のベンチマーク

VoxCPM2技術報告書

LongCat-Video-Avatar 1.5 技術報告

ChartNet: 堅牢なチャート理解のための百万規模・高品質マルチモーダルデータセット

ACL-Verbatim: 研究におけるハルシネーションフリーの質問応答

静的対話を超える：現実的、多様で進化し続ける長期記憶のためのベンチマーク

ソフトウェアエンジニアリングの終焉：AIエージェントがどのようにソフトウェアのパラダイムを根本から再構築しているか

なぜ大規模なモデルはより多くのことを学習するのか：容量、干渉、および稀なタスク保持の影響

ツールが失敗したとき：LLM Agentsにおける動的再計画と異常回復のベンチマーク

分解された視覚プロキシを用いた直接3D認識物体挿入

AnchorWorld: 視点に基づく進化カスタマイズを用いた具身自己中心世界シミュレーション

SoCRATES: ドメインおよび社会認知の多様性にわたる能動的LLM仲介の信頼性の高い自動評価に向けて

MMAE: 大規模マルチタスクオーディオ編集ベンチマーク

あなたのアンエンベディング行列は実はテキスト埋め込みのための特徴レンズである

ChordEdit：画像編集のためのワンステップ・低エネルギー輸送

NitroGen: 汎用ゲームエージェントのためのオープンな基盤モデル

D4RTごとに動的シーンを効率的に再構築する

Continual Learning Bench：現実世界の状態保持環境における最先端AIシステムの評価

MEMORY CACHING: Growing Memoryを持つRNN

RobotValues: 人間の価値観が衝突する際の家庭用ロボットの評価

VideoKR: 知識・推論集中型の動画理解へ向けて

AdaPlanBench: 世界制約とユーザー制約下における大規模言語モデル Agents の適応的計画の評価

TIDE: テンプレート誘導型反復による複数問題の先制的発見

ArcANE: ロールプレイ言語Agentsは適切なタイミングでキャラクターを維持しているか？

Code2LoRA: ソフトウェア進化におけるコード言語モデル用のハイパーネットワーク生成アダプタ

自己蒸留型方策勾配

LatentSkill: コンテキスト内テキストスキルから重み内潜在スキルへ LLM Agents 向け

CoVEBench: 動画編集モデルは複雑な指示を処理できるか？

動画世界モデルのための潜在空間記憶

オンポリシー蒸留の幾何学について

SWE-Explore: コーディング agents がリポジトリを探索する方法のベンチマーク

VoxCPM2技術報告書

LongCat-Video-Avatar 1.5 技術報告

ChartNet: 堅牢なチャート理解のための百万規模・高品質マルチモーダルデータセット

ACL-Verbatim: 研究におけるハルシネーションフリーの質問応答

静的対話を超える：現実的、多様で進化し続ける長期記憶のためのベンチマーク

ソフトウェアエンジニアリングの終焉：AIエージェントがどのようにソフトウェアのパラダイムを根本から再構築しているか

なぜ大規模なモデルはより多くのことを学習するのか：容量、干渉、および稀なタスク保持の影響

ツールが失敗したとき：LLM Agentsにおける動的再計画と異常回復のベンチマーク

分解された視覚プロキシを用いた直接3D認識物体挿入

AnchorWorld: 視点に基づく進化カスタマイズを用いた具身自己中心世界シミュレーション

SoCRATES: ドメインおよび社会認知の多様性にわたる能動的LLM仲介の信頼性の高い自動評価に向けて

MMAE: 大規模マルチタスクオーディオ編集ベンチマーク

あなたのアンエンベディング行列は実はテキスト埋め込みのための特徴レンズである

ChordEdit：画像編集のためのワンステップ・低エネルギー輸送

NitroGen: 汎用ゲームエージェントのためのオープンな基盤モデル

D4RTごとに動的シーンを効率的に再構築する

Continual Learning Bench：現実世界の状態保持環境における最先端AIシステムの評価

MEMORY CACHING: Growing Memoryを持つRNN

RobotValues: 人間の価値観が衝突する際の家庭用ロボットの評価

VideoKR: 知識・推論集中型の動画理解へ向けて

AdaPlanBench: 世界制約とユーザー制約下における大規模言語モデル Agents の適応的計画の評価

TIDE: テンプレート誘導型反復による複数問題の先制的発見

ArcANE: ロールプレイ言語Agentsは適切なタイミングでキャラクターを維持しているか？

Code2LoRA: ソフトウェア進化におけるコード言語モデル用のハイパーネットワーク生成アダプタ

自己蒸留型方策勾配