HyperAI

メイン

GPU

コンソール
Studio
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

人工知能の未来を築く

概要

当社についてサポートデータセットのヘルプ

製品

ニュース論文ノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

メイン

GPU

コンソール
Studio
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

人工知能の未来を築く

概要

当社についてサポートデータセットのヘルプ

製品

ニュース論文ノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)

MemLens: 大規模ビジョン・言語モデルにおけるマルチモーダル長期記憶の評価ベンチマーク

MemLens: 大規模ビジョン・言語モデルにおけるマルチモーダル長期記憶の評価ベンチマーク

マルチモーダル

視覚質問応答

Xiyu Ren, Zhaowei Wang, Yiming Du, et al.

自己蒸留型エージェント強化学習

自己蒸留型エージェント強化学習

エージェント

Zhengxi Lu, Zhiyuan Yao, Zhuowen Han, et al.

因果強制++: リアルタイムインタラクティブビデオ生成のためのスケーラブルな数ステップ自己回帰拡散蒸留

拡散モデル

Min Zhao, Hongzhou Zhu, Kaiwen Zheng, et al.

単純かつ統合されたスケーリングによるオリンピック競技レベルの推論の実現

モデル学習

Yafu Li, Runzhe Zhan, Haoran Zhang, et al.

RepoZero：LLMはゼロからコードリポジトリを生成できるか？

コード生成

Zhaoxi Zhang, Yiming Xu, Jiahui Liang, et al.

Qwen-Image-VAE-2.0 技術報告書

拡散モデル

Zekai Zhang, Deqing Li, Kuan Cao, et al.

テキスト・表形式モデリングによる限られた相互作用からのAIエージェントの意思決定の予測

エージェント

Eilam Shapira, Moshe Tennenholtz, Roi Reichart

128Kを超えるコンテキストにおける汎化を活用した長期コンテキストビジョン言語モデルの効率的なトレーニング

マルチモーダル

視覚質問応答

Zhaowei Wang, Lishu Luo, Haodong Duan, et al.

AnyFlow: オンポリシーフローマップ蒸留による任意ステップのビデオ拡散モデル

拡散モデル

Yuchao Gu, Guian Fang, Yuxin Jiang, et al.

MinT: 数百万のLLMのトレーニングとサービングのための管理されたインフラストラクチャ

モデル学習

Mind Lab, Song Cao, Vic Cao, et al.

MulTaBench: テキストと画像を用いたマルチモーダル表形式学習のベンチマーク

マルチモーダル表現

マルチモーダル

Alan Arazi, Eilam Shapira, Shoham Grunblat, et al.

ストリーミング3D再構築のための幾何コンテキストトランスフォーマー

3D マシンビジョン

ビデオ処理

Lin-Zhuo Chen, Jian Gao, Yihang Chen, et al.

Nemotron-Cascade 2: カスケードRLとマルチドメインオンポリシー蒸留によるLLMsの後訓練

監視付き微調整

Zhuolin Yang, Zihan Liu, Yang Chen, et al.

MOSS-TTS 技術報告書

音声および音声処理

SII-OpenMOSS Team

StreakMind: 天体画像における人工衛星の軌跡のAIによる検出・解析と自動データベース連携

オブジェクト検出

コンピュータビジョン

Rafael Carrillo, René Duffard, Pablo García-Martín, et al.

VibeServe: AI エージェントは、カスタム LLM サービングシステムを構築できるのか？

エージェント

Keisuke Kamahori, Shihang Li, Simon Peter, et al.

delta-mem: 大規模言語モデルのための効率的なオンラインメモリ

Jingdi Lei, Di Zhang, Junxian Li, et al.

MCP-Cosmos: MCP環境における複雑なタスク実行のための世界モデル強化エージェント

エージェント

Giridhar Ganapavarapu, Dhaval Patel

推論を超えて：強化学習がLLMのパラメトリック知識を解き放つ

Wanli Yang, Hongyu Zang, Junwei Zhang, et al.

サンプル効率的な連続制御のためのバイアス除去されたモデルベース表現

ディープラーニング

Jiafei Lyu, Zichuan Lin, Scott Fujimoto, et al.

マルチストリームLLM：思考、入力、出力の並列ストリームによる言語モデルのブロック解除

エージェント

Guinan Su, Yanwu Yang, Xueyan Li, et al.

あなたの言語モデルはそれ自身の批評家である：アクターの内部状態からの価値推定を用いた強化学習

Yunho Choi, Jongwon Lim, Woojin Ahn, et al.

Relit-LiVE: 環境ビデオを共同で学習することによるビデオの再照明

拡散モデル

Weiqing Xiao, Hong Li, Xiuyu Yang, et al.

ポジティブ・アラインメント：人間 flourishing のための人工知能

エージェント

Ruben Laukkonen, Seb Krier, Chloé Bakalar, et al.

LLaVA-UHD v4: MLLMにおける効率的な視覚エンコーディングの鍵とは

マルチモーダル

マルチモーダル表現

Kechen Fang, Yihua Qin, Chongyi Wang, et al.

オンポリシー蒸留の正体解明：どこで役立ち、どこで害を及ぼすのか、そしてその理由

Mohammadreza Armandpour, Fatih Ilhan, David Harrison, et al.

単一のニューロンで大規模言語モデルの安全アライメントを回避できる

テキスト生成

Hamid Kazemi, Atoosa Chegini, Maria Safi

SlimQwen: 大規模MoEモデルの事前学習におけるプルーニングと蒸留の探索

Shengkun Tang, Zekun Wang, Bo Zheng, et al.

ELF：埋め込み型言語フロー

拡散モデル

テキスト生成

Keya Hu, Linlu Qiu, Yiyang Lu, et al.

PaperFit: 科学文書のためのビジョン・イン・ザ・ループ組版最適化

ドキュメント理解

テキストから画像生成

Bihui Yu, Xinglong Xu, Junjie Jiang, et al.

ラUBRICに基づくオンポリシー蒸留

モデル学習

Junfeng Fang, Zhepei Hong, Mao Zheng, et al.

CollabVR: ビジュアル・言語および動画生成モデルを活用した協調型動画推論

ビデオ理解

Joowon Kim, Seungho Shin, Joonhyung Park, et al.

MemLens: 大規模ビジョン・言語モデルにおけるマルチモーダル長期記憶の評価ベンチマーク

MemLens: 大規模ビジョン・言語モデルにおけるマルチモーダル長期記憶の評価ベンチマーク

マルチモーダル

視覚質問応答

Xiyu Ren, Zhaowei Wang, Yiming Du, et al.

自己蒸留型エージェント強化学習

自己蒸留型エージェント強化学習

エージェント

Zhengxi Lu, Zhiyuan Yao, Zhuowen Han, et al.

因果強制++: リアルタイムインタラクティブビデオ生成のためのスケーラブルな数ステップ自己回帰拡散蒸留

拡散モデル

Min Zhao, Hongzhou Zhu, Kaiwen Zheng, et al.

単純かつ統合されたスケーリングによるオリンピック競技レベルの推論の実現

モデル学習

Yafu Li, Runzhe Zhan, Haoran Zhang, et al.

RepoZero：LLMはゼロからコードリポジトリを生成できるか？

コード生成

Zhaoxi Zhang, Yiming Xu, Jiahui Liang, et al.

Qwen-Image-VAE-2.0 技術報告書

拡散モデル

Zekai Zhang, Deqing Li, Kuan Cao, et al.

テキスト・表形式モデリングによる限られた相互作用からのAIエージェントの意思決定の予測

エージェント

Eilam Shapira, Moshe Tennenholtz, Roi Reichart

128Kを超えるコンテキストにおける汎化を活用した長期コンテキストビジョン言語モデルの効率的なトレーニング

マルチモーダル

視覚質問応答

Zhaowei Wang, Lishu Luo, Haodong Duan, et al.

AnyFlow: オンポリシーフローマップ蒸留による任意ステップのビデオ拡散モデル

拡散モデル

Yuchao Gu, Guian Fang, Yuxin Jiang, et al.

MinT: 数百万のLLMのトレーニングとサービングのための管理されたインフラストラクチャ

モデル学習

Mind Lab, Song Cao, Vic Cao, et al.

MulTaBench: テキストと画像を用いたマルチモーダル表形式学習のベンチマーク

マルチモーダル表現

マルチモーダル

Alan Arazi, Eilam Shapira, Shoham Grunblat, et al.

ストリーミング3D再構築のための幾何コンテキストトランスフォーマー

3D マシンビジョン

ビデオ処理

Lin-Zhuo Chen, Jian Gao, Yihang Chen, et al.

Nemotron-Cascade 2: カスケードRLとマルチドメインオンポリシー蒸留によるLLMsの後訓練

監視付き微調整

Zhuolin Yang, Zihan Liu, Yang Chen, et al.

MOSS-TTS 技術報告書

音声および音声処理

SII-OpenMOSS Team

StreakMind: 天体画像における人工衛星の軌跡のAIによる検出・解析と自動データベース連携

オブジェクト検出

コンピュータビジョン

Rafael Carrillo, René Duffard, Pablo García-Martín, et al.

VibeServe: AI エージェントは、カスタム LLM サービングシステムを構築できるのか？

エージェント

Keisuke Kamahori, Shihang Li, Simon Peter, et al.

delta-mem: 大規模言語モデルのための効率的なオンラインメモリ

Jingdi Lei, Di Zhang, Junxian Li, et al.

MCP-Cosmos: MCP環境における複雑なタスク実行のための世界モデル強化エージェント

エージェント

Giridhar Ganapavarapu, Dhaval Patel

推論を超えて：強化学習がLLMのパラメトリック知識を解き放つ

Wanli Yang, Hongyu Zang, Junwei Zhang, et al.

サンプル効率的な連続制御のためのバイアス除去されたモデルベース表現

ディープラーニング

Jiafei Lyu, Zichuan Lin, Scott Fujimoto, et al.

マルチストリームLLM：思考、入力、出力の並列ストリームによる言語モデルのブロック解除

エージェント

Guinan Su, Yanwu Yang, Xueyan Li, et al.

あなたの言語モデルはそれ自身の批評家である：アクターの内部状態からの価値推定を用いた強化学習

Yunho Choi, Jongwon Lim, Woojin Ahn, et al.

Relit-LiVE: 環境ビデオを共同で学習することによるビデオの再照明

拡散モデル

Weiqing Xiao, Hong Li, Xiuyu Yang, et al.

ポジティブ・アラインメント：人間 flourishing のための人工知能

エージェント

Ruben Laukkonen, Seb Krier, Chloé Bakalar, et al.

LLaVA-UHD v4: MLLMにおける効率的な視覚エンコーディングの鍵とは

マルチモーダル

マルチモーダル表現

Kechen Fang, Yihua Qin, Chongyi Wang, et al.

オンポリシー蒸留の正体解明：どこで役立ち、どこで害を及ぼすのか、そしてその理由

Mohammadreza Armandpour, Fatih Ilhan, David Harrison, et al.

単一のニューロンで大規模言語モデルの安全アライメントを回避できる

テキスト生成

Hamid Kazemi, Atoosa Chegini, Maria Safi

SlimQwen: 大規模MoEモデルの事前学習におけるプルーニングと蒸留の探索

Shengkun Tang, Zekun Wang, Bo Zheng, et al.

ELF：埋め込み型言語フロー

拡散モデル

テキスト生成

Keya Hu, Linlu Qiu, Yiyang Lu, et al.

PaperFit: 科学文書のためのビジョン・イン・ザ・ループ組版最適化

ドキュメント理解

テキストから画像生成

Bihui Yu, Xinglong Xu, Junjie Jiang, et al.

ラUBRICに基づくオンポリシー蒸留

モデル学習

Junfeng Fang, Zhepei Hong, Mao Zheng, et al.

CollabVR: ビジュアル・言語および動画生成モデルを活用した協調型動画推論

ビデオ理解

Joowon Kim, Seungho Shin, Joonhyung Park, et al.

因果強制++: リアルタイムインタラクティブビデオ生成のためのスケーラブルな数ステップ自己回帰拡散蒸留

単純かつ統合されたスケーリングによるオリンピック競技レベルの推論の実現

RepoZero：LLMはゼロからコードリポジトリを生成できるか？

Qwen-Image-VAE-2.0 技術報告書

テキスト・表形式モデリングによる限られた相互作用からのAIエージェントの意思決定の予測

128Kを超えるコンテキストにおける汎化を活用した長期コンテキストビジョン言語モデルの効率的なトレーニング

AnyFlow: オンポリシーフローマップ蒸留による任意ステップのビデオ拡散モデル

MinT: 数百万のLLMのトレーニングとサービングのための管理されたインフラストラクチャ

MulTaBench: テキストと画像を用いたマルチモーダル表形式学習のベンチマーク

ストリーミング3D再構築のための幾何コンテキストトランスフォーマー

Nemotron-Cascade 2: カスケードRLとマルチドメインオンポリシー蒸留によるLLMsの後訓練

MOSS-TTS 技術報告書

StreakMind: 天体画像における人工衛星の軌跡のAIによる検出・解析と自動データベース連携

VibeServe: AI エージェントは、カスタム LLM サービングシステムを構築できるのか？

delta-mem: 大規模言語モデルのための効率的なオンラインメモリ

MCP-Cosmos: MCP環境における複雑なタスク実行のための世界モデル強化エージェント

推論を超えて：強化学習がLLMのパラメトリック知識を解き放つ

サンプル効率的な連続制御のためのバイアス除去されたモデルベース表現

マルチストリームLLM：思考、入力、出力の並列ストリームによる言語モデルのブロック解除

あなたの言語モデルはそれ自身の批評家である：アクターの内部状態からの価値推定を用いた強化学習

Relit-LiVE: 環境ビデオを共同で学習することによるビデオの再照明

ポジティブ・アラインメント：人間 flourishing のための人工知能

LLaVA-UHD v4: MLLMにおける効率的な視覚エンコーディングの鍵とは

オンポリシー蒸留の正体解明：どこで役立ち、どこで害を及ぼすのか、そしてその理由

単一のニューロンで大規模言語モデルの安全アライメントを回避できる

SlimQwen: 大規模MoEモデルの事前学習におけるプルーニングと蒸留の探索

ELF：埋め込み型言語フロー

PaperFit: 科学文書のためのビジョン・イン・ザ・ループ組版最適化

ラUBRICに基づくオンポリシー蒸留

CollabVR: ビジュアル・言語および動画生成モデルを活用した協調型動画推論

因果強制++: リアルタイムインタラクティブビデオ生成のためのスケーラブルな数ステップ自己回帰拡散蒸留

単純かつ統合されたスケーリングによるオリンピック競技レベルの推論の実現

RepoZero：LLMはゼロからコードリポジトリを生成できるか？

Qwen-Image-VAE-2.0 技術報告書

テキスト・表形式モデリングによる限られた相互作用からのAIエージェントの意思決定の予測

128Kを超えるコンテキストにおける汎化を活用した長期コンテキストビジョン言語モデルの効率的なトレーニング

AnyFlow: オンポリシーフローマップ蒸留による任意ステップのビデオ拡散モデル

MinT: 数百万のLLMのトレーニングとサービングのための管理されたインフラストラクチャ

MulTaBench: テキストと画像を用いたマルチモーダル表形式学習のベンチマーク

ストリーミング3D再構築のための幾何コンテキストトランスフォーマー

Nemotron-Cascade 2: カスケードRLとマルチドメインオンポリシー蒸留によるLLMsの後訓練

MOSS-TTS 技術報告書

StreakMind: 天体画像における人工衛星の軌跡のAIによる検出・解析と自動データベース連携

VibeServe: AI エージェントは、カスタム LLM サービングシステムを構築できるのか？

delta-mem: 大規模言語モデルのための効率的なオンラインメモリ

MCP-Cosmos: MCP環境における複雑なタスク実行のための世界モデル強化エージェント

推論を超えて：強化学習がLLMのパラメトリック知識を解き放つ

サンプル効率的な連続制御のためのバイアス除去されたモデルベース表現

マルチストリームLLM：思考、入力、出力の並列ストリームによる言語モデルのブロック解除

あなたの言語モデルはそれ自身の批評家である：アクターの内部状態からの価値推定を用いた強化学習

Relit-LiVE: 環境ビデオを共同で学習することによるビデオの再照明

ポジティブ・アラインメント：人間 flourishing のための人工知能

LLaVA-UHD v4: MLLMにおける効率的な視覚エンコーディングの鍵とは

オンポリシー蒸留の正体解明：どこで役立ち、どこで害を及ぼすのか、そしてその理由

単一のニューロンで大規模言語モデルの安全アライメントを回避できる

SlimQwen: 大規模MoEモデルの事前学習におけるプルーニングと蒸留の探索

ELF：埋め込み型言語フロー

PaperFit: 科学文書のためのビジョン・イン・ザ・ループ組版最適化

ラUBRICに基づくオンポリシー蒸留

CollabVR: ビジュアル・言語および動画生成モデルを活用した協調型動画推論