HyperAI

メイン

GPU

コンソール
Studio
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

人工知能の未来を築く

概要

当社についてサポートデータセットのヘルプ

製品

ニュース論文ノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

メイン

GPU

コンソール
Studio
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

人工知能の未来を築く

概要

当社についてサポートデータセットのヘルプ

製品

ニュース論文ノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)

QuantAlphaAlpha：LLM駆動型アルファマイニングのための進化的フレームワーク

QuantAlphaAlpha：LLM駆動型アルファマイニングのための進化的フレームワーク

Jun Han, Shuo Zhang, Wei Li, et al.

モダリティギャップ駆動型部分空間アライメント訓練パラダイム：マルチモーダル大規模言語モデル向け

モダリティギャップ駆動型部分空間アライメント訓練パラダイム：マルチモーダル大規模言語モデル向け

マルチモーダル

マルチモーダル表現

Xiaomin Yu, Yi Xin, Wenjie Zhang, et al.

MOVA：スケーラブルかつ同期的な動画・音声生成へ向けて

マルチモーダル

SII-OpenMOSS Team, Donghua Yu, Mingshu Chen, et al.

MemoryLLM：即插即用の解釈可能な順方向メモリを備えたトランスフォーマー

Ajay Jaiswal, Lauren Hannah, Han-Byul Kim, et al.

DreamDojo：大規模なヒューマンビデオから得た汎用ロボットワールドモデル

マルチモーダル

ビデオ理解

Shenyuan Gao, William Liang, Kaiyuan Zheng, et al.

F-GRPO：明白なことを学ばせすぎず、まれなことを忘れさせないために

Daniil Plyusov, Alexey Gorbatovski, Boris Shaposhnikov, et al.

MSign：安定ランク回復による大規模言語モデルの学習不安定を防止する最適化手法

モデル学習

Lianhai Ren, Yucheng Ding, Xiao Liu, et al.

AudioSAE：スパース自己符号化器を用いた音声処理モデルの理解に向けて

音声および音声処理

ディープラーニング

Georgii Aparin, Tasnima Sadekova, Alexey Rukhovich, et al.

大規模言語モデルの強化学習ファインチューニングにおけるエントロピー動態について

Shumin Wang, Yuexiang Xie, Wenhao Zhang, et al.

オデッセイアリーナ：ロングホライズン、アクティブかつ誘導的インタラクションにおける大規模言語モデルのベンチマーク

エージェント

Fangzhi Xu, Hang Yan, Qiushi Sun, et al.

Baichuan-M3：信頼性のある医療意思決定のための臨床質問モデリング

Baichuan-M3 Team, Chengfeng Dou, Fan Yang, et al.

拡散を用いた生成モデリング

拡散モデル

Mingyang Deng, He Li, Tianhong Li, Kaiming He

AlphaEdit：言語モデル向けのノルム空間制約付き知識編集

テキスト生成

Junfeng Fang, Houcheng Jiang, Kun Wang, et al.

13パラメータにおける推論の学習

インテリジェントな質問応答

John X. Morris, Niloofar Mireshghallah, Mark Ibrahim, et al.

DFlash：フラッシュ予測デコードのためのブロック拡散

拡散モデル

Jian Chen, Yesheng Liang, Zhijian Liu

コンテキストフォースティング：長文コンテキストを用いた一貫性のある自己回帰型動画生成

拡散モデル

Shuo Chen, Cong Wei, Sun Sun, et al.

MemSkill：自己進化型エージェントにおける記憶スキルの学習と進化

エージェント

Haozhen Zhang, Quanyu Long, Jianzhu Bao, et al.

長さバイアスのないシーケンス方策最適化：RLVRにおける応答長さの変動の解明と制御

Fanfan Liu, Youyang Yin, Peng Shi, et al.

スパイラーデンス：階層的適応スクリーニングを用いた効率的なエージェント防御のための内在的リスクセンシング

エージェント

Zhenxiong Yu, Zhi Yang, Zhiheng Jin, et al.

CAR-bench：現実世界の不確実性下におけるLLMエージェントの一貫性および限界認識能力の評価

エージェント

Johannes Kirmayr, Lukas Stappen, Elisabeth André

遅延ストリームモデリングを用いたストリーミングSequence-to-Sequence学習

マルチモーダル表現

Neil Zeghidour, Eugene Kharitonov, Manu Orsini, et al.

Kiss3DGen: Image Diffusion Modelsを3D Asset Generationへ転用する手法

拡散モデル

Jiantao Lin, Xin Yang, Meixi Chen, et al.

Cacheベースの推論を用いたStreaming Automatic Speech RecognitionのためのStateful Conformer

Vahid Noroozi, Somshubra Majumdar, Ankur Kumar, et al.

3D生成のためのネイティブかつコンパクトな構造化Latents

拡散モデル

Jianfeng Xiang, Xiaoxue Chen, Sicheng Xu, et al.

連続的オーディオ言語モデル（Continuous Audio Language Models）

Simon Rouard, Manu Orsini, Axel Roebel, et al.

仮想臨床環境における進化型インタラクティブ診断Agentの開発

エージェント

Pengcheng Qiu, Chaoyi Wu, Junwei Liu, et al.

WeDLM：高速推論を実現するための拡散言語モデルと標準的な因果アテンションの調和

拡散モデル

Aiwei Liu, Minghua He, Shaoxun Zeng, et al.

TurboDiffusion：動画拡散モデルの処理速度を100〜200倍に高速化する

拡散モデル

Jintao Zhang, Kaiwen Zheng, Kai Jiang, et al.

フンイエンビデオ・フォーリー：表現アライメントを用いたマルチモーダル・ディフュージョンによる高忠実度のフォーリー音声生成

Sizhe Shan, Qiulin Li, Yutao Cui, et al.

Fara-7B：コンピュータ利用に向けた効率的なエージェントモデル

エージェント

Ahmed Awadallah, Yash Lara, Raghav Magazine, et al.

Fun-ASR 技術報告

Keyu An, Yanni Chen, Zhigao Chen, et al.

Geminiを活用した科学研究の加速：事例研究と一般的な手法

サイエンスのためのAI

David P. Woodruff, Vincent Cohen-Addad, Lalit Jain, et al.

QuantAlphaAlpha：LLM駆動型アルファマイニングのための進化的フレームワーク

QuantAlphaAlpha：LLM駆動型アルファマイニングのための進化的フレームワーク

Jun Han, Shuo Zhang, Wei Li, et al.

モダリティギャップ駆動型部分空間アライメント訓練パラダイム：マルチモーダル大規模言語モデル向け

モダリティギャップ駆動型部分空間アライメント訓練パラダイム：マルチモーダル大規模言語モデル向け

マルチモーダル

マルチモーダル表現

Xiaomin Yu, Yi Xin, Wenjie Zhang, et al.

MOVA：スケーラブルかつ同期的な動画・音声生成へ向けて

マルチモーダル

SII-OpenMOSS Team, Donghua Yu, Mingshu Chen, et al.

MemoryLLM：即插即用の解釈可能な順方向メモリを備えたトランスフォーマー

Ajay Jaiswal, Lauren Hannah, Han-Byul Kim, et al.

DreamDojo：大規模なヒューマンビデオから得た汎用ロボットワールドモデル

マルチモーダル

ビデオ理解

Shenyuan Gao, William Liang, Kaiyuan Zheng, et al.

F-GRPO：明白なことを学ばせすぎず、まれなことを忘れさせないために

Daniil Plyusov, Alexey Gorbatovski, Boris Shaposhnikov, et al.

MSign：安定ランク回復による大規模言語モデルの学習不安定を防止する最適化手法

モデル学習

Lianhai Ren, Yucheng Ding, Xiao Liu, et al.

AudioSAE：スパース自己符号化器を用いた音声処理モデルの理解に向けて

音声および音声処理

ディープラーニング

Georgii Aparin, Tasnima Sadekova, Alexey Rukhovich, et al.

大規模言語モデルの強化学習ファインチューニングにおけるエントロピー動態について

Shumin Wang, Yuexiang Xie, Wenhao Zhang, et al.

オデッセイアリーナ：ロングホライズン、アクティブかつ誘導的インタラクションにおける大規模言語モデルのベンチマーク

エージェント

Fangzhi Xu, Hang Yan, Qiushi Sun, et al.

Baichuan-M3：信頼性のある医療意思決定のための臨床質問モデリング

Baichuan-M3 Team, Chengfeng Dou, Fan Yang, et al.

拡散を用いた生成モデリング

拡散モデル

Mingyang Deng, He Li, Tianhong Li, Kaiming He

AlphaEdit：言語モデル向けのノルム空間制約付き知識編集

テキスト生成

Junfeng Fang, Houcheng Jiang, Kun Wang, et al.

13パラメータにおける推論の学習

インテリジェントな質問応答

John X. Morris, Niloofar Mireshghallah, Mark Ibrahim, et al.

DFlash：フラッシュ予測デコードのためのブロック拡散

拡散モデル

Jian Chen, Yesheng Liang, Zhijian Liu

コンテキストフォースティング：長文コンテキストを用いた一貫性のある自己回帰型動画生成

拡散モデル

Shuo Chen, Cong Wei, Sun Sun, et al.

MemSkill：自己進化型エージェントにおける記憶スキルの学習と進化

エージェント

Haozhen Zhang, Quanyu Long, Jianzhu Bao, et al.

長さバイアスのないシーケンス方策最適化：RLVRにおける応答長さの変動の解明と制御

Fanfan Liu, Youyang Yin, Peng Shi, et al.

スパイラーデンス：階層的適応スクリーニングを用いた効率的なエージェント防御のための内在的リスクセンシング

エージェント

Zhenxiong Yu, Zhi Yang, Zhiheng Jin, et al.

CAR-bench：現実世界の不確実性下におけるLLMエージェントの一貫性および限界認識能力の評価

エージェント

Johannes Kirmayr, Lukas Stappen, Elisabeth André

遅延ストリームモデリングを用いたストリーミングSequence-to-Sequence学習

マルチモーダル表現

Neil Zeghidour, Eugene Kharitonov, Manu Orsini, et al.

Kiss3DGen: Image Diffusion Modelsを3D Asset Generationへ転用する手法

拡散モデル

Jiantao Lin, Xin Yang, Meixi Chen, et al.

Cacheベースの推論を用いたStreaming Automatic Speech RecognitionのためのStateful Conformer

Vahid Noroozi, Somshubra Majumdar, Ankur Kumar, et al.

3D生成のためのネイティブかつコンパクトな構造化Latents

拡散モデル

Jianfeng Xiang, Xiaoxue Chen, Sicheng Xu, et al.

連続的オーディオ言語モデル（Continuous Audio Language Models）

Simon Rouard, Manu Orsini, Axel Roebel, et al.

仮想臨床環境における進化型インタラクティブ診断Agentの開発

エージェント

Pengcheng Qiu, Chaoyi Wu, Junwei Liu, et al.

WeDLM：高速推論を実現するための拡散言語モデルと標準的な因果アテンションの調和

拡散モデル

Aiwei Liu, Minghua He, Shaoxun Zeng, et al.

TurboDiffusion：動画拡散モデルの処理速度を100〜200倍に高速化する

拡散モデル

Jintao Zhang, Kaiwen Zheng, Kai Jiang, et al.

フンイエンビデオ・フォーリー：表現アライメントを用いたマルチモーダル・ディフュージョンによる高忠実度のフォーリー音声生成

Sizhe Shan, Qiulin Li, Yutao Cui, et al.

Fara-7B：コンピュータ利用に向けた効率的なエージェントモデル

エージェント

Ahmed Awadallah, Yash Lara, Raghav Magazine, et al.

Fun-ASR 技術報告

Keyu An, Yanni Chen, Zhigao Chen, et al.

Geminiを活用した科学研究の加速：事例研究と一般的な手法

サイエンスのためのAI

David P. Woodruff, Vincent Cohen-Addad, Lalit Jain, et al.

MOVA：スケーラブルかつ同期的な動画・音声生成へ向けて

MemoryLLM：即插即用の解釈可能な順方向メモリを備えたトランスフォーマー

DreamDojo：大規模なヒューマンビデオから得た汎用ロボットワールドモデル

F-GRPO：明白なことを学ばせすぎず、まれなことを忘れさせないために

MSign：安定ランク回復による大規模言語モデルの学習不安定を防止する最適化手法

AudioSAE：スパース自己符号化器を用いた音声処理モデルの理解に向けて

大規模言語モデルの強化学習ファインチューニングにおけるエントロピー動態について

オデッセイアリーナ：ロングホライズン、アクティブかつ誘導的インタラクションにおける大規模言語モデルのベンチマーク

Baichuan-M3：信頼性のある医療意思決定のための臨床質問モデリング

拡散を用いた生成モデリング

AlphaEdit：言語モデル向けのノルム空間制約付き知識編集

13パラメータにおける推論の学習

DFlash：フラッシュ予測デコードのためのブロック拡散

コンテキストフォースティング：長文コンテキストを用いた一貫性のある自己回帰型動画生成

MemSkill：自己進化型エージェントにおける記憶スキルの学習と進化

長さバイアスのないシーケンス方策最適化：RLVRにおける応答長さの変動の解明と制御

スパイラーデンス：階層的適応スクリーニングを用いた効率的なエージェント防御のための内在的リスクセンシング

CAR-bench：現実世界の不確実性下におけるLLMエージェントの一貫性および限界認識能力の評価

遅延ストリームモデリングを用いたストリーミングSequence-to-Sequence学習

Kiss3DGen: Image Diffusion Modelsを3D Asset Generationへ転用する手法

Cacheベースの推論を用いたStreaming Automatic Speech RecognitionのためのStateful Conformer

3D生成のためのネイティブかつコンパクトな構造化Latents

連続的オーディオ言語モデル（Continuous Audio Language Models）

仮想臨床環境における進化型インタラクティブ診断Agentの開発

WeDLM：高速推論を実現するための拡散言語モデルと標準的な因果アテンションの調和

TurboDiffusion：動画拡散モデルの処理速度を100〜200倍に高速化する

フンイエンビデオ・フォーリー：表現アライメントを用いたマルチモーダル・ディフュージョンによる高忠実度のフォーリー音声生成

Fara-7B：コンピュータ利用に向けた効率的なエージェントモデル

Fun-ASR 技術報告

Geminiを活用した科学研究の加速：事例研究と一般的な手法

MOVA：スケーラブルかつ同期的な動画・音声生成へ向けて

MemoryLLM：即插即用の解釈可能な順方向メモリを備えたトランスフォーマー

DreamDojo：大規模なヒューマンビデオから得た汎用ロボットワールドモデル

F-GRPO：明白なことを学ばせすぎず、まれなことを忘れさせないために

MSign：安定ランク回復による大規模言語モデルの学習不安定を防止する最適化手法

AudioSAE：スパース自己符号化器を用いた音声処理モデルの理解に向けて

大規模言語モデルの強化学習ファインチューニングにおけるエントロピー動態について

オデッセイアリーナ：ロングホライズン、アクティブかつ誘導的インタラクションにおける大規模言語モデルのベンチマーク

Baichuan-M3：信頼性のある医療意思決定のための臨床質問モデリング

拡散を用いた生成モデリング

AlphaEdit：言語モデル向けのノルム空間制約付き知識編集

13パラメータにおける推論の学習

DFlash：フラッシュ予測デコードのためのブロック拡散

コンテキストフォースティング：長文コンテキストを用いた一貫性のある自己回帰型動画生成

MemSkill：自己進化型エージェントにおける記憶スキルの学習と進化

長さバイアスのないシーケンス方策最適化：RLVRにおける応答長さの変動の解明と制御

スパイラーデンス：階層的適応スクリーニングを用いた効率的なエージェント防御のための内在的リスクセンシング

CAR-bench：現実世界の不確実性下におけるLLMエージェントの一貫性および限界認識能力の評価

遅延ストリームモデリングを用いたストリーミングSequence-to-Sequence学習

Kiss3DGen: Image Diffusion Modelsを3D Asset Generationへ転用する手法

Cacheベースの推論を用いたStreaming Automatic Speech RecognitionのためのStateful Conformer

3D生成のためのネイティブかつコンパクトな構造化Latents

連続的オーディオ言語モデル（Continuous Audio Language Models）

仮想臨床環境における進化型インタラクティブ診断Agentの開発

WeDLM：高速推論を実現するための拡散言語モデルと標準的な因果アテンションの調和

TurboDiffusion：動画拡散モデルの処理速度を100〜200倍に高速化する

フンイエンビデオ・フォーリー：表現アライメントを用いたマルチモーダル・ディフュージョンによる高忠実度のフォーリー音声生成

Fara-7B：コンピュータ利用に向けた効率的なエージェントモデル

Fun-ASR 技術報告

Geminiを活用した科学研究の加速：事例研究と一般的な手法