HyperAI

メイン

GPU

コンソール
Studio
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

人工知能の未来を築く

概要

当社についてサポートデータセットのヘルプ

製品

ニュース論文ノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

メイン

GPU

コンソール
Studio
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

人工知能の未来を築く

概要

当社についてサポートデータセットのヘルプ

製品

ニュース論文ノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)

DoVer：LLMマルチエージェントシステムにおけるインターベンション駆動型自動デバッグ

DoVer：LLMマルチエージェントシステムにおけるインターベンション駆動型自動デバッグ

エージェント

Ming Ma, Jue Zhang, Fangkai Yang, et al.

時系列推論を用いた統合型ビデオ編集

時系列推論を用いた統合型ビデオ編集

ビデオ処理

Xiangpeng Yang, Ji Xie, Yiyuan Yang, et al.

Beyond Real: 長文脈 LLM における回転位置埋め込みの虚構拡張

Xiaoran Liu, Yuerong Song, Zhigeng Liu, et al.

ネイティブ並列推論者：自己蒸留強化学習を用いた並列推論

エージェント

Tong Wu, Yang Liu, Jun Bai, et al.

iSeal：信頼性のあるLLM所有権検証のための暗号化されたフィンガープリント技術

ディープラーニング

Zixun Xiong, Gaoyi Wu, Qingyang Yu, et al.

DAVSP：深層整合視覚安全プロンプトを用いた大規模な視覚言語モデルの安全整合

マルチモーダル

監視付き微調整

Yitong Zhang, Jia Li, Liyi Cai, et al.

WorldGen：テキストから走行可能でインタラクティブな3D世界へ

拡散モデル

Dilin Wang, Hyunyoung Jung, Tom Monnier, et al.

Souper-Model：単純な算術が最先端のLLM性能を解き放つメカニズム

モデル学習

Shalini Maiti, Amar Budhiraja, Bhavul Gauri, et al.

DTS：デコード木スケッチを活用した大規模推論モデルの性能向上

Zicheng Xu, Guanchu Wang, Yu-Neng Chuang, et al.

ベイズ最適化における適応型カーネル設計は、LLMのおかげでカンタンなケーキである

モデリング

Richard Cornelius Suwandi, Feng Yin, Juntao Wang, et al.

DePass：シンプルな分解型フォワードパスによる統一的特徴属性付与

自然言語処理

Xiangyu Hong, Che Jiang, Kai Tian, et al.

COOPER：空間知能における協調的認識と推論のための統一モデル

マルチモーダル

マルチタスク学習

Zefeng Zhang, Xiangzhao Hao, Hengzhu Tang, et al.

模倣から識別へ：ドメイン間推論タスクを強化する汎用カリキュラム優位性メカニズムへ

Changpeng Yang, Jinyang Wu, Yuchen Liu, et al.

PaCo-RL：ペアワイズ報酬モデリングを用いた一貫性のある画像生成のための強化学習の進展

テキストから画像生成

Bowen Ping, Chengyou Jia, Minnan Luo, et al.

EMMA：統一アーキテクチャを用いた効率的なマルチモーダル理解、生成、編集

マルチタスク学習

Xin He, Longhui Wei, Jianbo Ouyang, et al.

EditThinker：あらゆるイメージエディタにおける反復的推論を解き放つ

Hongyu Li, Manyuan Zhang, Dian Zheng, et al.

TwinFlow：自己対抗的フローを用いた大規模モデルにおけるワンステップ生成の実現

拡散モデル

テキストから画像生成

Zhenglin Cheng, Peng Sun, Jianguo Li, et al.

CARE-PD：パーキンソン病歩行評価を目的とした多施設匿名化臨床データセット

ビデオ理解

データセット

Vida Adeli, Ivan Klabucar, Javad Rajabi, et al.

WenetSpeech-Chuan：方言音声処理のための大規模な四川語コーパスと豊富なアノテーション

音声および音声処理

データセット

Yuhang Dai, Ziyu Zhang, Shuai Wang, et al.

PolypSense3D：内視鏡における深度認識型ポリープサイズ測定のためのマルチソースベンチマークデータセット

セマンティックセグメンテーション

Ruyu Liu, Lin Wang, Zhou Mingming, et al.

PhysDrive：車内ドライバー監視を目的としたマルチモーダル遠隔生理測定データセット

マルチモーダル

コンピュータビジョン

Jiyao Wang, Xiao Yang, Qingyong Hu, et al.

人工ハーモニーマインド：言語モデルの無限に続く均質性（それ以上へ）

データセット

Liwei Jiang, Yuanjun Chai, Margaret Li, et al.

OmniSVG：統合型スケーラブルベクターグラフィックス生成モデル

テキストから画像生成

Yiying Yang, Wei Cheng, Sijin Chen, et al.

アルゴリズム的思考理論

MohammadHossein Bateni, Vincent Cohen-Addad, Yuzhou Gu, et al.

ロボットワールドモデル：ロボティクスにおけるロバストな方策最適化のためのニューラルネットワークシミュレータ

ロボティクス

Chenhao Li, Andreas Krause, Marco Hutter

リワードフォースティング：リワードド分布マッチング蒸留を用いた効率的なストリーミング動画生成

拡散モデル

Yunhong Lu, Yanhong Zeng, Haobo Li, et al.

意味が道を示す：非同期潜在拡散を用いた意味表現とテクスチャ表現の調和

拡散モデル

Yueming Pan, Ruoyu Feng, Qi Dai, et al.

ARM-Thinker：エージェントによるツール利用と視覚的推論を活用したマルチモーダル生成型報酬モデルの強化

エージェント

Preference Modeling

Shengyuan Ding, Xinyu Fang, Ziyu Liu, et al.

Nex-N1：大規模な環境構築を実現する統合エコシステムを用いたエージェントモデルの訓練

エージェント

Nex-AGI Team, Yuxuan Cai, Lu Chen, et al.

DAComp：データインテリジェンスライフサイクル全体にわたるデータエージェントのベンチマーク

ベンチマーク

エージェント

Fangyu Lei, Jinxiang Meng, Yiming Huang, et al.

ライブアバター：無限長のリアルタイム音声駆動型アバター生成

拡散モデル

Yubo Huang, Hailong Guo, Fangtai Wu, et al.

F5-TTS：フローマッチングを用いた流暢かつ忠実な発話を偽造する童話作家

Yushen Chen, Zhikang Niu, Ziyang Ma, et al.

DoVer：LLMマルチエージェントシステムにおけるインターベンション駆動型自動デバッグ

DoVer：LLMマルチエージェントシステムにおけるインターベンション駆動型自動デバッグ

エージェント

Ming Ma, Jue Zhang, Fangkai Yang, et al.

時系列推論を用いた統合型ビデオ編集

時系列推論を用いた統合型ビデオ編集

ビデオ処理

Xiangpeng Yang, Ji Xie, Yiyuan Yang, et al.

Beyond Real: 長文脈 LLM における回転位置埋め込みの虚構拡張

Xiaoran Liu, Yuerong Song, Zhigeng Liu, et al.

ネイティブ並列推論者：自己蒸留強化学習を用いた並列推論

エージェント

Tong Wu, Yang Liu, Jun Bai, et al.

iSeal：信頼性のあるLLM所有権検証のための暗号化されたフィンガープリント技術

ディープラーニング

Zixun Xiong, Gaoyi Wu, Qingyang Yu, et al.

DAVSP：深層整合視覚安全プロンプトを用いた大規模な視覚言語モデルの安全整合

マルチモーダル

監視付き微調整

Yitong Zhang, Jia Li, Liyi Cai, et al.

WorldGen：テキストから走行可能でインタラクティブな3D世界へ

拡散モデル

Dilin Wang, Hyunyoung Jung, Tom Monnier, et al.

Souper-Model：単純な算術が最先端のLLM性能を解き放つメカニズム

モデル学習

Shalini Maiti, Amar Budhiraja, Bhavul Gauri, et al.

DTS：デコード木スケッチを活用した大規模推論モデルの性能向上

Zicheng Xu, Guanchu Wang, Yu-Neng Chuang, et al.

ベイズ最適化における適応型カーネル設計は、LLMのおかげでカンタンなケーキである

モデリング

Richard Cornelius Suwandi, Feng Yin, Juntao Wang, et al.

DePass：シンプルな分解型フォワードパスによる統一的特徴属性付与

自然言語処理

Xiangyu Hong, Che Jiang, Kai Tian, et al.

COOPER：空間知能における協調的認識と推論のための統一モデル

マルチモーダル

マルチタスク学習

Zefeng Zhang, Xiangzhao Hao, Hengzhu Tang, et al.

模倣から識別へ：ドメイン間推論タスクを強化する汎用カリキュラム優位性メカニズムへ

Changpeng Yang, Jinyang Wu, Yuchen Liu, et al.

PaCo-RL：ペアワイズ報酬モデリングを用いた一貫性のある画像生成のための強化学習の進展

テキストから画像生成

Bowen Ping, Chengyou Jia, Minnan Luo, et al.

EMMA：統一アーキテクチャを用いた効率的なマルチモーダル理解、生成、編集

マルチタスク学習

Xin He, Longhui Wei, Jianbo Ouyang, et al.

EditThinker：あらゆるイメージエディタにおける反復的推論を解き放つ

Hongyu Li, Manyuan Zhang, Dian Zheng, et al.

TwinFlow：自己対抗的フローを用いた大規模モデルにおけるワンステップ生成の実現

拡散モデル

テキストから画像生成

Zhenglin Cheng, Peng Sun, Jianguo Li, et al.

CARE-PD：パーキンソン病歩行評価を目的とした多施設匿名化臨床データセット

ビデオ理解

データセット

Vida Adeli, Ivan Klabucar, Javad Rajabi, et al.

WenetSpeech-Chuan：方言音声処理のための大規模な四川語コーパスと豊富なアノテーション

音声および音声処理

データセット

Yuhang Dai, Ziyu Zhang, Shuai Wang, et al.

PolypSense3D：内視鏡における深度認識型ポリープサイズ測定のためのマルチソースベンチマークデータセット

セマンティックセグメンテーション

Ruyu Liu, Lin Wang, Zhou Mingming, et al.

PhysDrive：車内ドライバー監視を目的としたマルチモーダル遠隔生理測定データセット

マルチモーダル

コンピュータビジョン

Jiyao Wang, Xiao Yang, Qingyong Hu, et al.

人工ハーモニーマインド：言語モデルの無限に続く均質性（それ以上へ）

データセット

Liwei Jiang, Yuanjun Chai, Margaret Li, et al.

OmniSVG：統合型スケーラブルベクターグラフィックス生成モデル

テキストから画像生成

Yiying Yang, Wei Cheng, Sijin Chen, et al.

アルゴリズム的思考理論

MohammadHossein Bateni, Vincent Cohen-Addad, Yuzhou Gu, et al.

ロボットワールドモデル：ロボティクスにおけるロバストな方策最適化のためのニューラルネットワークシミュレータ

ロボティクス

Chenhao Li, Andreas Krause, Marco Hutter

リワードフォースティング：リワードド分布マッチング蒸留を用いた効率的なストリーミング動画生成

拡散モデル

Yunhong Lu, Yanhong Zeng, Haobo Li, et al.

意味が道を示す：非同期潜在拡散を用いた意味表現とテクスチャ表現の調和

拡散モデル

Yueming Pan, Ruoyu Feng, Qi Dai, et al.

ARM-Thinker：エージェントによるツール利用と視覚的推論を活用したマルチモーダル生成型報酬モデルの強化

エージェント

Preference Modeling

Shengyuan Ding, Xinyu Fang, Ziyu Liu, et al.

Nex-N1：大規模な環境構築を実現する統合エコシステムを用いたエージェントモデルの訓練

エージェント

Nex-AGI Team, Yuxuan Cai, Lu Chen, et al.

DAComp：データインテリジェンスライフサイクル全体にわたるデータエージェントのベンチマーク

ベンチマーク

エージェント

Fangyu Lei, Jinxiang Meng, Yiming Huang, et al.

ライブアバター：無限長のリアルタイム音声駆動型アバター生成

拡散モデル

Yubo Huang, Hailong Guo, Fangtai Wu, et al.

F5-TTS：フローマッチングを用いた流暢かつ忠実な発話を偽造する童話作家

Yushen Chen, Zhikang Niu, Ziyang Ma, et al.

Beyond Real: 長文脈 LLM における回転位置埋め込みの虚構拡張

ネイティブ並列推論者：自己蒸留強化学習を用いた並列推論

iSeal：信頼性のあるLLM所有権検証のための暗号化されたフィンガープリント技術

DAVSP：深層整合視覚安全プロンプトを用いた大規模な視覚言語モデルの安全整合

WorldGen：テキストから走行可能でインタラクティブな3D世界へ

Souper-Model：単純な算術が最先端のLLM性能を解き放つメカニズム

DTS：デコード木スケッチを活用した大規模推論モデルの性能向上

ベイズ最適化における適応型カーネル設計は、LLMのおかげでカンタンなケーキである

DePass：シンプルな分解型フォワードパスによる統一的特徴属性付与

COOPER：空間知能における協調的認識と推論のための統一モデル

模倣から識別へ：ドメイン間推論タスクを強化する汎用カリキュラム優位性メカニズムへ

PaCo-RL：ペアワイズ報酬モデリングを用いた一貫性のある画像生成のための強化学習の進展

EMMA：統一アーキテクチャを用いた効率的なマルチモーダル理解、生成、編集

EditThinker：あらゆるイメージエディタにおける反復的推論を解き放つ

TwinFlow：自己対抗的フローを用いた大規模モデルにおけるワンステップ生成の実現

CARE-PD：パーキンソン病歩行評価を目的とした多施設匿名化臨床データセット

WenetSpeech-Chuan：方言音声処理のための大規模な四川語コーパスと豊富なアノテーション

PolypSense3D：内視鏡における深度認識型ポリープサイズ測定のためのマルチソースベンチマークデータセット

PhysDrive：車内ドライバー監視を目的としたマルチモーダル遠隔生理測定データセット

人工ハーモニーマインド：言語モデルの無限に続く均質性（それ以上へ）

OmniSVG：統合型スケーラブルベクターグラフィックス生成モデル

アルゴリズム的思考理論

ロボットワールドモデル：ロボティクスにおけるロバストな方策最適化のためのニューラルネットワークシミュレータ

リワードフォースティング：リワードド分布マッチング蒸留を用いた効率的なストリーミング動画生成

意味が道を示す：非同期潜在拡散を用いた意味表現とテクスチャ表現の調和

ARM-Thinker：エージェントによるツール利用と視覚的推論を活用したマルチモーダル生成型報酬モデルの強化

Nex-N1：大規模な環境構築を実現する統合エコシステムを用いたエージェントモデルの訓練

DAComp：データインテリジェンスライフサイクル全体にわたるデータエージェントのベンチマーク

ライブアバター：無限長のリアルタイム音声駆動型アバター生成

F5-TTS：フローマッチングを用いた流暢かつ忠実な発話を偽造する童話作家

Beyond Real: 長文脈 LLM における回転位置埋め込みの虚構拡張

ネイティブ並列推論者：自己蒸留強化学習を用いた並列推論

iSeal：信頼性のあるLLM所有権検証のための暗号化されたフィンガープリント技術

DAVSP：深層整合視覚安全プロンプトを用いた大規模な視覚言語モデルの安全整合

WorldGen：テキストから走行可能でインタラクティブな3D世界へ

Souper-Model：単純な算術が最先端のLLM性能を解き放つメカニズム

DTS：デコード木スケッチを活用した大規模推論モデルの性能向上

ベイズ最適化における適応型カーネル設計は、LLMのおかげでカンタンなケーキである

DePass：シンプルな分解型フォワードパスによる統一的特徴属性付与

COOPER：空間知能における協調的認識と推論のための統一モデル

模倣から識別へ：ドメイン間推論タスクを強化する汎用カリキュラム優位性メカニズムへ

PaCo-RL：ペアワイズ報酬モデリングを用いた一貫性のある画像生成のための強化学習の進展

EMMA：統一アーキテクチャを用いた効率的なマルチモーダル理解、生成、編集

EditThinker：あらゆるイメージエディタにおける反復的推論を解き放つ

TwinFlow：自己対抗的フローを用いた大規模モデルにおけるワンステップ生成の実現

CARE-PD：パーキンソン病歩行評価を目的とした多施設匿名化臨床データセット

WenetSpeech-Chuan：方言音声処理のための大規模な四川語コーパスと豊富なアノテーション

PolypSense3D：内視鏡における深度認識型ポリープサイズ測定のためのマルチソースベンチマークデータセット

PhysDrive：車内ドライバー監視を目的としたマルチモーダル遠隔生理測定データセット

人工ハーモニーマインド：言語モデルの無限に続く均質性（それ以上へ）

OmniSVG：統合型スケーラブルベクターグラフィックス生成モデル

アルゴリズム的思考理論

ロボットワールドモデル：ロボティクスにおけるロバストな方策最適化のためのニューラルネットワークシミュレータ

リワードフォースティング：リワードド分布マッチング蒸留を用いた効率的なストリーミング動画生成

意味が道を示す：非同期潜在拡散を用いた意味表現とテクスチャ表現の調和

ARM-Thinker：エージェントによるツール利用と視覚的推論を活用したマルチモーダル生成型報酬モデルの強化

Nex-N1：大規模な環境構築を実現する統合エコシステムを用いたエージェントモデルの訓練

DAComp：データインテリジェンスライフサイクル全体にわたるデータエージェントのベンチマーク

ライブアバター：無限長のリアルタイム音声駆動型アバター生成

F5-TTS：フローマッチングを用いた流暢かつ忠実な発話を偽造する童話作家