HyperAI

メイン

GPU

コンソール
Studio
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

人工知能の未来を築く

概要

当社についてサポートデータセットのヘルプ

製品

ニュース論文ノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

メイン

GPU

コンソール
Studio
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

人工知能の未来を築く

概要

当社についてサポートデータセットのヘルプ

製品

ニュース論文ノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)

WindowsWorld：専門的なクロスアプリケーション環境における自律型GUIエージェントのためのプロセス中心ベンチマーク

WindowsWorld：専門的なクロスアプリケーション環境における自律型GUIエージェントのためのプロセス中心ベンチマーク

ベンチマーク

エージェント

Jinchao Li, Yunxin Li, Chenrui Zhao, et al.

ハルシネーションは信頼を損なう；メタ認知が次なる道である

ハルシネーションは信頼を損なう；メタ認知が次なる道である

インテリジェントな質問応答

Gal Yona, Mor Geva, Yossi Matias

X2SAM: 画像および動画における任意のセグメンテーション

マルチモーダル

Hao Wang, Limeng Qiao, Chi Zhang, et al.

OpenSeeker-v2：情報豊富で高難易度のトラジェクトリを用いた検索agentの限界突破

エージェント

Yuwen Du, Rui Ye, Shuo Tang, et al.

PRISM: マルチモーダル強化学習のためのブラックボックスオンポリシー蒸留による事前整列

監視付き微調整

モデル学習

Sudong Wang, Weiquan Huang, Xiaomin Yu, et al.

ARIS: 敵対的多エージェント協働による自律的研究

エージェント

Ruofeng Yang, Yongcan Li, Shuai Li

ProgramBench：言語モデルはゼロからプログラムを再構築できるか

コード生成

ベンチマーク

John Yang, Kilian Lieret, Jeffrey Ma, et al.

GPU上における効率的な加速されたグラフ編集距離計算

Adel Dabah, Andreas Herten

危機報道のためのソーシャルメディアの状況信号に関するLLMベースの不確実性評価

テキスト生成

Timothy Douglas, Roben Delos Reyes, Asanobu Kitamoto

カノニカルLST: Tezosのためのプロトコルネイティブリクイッドステーキングソリューション

Mathias Bourgoin, Arthur Breitman, Pierrick Couderc, et al.

知性と実行の分離：モデルコンテキストプロトコル用のワークフローエンジン

エージェント

Abhinav Singh Parmar

テキストからビデオへの検索におけるパフォーマンスの頭打ちの理解：包括的な経験的および言語学的分析

テキストから動画

マルチモーダル

Maria-Eirini Pegia, Dimitrios Stefanopoulos, Björn Þór Jónsson, et al.

永続的視覚記憶：LVLMsにおける深層生成のための知覚の持続

マルチモーダル

検索拡張生成

Siyuan Huang, Xiaoye Qu, Yafu Li, et al.

EnergAIzer: AIワークロードに対する高速かつ高精度なGPU電力推定フレームワーク

ディープラーニング

高性能計算

Kyungmi Lee, Zhiye Song, Eun Kyung Lee, et al.

画像編集における検証者ベースの強化学習の活用

Hanzhong Guo, Jie Wu, Jie Liu, et al.

RoundPipeを用いた複数の消費者向けGPUでの効率的なトレーニング

モデル学習

Yibin Luo, Shiwei Gao, Huichuan Zheng, et al.

外見的生成を汎用的な対話型ヒューマノイド制御として捉えるExoActor

エムボディドインテリジェンス

Yanghao Zhou, Jingyu Ma, Yibo Peng, et al.

Co-Evolving Policy Distillation

モデル学習

マルチモーダル

Naibin Gu, Chenxu Yang, Qingyi Si, et al.

新しい時代のビジュアル生成：アトミックマッピングからエージェント型ワールドモデリングへの進化

マルチモーダル

Keming Wu, Zuhao Yang, Kaichen Zhang, et al.

異種科学基盤モデルの協調

エージェント

サイエンスのためのAI

Zihao Li, Jiaru Zou, Feihao Fang, et al.

拡散テンプレート：制御可能な拡散のための統一プラグインフレームワーク

拡散モデル

Zhongjie Duan, Hong Zhang, Yingda Chen

RADIO-ViPE: 動的環境におけるオープンボキャブラリセマンティックSLAMのためのオンライン密結合マルチモーダル融合

マルチモーダル表現

3D マシンビジョン

Zaid Nasser, Mikhail Iumanov, Tianhao Li, et al.

ClawGym：効果的なClawエージェントを構築するためのスケーラブルなフレームワーク

エージェント

Fei Bai, Huatong Song, Shuang Sun, et al.

TIDEの変革：拡散大規模言語モデルのためのアーキテクチャ横断的蒸留

拡散モデル

モデル学習

Gongbo Zhang, Wen Wang, Ye Tian, et al.

潜在蒸留による大規模言語モデルの探索

テキスト生成

Yuanhao Zeng, Ao Lu, Lufei Li, et al.

GLM-5V-Turbo：マルチモーダルエージェントのためのネイティブファウンデーションモデルへの道

マルチモーダル

エージェント

V Team, Wenyi Hong, Xiaotao Gu, et al.

SWE-chat: 野外環境における実ユーザーからのコーディングエージェントの対話

コード生成

エージェント

Joachim Baumann, Vishakh Padmakumar, Xiang Li, et al.

AdaExplore: 効率的なカーネル生成のための失敗駆動適応および多様性維持探索

コード生成

エージェント

Weihua Du, Jingming Zhuo, Yixin Dong, et al.

再生による精緻化：修正空間の拡大が統一マルチモーダルモデルにおける画像精緻化を促進する

テキストから画像生成

Jiayi Guo, Linqing Wang, Jiangshan Wang, et al.

AutoResearchBench: 複雑な科学的文献検索におけるAIエージェントのベンチマーク

エージェント

ベンチマーク

Lei Xiong, Kun Luo, Ziyi Xia, et al.

Meta-CoT: 画像編集における粒度と汎化能力の向上

視覚質問応答

Shiyi Zhang, Yiji Cheng, Tiankai Hang, et al.

DV-World: 現実世界でのデータ可視化エージェントの評価ベンチマーク

ベンチマーク

マルチモーダル表現

Jinxiang Meng, Shaoping Huang, Fangyu Lei, et al.

WindowsWorld：専門的なクロスアプリケーション環境における自律型GUIエージェントのためのプロセス中心ベンチマーク

WindowsWorld：専門的なクロスアプリケーション環境における自律型GUIエージェントのためのプロセス中心ベンチマーク

ベンチマーク

エージェント

Jinchao Li, Yunxin Li, Chenrui Zhao, et al.

ハルシネーションは信頼を損なう；メタ認知が次なる道である

ハルシネーションは信頼を損なう；メタ認知が次なる道である

インテリジェントな質問応答

Gal Yona, Mor Geva, Yossi Matias

X2SAM: 画像および動画における任意のセグメンテーション

マルチモーダル

Hao Wang, Limeng Qiao, Chi Zhang, et al.

OpenSeeker-v2：情報豊富で高難易度のトラジェクトリを用いた検索agentの限界突破

エージェント

Yuwen Du, Rui Ye, Shuo Tang, et al.

PRISM: マルチモーダル強化学習のためのブラックボックスオンポリシー蒸留による事前整列

監視付き微調整

モデル学習

Sudong Wang, Weiquan Huang, Xiaomin Yu, et al.

ARIS: 敵対的多エージェント協働による自律的研究

エージェント

Ruofeng Yang, Yongcan Li, Shuai Li

ProgramBench：言語モデルはゼロからプログラムを再構築できるか

コード生成

ベンチマーク

John Yang, Kilian Lieret, Jeffrey Ma, et al.

GPU上における効率的な加速されたグラフ編集距離計算

Adel Dabah, Andreas Herten

危機報道のためのソーシャルメディアの状況信号に関するLLMベースの不確実性評価

テキスト生成

Timothy Douglas, Roben Delos Reyes, Asanobu Kitamoto

カノニカルLST: Tezosのためのプロトコルネイティブリクイッドステーキングソリューション

Mathias Bourgoin, Arthur Breitman, Pierrick Couderc, et al.

知性と実行の分離：モデルコンテキストプロトコル用のワークフローエンジン

エージェント

Abhinav Singh Parmar

テキストからビデオへの検索におけるパフォーマンスの頭打ちの理解：包括的な経験的および言語学的分析

テキストから動画

マルチモーダル

Maria-Eirini Pegia, Dimitrios Stefanopoulos, Björn Þór Jónsson, et al.

永続的視覚記憶：LVLMsにおける深層生成のための知覚の持続

マルチモーダル

検索拡張生成

Siyuan Huang, Xiaoye Qu, Yafu Li, et al.

EnergAIzer: AIワークロードに対する高速かつ高精度なGPU電力推定フレームワーク

ディープラーニング

高性能計算

Kyungmi Lee, Zhiye Song, Eun Kyung Lee, et al.

画像編集における検証者ベースの強化学習の活用

Hanzhong Guo, Jie Wu, Jie Liu, et al.

RoundPipeを用いた複数の消費者向けGPUでの効率的なトレーニング

モデル学習

Yibin Luo, Shiwei Gao, Huichuan Zheng, et al.

外見的生成を汎用的な対話型ヒューマノイド制御として捉えるExoActor

エムボディドインテリジェンス

Yanghao Zhou, Jingyu Ma, Yibo Peng, et al.

Co-Evolving Policy Distillation

モデル学習

マルチモーダル

Naibin Gu, Chenxu Yang, Qingyi Si, et al.

新しい時代のビジュアル生成：アトミックマッピングからエージェント型ワールドモデリングへの進化

マルチモーダル

Keming Wu, Zuhao Yang, Kaichen Zhang, et al.

異種科学基盤モデルの協調

エージェント

サイエンスのためのAI

Zihao Li, Jiaru Zou, Feihao Fang, et al.

拡散テンプレート：制御可能な拡散のための統一プラグインフレームワーク

拡散モデル

Zhongjie Duan, Hong Zhang, Yingda Chen

RADIO-ViPE: 動的環境におけるオープンボキャブラリセマンティックSLAMのためのオンライン密結合マルチモーダル融合

マルチモーダル表現

3D マシンビジョン

Zaid Nasser, Mikhail Iumanov, Tianhao Li, et al.

ClawGym：効果的なClawエージェントを構築するためのスケーラブルなフレームワーク

エージェント

Fei Bai, Huatong Song, Shuang Sun, et al.

TIDEの変革：拡散大規模言語モデルのためのアーキテクチャ横断的蒸留

拡散モデル

モデル学習

Gongbo Zhang, Wen Wang, Ye Tian, et al.

潜在蒸留による大規模言語モデルの探索

テキスト生成

Yuanhao Zeng, Ao Lu, Lufei Li, et al.

GLM-5V-Turbo：マルチモーダルエージェントのためのネイティブファウンデーションモデルへの道

マルチモーダル

エージェント

V Team, Wenyi Hong, Xiaotao Gu, et al.

SWE-chat: 野外環境における実ユーザーからのコーディングエージェントの対話

コード生成

エージェント

Joachim Baumann, Vishakh Padmakumar, Xiang Li, et al.

AdaExplore: 効率的なカーネル生成のための失敗駆動適応および多様性維持探索

コード生成

エージェント

Weihua Du, Jingming Zhuo, Yixin Dong, et al.

再生による精緻化：修正空間の拡大が統一マルチモーダルモデルにおける画像精緻化を促進する

テキストから画像生成

Jiayi Guo, Linqing Wang, Jiangshan Wang, et al.

AutoResearchBench: 複雑な科学的文献検索におけるAIエージェントのベンチマーク

エージェント

ベンチマーク

Lei Xiong, Kun Luo, Ziyi Xia, et al.

Meta-CoT: 画像編集における粒度と汎化能力の向上

視覚質問応答

Shiyi Zhang, Yiji Cheng, Tiankai Hang, et al.

DV-World: 現実世界でのデータ可視化エージェントの評価ベンチマーク

ベンチマーク

マルチモーダル表現

Jinxiang Meng, Shaoping Huang, Fangyu Lei, et al.

X2SAM: 画像および動画における任意のセグメンテーション

OpenSeeker-v2：情報豊富で高難易度のトラジェクトリを用いた検索agentの限界突破

PRISM: マルチモーダル強化学習のためのブラックボックスオンポリシー蒸留による事前整列

ARIS: 敵対的多エージェント協働による自律的研究

ProgramBench：言語モデルはゼロからプログラムを再構築できるか

GPU上における効率的な加速されたグラフ編集距離計算

危機報道のためのソーシャルメディアの状況信号に関するLLMベースの不確実性評価

カノニカルLST: Tezosのためのプロトコルネイティブリクイッドステーキングソリューション

知性と実行の分離：モデルコンテキストプロトコル用のワークフローエンジン

テキストからビデオへの検索におけるパフォーマンスの頭打ちの理解：包括的な経験的および言語学的分析

永続的視覚記憶：LVLMsにおける深層生成のための知覚の持続

EnergAIzer: AIワークロードに対する高速かつ高精度なGPU電力推定フレームワーク

画像編集における検証者ベースの強化学習の活用

RoundPipeを用いた複数の消費者向けGPUでの効率的なトレーニング

外見的生成を汎用的な対話型ヒューマノイド制御として捉えるExoActor

Co-Evolving Policy Distillation

新しい時代のビジュアル生成：アトミックマッピングからエージェント型ワールドモデリングへの進化

異種科学基盤モデルの協調

拡散テンプレート：制御可能な拡散のための統一プラグインフレームワーク

RADIO-ViPE: 動的環境におけるオープンボキャブラリセマンティックSLAMのためのオンライン密結合マルチモーダル融合

ClawGym：効果的なClawエージェントを構築するためのスケーラブルなフレームワーク

TIDEの変革：拡散大規模言語モデルのためのアーキテクチャ横断的蒸留

潜在蒸留による大規模言語モデルの探索

GLM-5V-Turbo：マルチモーダルエージェントのためのネイティブファウンデーションモデルへの道

SWE-chat: 野外環境における実ユーザーからのコーディングエージェントの対話

AdaExplore: 効率的なカーネル生成のための失敗駆動適応および多様性維持探索

再生による精緻化：修正空間の拡大が統一マルチモーダルモデルにおける画像精緻化を促進する

AutoResearchBench: 複雑な科学的文献検索におけるAIエージェントのベンチマーク

Meta-CoT: 画像編集における粒度と汎化能力の向上

DV-World: 現実世界でのデータ可視化エージェントの評価ベンチマーク

X2SAM: 画像および動画における任意のセグメンテーション

OpenSeeker-v2：情報豊富で高難易度のトラジェクトリを用いた検索agentの限界突破

PRISM: マルチモーダル強化学習のためのブラックボックスオンポリシー蒸留による事前整列

ARIS: 敵対的多エージェント協働による自律的研究

ProgramBench：言語モデルはゼロからプログラムを再構築できるか

GPU上における効率的な加速されたグラフ編集距離計算

危機報道のためのソーシャルメディアの状況信号に関するLLMベースの不確実性評価

カノニカルLST: Tezosのためのプロトコルネイティブリクイッドステーキングソリューション

知性と実行の分離：モデルコンテキストプロトコル用のワークフローエンジン

テキストからビデオへの検索におけるパフォーマンスの頭打ちの理解：包括的な経験的および言語学的分析

永続的視覚記憶：LVLMsにおける深層生成のための知覚の持続

EnergAIzer: AIワークロードに対する高速かつ高精度なGPU電力推定フレームワーク

画像編集における検証者ベースの強化学習の活用

RoundPipeを用いた複数の消費者向けGPUでの効率的なトレーニング

外見的生成を汎用的な対話型ヒューマノイド制御として捉えるExoActor

Co-Evolving Policy Distillation

新しい時代のビジュアル生成：アトミックマッピングからエージェント型ワールドモデリングへの進化

異種科学基盤モデルの協調

拡散テンプレート：制御可能な拡散のための統一プラグインフレームワーク

RADIO-ViPE: 動的環境におけるオープンボキャブラリセマンティックSLAMのためのオンライン密結合マルチモーダル融合

ClawGym：効果的なClawエージェントを構築するためのスケーラブルなフレームワーク

TIDEの変革：拡散大規模言語モデルのためのアーキテクチャ横断的蒸留

潜在蒸留による大規模言語モデルの探索

GLM-5V-Turbo：マルチモーダルエージェントのためのネイティブファウンデーションモデルへの道

SWE-chat: 野外環境における実ユーザーからのコーディングエージェントの対話

AdaExplore: 効率的なカーネル生成のための失敗駆動適応および多様性維持探索

再生による精緻化：修正空間の拡大が統一マルチモーダルモデルにおける画像精緻化を促進する

AutoResearchBench: 複雑な科学的文献検索におけるAIエージェントのベンチマーク

Meta-CoT: 画像編集における粒度と汎化能力の向上

DV-World: 現実世界でのデータ可視化エージェントの評価ベンチマーク