HyperAI

メイン

GPU

コンソール
Studio
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

人工知能の未来を築く

概要

当社についてサポートデータセットのヘルプ

製品

ニュース論文ノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

メイン

GPU

コンソール
Studio
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

人工知能の未来を築く

概要

当社についてサポートデータセットのヘルプ

製品

ニュース論文ノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)

LLMを活用したエージェントによるドラッグ資産デューデリジェンスにおける競合状況マッピング

LLMを活用したエージェントによるドラッグ資産デューデリジェンスにおける競合状況マッピング

ドキュメント理解

マルチモーダル

Alisa Vinogradova, Vlad Vinogradov, Dmitrii Radkevich, et al.

SceneGen：1回のフォワードパスによる単一画像からの3Dシーン生成

SceneGen：1回のフォワードパスによる単一画像からの3Dシーン生成

Yanxu Meng, Haoning Wu, Ya Zhang, et al.

大規模言語モデルベンチマークに関する調査

データセット

Shiwen Ni, Guhong Chen, Shuaimin Li, et al.

Waver：リアルな動画生成へ向かう波を操る

画像から動画生成

テキストから動画

Yifu Zhang, Hao Yang, Yuqi Zhang, et al.

LiveMCP-101：挑戦的なクエリにおけるMCP対応エージェントのストレステストと診断

ベンチマーク

エージェント

Ming Yin, Dinghan Shen, Silei Xu, et al.

自信を持って深く考える

Yichao Fu, Xuewei Wang, Yuandong Tian, et al.

Mobile-Agent-v3：GUI自動化のための基盤エージェント

エージェント

Jiabo Ye, Xi Zhang, Haiyang Xu, et al.

Intern-S1：科学用マルチモーダル基盤モデル

マルチモーダル

Lei Bai, Zhongrui Cai, Maosong Cao, et al.

言語誘導型チューニング：テキストフィードバックを活用した数値最適化の向上

Yuxing Lu, Yucheng Hu, Nan Sun, et al.

NiceWebRL：強化学習環境を用いた被験者実験用Pythonライブラリ

人間-コンピュータインタラクション

Wilka Carvalho, Vikram Goddla, Ishaan Sinha, et al.

サイエンスのためのAIからエージェント型サイエンスへ：自律的科学発見に関するサーベイ

サイエンスのためのAI

エージェント

Jiaqi Wei, Yuejin Yang, Xiang Zhang, et al.

MeshCoder：点群からの構造化メッシュコード生成を実現するLLM駆動型手法

コード生成

Bingquan Dai, Li Ray Luo, Qihong Tang, et al.

Tinker：拡散モデルが3Dにもたらす贈り物——シーン最適化を必要としないスパース入力からの多視点一貫性のある編集

拡散モデル

Canyu Zhao, Xiaoman Li, Tianjian Feng, et al.

FutureX：未来予測におけるLLMエージェント向け高度なライブベンチマーク

ベンチマーク

Zhiyuan Zeng, Jiashuo Liu, Siyuan Chen, et al.

DuPO：二重選好に基づく信頼性のあるLLM自己検証の実現

監視付き微調整

Preference Modeling

Shuaijie She, Yu Bao, Yu Lu, et al.

スコアからスキルへ：金融分野向け大規模言語モデルの評価を目的とした認知診断枠組み

ベンチマーク

データセット

Ziyan Kuang, Feiyu Zhu, Maowei Jiang, et al.

グランアリー：25ヶ国語における音声認識および翻訳データセット

データセット

マルチタスク学習

Nithin Rao Koluguri, Monica Sekoyan, George Zelenfroynd, et al.

TransLLM：学習可能プロンプトを用いた都市交通向け統合型マルチタスク基盤フレームワーク

マルチタスク学習

Jiaming Leng, Yunying Bi, Chuan Qin, et al.

量子化とdLLMsの融合：拡散LLMにおける事後量子化の系統的研究

ディープラーニング

Haokun Lin, Haobo Xu, Yichen Wu, et al.

訓練不要なテキスト誘導型カラーディターリング手法：マルチモーダル拡散トランスフォーマーを用いた手法

拡散モデル

テキストから画像生成

Zixin Yin, Xili Dai, Ling-Hao Chen, et al.

プロファイルを意識したLLMをジャッジとして用いたポッドキャスト推薦の評価

Preference Modeling

Francesco Fabbri, Gustavo Penha, Edoardo D&#39, et al.

MultiRef：複数の視覚的参照を用いた制御可能な画像生成

拡散モデル

Ruoxi Chen, Dongping Chen, Siyuan Wu, et al.

プロンプトオーケストレーションマークアップ言語

インテリジェントな質問応答

Yuge Zhang, Nan Chen, Jiahang Xu, et al.

LongSplat：カジュアルな長時間動画向けのロバストな非姿勢制約3Dガウススプラッティング

コンピュータビジョン

3D マシンビジョン

Chin-Yang Lin, Cheng Sun, Fu-En Yang, et al.

エージェント連鎖：マルチエージェント蒸留とエージェント型RLによるエンドツーエンドエージェント基盤モデル

エージェント

Weizhen Li, Jianbo Lin, Zhuosong Jiang, et al.

HPSv3：広範囲な人間の好みスコアへの挑戦

Preference Modeling

テキストから画像生成

Yuhang Ma, Xiaoshi Wu, Keqiang Sun, et al.

ComputerRL：コンピュータ利用エージェント向けエンドツーエンドオンライン強化学習のスケーリング

エージェント

Hanyu Lai, Xiao Liu, Yanxiao Zhao, et al.

発話者識別情報の漏洩評価に関する研究

ベンチマーク

音声および音声処理

Seungmin Seo, Oleg Aulov, Afzal Godil, et al.

次に視覚的粒度生成を実行する

Yikai Wang, Zhouxia Wang, Zhonghua Wu, et al.

4DNeX：フォワード・プロパゲーションによる4D生成モデリングの簡便化

Zhaoxi Chen, Tianqi Liu, Long Zhuo, et al.

ComoRAG：状態保持型長文推論のための認知にインスパイアされた記憶組織型RAG

検索拡張生成

Juyuan Wang, Rongchen Zhao, Wei Wei, et al.

広帯域計算および通信を実現する統合型マイクロ波ニューラルネットワーク

ニューラルネットワーク

高性能計算

Bala Govind, Maxwell G. Anderson, Fan O. Wu, et al.

LLMを活用したエージェントによるドラッグ資産デューデリジェンスにおける競合状況マッピング

LLMを活用したエージェントによるドラッグ資産デューデリジェンスにおける競合状況マッピング

ドキュメント理解

マルチモーダル

Alisa Vinogradova, Vlad Vinogradov, Dmitrii Radkevich, et al.

SceneGen：1回のフォワードパスによる単一画像からの3Dシーン生成

SceneGen：1回のフォワードパスによる単一画像からの3Dシーン生成

Yanxu Meng, Haoning Wu, Ya Zhang, et al.

大規模言語モデルベンチマークに関する調査

データセット

Shiwen Ni, Guhong Chen, Shuaimin Li, et al.

Waver：リアルな動画生成へ向かう波を操る

画像から動画生成

テキストから動画

Yifu Zhang, Hao Yang, Yuqi Zhang, et al.

LiveMCP-101：挑戦的なクエリにおけるMCP対応エージェントのストレステストと診断

ベンチマーク

エージェント

Ming Yin, Dinghan Shen, Silei Xu, et al.

自信を持って深く考える

Yichao Fu, Xuewei Wang, Yuandong Tian, et al.

Mobile-Agent-v3：GUI自動化のための基盤エージェント

エージェント

Jiabo Ye, Xi Zhang, Haiyang Xu, et al.

Intern-S1：科学用マルチモーダル基盤モデル

マルチモーダル

Lei Bai, Zhongrui Cai, Maosong Cao, et al.

言語誘導型チューニング：テキストフィードバックを活用した数値最適化の向上

Yuxing Lu, Yucheng Hu, Nan Sun, et al.

NiceWebRL：強化学習環境を用いた被験者実験用Pythonライブラリ

人間-コンピュータインタラクション

Wilka Carvalho, Vikram Goddla, Ishaan Sinha, et al.

サイエンスのためのAIからエージェント型サイエンスへ：自律的科学発見に関するサーベイ

サイエンスのためのAI

エージェント

Jiaqi Wei, Yuejin Yang, Xiang Zhang, et al.

MeshCoder：点群からの構造化メッシュコード生成を実現するLLM駆動型手法

コード生成

Bingquan Dai, Li Ray Luo, Qihong Tang, et al.

Tinker：拡散モデルが3Dにもたらす贈り物——シーン最適化を必要としないスパース入力からの多視点一貫性のある編集

拡散モデル

Canyu Zhao, Xiaoman Li, Tianjian Feng, et al.

FutureX：未来予測におけるLLMエージェント向け高度なライブベンチマーク

ベンチマーク

Zhiyuan Zeng, Jiashuo Liu, Siyuan Chen, et al.

DuPO：二重選好に基づく信頼性のあるLLM自己検証の実現

監視付き微調整

Preference Modeling

Shuaijie She, Yu Bao, Yu Lu, et al.

スコアからスキルへ：金融分野向け大規模言語モデルの評価を目的とした認知診断枠組み

ベンチマーク

データセット

Ziyan Kuang, Feiyu Zhu, Maowei Jiang, et al.

グランアリー：25ヶ国語における音声認識および翻訳データセット

データセット

マルチタスク学習

Nithin Rao Koluguri, Monica Sekoyan, George Zelenfroynd, et al.

TransLLM：学習可能プロンプトを用いた都市交通向け統合型マルチタスク基盤フレームワーク

マルチタスク学習

Jiaming Leng, Yunying Bi, Chuan Qin, et al.

量子化とdLLMsの融合：拡散LLMにおける事後量子化の系統的研究

ディープラーニング

Haokun Lin, Haobo Xu, Yichen Wu, et al.

訓練不要なテキスト誘導型カラーディターリング手法：マルチモーダル拡散トランスフォーマーを用いた手法

拡散モデル

テキストから画像生成

Zixin Yin, Xili Dai, Ling-Hao Chen, et al.

プロファイルを意識したLLMをジャッジとして用いたポッドキャスト推薦の評価

Preference Modeling

Francesco Fabbri, Gustavo Penha, Edoardo D&#39, et al.

MultiRef：複数の視覚的参照を用いた制御可能な画像生成

拡散モデル

Ruoxi Chen, Dongping Chen, Siyuan Wu, et al.

プロンプトオーケストレーションマークアップ言語

インテリジェントな質問応答

Yuge Zhang, Nan Chen, Jiahang Xu, et al.

LongSplat：カジュアルな長時間動画向けのロバストな非姿勢制約3Dガウススプラッティング

コンピュータビジョン

3D マシンビジョン

Chin-Yang Lin, Cheng Sun, Fu-En Yang, et al.

エージェント連鎖：マルチエージェント蒸留とエージェント型RLによるエンドツーエンドエージェント基盤モデル

エージェント

Weizhen Li, Jianbo Lin, Zhuosong Jiang, et al.

HPSv3：広範囲な人間の好みスコアへの挑戦

Preference Modeling

テキストから画像生成

Yuhang Ma, Xiaoshi Wu, Keqiang Sun, et al.

ComputerRL：コンピュータ利用エージェント向けエンドツーエンドオンライン強化学習のスケーリング

エージェント

Hanyu Lai, Xiao Liu, Yanxiao Zhao, et al.

発話者識別情報の漏洩評価に関する研究

ベンチマーク

音声および音声処理

Seungmin Seo, Oleg Aulov, Afzal Godil, et al.

次に視覚的粒度生成を実行する

Yikai Wang, Zhouxia Wang, Zhonghua Wu, et al.

4DNeX：フォワード・プロパゲーションによる4D生成モデリングの簡便化

Zhaoxi Chen, Tianqi Liu, Long Zhuo, et al.

ComoRAG：状態保持型長文推論のための認知にインスパイアされた記憶組織型RAG

検索拡張生成

Juyuan Wang, Rongchen Zhao, Wei Wei, et al.

広帯域計算および通信を実現する統合型マイクロ波ニューラルネットワーク

ニューラルネットワーク

高性能計算

Bala Govind, Maxwell G. Anderson, Fan O. Wu, et al.

大規模言語モデルベンチマークに関する調査

Waver：リアルな動画生成へ向かう波を操る

LiveMCP-101：挑戦的なクエリにおけるMCP対応エージェントのストレステストと診断

自信を持って深く考える

Mobile-Agent-v3：GUI自動化のための基盤エージェント

Intern-S1：科学用マルチモーダル基盤モデル

言語誘導型チューニング：テキストフィードバックを活用した数値最適化の向上

NiceWebRL：強化学習環境を用いた被験者実験用Pythonライブラリ

サイエンスのためのAIからエージェント型サイエンスへ：自律的科学発見に関するサーベイ

MeshCoder：点群からの構造化メッシュコード生成を実現するLLM駆動型手法

Tinker：拡散モデルが3Dにもたらす贈り物——シーン最適化を必要としないスパース入力からの多視点一貫性のある編集

FutureX：未来予測におけるLLMエージェント向け高度なライブベンチマーク

DuPO：二重選好に基づく信頼性のあるLLM自己検証の実現

スコアからスキルへ：金融分野向け大規模言語モデルの評価を目的とした認知診断枠組み

グランアリー：25ヶ国語における音声認識および翻訳データセット

TransLLM：学習可能プロンプトを用いた都市交通向け統合型マルチタスク基盤フレームワーク

量子化とdLLMsの融合：拡散LLMにおける事後量子化の系統的研究

訓練不要なテキスト誘導型カラーディターリング手法：マルチモーダル拡散トランスフォーマーを用いた手法

プロファイルを意識したLLMをジャッジとして用いたポッドキャスト推薦の評価

MultiRef：複数の視覚的参照を用いた制御可能な画像生成

プロンプトオーケストレーションマークアップ言語

LongSplat：カジュアルな長時間動画向けのロバストな非姿勢制約3Dガウススプラッティング

エージェント連鎖：マルチエージェント蒸留とエージェント型RLによるエンドツーエンドエージェント基盤モデル

HPSv3：広範囲な人間の好みスコアへの挑戦

ComputerRL：コンピュータ利用エージェント向けエンドツーエンドオンライン強化学習のスケーリング

発話者識別情報の漏洩評価に関する研究

次に視覚的粒度生成を実行する

4DNeX：フォワード・プロパゲーションによる4D生成モデリングの簡便化

ComoRAG：状態保持型長文推論のための認知にインスパイアされた記憶組織型RAG

広帯域計算および通信を実現する統合型マイクロ波ニューラルネットワーク

大規模言語モデルベンチマークに関する調査

Waver：リアルな動画生成へ向かう波を操る

LiveMCP-101：挑戦的なクエリにおけるMCP対応エージェントのストレステストと診断

自信を持って深く考える

Mobile-Agent-v3：GUI自動化のための基盤エージェント

Intern-S1：科学用マルチモーダル基盤モデル

言語誘導型チューニング：テキストフィードバックを活用した数値最適化の向上

NiceWebRL：強化学習環境を用いた被験者実験用Pythonライブラリ

サイエンスのためのAIからエージェント型サイエンスへ：自律的科学発見に関するサーベイ

MeshCoder：点群からの構造化メッシュコード生成を実現するLLM駆動型手法

Tinker：拡散モデルが3Dにもたらす贈り物——シーン最適化を必要としないスパース入力からの多視点一貫性のある編集

FutureX：未来予測におけるLLMエージェント向け高度なライブベンチマーク

DuPO：二重選好に基づく信頼性のあるLLM自己検証の実現

スコアからスキルへ：金融分野向け大規模言語モデルの評価を目的とした認知診断枠組み

グランアリー：25ヶ国語における音声認識および翻訳データセット

TransLLM：学習可能プロンプトを用いた都市交通向け統合型マルチタスク基盤フレームワーク

量子化とdLLMsの融合：拡散LLMにおける事後量子化の系統的研究

訓練不要なテキスト誘導型カラーディターリング手法：マルチモーダル拡散トランスフォーマーを用いた手法

プロファイルを意識したLLMをジャッジとして用いたポッドキャスト推薦の評価

MultiRef：複数の視覚的参照を用いた制御可能な画像生成

プロンプトオーケストレーションマークアップ言語

LongSplat：カジュアルな長時間動画向けのロバストな非姿勢制約3Dガウススプラッティング

エージェント連鎖：マルチエージェント蒸留とエージェント型RLによるエンドツーエンドエージェント基盤モデル

HPSv3：広範囲な人間の好みスコアへの挑戦

ComputerRL：コンピュータ利用エージェント向けエンドツーエンドオンライン強化学習のスケーリング

発話者識別情報の漏洩評価に関する研究

次に視覚的粒度生成を実行する

4DNeX：フォワード・プロパゲーションによる4D生成モデリングの簡便化

ComoRAG：状態保持型長文推論のための認知にインスパイアされた記憶組織型RAG

広帯域計算および通信を実現する統合型マイクロ波ニューラルネットワーク