HyperAI

メイン

GPU

コンソール
Studio
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

人工知能の未来を築く

概要

当社についてサポートデータセットのヘルプ

製品

ニュース論文ノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

メイン

GPU

コンソール
Studio
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

人工知能の未来を築く

概要

当社についてサポートデータセットのヘルプ

製品

ニュース論文ノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)

TriSplat: シミュレーション対応のフィードフォワード3Dシーン再構築

TriSplat: シミュレーション対応のフィードフォワード3Dシーン再構築

コンピュータビジョン

Weijie Wang, Zimu Li, Jinchuan Shi, et al.

ファウンデーションプロトコル：エージェント社会のための協調レイヤー

ファウンデーションプロトコル：エージェント社会のための協調レイヤー

エージェント

Bang Liu, Yongfeng Gu, Jiayi Zhang, et al.

WBench: インタラクティブなビデオワールドモデル評価のための包括的なマルチターンベンチマーク

マルチモーダル

Kaining Ying, Hengrui Hu, Siyu Ren, et al.

Macaron-A2UI: パーソナルエージェントにおける生成UIのためのモデル

エージェント

Fancy Kong, Congjie Zheng, Murphy Zhuang, et al.

DVAO: 多報酬強化学習のための動的分散適応型アドバンテージ最適化

マルチタスク学習

Guochao Jiang, Jingyi Song, Guofeng Quan, et al.

ViMU: ビデオの比喩的理解の評価

ビデオ理解

Qi Li, Xinchao Wang

SMOL：115の過小代表言語のための専門的に翻訳された並列データ

監視付き微調整

Isaac Caswell, Elizabeth Nielsen, Jiaming Luo, et al.

Chi-Bench: AIエージェントは、エンドツーエンドで長期にわたる、政策に富む医療ワークフローを自動化できるか？

エージェント

ベンチマーク

Haolin Chen, Deon Metelski, Leon Qi, et al.

大規模言語モデルにおける長期文脈の推論のためのオンポリシー最適化と蒸留の融合

モデル学習

Miguel Moura Ramos, Duarte M. Alves, André F. T. Martins

対照のレンズを通じて：VLMにおける自己改善型視覚推論

視覚質問応答

マルチモーダル

Zhiyu Pan, Yizheng Wu, Jiashen Hua, et al.

HRM-Text: スケーリングを超えた効率的な事前トレーニング

モデル学習

ディープラーニング

Guan Wang, Changling Liu, Chenyu Wang, et al.

私が何を意味しているかを見る：ビデオの細粒度オブジェクト理解のためにビジョンと言語表現をアラインする

マルチモーダル

マルチモーダル表現

Boyuan Sun, Bowen Yin, Yuanming Li, et al.

StepAudio 2.5 技術報告書

Bin Lin, Bo Zhao, Boyong Wu, et al.

SciAtlas: 自動化された科学的研究のための大規模知識グラフ

サイエンスのためのAI

Shuofei Qiao, Yunxiang Wei, Jiazheng Fan, et al.

拡散トランスフォーマーにおけるクロスレイヤー情報ルーティングの再考

拡散モデル

Chao Xu, Maohua Li, Qirui Li, et al.

Lens: 基礎的なテキストから画像へのモデルのトレーニング効率を再考する

テキストから画像生成

拡散モデル

Dong Chen, Fangyun Wei, Ziyu Wan, et al.

SkillOpt: 自己進化するエージェントスキルのための実行戦略

エージェント

Yifan Yang, Ziyang Gong, Weiquan Huang, et al.

CVEvolve: 非構造化科学データ処理のための自律的アルゴリズム発見

サイエンスのためのAI

Ming Du, Xiangyu Yin, Yanqi Luo, et al.

Poly-EPO: 探索的推論モデルのトレーニング

Ifdita Hasan Orney, Jubayer Ibn Hamid, Shreya S Ramanujam, et al.

検索拡張生成

Ryan Wei Heng Quek, Sanghyuk Lee, Alfred Wei Lun Leong, et al.

ACC: 長期コンテキストトレーニングのためのエージェント軌道のコンパイル

エージェント

監視付き微調整

Qisheng Su, Zhen Fang, Shiting Huang, et al.

フルアテンションが再び襲来：数百のトレーニングステップ内でフルアテンションをスパースに変換する

Yanke Zhou, Yiduo Li, Hanlin Tang, et al.

$π$-Bench: 長期ワークフローにおけるプロアクティブなパーソナルアシスタントエージェントの評価

エージェント

ベンチマーク

Haoran Zhang, Luxin Xu, Zhilin Wang, et al.

知覚か偏見か：大規模言語モデルは性格の第一印象を超えられるか？

マルチモーダル

Caixin Kang, Tianyu Yan, Sitong Gong, et al.

TransitLM: マップフリーな交通経路生成のための大規模データセットとベンチマーク

Hanyu Guo, Jiedong Yang, Chao Chen, et al.

DelTA: 検証可能な報酬からの強化学習における判別トークン信用割り当て

Kaiyi Zhang, Wei Wu, Yankai Lin

インタラクティブな評価にはデザイン科学が必要である

ベンチマーク

Keyang Xuan, Peiyang Song, Pan Lu, et al.

ESI-BENCH: 知覚と行動のループを閉じる具現化された空間知能 towards

エムボディドインテリジェンス

Yining Hong, Jiageng Liu, Han Yin, et al.

複数の可視スペクトラムにわたるドローン画像を用いた軍事検出の比較分析

オブジェクト検出

マシンビジョン

Sourov Roy Shuvo, Prajwal Panth, Rajesh Chowdhury, et al.

精神疾患診断のICD分類の自動化：古典的NLPから大規模言語モデルへ

自然言語処理

Fernando Ortega, Raúl Lara-Cabrera, Jorge Dueñas-Lerín, et al.

コミュニティIBRの残存容量を用いた配電系統における協調的最適な電力品質管理

テキスト生成

Tiantian Ji, Pengfeng Lin, Miao Zhu, et al.

EllipseLIO: 楕円体表現を用いた適応型LiDAR慣性オドメトリ

3D マシンビジョン

Rowan Border, Margarita Chli

TriSplat: シミュレーション対応のフィードフォワード3Dシーン再構築

TriSplat: シミュレーション対応のフィードフォワード3Dシーン再構築

コンピュータビジョン

Weijie Wang, Zimu Li, Jinchuan Shi, et al.

ファウンデーションプロトコル：エージェント社会のための協調レイヤー

ファウンデーションプロトコル：エージェント社会のための協調レイヤー

エージェント

Bang Liu, Yongfeng Gu, Jiayi Zhang, et al.

WBench: インタラクティブなビデオワールドモデル評価のための包括的なマルチターンベンチマーク

マルチモーダル

Kaining Ying, Hengrui Hu, Siyu Ren, et al.

Macaron-A2UI: パーソナルエージェントにおける生成UIのためのモデル

エージェント

Fancy Kong, Congjie Zheng, Murphy Zhuang, et al.

DVAO: 多報酬強化学習のための動的分散適応型アドバンテージ最適化

マルチタスク学習

Guochao Jiang, Jingyi Song, Guofeng Quan, et al.

ViMU: ビデオの比喩的理解の評価

ビデオ理解

Qi Li, Xinchao Wang

SMOL：115の過小代表言語のための専門的に翻訳された並列データ

監視付き微調整

Isaac Caswell, Elizabeth Nielsen, Jiaming Luo, et al.

Chi-Bench: AIエージェントは、エンドツーエンドで長期にわたる、政策に富む医療ワークフローを自動化できるか？

エージェント

ベンチマーク

Haolin Chen, Deon Metelski, Leon Qi, et al.

大規模言語モデルにおける長期文脈の推論のためのオンポリシー最適化と蒸留の融合

モデル学習

Miguel Moura Ramos, Duarte M. Alves, André F. T. Martins

対照のレンズを通じて：VLMにおける自己改善型視覚推論

視覚質問応答

マルチモーダル

Zhiyu Pan, Yizheng Wu, Jiashen Hua, et al.

HRM-Text: スケーリングを超えた効率的な事前トレーニング

モデル学習

ディープラーニング

Guan Wang, Changling Liu, Chenyu Wang, et al.

私が何を意味しているかを見る：ビデオの細粒度オブジェクト理解のためにビジョンと言語表現をアラインする

マルチモーダル

マルチモーダル表現

Boyuan Sun, Bowen Yin, Yuanming Li, et al.

StepAudio 2.5 技術報告書

Bin Lin, Bo Zhao, Boyong Wu, et al.

SciAtlas: 自動化された科学的研究のための大規模知識グラフ

サイエンスのためのAI

Shuofei Qiao, Yunxiang Wei, Jiazheng Fan, et al.

拡散トランスフォーマーにおけるクロスレイヤー情報ルーティングの再考

拡散モデル

Chao Xu, Maohua Li, Qirui Li, et al.

Lens: 基礎的なテキストから画像へのモデルのトレーニング効率を再考する

テキストから画像生成

拡散モデル

Dong Chen, Fangyun Wei, Ziyu Wan, et al.

SkillOpt: 自己進化するエージェントスキルのための実行戦略

エージェント

Yifan Yang, Ziyang Gong, Weiquan Huang, et al.

CVEvolve: 非構造化科学データ処理のための自律的アルゴリズム発見

サイエンスのためのAI

Ming Du, Xiangyu Yin, Yanqi Luo, et al.

Poly-EPO: 探索的推論モデルのトレーニング

Ifdita Hasan Orney, Jubayer Ibn Hamid, Shreya S Ramanujam, et al.

検索拡張生成

Ryan Wei Heng Quek, Sanghyuk Lee, Alfred Wei Lun Leong, et al.

ACC: 長期コンテキストトレーニングのためのエージェント軌道のコンパイル

エージェント

監視付き微調整

Qisheng Su, Zhen Fang, Shiting Huang, et al.

フルアテンションが再び襲来：数百のトレーニングステップ内でフルアテンションをスパースに変換する

Yanke Zhou, Yiduo Li, Hanlin Tang, et al.

$π$-Bench: 長期ワークフローにおけるプロアクティブなパーソナルアシスタントエージェントの評価

エージェント

ベンチマーク

Haoran Zhang, Luxin Xu, Zhilin Wang, et al.

知覚か偏見か：大規模言語モデルは性格の第一印象を超えられるか？

マルチモーダル

Caixin Kang, Tianyu Yan, Sitong Gong, et al.

TransitLM: マップフリーな交通経路生成のための大規模データセットとベンチマーク

Hanyu Guo, Jiedong Yang, Chao Chen, et al.

DelTA: 検証可能な報酬からの強化学習における判別トークン信用割り当て

Kaiyi Zhang, Wei Wu, Yankai Lin

インタラクティブな評価にはデザイン科学が必要である

ベンチマーク

Keyang Xuan, Peiyang Song, Pan Lu, et al.

ESI-BENCH: 知覚と行動のループを閉じる具現化された空間知能 towards

エムボディドインテリジェンス

Yining Hong, Jiageng Liu, Han Yin, et al.

複数の可視スペクトラムにわたるドローン画像を用いた軍事検出の比較分析

オブジェクト検出

マシンビジョン

Sourov Roy Shuvo, Prajwal Panth, Rajesh Chowdhury, et al.

精神疾患診断のICD分類の自動化：古典的NLPから大規模言語モデルへ

自然言語処理

Fernando Ortega, Raúl Lara-Cabrera, Jorge Dueñas-Lerín, et al.

コミュニティIBRの残存容量を用いた配電系統における協調的最適な電力品質管理

テキスト生成

Tiantian Ji, Pengfeng Lin, Miao Zhu, et al.

EllipseLIO: 楕円体表現を用いた適応型LiDAR慣性オドメトリ

3D マシンビジョン

Rowan Border, Margarita Chli

WBench: インタラクティブなビデオワールドモデル評価のための包括的なマルチターンベンチマーク

Macaron-A2UI: パーソナルエージェントにおける生成UIのためのモデル

DVAO: 多報酬強化学習のための動的分散適応型アドバンテージ最適化

ViMU: ビデオの比喩的理解の評価

SMOL：115の過小代表言語のための専門的に翻訳された並列データ

Chi-Bench: AIエージェントは、エンドツーエンドで長期にわたる、政策に富む医療ワークフローを自動化できるか？

大規模言語モデルにおける長期文脈の推論のためのオンポリシー最適化と蒸留の融合

対照のレンズを通じて：VLMにおける自己改善型視覚推論

HRM-Text: スケーリングを超えた効率的な事前トレーニング

私が何を意味しているかを見る：ビデオの細粒度オブジェクト理解のためにビジョンと言語表現をアラインする

StepAudio 2.5 技術報告書

SciAtlas: 自動化された科学的研究のための大規模知識グラフ

拡散トランスフォーマーにおけるクロスレイヤー情報ルーティングの再考

Lens: 基礎的なテキストから画像へのモデルのトレーニング効率を再考する

SkillOpt: 自己進化するエージェントスキルのための実行戦略

CVEvolve: 非構造化科学データ処理のための自律的アルゴリズム発見

Poly-EPO: 探索的推論モデルのトレーニング

概要

ACC: 長期コンテキストトレーニングのためのエージェント軌道のコンパイル

フルアテンションが再び襲来：数百のトレーニングステップ内でフルアテンションをスパースに変換する

$π$ -Bench: 長期ワークフローにおけるプロアクティブなパーソナルアシスタントエージェントの評価

知覚か偏見か：大規模言語モデルは性格の第一印象を超えられるか？

TransitLM: マップフリーな交通経路生成のための大規模データセットとベンチマーク

DelTA: 検証可能な報酬からの強化学習における判別トークン信用割り当て

インタラクティブな評価にはデザイン科学が必要である

ESI-BENCH: 知覚と行動のループを閉じる具現化された空間知能 towards

複数の可視スペクトラムにわたるドローン画像を用いた軍事検出の比較分析

精神疾患診断のICD分類の自動化：古典的NLPから大規模言語モデルへ

コミュニティIBRの残存容量を用いた配電系統における協調的最適な電力品質管理

EllipseLIO: 楕円体表現を用いた適応型LiDAR慣性オドメトリ

WBench: インタラクティブなビデオワールドモデル評価のための包括的なマルチターンベンチマーク

Macaron-A2UI: パーソナルエージェントにおける生成UIのためのモデル

DVAO: 多報酬強化学習のための動的分散適応型アドバンテージ最適化

ViMU: ビデオの比喩的理解の評価

SMOL：115の過小代表言語のための専門的に翻訳された並列データ

Chi-Bench: AIエージェントは、エンドツーエンドで長期にわたる、政策に富む医療ワークフローを自動化できるか？

大規模言語モデルにおける長期文脈の推論のためのオンポリシー最適化と蒸留の融合

対照のレンズを通じて：VLMにおける自己改善型視覚推論

HRM-Text: スケーリングを超えた効率的な事前トレーニング

私が何を意味しているかを見る：ビデオの細粒度オブジェクト理解のためにビジョンと言語表現をアラインする

StepAudio 2.5 技術報告書

SciAtlas: 自動化された科学的研究のための大規模知識グラフ

拡散トランスフォーマーにおけるクロスレイヤー情報ルーティングの再考

Lens: 基礎的なテキストから画像へのモデルのトレーニング効率を再考する

SkillOpt: 自己進化するエージェントスキルのための実行戦略

CVEvolve: 非構造化科学データ処理のための自律的アルゴリズム発見

Poly-EPO: 探索的推論モデルのトレーニング

概要

ACC: 長期コンテキストトレーニングのためのエージェント軌道のコンパイル

フルアテンションが再び襲来：数百のトレーニングステップ内でフルアテンションをスパースに変換する

$π$ -Bench: 長期ワークフローにおけるプロアクティブなパーソナルアシスタントエージェントの評価

知覚か偏見か：大規模言語モデルは性格の第一印象を超えられるか？

TransitLM: マップフリーな交通経路生成のための大規模データセットとベンチマーク

DelTA: 検証可能な報酬からの強化学習における判別トークン信用割り当て

インタラクティブな評価にはデザイン科学が必要である

ESI-BENCH: 知覚と行動のループを閉じる具現化された空間知能 towards

複数の可視スペクトラムにわたるドローン画像を用いた軍事検出の比較分析

精神疾患診断のICD分類の自動化：古典的NLPから大規模言語モデルへ

コミュニティIBRの残存容量を用いた配電系統における協調的最適な電力品質管理

EllipseLIO: 楕円体表現を用いた適応型LiDAR慣性オドメトリ