HyperAI

メイン

GPU

コンソール
Studio
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

人工知能の未来を築く

概要

当社についてサポートデータセットのヘルプ

製品

ニュース論文ノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

メイン

GPU

コンソール
Studio
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

人工知能の未来を築く

概要

当社についてサポートデータセットのヘルプ

製品

ニュース論文ノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)

OpenAutoNLU：NLU向けオープンソースAutoMLライブラリ

OpenAutoNLU：NLU向けオープンソースAutoMLライブラリ

自然言語処理

Grigory Arshinov, Aleksandr Boriskin, Sergey Senichev, et al.

OmniLottie：パラメータ化Lottieトークンを用いたベクターアニメーション生成

OmniLottie：パラメータ化Lottieトークンを用いたベクターアニメーション生成

マルチモーダル

Yiying Yang, Wei Cheng, Sijin Chen, et al.

スケールからスピードへ：画像編集における適応的テスト時スケーリング

画像間変換

Xiangyan Qu, Zhenlong Yuan, Jing Tang, et al.

in-context co-player inference を介した Multi-agent 間の協力

エージェント

Marissa A. Weis, Maciej Wołczyk, Rajai Nasser, et al.

ACTIONENGINE: State Machine Memory を介した Reactive な GUI Agent から Programmatic な Agent への転換

エージェント

Hongbin Zhong, Fazole Faisalal, Luis França, et al.

CiteAudit：あなたは引用しましたが、読んだでしょうか？LLM時代における科学的引用の検証のためのベンチマーク

検索拡張生成

ベンチマーク

Zhengqing Yuan, Kaiwen Shi, Zheyuan Zhang, et al.

モード探索が平均探索と融合した高速な長時間動画生成

拡散モデル

Shengqu Cai, Weili Nie, Chao Liu, et al.

CUDA Agent：高性能CUDAカーネル生成のための大規模エージェント型強化学習

AI コンパイラ

コード生成

Weinan Dai, Hanlin Wu, Qiying Yu, et al.

翻訳による回復：ベンチマークおよびデータセットの自動翻訳を効率的に行うパイプライン

Hanna Yukhymenko, Anton Alexandrov, Martin Vechev

画像生成における空間理解の向上：報酬モデリングを活用して

テキストから画像生成

Zhenyu Tang, Chaoran Feng, Yufan Deng, et al.

dLLM：シンプルなディフュージョン言語モデリング

拡散モデル

テキスト生成

Zhanhui Zhou, Lingjie Chen, Hanghang Tong, et al.

探索的メモリ拡張型LLMエージェント：ハイブリッドオンポリシーおよびオフポリシー最適化による実現

エージェント

Zeyuan Liu, Jeonghye Kim, Xufang Luo, et al.

想像力は視覚的推論を支援するが、まだ潜在空間では実現していない

マルチモーダル

視覚質問応答

You Li, Chi Chen, Yanghao Li, et al.

オムニGAIA：ネイティブなオムニモーダルAIエージェントへ向けて

マルチモーダル

エージェント

Xiaoxi Li, Wenxiang Jiao, Jiarui Jin, et al.

MobilityBench：現実世界のモビリティシナリオにおけるルート計画エージェント評価のためのベンチマーク

インテリジェントな質問応答

ベンチマーク

Zhiheng Song, Jingshuai Zhang, Chuan Qin, et al.

盲点から利益へ：大規模なマルチモーダルモデルにおける診断駆動型反復学習

マルチモーダル

モデル学習

Hongrui Jia, Chaoya Jiang, Shikun Zhang, et al.

一貫性の三位一体が汎用世界モデルの定義的原則としての役割

マルチモーダル表現

Jingxuan Wei, Siyuan Li, Yuhang Xu, et al.

GUI-Libra：アクション認識型の監督と部分検証可能なRLを用いたネイティブGUIエージェントの推論・実行訓練

監視付き微調整

エージェント

Rui Yang, Qianhui Wu, Zhaoyang Wang, et al.

SkyReels-V4：マルチモーダルな動画・音声生成、インペインティングおよび編集モデル

テキストから動画

拡散モデル

Guibin Chen, Dixuan Lin, Jiangping Yang, et al.

ARLArena：安定したエージェント強化学習を実現する包括的フレームワーク

Xiaoxuan Wang, Han Zhang, Haixin Wang, et al.

DreamID-Omni：制御可能かつ人間中心型音声・映像生成のための統合枠組み

マルチモーダル

Xu Guo, Fulong Ye, Qichao Sun, et al.

MolHIT：階層的離散拡散モデルによる分子グラフ生成の進展

拡散モデル

サイエンスのためのAI

Hojung Jung, Rodrigo Hormazabal, Jaehyeong Jo, et al.

HyTRec：長期間行動順序推薦のためのハイブリッド時系列認識アテンションアーキテクチャ

Preference Modeling

Lei Xin, Yuhao Zheng, Ke Cheng, et al.

DREAM：エージェンティックメトリクスを用いたディープリサーチ評価

ベンチマーク

Elad Ben Avraham, Changhao Li, Ron Dorfman, et al.

LongCLI-Bench：コマンドラインインターフェースにおける長期視野型エージェントプログラミングのための初期ベンチマークと研究

エージェント

ベンチマーク

Yukang Feng, Jianwen Sun, Zelai Yang, et al.

PyVision-RL：RLを活用したオープン型エージェント視覚モデルの構築

ビデオ理解

エージェント

Shitian Zhao, Shaoheng Lin, Ming Li, et al.

知覚から行動へ：視覚推論のためのインタラクティブベンチマーク

マルチモーダル

マルチモーダル表現

Yuhao Wu, Maojia Song, Yihuai Lan, et al.

クエリ中心型かつメモリ認識型リランカーによる長文脈処理

検索拡張生成

Yuqing Li, Jiangnan Li, Mo Yu, et al.

LLM端末機能のスケーリングのためのデータ工学

モデル学習

Renjie Pi, Grace Lam, Mohammad Shoeybi, et al.

DSDR：LLM推論における探索のためのデュアルスケール多様性正則化

Zhongwei Wan, Yun Shen, Zhihao Dou, et al.

Mobile-O：モバイルデバイス上の統合的マルチモーダル理解と生成

マルチモーダル

拡散モデル

Abdelrahman Shaker, Ahmed Heakl, Jaseel Muhammad, et al.

TOPReward：ロボティクスにおける隠れたゼロショット報酬としてのトークン確率

マルチモーダル表現

Shirui Chen, Cole Harrison, Ying-Chun Lee, et al.

OpenAutoNLU：NLU向けオープンソースAutoMLライブラリ

OpenAutoNLU：NLU向けオープンソースAutoMLライブラリ

自然言語処理

Grigory Arshinov, Aleksandr Boriskin, Sergey Senichev, et al.

OmniLottie：パラメータ化Lottieトークンを用いたベクターアニメーション生成

OmniLottie：パラメータ化Lottieトークンを用いたベクターアニメーション生成

マルチモーダル

Yiying Yang, Wei Cheng, Sijin Chen, et al.

スケールからスピードへ：画像編集における適応的テスト時スケーリング

画像間変換

Xiangyan Qu, Zhenlong Yuan, Jing Tang, et al.

in-context co-player inference を介した Multi-agent 間の協力

エージェント

Marissa A. Weis, Maciej Wołczyk, Rajai Nasser, et al.

ACTIONENGINE: State Machine Memory を介した Reactive な GUI Agent から Programmatic な Agent への転換

エージェント

Hongbin Zhong, Fazole Faisalal, Luis França, et al.

CiteAudit：あなたは引用しましたが、読んだでしょうか？LLM時代における科学的引用の検証のためのベンチマーク

検索拡張生成

ベンチマーク

Zhengqing Yuan, Kaiwen Shi, Zheyuan Zhang, et al.

モード探索が平均探索と融合した高速な長時間動画生成

拡散モデル

Shengqu Cai, Weili Nie, Chao Liu, et al.

CUDA Agent：高性能CUDAカーネル生成のための大規模エージェント型強化学習

AI コンパイラ

コード生成

Weinan Dai, Hanlin Wu, Qiying Yu, et al.

翻訳による回復：ベンチマークおよびデータセットの自動翻訳を効率的に行うパイプライン

Hanna Yukhymenko, Anton Alexandrov, Martin Vechev

画像生成における空間理解の向上：報酬モデリングを活用して

テキストから画像生成

Zhenyu Tang, Chaoran Feng, Yufan Deng, et al.

dLLM：シンプルなディフュージョン言語モデリング

拡散モデル

テキスト生成

Zhanhui Zhou, Lingjie Chen, Hanghang Tong, et al.

探索的メモリ拡張型LLMエージェント：ハイブリッドオンポリシーおよびオフポリシー最適化による実現

エージェント

Zeyuan Liu, Jeonghye Kim, Xufang Luo, et al.

想像力は視覚的推論を支援するが、まだ潜在空間では実現していない

マルチモーダル

視覚質問応答

You Li, Chi Chen, Yanghao Li, et al.

オムニGAIA：ネイティブなオムニモーダルAIエージェントへ向けて

マルチモーダル

エージェント

Xiaoxi Li, Wenxiang Jiao, Jiarui Jin, et al.

MobilityBench：現実世界のモビリティシナリオにおけるルート計画エージェント評価のためのベンチマーク

インテリジェントな質問応答

ベンチマーク

Zhiheng Song, Jingshuai Zhang, Chuan Qin, et al.

盲点から利益へ：大規模なマルチモーダルモデルにおける診断駆動型反復学習

マルチモーダル

モデル学習

Hongrui Jia, Chaoya Jiang, Shikun Zhang, et al.

一貫性の三位一体が汎用世界モデルの定義的原則としての役割

マルチモーダル表現

Jingxuan Wei, Siyuan Li, Yuhang Xu, et al.

GUI-Libra：アクション認識型の監督と部分検証可能なRLを用いたネイティブGUIエージェントの推論・実行訓練

監視付き微調整

エージェント

Rui Yang, Qianhui Wu, Zhaoyang Wang, et al.

SkyReels-V4：マルチモーダルな動画・音声生成、インペインティングおよび編集モデル

テキストから動画

拡散モデル

Guibin Chen, Dixuan Lin, Jiangping Yang, et al.

ARLArena：安定したエージェント強化学習を実現する包括的フレームワーク

Xiaoxuan Wang, Han Zhang, Haixin Wang, et al.

DreamID-Omni：制御可能かつ人間中心型音声・映像生成のための統合枠組み

マルチモーダル

Xu Guo, Fulong Ye, Qichao Sun, et al.

MolHIT：階層的離散拡散モデルによる分子グラフ生成の進展

拡散モデル

サイエンスのためのAI

Hojung Jung, Rodrigo Hormazabal, Jaehyeong Jo, et al.

HyTRec：長期間行動順序推薦のためのハイブリッド時系列認識アテンションアーキテクチャ

Preference Modeling

Lei Xin, Yuhao Zheng, Ke Cheng, et al.

DREAM：エージェンティックメトリクスを用いたディープリサーチ評価

ベンチマーク

Elad Ben Avraham, Changhao Li, Ron Dorfman, et al.

LongCLI-Bench：コマンドラインインターフェースにおける長期視野型エージェントプログラミングのための初期ベンチマークと研究

エージェント

ベンチマーク

Yukang Feng, Jianwen Sun, Zelai Yang, et al.

PyVision-RL：RLを活用したオープン型エージェント視覚モデルの構築

ビデオ理解

エージェント

Shitian Zhao, Shaoheng Lin, Ming Li, et al.

知覚から行動へ：視覚推論のためのインタラクティブベンチマーク

マルチモーダル

マルチモーダル表現

Yuhao Wu, Maojia Song, Yihuai Lan, et al.

クエリ中心型かつメモリ認識型リランカーによる長文脈処理

検索拡張生成

Yuqing Li, Jiangnan Li, Mo Yu, et al.

LLM端末機能のスケーリングのためのデータ工学

モデル学習

Renjie Pi, Grace Lam, Mohammad Shoeybi, et al.

DSDR：LLM推論における探索のためのデュアルスケール多様性正則化

Zhongwei Wan, Yun Shen, Zhihao Dou, et al.

Mobile-O：モバイルデバイス上の統合的マルチモーダル理解と生成

マルチモーダル

拡散モデル

Abdelrahman Shaker, Ahmed Heakl, Jaseel Muhammad, et al.

TOPReward：ロボティクスにおける隠れたゼロショット報酬としてのトークン確率

マルチモーダル表現

Shirui Chen, Cole Harrison, Ying-Chun Lee, et al.

スケールからスピードへ：画像編集における適応的テスト時スケーリング

in-context co-player inference を介した Multi-agent 間の協力

ACTIONENGINE: State Machine Memory を介した Reactive な GUI Agent から Programmatic な Agent への転換

CiteAudit：あなたは引用しましたが、読んだでしょうか？LLM時代における科学的引用の検証のためのベンチマーク

モード探索が平均探索と融合した高速な長時間動画生成

CUDA Agent：高性能CUDAカーネル生成のための大規模エージェント型強化学習

翻訳による回復：ベンチマークおよびデータセットの自動翻訳を効率的に行うパイプライン

画像生成における空間理解の向上：報酬モデリングを活用して

dLLM：シンプルなディフュージョン言語モデリング

探索的メモリ拡張型LLMエージェント：ハイブリッドオンポリシーおよびオフポリシー最適化による実現

想像力は視覚的推論を支援するが、まだ潜在空間では実現していない

オムニGAIA：ネイティブなオムニモーダルAIエージェントへ向けて

MobilityBench：現実世界のモビリティシナリオにおけるルート計画エージェント評価のためのベンチマーク

盲点から利益へ：大規模なマルチモーダルモデルにおける診断駆動型反復学習

一貫性の三位一体が汎用世界モデルの定義的原則としての役割

GUI-Libra：アクション認識型の監督と部分検証可能なRLを用いたネイティブGUIエージェントの推論・実行訓練

SkyReels-V4：マルチモーダルな動画・音声生成、インペインティングおよび編集モデル

ARLArena：安定したエージェント強化学習を実現する包括的フレームワーク

DreamID-Omni：制御可能かつ人間中心型音声・映像生成のための統合枠組み

MolHIT：階層的離散拡散モデルによる分子グラフ生成の進展

HyTRec：長期間行動順序推薦のためのハイブリッド時系列認識アテンションアーキテクチャ

DREAM：エージェンティックメトリクスを用いたディープリサーチ評価

LongCLI-Bench：コマンドラインインターフェースにおける長期視野型エージェントプログラミングのための初期ベンチマークと研究

PyVision-RL：RLを活用したオープン型エージェント視覚モデルの構築

知覚から行動へ：視覚推論のためのインタラクティブベンチマーク

クエリ中心型かつメモリ認識型リランカーによる長文脈処理

LLM端末機能のスケーリングのためのデータ工学

DSDR：LLM推論における探索のためのデュアルスケール多様性正則化

Mobile-O：モバイルデバイス上の統合的マルチモーダル理解と生成

TOPReward：ロボティクスにおける隠れたゼロショット報酬としてのトークン確率

スケールからスピードへ：画像編集における適応的テスト時スケーリング

in-context co-player inference を介した Multi-agent 間の協力

ACTIONENGINE: State Machine Memory を介した Reactive な GUI Agent から Programmatic な Agent への転換

CiteAudit：あなたは引用しましたが、読んだでしょうか？LLM時代における科学的引用の検証のためのベンチマーク

モード探索が平均探索と融合した高速な長時間動画生成

CUDA Agent：高性能CUDAカーネル生成のための大規模エージェント型強化学習

翻訳による回復：ベンチマークおよびデータセットの自動翻訳を効率的に行うパイプライン

画像生成における空間理解の向上：報酬モデリングを活用して

dLLM：シンプルなディフュージョン言語モデリング

探索的メモリ拡張型LLMエージェント：ハイブリッドオンポリシーおよびオフポリシー最適化による実現

想像力は視覚的推論を支援するが、まだ潜在空間では実現していない

オムニGAIA：ネイティブなオムニモーダルAIエージェントへ向けて

MobilityBench：現実世界のモビリティシナリオにおけるルート計画エージェント評価のためのベンチマーク

盲点から利益へ：大規模なマルチモーダルモデルにおける診断駆動型反復学習

一貫性の三位一体が汎用世界モデルの定義的原則としての役割

GUI-Libra：アクション認識型の監督と部分検証可能なRLを用いたネイティブGUIエージェントの推論・実行訓練

SkyReels-V4：マルチモーダルな動画・音声生成、インペインティングおよび編集モデル

ARLArena：安定したエージェント強化学習を実現する包括的フレームワーク

DreamID-Omni：制御可能かつ人間中心型音声・映像生成のための統合枠組み

MolHIT：階層的離散拡散モデルによる分子グラフ生成の進展

HyTRec：長期間行動順序推薦のためのハイブリッド時系列認識アテンションアーキテクチャ

DREAM：エージェンティックメトリクスを用いたディープリサーチ評価

LongCLI-Bench：コマンドラインインターフェースにおける長期視野型エージェントプログラミングのための初期ベンチマークと研究

PyVision-RL：RLを活用したオープン型エージェント視覚モデルの構築

知覚から行動へ：視覚推論のためのインタラクティブベンチマーク

クエリ中心型かつメモリ認識型リランカーによる長文脈処理

LLM端末機能のスケーリングのためのデータ工学

DSDR：LLM推論における探索のためのデュアルスケール多様性正則化

Mobile-O：モバイルデバイス上の統合的マルチモーダル理解と生成

TOPReward：ロボティクスにおける隠れたゼロショット報酬としてのトークン確率