HyperAI

メイン

GPU

コンソール
Studio
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

人工知能の未来を築く

概要

当社についてサポートデータセットのヘルプ

製品

ニュース論文ノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

メイン

GPU

コンソール
Studio
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

人工知能の未来を築く

概要

当社についてサポートデータセットのヘルプ

製品

ニュース論文ノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)

戦略入札を用いた小規模エージェントのスケーリング

戦略入札を用いた小規模エージェントのスケーリング

エージェント

Lisa Alazraki, William F. Shen, Yoram Bachrach, et al.

バイブAIGC：エージェント統合によるコンテンツ生成の新たなパラダイム

バイブAIGC：エージェント統合によるコンテンツ生成の新たなパラダイム

エージェント

マルチモーダル

Jiaheng Liu, Yuanxing Zhang, Shihao Li, et al.

PaperSearchQA：RLVRを用いた科学論文における検索と推論の学習

検索拡張生成

サイエンスのためのAI

James Burgess, Jan N. Hansen, Duo Peng, et al.

EgoActor：視覚言語モデルを活用した空間認識型自己中心行動へのタスク計画の根拠化による人間型ロボット向けアプローチ

マルチモーダル

視覚質問応答

Yu Bai, MingMing Yu, Chaojie Li, et al.

A-RAG：階層的リトリーブインターフェースを活用したエージェント型リトリーブ増強生成のスケーラビリティ向上

検索拡張生成

エージェント

Mingxuan Du, Benfeng Xu, Chiwei Zhu, et al.

Quant VideoGen：2ビットKVキャッシュ量子化を用いた自己回帰型長時間動画生成

拡散モデル

Haocheng Xi, Shuo Yang, Yilong Zhao, et al.

SoMA：ロボット柔体操作における現実世界からシミュレーションへのニューラルシミュレータ

ロボティクス

Mu Huang, Hui Wang, Kerui Ren, et al.

3Dアウェアな暗黙的モーション制御を用いた視点適応型人体動画生成

Zhixue Fang, Xu He, Songlin Tang, et al.

daVinci-Agency：長期スパンのエージェンシー・データを効率的に活用する

監視付き微調整

Mohan Jiang, Dayuan Fu, Junhao Shi, et al.

世界モデルに関する研究は、単に特定のタスクに世界知識を注入するものにとどまらない

モデリング

エムボディドインテリジェンス

Bohan Zeng, Kaixin Zhu, Daili Hua, et al.

AOrchestra：エージェントオーケストレーションにおけるサブエージェント作成の自動化

エージェント

インテリジェントな質問応答

Jianhao Ruan, Zhihao Xu, Yiran Peng, et al.

チェーン・オブ・シンキングにおけるグローバル・プランの不在：LLMの潜在的計画ホライズンの解明

Liyan Xu, Mo Yu, Fandong Meng, et al.

CodeOCR：視覚言語モデルのコード理解における有効性について

マルチモーダル

Yuling Shi, Chaoxiang Xie, Zhensu Sun, et al.

DeepPlanning：検証可能な制約条件を用いた長期予測エージェント計画のベンチマーク

エージェント

Yinger Zhang, Shutong Jiang, Renhao Li, et al.

CL-bench：コンテキスト学習のためのベンチマーク

インテリジェントな質問応答

Shihan Dou, Ming Zhang, Zhangyue Yin, et al.

自己蒸留を用いた強化学習

検索拡張生成

Jonas Hübotter, Frederike Lübeck, Lejs Behric, et al.

チャットボットを社交的コンパニオンとして：人々が機械における意識、人間らしさ、および社会的健康上の利点をどのように認識しているか

人間-コンピュータインタラクション

Rose E. Guingrich, Michael S. A. Graziano

POPE：専用オンポリシー探索を活用した難問における推論の学習

Yuxiao Qu, Amrith Setlur, Virginia Smith, et al.

UniReason 1.0：世界知識の整合型画像生成および編集を実現する統一推論フレームワーク

テキストから画像生成

マルチモーダル

Dianyi Wang, Chaofan Ma, Feng Han, et al.

ループを閉じる：RPG-Encoderを用いたユニバーサルリポジトリ表現

コード生成

マルチモーダル表現

Jane Luo, Chengyu Yin, Xin Zhang, et al.

ビジョン・ディープリサーチベンチマーク：マルチモーダル大規模言語モデルにおける視覚的およびテキスト検索の再考

視覚質問応答

マルチモーダル

Yu Zeng, Wenxuan Huang, Zhen Fang, et al.

ビジョン・ディープリサーチ：マルチモーダル大規模言語モデルにおけるディープリサーチ能力の促進

検索拡張生成

視覚質問応答

Wenxuan Huang, Yu Zeng, Qiuchen Wang, et al.

Kimi K2.5：視覚的エージェント知能

マルチモーダル

マルチモーダル表現

Kimi Team, Tongtong Bai, Yifan Bai, et al.

Green-VLA：汎用ロボット向けの段階的ビジュアル・言語・アクションモデル

マルチモーダル

I. Apanasevich, M. Artemyev, R. Babakyan, et al.

PaperBanana：AI研究者のための学術図解の自動化

テキストから画像生成

サイエンスのためのAI

Dawei Zhu, Rui Meng, Yale Song, et al.

Geminiを用いた準自律的数学発見：Erdős問題に関する事例研究

サイエンスのためのAI

Tony Feng, Trieu Trinh, Garrett Bingham, et al.

潜在チェーン・オブ・シンキングを計画として：推論と言語化を分離する

Jiecong Wang, Hao Peng, Chunyang Liu

リアルタイム対応型の意味論を超える報酬モデル

Zixuan Huang, Xin Xia, Yuxi Ren, et al.

DenseGRPO：フローマッチングモデルの整合性向上のためのスパースからディンスな報酬へ

拡散モデル

監視付き微調整

Haoyou Deng, Keyu Yan, Chaojie Mao, et al.

DreamActor-M2：時空間的コントキスト学習を用いたユニバーサルなキャラクター画像アニメーション

画像から動画生成

Mingshuang Luo, Shuang Liang, Zhengkun Rong, et al.

TTCS：自己進化型におけるテスト時カリキュラム合成

Chengyi Yang, Zhishang Xiang, Yunbo Tang, et al.

ASTRA：エージェント軌道および強化学習アリーナの自動合成

Xiaoyu Tian, Haotian Wang, Shuaiting Chen, et al.

戦略入札を用いた小規模エージェントのスケーリング

戦略入札を用いた小規模エージェントのスケーリング

エージェント

Lisa Alazraki, William F. Shen, Yoram Bachrach, et al.

バイブAIGC：エージェント統合によるコンテンツ生成の新たなパラダイム

バイブAIGC：エージェント統合によるコンテンツ生成の新たなパラダイム

エージェント

マルチモーダル

Jiaheng Liu, Yuanxing Zhang, Shihao Li, et al.

PaperSearchQA：RLVRを用いた科学論文における検索と推論の学習

検索拡張生成

サイエンスのためのAI

James Burgess, Jan N. Hansen, Duo Peng, et al.

EgoActor：視覚言語モデルを活用した空間認識型自己中心行動へのタスク計画の根拠化による人間型ロボット向けアプローチ

マルチモーダル

視覚質問応答

Yu Bai, MingMing Yu, Chaojie Li, et al.

A-RAG：階層的リトリーブインターフェースを活用したエージェント型リトリーブ増強生成のスケーラビリティ向上

検索拡張生成

エージェント

Mingxuan Du, Benfeng Xu, Chiwei Zhu, et al.

Quant VideoGen：2ビットKVキャッシュ量子化を用いた自己回帰型長時間動画生成

拡散モデル

Haocheng Xi, Shuo Yang, Yilong Zhao, et al.

SoMA：ロボット柔体操作における現実世界からシミュレーションへのニューラルシミュレータ

ロボティクス

Mu Huang, Hui Wang, Kerui Ren, et al.

3Dアウェアな暗黙的モーション制御を用いた視点適応型人体動画生成

Zhixue Fang, Xu He, Songlin Tang, et al.

daVinci-Agency：長期スパンのエージェンシー・データを効率的に活用する

監視付き微調整

Mohan Jiang, Dayuan Fu, Junhao Shi, et al.

世界モデルに関する研究は、単に特定のタスクに世界知識を注入するものにとどまらない

モデリング

エムボディドインテリジェンス

Bohan Zeng, Kaixin Zhu, Daili Hua, et al.

AOrchestra：エージェントオーケストレーションにおけるサブエージェント作成の自動化

エージェント

インテリジェントな質問応答

Jianhao Ruan, Zhihao Xu, Yiran Peng, et al.

チェーン・オブ・シンキングにおけるグローバル・プランの不在：LLMの潜在的計画ホライズンの解明

Liyan Xu, Mo Yu, Fandong Meng, et al.

CodeOCR：視覚言語モデルのコード理解における有効性について

マルチモーダル

Yuling Shi, Chaoxiang Xie, Zhensu Sun, et al.

DeepPlanning：検証可能な制約条件を用いた長期予測エージェント計画のベンチマーク

エージェント

Yinger Zhang, Shutong Jiang, Renhao Li, et al.

CL-bench：コンテキスト学習のためのベンチマーク

インテリジェントな質問応答

Shihan Dou, Ming Zhang, Zhangyue Yin, et al.

自己蒸留を用いた強化学習

検索拡張生成

Jonas Hübotter, Frederike Lübeck, Lejs Behric, et al.

チャットボットを社交的コンパニオンとして：人々が機械における意識、人間らしさ、および社会的健康上の利点をどのように認識しているか

人間-コンピュータインタラクション

Rose E. Guingrich, Michael S. A. Graziano

POPE：専用オンポリシー探索を活用した難問における推論の学習

Yuxiao Qu, Amrith Setlur, Virginia Smith, et al.

UniReason 1.0：世界知識の整合型画像生成および編集を実現する統一推論フレームワーク

テキストから画像生成

マルチモーダル

Dianyi Wang, Chaofan Ma, Feng Han, et al.

ループを閉じる：RPG-Encoderを用いたユニバーサルリポジトリ表現

コード生成

マルチモーダル表現

Jane Luo, Chengyu Yin, Xin Zhang, et al.

ビジョン・ディープリサーチベンチマーク：マルチモーダル大規模言語モデルにおける視覚的およびテキスト検索の再考

視覚質問応答

マルチモーダル

Yu Zeng, Wenxuan Huang, Zhen Fang, et al.

ビジョン・ディープリサーチ：マルチモーダル大規模言語モデルにおけるディープリサーチ能力の促進

検索拡張生成

視覚質問応答

Wenxuan Huang, Yu Zeng, Qiuchen Wang, et al.

Kimi K2.5：視覚的エージェント知能

マルチモーダル

マルチモーダル表現

Kimi Team, Tongtong Bai, Yifan Bai, et al.

Green-VLA：汎用ロボット向けの段階的ビジュアル・言語・アクションモデル

マルチモーダル

I. Apanasevich, M. Artemyev, R. Babakyan, et al.

PaperBanana：AI研究者のための学術図解の自動化

テキストから画像生成

サイエンスのためのAI

Dawei Zhu, Rui Meng, Yale Song, et al.

Geminiを用いた準自律的数学発見：Erdős問題に関する事例研究

サイエンスのためのAI

Tony Feng, Trieu Trinh, Garrett Bingham, et al.

潜在チェーン・オブ・シンキングを計画として：推論と言語化を分離する

Jiecong Wang, Hao Peng, Chunyang Liu

リアルタイム対応型の意味論を超える報酬モデル

Zixuan Huang, Xin Xia, Yuxi Ren, et al.

DenseGRPO：フローマッチングモデルの整合性向上のためのスパースからディンスな報酬へ

拡散モデル

監視付き微調整

Haoyou Deng, Keyu Yan, Chaojie Mao, et al.

DreamActor-M2：時空間的コントキスト学習を用いたユニバーサルなキャラクター画像アニメーション

画像から動画生成

Mingshuang Luo, Shuang Liang, Zhengkun Rong, et al.

TTCS：自己進化型におけるテスト時カリキュラム合成

Chengyi Yang, Zhishang Xiang, Yunbo Tang, et al.

ASTRA：エージェント軌道および強化学習アリーナの自動合成

Xiaoyu Tian, Haotian Wang, Shuaiting Chen, et al.

PaperSearchQA：RLVRを用いた科学論文における検索と推論の学習

EgoActor：視覚言語モデルを活用した空間認識型自己中心行動へのタスク計画の根拠化による人間型ロボット向けアプローチ

A-RAG：階層的リトリーブインターフェースを活用したエージェント型リトリーブ増強生成のスケーラビリティ向上

Quant VideoGen：2ビットKVキャッシュ量子化を用いた自己回帰型長時間動画生成

SoMA：ロボット柔体操作における現実世界からシミュレーションへのニューラルシミュレータ

3Dアウェアな暗黙的モーション制御を用いた視点適応型人体動画生成

daVinci-Agency：長期スパンのエージェンシー・データを効率的に活用する

世界モデルに関する研究は、単に特定のタスクに世界知識を注入するものにとどまらない

AOrchestra：エージェントオーケストレーションにおけるサブエージェント作成の自動化

チェーン・オブ・シンキングにおけるグローバル・プランの不在：LLMの潜在的計画ホライズンの解明

CodeOCR：視覚言語モデルのコード理解における有効性について

DeepPlanning：検証可能な制約条件を用いた長期予測エージェント計画のベンチマーク

CL-bench：コンテキスト学習のためのベンチマーク

自己蒸留を用いた強化学習

チャットボットを社交的コンパニオンとして：人々が機械における意識、人間らしさ、および社会的健康上の利点をどのように認識しているか

POPE：専用オンポリシー探索を活用した難問における推論の学習

UniReason 1.0：世界知識の整合型画像生成および編集を実現する統一推論フレームワーク

ループを閉じる：RPG-Encoderを用いたユニバーサルリポジトリ表現

ビジョン・ディープリサーチベンチマーク：マルチモーダル大規模言語モデルにおける視覚的およびテキスト検索の再考

ビジョン・ディープリサーチ：マルチモーダル大規模言語モデルにおけるディープリサーチ能力の促進

Kimi K2.5：視覚的エージェント知能

Green-VLA：汎用ロボット向けの段階的ビジュアル・言語・アクションモデル

PaperBanana：AI研究者のための学術図解の自動化

Geminiを用いた準自律的数学発見：Erdős問題に関する事例研究

潜在チェーン・オブ・シンキングを計画として：推論と言語化を分離する

リアルタイム対応型の意味論を超える報酬モデル

DenseGRPO：フローマッチングモデルの整合性向上のためのスパースからディンスな報酬へ

DreamActor-M2：時空間的コントキスト学習を用いたユニバーサルなキャラクター画像アニメーション

TTCS：自己進化型におけるテスト時カリキュラム合成

ASTRA：エージェント軌道および強化学習アリーナの自動合成

PaperSearchQA：RLVRを用いた科学論文における検索と推論の学習

EgoActor：視覚言語モデルを活用した空間認識型自己中心行動へのタスク計画の根拠化による人間型ロボット向けアプローチ

A-RAG：階層的リトリーブインターフェースを活用したエージェント型リトリーブ増強生成のスケーラビリティ向上

Quant VideoGen：2ビットKVキャッシュ量子化を用いた自己回帰型長時間動画生成

SoMA：ロボット柔体操作における現実世界からシミュレーションへのニューラルシミュレータ

3Dアウェアな暗黙的モーション制御を用いた視点適応型人体動画生成

daVinci-Agency：長期スパンのエージェンシー・データを効率的に活用する

世界モデルに関する研究は、単に特定のタスクに世界知識を注入するものにとどまらない

AOrchestra：エージェントオーケストレーションにおけるサブエージェント作成の自動化

チェーン・オブ・シンキングにおけるグローバル・プランの不在：LLMの潜在的計画ホライズンの解明

CodeOCR：視覚言語モデルのコード理解における有効性について

DeepPlanning：検証可能な制約条件を用いた長期予測エージェント計画のベンチマーク

CL-bench：コンテキスト学習のためのベンチマーク

自己蒸留を用いた強化学習

チャットボットを社交的コンパニオンとして：人々が機械における意識、人間らしさ、および社会的健康上の利点をどのように認識しているか

POPE：専用オンポリシー探索を活用した難問における推論の学習

UniReason 1.0：世界知識の整合型画像生成および編集を実現する統一推論フレームワーク

ループを閉じる：RPG-Encoderを用いたユニバーサルリポジトリ表現

ビジョン・ディープリサーチベンチマーク：マルチモーダル大規模言語モデルにおける視覚的およびテキスト検索の再考

ビジョン・ディープリサーチ：マルチモーダル大規模言語モデルにおけるディープリサーチ能力の促進

Kimi K2.5：視覚的エージェント知能

Green-VLA：汎用ロボット向けの段階的ビジュアル・言語・アクションモデル

PaperBanana：AI研究者のための学術図解の自動化

Geminiを用いた準自律的数学発見：Erdős問題に関する事例研究

潜在チェーン・オブ・シンキングを計画として：推論と言語化を分離する

リアルタイム対応型の意味論を超える報酬モデル

DenseGRPO：フローマッチングモデルの整合性向上のためのスパースからディンスな報酬へ

DreamActor-M2：時空間的コントキスト学習を用いたユニバーサルなキャラクター画像アニメーション

TTCS：自己進化型におけるテスト時カリキュラム合成

ASTRA：エージェント軌道および強化学習アリーナの自動合成