HyperAI

メイン

GPU

コンソール
Studio
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

人工知能の未来を築く

概要

当社についてサポートデータセットのヘルプ

製品

ニュース論文ノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

メイン

GPU

コンソール
Studio
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

人工知能の未来を築く

概要

当社についてサポートデータセットのヘルプ

製品

ニュース論文ノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)

人間とLLMの研究アイデアのギャップの測定

人間とLLMの研究アイデアのギャップの測定

サイエンスのためのAI

Ziyu Chen, Yilun Zhao, Arman Cohan

ハーネス効果：オーケストレーション設計がエンタープライズエージェントAIのトークン経済を決定する仕組み

ハーネス効果：オーケストレーション設計がエンタープライズエージェントAIのトークン経済を決定する仕組み

エージェント

Muayad Sayed Ali, Aliaksandra Novik, Anji Boddupally, et al.

多様なインタラクションを備えた無限の世界

エージェント

Zelin Gao, Qiuyu Wang, Jiapeng Zhu, et al.

身体性知能のためのMixture-of-Expertsビデオ事前学習のスケーリング

Shuailei Ma, Jiaqi Liao, Xinyang Wang, et al.

LAME M-VLA: ロボット操作のための視覚-言語-行動モデルにおける二重潜在記憶

マルチモーダル

マルチモーダル表現

Hongyu Qu, Jianzhe Gao, Xiaobin Hu, et al.

深層ネイティブ構造推論による高精度・学際的・透明性の高い構造-物性理解

サイエンスのためのAI

Chen Tang, Yizhou Wang, Jianyu Wu, et al.

全モーダル密なビデオキャプションのための並列自己回帰デコーディング

Video Captioning

マルチモーダル

Wenzheng Zeng, Siyi Jiao, Chen Gao, et al.

Light-Omni: 長期記憶を用いたエージェント型映像理解における推論より反射

ビデオ理解

エージェント

Chang Nie, Jiaju Wei, Junlan Feng, et al.

統一マルチモーダル生成としての視覚

マルチモーダル

Xiaoyang Han, Jianhua Li, Kewang Deng, et al.

階層的スパースアテンションの正しい実現：無限コンテキストモデリングに向けて

Xiang Hu, Xinyu Wei, Hao Gu, et al.

AlayaWorld: 長期的かつプレイ可能なビデオワールド生成

RynnWorld-4D: ロボット操作のための4D具現化世界モデル

拡散モデル

Haoyu Zhao, Xingyue Zhao, Siteng Huang, et al.

Nemotron-Labs-3-Puzzle-75B-A9B: ハイブリッドMoE LLMの圧縮

モデル学習

Akhiad Bercovich, Talor Abramovich, Daniel Afrimi, et al.

プレフィックスリプレイを用いたマルチターンオンポリシー蒸留

エージェント

Baohao Liao, Hanze Dong, Christof Monz, et al.

Gemma 4 技術報告書

マルチモーダル

Sherif El Abd, Vaibhav Aggarwal, Robin Algayres, et al.

UI-MOPD: GUIエージェントの継続学習のためのマルチプラットフォーム・オンポリシー蒸留

エージェント

マルチモーダル

Niu Lian, Alan Chen, Zhehao Yu, et al.

Wan-Streamer v0.2: 高解像度化と同一レイテンシの両立

Lianghua Huang, Zhi-Fan Wu, Yupeng Shi, et al.

EVA-Client: 実ロボットにおける展開、評価、データ収集のための統一フレームワーク

マルチモーダル

Heqing Yang, Yang Yi, Liyao Wang, et al.

GigaWorld-1: ロボットポリシー評価のためのワールドモデル構築へのロードマップ

ベンチマーク

Angyuan Ma, Boyuan Wang, Bohan Li, et al.

ResearchStudio-Idea: 機械学習会議の採択結果に基づくエビデンス重視の研究発想スキル群

検索拡張生成

Qihao Zhao, Yangyu Huang, Yalun Dai, et al.

ResearchStudio-Reel: 論文からポスター、動画、ブログへの研究発信のラストワンマイルを自動化する

ドキュメント理解

テキスト生成

Lingao Xiao, Yalun Dai, Yangyu Huang, et al.

FINAL Bench: 大規模言語モデルにおける機能的メタ認知推論の測定

ベンチマーク

Taebong Kim, Minsik Kim, Sunyoung Choi, et al.

SceneFun3D: 3Dシーンにおける詳細な機能性とアフォーダンス理解

3D マシンビジョン

セマンティックセグメンテーション

TheoremGraph: 形式数学と非形式数学の橋渡し

検索拡張生成

Simon Kurgan, Evan Wang, Eric Leonen, et al.

常時稼働エージェント：LLMエージェントにおける永続的記憶、状態、ガバナンスに関するサーベイ

エージェント

Tianyu Ding, Aditya Nannapaneni, Bingfan Liu, et al.

AIエージェントのセキュリティ確保：多層エージェントレッドチーミングのための統一フレームワーク

エージェント

Yong Yang, Xing Zheng, Huiyu Wu, et al.

DataComp-VLM: 視覚言語モデルのための改善されたオープンデータセット

データセット

マルチモーダル

Matteo Farina, Vishaal Udandarao, Thao Nguyen, et al.

OrbitQuant: 画像・動画拡散変換器のためのデータ非依存型量子化

拡散モデル

Donghyun Lee, Jitesh Chavan, Duy Nguyen, et al.

VLA-Corrector: 適応的行動ホライズンのための軽量な検出・修正推論

マルチモーダル

Yi Pan, Miao Pan, Qi Lu, et al.

Embodied.cpp: 異種ロボットにおけるEmbodied AIモデルの可搬型推論ランタイム

エムボディドインテリジェンス

マルチモーダル

Ling Xu, Chuyu Han, Borui Li, et al.

訓練方針最適化の幻影：大規模言語モデル強化学習における真の目的としての単調推論方針

モデル学習

監視付き微調整

Jing Liang, Hongyao Tang, Yi Ma, et al.

GeneBench-Pro：ゲノミクス、定量生物学、トランスレーショナルバイオメディシンにおける多段階統計推論の評価

ベンチマーク

サイエンスのためのAI

Jeremy Li, Andrew Ho

人間とLLMの研究アイデアのギャップの測定

人間とLLMの研究アイデアのギャップの測定

サイエンスのためのAI

Ziyu Chen, Yilun Zhao, Arman Cohan

ハーネス効果：オーケストレーション設計がエンタープライズエージェントAIのトークン経済を決定する仕組み

ハーネス効果：オーケストレーション設計がエンタープライズエージェントAIのトークン経済を決定する仕組み

エージェント

Muayad Sayed Ali, Aliaksandra Novik, Anji Boddupally, et al.

多様なインタラクションを備えた無限の世界

エージェント

Zelin Gao, Qiuyu Wang, Jiapeng Zhu, et al.

身体性知能のためのMixture-of-Expertsビデオ事前学習のスケーリング

Shuailei Ma, Jiaqi Liao, Xinyang Wang, et al.

LAME M-VLA: ロボット操作のための視覚-言語-行動モデルにおける二重潜在記憶

マルチモーダル

マルチモーダル表現

Hongyu Qu, Jianzhe Gao, Xiaobin Hu, et al.

深層ネイティブ構造推論による高精度・学際的・透明性の高い構造-物性理解

サイエンスのためのAI

Chen Tang, Yizhou Wang, Jianyu Wu, et al.

全モーダル密なビデオキャプションのための並列自己回帰デコーディング

Video Captioning

マルチモーダル

Wenzheng Zeng, Siyi Jiao, Chen Gao, et al.

Light-Omni: 長期記憶を用いたエージェント型映像理解における推論より反射

ビデオ理解

エージェント

Chang Nie, Jiaju Wei, Junlan Feng, et al.

統一マルチモーダル生成としての視覚

マルチモーダル

Xiaoyang Han, Jianhua Li, Kewang Deng, et al.

階層的スパースアテンションの正しい実現：無限コンテキストモデリングに向けて

Xiang Hu, Xinyu Wei, Hao Gu, et al.

AlayaWorld: 長期的かつプレイ可能なビデオワールド生成

RynnWorld-4D: ロボット操作のための4D具現化世界モデル

拡散モデル

Haoyu Zhao, Xingyue Zhao, Siteng Huang, et al.

Nemotron-Labs-3-Puzzle-75B-A9B: ハイブリッドMoE LLMの圧縮

モデル学習

Akhiad Bercovich, Talor Abramovich, Daniel Afrimi, et al.

プレフィックスリプレイを用いたマルチターンオンポリシー蒸留

エージェント

Baohao Liao, Hanze Dong, Christof Monz, et al.

Gemma 4 技術報告書

マルチモーダル

Sherif El Abd, Vaibhav Aggarwal, Robin Algayres, et al.

UI-MOPD: GUIエージェントの継続学習のためのマルチプラットフォーム・オンポリシー蒸留

エージェント

マルチモーダル

Niu Lian, Alan Chen, Zhehao Yu, et al.

Wan-Streamer v0.2: 高解像度化と同一レイテンシの両立

Lianghua Huang, Zhi-Fan Wu, Yupeng Shi, et al.

EVA-Client: 実ロボットにおける展開、評価、データ収集のための統一フレームワーク

マルチモーダル

Heqing Yang, Yang Yi, Liyao Wang, et al.

GigaWorld-1: ロボットポリシー評価のためのワールドモデル構築へのロードマップ

ベンチマーク

Angyuan Ma, Boyuan Wang, Bohan Li, et al.

ResearchStudio-Idea: 機械学習会議の採択結果に基づくエビデンス重視の研究発想スキル群

検索拡張生成

Qihao Zhao, Yangyu Huang, Yalun Dai, et al.

ResearchStudio-Reel: 論文からポスター、動画、ブログへの研究発信のラストワンマイルを自動化する

ドキュメント理解

テキスト生成

Lingao Xiao, Yalun Dai, Yangyu Huang, et al.

FINAL Bench: 大規模言語モデルにおける機能的メタ認知推論の測定

ベンチマーク

Taebong Kim, Minsik Kim, Sunyoung Choi, et al.

SceneFun3D: 3Dシーンにおける詳細な機能性とアフォーダンス理解

3D マシンビジョン

セマンティックセグメンテーション

TheoremGraph: 形式数学と非形式数学の橋渡し

検索拡張生成

Simon Kurgan, Evan Wang, Eric Leonen, et al.

常時稼働エージェント：LLMエージェントにおける永続的記憶、状態、ガバナンスに関するサーベイ

エージェント

Tianyu Ding, Aditya Nannapaneni, Bingfan Liu, et al.

AIエージェントのセキュリティ確保：多層エージェントレッドチーミングのための統一フレームワーク

エージェント

Yong Yang, Xing Zheng, Huiyu Wu, et al.

DataComp-VLM: 視覚言語モデルのための改善されたオープンデータセット

データセット

マルチモーダル

Matteo Farina, Vishaal Udandarao, Thao Nguyen, et al.

OrbitQuant: 画像・動画拡散変換器のためのデータ非依存型量子化

拡散モデル

Donghyun Lee, Jitesh Chavan, Duy Nguyen, et al.

VLA-Corrector: 適応的行動ホライズンのための軽量な検出・修正推論

マルチモーダル

Yi Pan, Miao Pan, Qi Lu, et al.

Embodied.cpp: 異種ロボットにおけるEmbodied AIモデルの可搬型推論ランタイム

エムボディドインテリジェンス

マルチモーダル

Ling Xu, Chuyu Han, Borui Li, et al.

訓練方針最適化の幻影：大規模言語モデル強化学習における真の目的としての単調推論方針

モデル学習

監視付き微調整

Jing Liang, Hongyao Tang, Yi Ma, et al.

GeneBench-Pro：ゲノミクス、定量生物学、トランスレーショナルバイオメディシンにおける多段階統計推論の評価

ベンチマーク

サイエンスのためのAI

Jeremy Li, Andrew Ho

多様なインタラクションを備えた無限の世界

身体性知能のためのMixture-of-Expertsビデオ事前学習のスケーリング

LAME M-VLA: ロボット操作のための視覚-言語-行動モデルにおける二重潜在記憶

深層ネイティブ構造推論による高精度・学際的・透明性の高い構造-物性理解

全モーダル密なビデオキャプションのための並列自己回帰デコーディング

Light-Omni: 長期記憶を用いたエージェント型映像理解における推論より反射

統一マルチモーダル生成としての視覚

階層的スパースアテンションの正しい実現：無限コンテキストモデリングに向けて

AlayaWorld: 長期的かつプレイ可能なビデオワールド生成

RynnWorld-4D: ロボット操作のための4D具現化世界モデル

Nemotron-Labs-3-Puzzle-75B-A9B: ハイブリッドMoE LLMの圧縮

プレフィックスリプレイを用いたマルチターンオンポリシー蒸留

Gemma 4 技術報告書

UI-MOPD: GUIエージェントの継続学習のためのマルチプラットフォーム・オンポリシー蒸留

Wan-Streamer v0.2: 高解像度化と同一レイテンシの両立

EVA-Client: 実ロボットにおける展開、評価、データ収集のための統一フレームワーク

GigaWorld-1: ロボットポリシー評価のためのワールドモデル構築へのロードマップ

ResearchStudio-Idea: 機械学習会議の採択結果に基づくエビデンス重視の研究発想スキル群

ResearchStudio-Reel: 論文からポスター、動画、ブログへの研究発信のラストワンマイルを自動化する

FINAL Bench: 大規模言語モデルにおける機能的メタ認知推論の測定

SceneFun3D: 3Dシーンにおける詳細な機能性とアフォーダンス理解

TheoremGraph: 形式数学と非形式数学の橋渡し

常時稼働エージェント：LLMエージェントにおける永続的記憶、状態、ガバナンスに関するサーベイ

AIエージェントのセキュリティ確保：多層エージェントレッドチーミングのための統一フレームワーク

DataComp-VLM: 視覚言語モデルのための改善されたオープンデータセット

OrbitQuant: 画像・動画拡散変換器のためのデータ非依存型量子化

VLA-Corrector: 適応的行動ホライズンのための軽量な検出・修正推論

Embodied.cpp: 異種ロボットにおけるEmbodied AIモデルの可搬型推論ランタイム

訓練方針最適化の幻影：大規模言語モデル強化学習における真の目的としての単調推論方針

GeneBench-Pro：ゲノミクス、定量生物学、トランスレーショナルバイオメディシンにおける多段階統計推論の評価

多様なインタラクションを備えた無限の世界

身体性知能のためのMixture-of-Expertsビデオ事前学習のスケーリング

LAME M-VLA: ロボット操作のための視覚-言語-行動モデルにおける二重潜在記憶

深層ネイティブ構造推論による高精度・学際的・透明性の高い構造-物性理解

全モーダル密なビデオキャプションのための並列自己回帰デコーディング

Light-Omni: 長期記憶を用いたエージェント型映像理解における推論より反射

統一マルチモーダル生成としての視覚

階層的スパースアテンションの正しい実現：無限コンテキストモデリングに向けて

AlayaWorld: 長期的かつプレイ可能なビデオワールド生成

RynnWorld-4D: ロボット操作のための4D具現化世界モデル

Nemotron-Labs-3-Puzzle-75B-A9B: ハイブリッドMoE LLMの圧縮

プレフィックスリプレイを用いたマルチターンオンポリシー蒸留

Gemma 4 技術報告書

UI-MOPD: GUIエージェントの継続学習のためのマルチプラットフォーム・オンポリシー蒸留

Wan-Streamer v0.2: 高解像度化と同一レイテンシの両立

EVA-Client: 実ロボットにおける展開、評価、データ収集のための統一フレームワーク

GigaWorld-1: ロボットポリシー評価のためのワールドモデル構築へのロードマップ

ResearchStudio-Idea: 機械学習会議の採択結果に基づくエビデンス重視の研究発想スキル群

ResearchStudio-Reel: 論文からポスター、動画、ブログへの研究発信のラストワンマイルを自動化する

FINAL Bench: 大規模言語モデルにおける機能的メタ認知推論の測定

SceneFun3D: 3Dシーンにおける詳細な機能性とアフォーダンス理解

TheoremGraph: 形式数学と非形式数学の橋渡し

常時稼働エージェント：LLMエージェントにおける永続的記憶、状態、ガバナンスに関するサーベイ

AIエージェントのセキュリティ確保：多層エージェントレッドチーミングのための統一フレームワーク

DataComp-VLM: 視覚言語モデルのための改善されたオープンデータセット

OrbitQuant: 画像・動画拡散変換器のためのデータ非依存型量子化

VLA-Corrector: 適応的行動ホライズンのための軽量な検出・修正推論

Embodied.cpp: 異種ロボットにおけるEmbodied AIモデルの可搬型推論ランタイム

訓練方針最適化の幻影：大規模言語モデル強化学習における真の目的としての単調推論方針

GeneBench-Pro：ゲノミクス、定量生物学、トランスレーショナルバイオメディシンにおける多段階統計推論の評価