HyperAI

メイン

GPU

コンソール
Studio
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

人工知能の未来を築く

概要

当社についてサポートデータセットのヘルプ

製品

ニュース論文ノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

メイン

GPU

コンソール
Studio
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

人工知能の未来を築く

概要

当社についてサポートデータセットのヘルプ

製品

ニュース論文ノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)

SwanVoice: 独白と対話の両方に対応する表現力のある長尺ゼロショット音声合成

SwanVoice: 独白と対話の両方に対応する表現力のある長尺ゼロショット音声合成

Ruiqi Li, Yu Zhang, Changhao Pan, et al.

ボトルネックフリー統合マルチモーダルモデルのための表現強制

ボトルネックフリー統合マルチモーダルモデルのための表現強制

Yuqing Wang, Zhijie Lin, Ceyuan Yang, et al.

GrepSeek: 直接コーパス相互作用のための検索Agentsの訓練

エージェント

Alireza Salemi, Chang Zeng, Atharva Nijasure, et al.

COLLEAGUE.SKILL：専門知識蒸留による自動AIスキル生成

エージェント

Tianyi Zhou, Dongrui Liu, Leitao Yuan, et al.

エージェント型システムによる弱い推論モデルの強化

エージェント

Varun Sunkaraneni, Pierfrancesco Beneventano, Riccardo Neumarker, et al.

YoCausal: ビデオ生成はワールドモデルからどれくらい離れているのか？因果性の視点から

拡散モデル

You-Zhe Xie, Yu-Hsuan Li, Jie-Ying Lee, et al.

minWM: リアルタイムインタラクティブビデオワールドモデルのためのフルスタックオープンソースフレームワーク

拡散モデル

Min Zhao, Hongzhou Zhu, Bokai Yan, et al.

CollectionLoRA: マルチティーチャー・オンポリシー蒸留により1つのLoRAに50の効果を収集する

拡散モデル

Fangtai Wu, Hailong Guo, Shijie Huang, et al.

OmniRetrieval: 異種知識源を横断する統一検索

検索拡張生成

インテリジェントな質問応答

Jinheon Baek, Soyeong Jeong, Sangwoo Park, et al.

Qwen-VLA: タスク、環境、およびロボット具現化にわたる視覚・言語・行動モデリングの統合

マルチモーダル

Qiuyue Wang, Mingsheng Li, Jian Guan, et al.

AgentDoG 1.5: AI Agentの安全性とセキュリティのための軽量かつスケーラブルなアライメントフレームワーク

エージェント

Dongrui Liu, Yu Li, Zhonghao Yang, et al.

ワールドアクションモデル：具現化AIの新たなフロンティア

エムボディドインテリジェンス

エージェント

Siyin Wang, Junhao Shi, Zhaoyang Fu, et al.

ワールドアクションモデルはゼロショットポリシーである

拡散モデル

Seonghyeon Ye, Yunhao Ge, Kaiyuan Zheng, et al.

ResearchMath-14K: Agentsによる研究レベルの数学のスケーリング

Guijin Son, Seungyeop Yi, Minju Gwak, et al.

双方向進化的探索を用いた自己改善型言語モデル

モデル学習

Guowei Xu, Zhenting Qi, Huangyuan Su, et al.

ピクセルから単語へ -- 大規模なネイティブワンビジョンモデルに向けて

マルチモーダル

ビデオ理解

Haiwen Diao, Jiahao Wang, Penghao Wu, et al.

Agent探索的方策最適化のためのマルチモーダルエージェント推論

マルチモーダル

エージェント

Minki Kang, Shizhe Diao, Ryo Hachiuma, et al.

ProRL: 補正ポリシー勾配推定による能動的推薦のための効果的な強化学習

Preference Modeling

Hongru Hou, Tiehua Mei, Denghui Geng, et al.

ガンマ・ワールド：2人プレイヤーを超えた生成型Multi-Agent世界モデル構築

拡散モデル

Fangfu Liu, Kai He, Tianchang Shen, et al.

AutoFigure: 出版準備が整った科学的図像の生成と精緻化

テキストから画像生成

サイエンスのためのAI

Minjun Zhu, Zhen Lin, Yixuan Weng, et al.

AutoResearch AI: 科学発見のためのAI主導型研究自動化に向けて

サイエンスのためのAI

エムボディドインテリジェンス

Guiyao Tie, Jiawen Shi, Dingjie Song, et al.

エージェント・ハーネス工学：調査

エージェント

Junjie Li, Xi Xiao, Yunbei Zhang, et al.

D^2-Monitor：Diffusion LLMs に対する動的安全性監視～躊躇認識型ルーティングによる～

拡散モデル

Aoxi Liu, Yupeng Chen, James Oldfield, et al.

堅牢なマルチビュー3D再構成のための幾何構造を考慮した表現のノイズ除去

拡散モデル

3D マシンビジョン

Jin Hyeon Kim, Jaeeun Lee, Claire Kim, et al.

EvalVerse: プロフェッショナルシネマティック動画生成のためのパイプライン対応型および専門家較正型ベンチマーク

ベンチマーク

Songlin Yang, Haobin Zhong, Ruilin Zhang, et al.

MobileGym: モバイルGUI Agent研究のための検証可能かつ高並列シミュレーションプラットフォーム

エージェント

Dingbang Wu, Rui Hao, Haiyang Wang, et al.

SpatialBench: あなたの空間基盤モデルは万能選手ですか？

ベンチマーク

Haosong Peng, Hao Li, Jiaqi Chen, et al.

LocateAnything: 並列ボックスデコーディングによる高速かつ高品質な視覚言語グラウンディング

オブジェクト検出

マルチモーダル

Shihao Wang, Shilong Liu, Yuanguo Kuang, et al.

Gemini Embedding 2: ジェミニ由来のネイティブマルチモーダル埋め込みモデル

マルチモーダル表現

Madhuri Shanbhogue, Zhe Li, Shanfeng Zhang, et al.

言語モデルは睡眠を必要とする

ディープラーニング

Sangyun Lee, Sean McLeish, Tom Goldstein, et al.

ECHO: ターミナルエージェントが無償でワールドモデルを学習する

エージェント

Vaishnavi Shrivastava, Piero Kauffmann, Ahmed Awadallah, et al.

ParaVT: エージェント型動画強化学習における並列ツール使用のためのツール事前知識のパラドックスを制御する

マルチモーダル

ビデオ理解

Zuhao Yang, Kaichen Zhang, Sudong Wang, et al.

SwanVoice: 独白と対話の両方に対応する表現力のある長尺ゼロショット音声合成

SwanVoice: 独白と対話の両方に対応する表現力のある長尺ゼロショット音声合成

Ruiqi Li, Yu Zhang, Changhao Pan, et al.

ボトルネックフリー統合マルチモーダルモデルのための表現強制

ボトルネックフリー統合マルチモーダルモデルのための表現強制

Yuqing Wang, Zhijie Lin, Ceyuan Yang, et al.

GrepSeek: 直接コーパス相互作用のための検索Agentsの訓練

エージェント

Alireza Salemi, Chang Zeng, Atharva Nijasure, et al.

COLLEAGUE.SKILL：専門知識蒸留による自動AIスキル生成

エージェント

Tianyi Zhou, Dongrui Liu, Leitao Yuan, et al.

エージェント型システムによる弱い推論モデルの強化

エージェント

Varun Sunkaraneni, Pierfrancesco Beneventano, Riccardo Neumarker, et al.

YoCausal: ビデオ生成はワールドモデルからどれくらい離れているのか？因果性の視点から

拡散モデル

You-Zhe Xie, Yu-Hsuan Li, Jie-Ying Lee, et al.

minWM: リアルタイムインタラクティブビデオワールドモデルのためのフルスタックオープンソースフレームワーク

拡散モデル

Min Zhao, Hongzhou Zhu, Bokai Yan, et al.

CollectionLoRA: マルチティーチャー・オンポリシー蒸留により1つのLoRAに50の効果を収集する

拡散モデル

Fangtai Wu, Hailong Guo, Shijie Huang, et al.

OmniRetrieval: 異種知識源を横断する統一検索

検索拡張生成

インテリジェントな質問応答

Jinheon Baek, Soyeong Jeong, Sangwoo Park, et al.

Qwen-VLA: タスク、環境、およびロボット具現化にわたる視覚・言語・行動モデリングの統合

マルチモーダル

Qiuyue Wang, Mingsheng Li, Jian Guan, et al.

AgentDoG 1.5: AI Agentの安全性とセキュリティのための軽量かつスケーラブルなアライメントフレームワーク

エージェント

Dongrui Liu, Yu Li, Zhonghao Yang, et al.

ワールドアクションモデル：具現化AIの新たなフロンティア

エムボディドインテリジェンス

エージェント

Siyin Wang, Junhao Shi, Zhaoyang Fu, et al.

ワールドアクションモデルはゼロショットポリシーである

拡散モデル

Seonghyeon Ye, Yunhao Ge, Kaiyuan Zheng, et al.

ResearchMath-14K: Agentsによる研究レベルの数学のスケーリング

Guijin Son, Seungyeop Yi, Minju Gwak, et al.

双方向進化的探索を用いた自己改善型言語モデル

モデル学習

Guowei Xu, Zhenting Qi, Huangyuan Su, et al.

ピクセルから単語へ -- 大規模なネイティブワンビジョンモデルに向けて

マルチモーダル

ビデオ理解

Haiwen Diao, Jiahao Wang, Penghao Wu, et al.

Agent探索的方策最適化のためのマルチモーダルエージェント推論

マルチモーダル

エージェント

Minki Kang, Shizhe Diao, Ryo Hachiuma, et al.

ProRL: 補正ポリシー勾配推定による能動的推薦のための効果的な強化学習

Preference Modeling

Hongru Hou, Tiehua Mei, Denghui Geng, et al.

ガンマ・ワールド：2人プレイヤーを超えた生成型Multi-Agent世界モデル構築

拡散モデル

Fangfu Liu, Kai He, Tianchang Shen, et al.

AutoFigure: 出版準備が整った科学的図像の生成と精緻化

テキストから画像生成

サイエンスのためのAI

Minjun Zhu, Zhen Lin, Yixuan Weng, et al.

AutoResearch AI: 科学発見のためのAI主導型研究自動化に向けて

サイエンスのためのAI

エムボディドインテリジェンス

Guiyao Tie, Jiawen Shi, Dingjie Song, et al.

エージェント・ハーネス工学：調査

エージェント

Junjie Li, Xi Xiao, Yunbei Zhang, et al.

D^2-Monitor：Diffusion LLMs に対する動的安全性監視～躊躇認識型ルーティングによる～

拡散モデル

Aoxi Liu, Yupeng Chen, James Oldfield, et al.

堅牢なマルチビュー3D再構成のための幾何構造を考慮した表現のノイズ除去

拡散モデル

3D マシンビジョン

Jin Hyeon Kim, Jaeeun Lee, Claire Kim, et al.

EvalVerse: プロフェッショナルシネマティック動画生成のためのパイプライン対応型および専門家較正型ベンチマーク

ベンチマーク

Songlin Yang, Haobin Zhong, Ruilin Zhang, et al.

MobileGym: モバイルGUI Agent研究のための検証可能かつ高並列シミュレーションプラットフォーム

エージェント

Dingbang Wu, Rui Hao, Haiyang Wang, et al.

SpatialBench: あなたの空間基盤モデルは万能選手ですか？

ベンチマーク

Haosong Peng, Hao Li, Jiaqi Chen, et al.

LocateAnything: 並列ボックスデコーディングによる高速かつ高品質な視覚言語グラウンディング

オブジェクト検出

マルチモーダル

Shihao Wang, Shilong Liu, Yuanguo Kuang, et al.

Gemini Embedding 2: ジェミニ由来のネイティブマルチモーダル埋め込みモデル

マルチモーダル表現

Madhuri Shanbhogue, Zhe Li, Shanfeng Zhang, et al.

言語モデルは睡眠を必要とする

ディープラーニング

Sangyun Lee, Sean McLeish, Tom Goldstein, et al.

ECHO: ターミナルエージェントが無償でワールドモデルを学習する

エージェント

Vaishnavi Shrivastava, Piero Kauffmann, Ahmed Awadallah, et al.

ParaVT: エージェント型動画強化学習における並列ツール使用のためのツール事前知識のパラドックスを制御する

マルチモーダル

ビデオ理解

Zuhao Yang, Kaichen Zhang, Sudong Wang, et al.

GrepSeek: 直接コーパス相互作用のための検索Agentsの訓練

COLLEAGUE.SKILL：専門知識蒸留による自動AIスキル生成

エージェント型システムによる弱い推論モデルの強化

YoCausal: ビデオ生成はワールドモデルからどれくらい離れているのか？因果性の視点から

minWM: リアルタイムインタラクティブビデオワールドモデルのためのフルスタックオープンソースフレームワーク

CollectionLoRA: マルチティーチャー・オンポリシー蒸留により1つのLoRAに50の効果を収集する

OmniRetrieval: 異種知識源を横断する統一検索

Qwen-VLA: タスク、環境、およびロボット具現化にわたる視覚・言語・行動モデリングの統合

AgentDoG 1.5: AI Agentの安全性とセキュリティのための軽量かつスケーラブルなアライメントフレームワーク

ワールドアクションモデル：具現化AIの新たなフロンティア

ワールドアクションモデルはゼロショットポリシーである

ResearchMath-14K: Agentsによる研究レベルの数学のスケーリング

双方向進化的探索を用いた自己改善型言語モデル

ピクセルから単語へ -- 大規模なネイティブワンビジョンモデルに向けて

Agent探索的方策最適化のためのマルチモーダルエージェント推論

ProRL: 補正ポリシー勾配推定による能動的推薦のための効果的な強化学習

ガンマ・ワールド：2人プレイヤーを超えた生成型Multi-Agent世界モデル構築

AutoFigure: 出版準備が整った科学的図像の生成と精緻化

AutoResearch AI: 科学発見のためのAI主導型研究自動化に向けて

エージェント・ハーネス工学：調査

D^2-Monitor：Diffusion LLMs に対する動的安全性監視～躊躇認識型ルーティングによる～

堅牢なマルチビュー3D再構成のための幾何構造を考慮した表現のノイズ除去

EvalVerse: プロフェッショナルシネマティック動画生成のためのパイプライン対応型および専門家較正型ベンチマーク

MobileGym: モバイルGUI Agent研究のための検証可能かつ高並列シミュレーションプラットフォーム

SpatialBench: あなたの空間基盤モデルは万能選手ですか？

LocateAnything: 並列ボックスデコーディングによる高速かつ高品質な視覚言語グラウンディング

Gemini Embedding 2: ジェミニ由来のネイティブマルチモーダル埋め込みモデル

言語モデルは睡眠を必要とする

ECHO: ターミナルエージェントが無償でワールドモデルを学習する

ParaVT: エージェント型動画強化学習における並列ツール使用のためのツール事前知識のパラドックスを制御する

GrepSeek: 直接コーパス相互作用のための検索Agentsの訓練

COLLEAGUE.SKILL：専門知識蒸留による自動AIスキル生成

エージェント型システムによる弱い推論モデルの強化

YoCausal: ビデオ生成はワールドモデルからどれくらい離れているのか？因果性の視点から

minWM: リアルタイムインタラクティブビデオワールドモデルのためのフルスタックオープンソースフレームワーク

CollectionLoRA: マルチティーチャー・オンポリシー蒸留により1つのLoRAに50の効果を収集する

OmniRetrieval: 異種知識源を横断する統一検索

Qwen-VLA: タスク、環境、およびロボット具現化にわたる視覚・言語・行動モデリングの統合

AgentDoG 1.5: AI Agentの安全性とセキュリティのための軽量かつスケーラブルなアライメントフレームワーク

ワールドアクションモデル：具現化AIの新たなフロンティア

ワールドアクションモデルはゼロショットポリシーである

ResearchMath-14K: Agentsによる研究レベルの数学のスケーリング

双方向進化的探索を用いた自己改善型言語モデル

ピクセルから単語へ -- 大規模なネイティブワンビジョンモデルに向けて

Agent探索的方策最適化のためのマルチモーダルエージェント推論

ProRL: 補正ポリシー勾配推定による能動的推薦のための効果的な強化学習

ガンマ・ワールド：2人プレイヤーを超えた生成型Multi-Agent世界モデル構築

AutoFigure: 出版準備が整った科学的図像の生成と精緻化

AutoResearch AI: 科学発見のためのAI主導型研究自動化に向けて

エージェント・ハーネス工学：調査

D^2-Monitor：Diffusion LLMs に対する動的安全性監視～躊躇認識型ルーティングによる～

堅牢なマルチビュー3D再構成のための幾何構造を考慮した表現のノイズ除去

EvalVerse: プロフェッショナルシネマティック動画生成のためのパイプライン対応型および専門家較正型ベンチマーク

MobileGym: モバイルGUI Agent研究のための検証可能かつ高並列シミュレーションプラットフォーム

SpatialBench: あなたの空間基盤モデルは万能選手ですか？

LocateAnything: 並列ボックスデコーディングによる高速かつ高品質な視覚言語グラウンディング

Gemini Embedding 2: ジェミニ由来のネイティブマルチモーダル埋め込みモデル

言語モデルは睡眠を必要とする

ECHO: ターミナルエージェントが無償でワールドモデルを学習する

ParaVT: エージェント型動画強化学習における並列ツール使用のためのツール事前知識のパラドックスを制御する