HyperAI

メイン

GPU

コンソール
Studio
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

人工知能の未来を築く

概要

当社についてサポートデータセットのヘルプ

製品

ニュース論文ノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

メイン

GPU

コンソール
Studio
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

人工知能の未来を築く

概要

当社についてサポートデータセットのヘルプ

製品

ニュース論文ノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)

幻覚の制御：反事実動画生成によるMLLMの動画理解能力の向上

幻覚の制御：反事実動画生成によるMLLMの動画理解能力の向上

拡散モデル

ビデオ理解

Zhe Huang, Hao Wen, Aiming Hao, et al.

SenseNova-MARS：強化学習を活用したマルチモーダルエージェント型推論と検索の実現

SenseNova-MARS：強化学習を活用したマルチモーダルエージェント型推論と検索の実現

エージェント

マルチモーダル表現

Yong Xien Chng, Tao Hu, Wenwen Tong, et al.

アバター・フォースイング：自然な会話を実現するリアルタイム対話型ヘッドアバター生成

人間-コンピュータインタラクション

エムボディドインテリジェンス

Taekyung Ki, Sangwon Jang, Jaehyeong Jo, et al.

NeoVerse：リアルワールドの単眼動画を活用した4Dワールドモデルの強化

Yuxue Yang, Lue Fan, Ziqi Shi, et al.

Youtu-Agent：自動生成とハイブリッドポリシー最適化によるエージェント生産性のスケーリング

エージェント

Yuchen Shi, Yuzheng Cai, Siqi Cai, et al.

IQuest-Coder-V1 技術報告

コード生成

エージェント

Jian Yang, Wei Zhang, Shawn Guo, et al.

再帰型言語モデル

エージェント

Alex L. Zhang, Tim Kraska, Omar Khattab

FlowBlending：段階認識型マルチモデルサンプリングによる高速かつ高忠実度の動画生成

拡散モデル

Jibin Song, Mingi Kwon, Jaeseok Jeong, et al.

Dream2Flow：3Dオブジェクトフローを用いたビデオ生成とオープンワールド操作の橋渡し

ロボティクス

Karthik Dharmarajan, Wenlong Huang, Jiajun Wu, et al.

拡散LLMにおける離散性の役割

拡散モデル

Ziqi Jin, Bin Wang, Xiang Lin, et al.

DiffThinker：拡散モデルを用いた生成型マルチモーダル推論へ向けて

拡散モデル

Zefeng He, Xiaoye Qu, Yafu Li, et al.

動的大型概念モデル：適応型意味空間における潜在的推論

自然言語処理

Xingwei Qu, Shaowen Wang, Zihao Huang, et al.

長文脈複雑関係モデリングにおけるハイパーグラフベースメモリを用いたマルチステップRAGの改善

検索拡張生成

Chulun Zhou, Chunkang Zhang, Guoxin Yu, et al.

AIが脳に出会う：認知神経科学から自律エージェントへ至る記憶システム

エージェント

Jiafeng Liang, Hao Li, Chang Li, et al.

スケーラビリティの向上による開かれたエンドリーディング推論による未来予測

検索拡張生成

Nikhil Chandak, Shashwat Goel, Ameya Prabhu, et al.

GaMO：スパースビュー3D再構成のための幾何学的注意型マルチビュー拡散外挿

拡散モデル

3D マシンビジョン

Yi-Chuan Huang, Hao-Jen Chien, Chin-Yang Lin, et al.

mHC：多様体制約付きハイパーパス

モデル学習

Zhenda Xie, Yixuan Wei, Huanqi Cao, et al.

Let It Flow: ロックンロールにおけるエージェンティック・クラフティング、オープンエージェンティック・ラーニングエコシステム内でのROMEモデル構築

エージェント

オープンソース

Weixun Wang, XiaoXiao Xu, Wanhe An, et al.

Youtu-LLM：軽量型大規模言語モデルにおけるネイティブなエージェント機能の潜在能力を解き放つ

エージェント

Junru Lu, Jiarui Qin, Lingfeng Qiao, et al.

GateBreaker：Mixture-of-Expert LLMsにおけるGate誘導型攻撃

テキスト生成

Lichao Wu, Sasha Behrouzi, Mohamadreza Rostami, et al.

GraphLocator：グラフ誘導型因果推論を用いた問題局所化

アルゴリズム

Wei Liu, Chao Peng, Pengfei Gao, et al.

RLVRにおけるパラメータ効率的な手法の評価

監視付き微調整

Qingyu Yin, Yulun Wu, Zhennan Shen, et al.

エンドツーエンドテスト時学習による長文脈処理

自然言語処理

Arnuv Tandon, Karan Dalal, Xinhao Li, et al.

DreamOmni3：スクリブルベースの編集と生成

Bin Xia, Bohao Peng, Jiyang Liu, et al.

UltraShape 1.0：スケーラブルな幾何学的精緻化を用いた高忠実度3D形状生成

拡散モデル

Tanghui Jia, Dongyu Yan, Dehao Hao, et al.

mimic-video：汎用的なロボット制御のためのビデオ・アクションモデル—VLAsを超えた枠組み

ロボティクス

エムボディドインテリジェンス

Jonas Pai, Liam Achenbach, Victoriano Montesinos, et al.

HY-Motion 1.0：テキストからモーション生成へのフローマッチングモデルのスケーリング

拡散モデル

Yuxin Wen, Qing Shuai, Di Kang, et al.

SurgWorld：ワールドモデリングを用いた動画からの外科ロボット方策学習

ロボティクス

エムボディドインテリジェンス

Yufan He, Pengfei Guo, Mengya Xu, et al.

SpotEdit：拡散変換器における選択的領域編集

拡散モデル

Zhibin Qin, Zhenxiong Tan, Zeqing Wang, et al.

拡散モデルは透過性を理解する：動画拡散モデルを用いた透過物体の深度および法線推定

拡散モデル

Shaocong Xu, Songlin Wei, Qizhe Wei, et al.

SmartSnap：自己検証型エージェントにおける能動的証拠探索

エージェント

Shaofei Cai, Yulei Qin, Haojia Lin, et al.

Yume-1.5：テキスト制御型インタラクティブな世界生成モデル

テキストから動画

拡散モデル

Xiaofeng Mao, Zhen Li, Chuanhao Li, et al.

幻覚の制御：反事実動画生成によるMLLMの動画理解能力の向上

幻覚の制御：反事実動画生成によるMLLMの動画理解能力の向上

拡散モデル

ビデオ理解

Zhe Huang, Hao Wen, Aiming Hao, et al.

SenseNova-MARS：強化学習を活用したマルチモーダルエージェント型推論と検索の実現

SenseNova-MARS：強化学習を活用したマルチモーダルエージェント型推論と検索の実現

エージェント

マルチモーダル表現

Yong Xien Chng, Tao Hu, Wenwen Tong, et al.

アバター・フォースイング：自然な会話を実現するリアルタイム対話型ヘッドアバター生成

人間-コンピュータインタラクション

エムボディドインテリジェンス

Taekyung Ki, Sangwon Jang, Jaehyeong Jo, et al.

NeoVerse：リアルワールドの単眼動画を活用した4Dワールドモデルの強化

Yuxue Yang, Lue Fan, Ziqi Shi, et al.

Youtu-Agent：自動生成とハイブリッドポリシー最適化によるエージェント生産性のスケーリング

エージェント

Yuchen Shi, Yuzheng Cai, Siqi Cai, et al.

IQuest-Coder-V1 技術報告

コード生成

エージェント

Jian Yang, Wei Zhang, Shawn Guo, et al.

再帰型言語モデル

エージェント

Alex L. Zhang, Tim Kraska, Omar Khattab

FlowBlending：段階認識型マルチモデルサンプリングによる高速かつ高忠実度の動画生成

拡散モデル

Jibin Song, Mingi Kwon, Jaeseok Jeong, et al.

Dream2Flow：3Dオブジェクトフローを用いたビデオ生成とオープンワールド操作の橋渡し

ロボティクス

Karthik Dharmarajan, Wenlong Huang, Jiajun Wu, et al.

拡散LLMにおける離散性の役割

拡散モデル

Ziqi Jin, Bin Wang, Xiang Lin, et al.

DiffThinker：拡散モデルを用いた生成型マルチモーダル推論へ向けて

拡散モデル

Zefeng He, Xiaoye Qu, Yafu Li, et al.

動的大型概念モデル：適応型意味空間における潜在的推論

自然言語処理

Xingwei Qu, Shaowen Wang, Zihao Huang, et al.

長文脈複雑関係モデリングにおけるハイパーグラフベースメモリを用いたマルチステップRAGの改善

検索拡張生成

Chulun Zhou, Chunkang Zhang, Guoxin Yu, et al.

AIが脳に出会う：認知神経科学から自律エージェントへ至る記憶システム

エージェント

Jiafeng Liang, Hao Li, Chang Li, et al.

スケーラビリティの向上による開かれたエンドリーディング推論による未来予測

検索拡張生成

Nikhil Chandak, Shashwat Goel, Ameya Prabhu, et al.

GaMO：スパースビュー3D再構成のための幾何学的注意型マルチビュー拡散外挿

拡散モデル

3D マシンビジョン

Yi-Chuan Huang, Hao-Jen Chien, Chin-Yang Lin, et al.

mHC：多様体制約付きハイパーパス

モデル学習

Zhenda Xie, Yixuan Wei, Huanqi Cao, et al.

Let It Flow: ロックンロールにおけるエージェンティック・クラフティング、オープンエージェンティック・ラーニングエコシステム内でのROMEモデル構築

エージェント

オープンソース

Weixun Wang, XiaoXiao Xu, Wanhe An, et al.

Youtu-LLM：軽量型大規模言語モデルにおけるネイティブなエージェント機能の潜在能力を解き放つ

エージェント

Junru Lu, Jiarui Qin, Lingfeng Qiao, et al.

GateBreaker：Mixture-of-Expert LLMsにおけるGate誘導型攻撃

テキスト生成

Lichao Wu, Sasha Behrouzi, Mohamadreza Rostami, et al.

GraphLocator：グラフ誘導型因果推論を用いた問題局所化

アルゴリズム

Wei Liu, Chao Peng, Pengfei Gao, et al.

RLVRにおけるパラメータ効率的な手法の評価

監視付き微調整

Qingyu Yin, Yulun Wu, Zhennan Shen, et al.

エンドツーエンドテスト時学習による長文脈処理

自然言語処理

Arnuv Tandon, Karan Dalal, Xinhao Li, et al.

DreamOmni3：スクリブルベースの編集と生成

Bin Xia, Bohao Peng, Jiyang Liu, et al.

UltraShape 1.0：スケーラブルな幾何学的精緻化を用いた高忠実度3D形状生成

拡散モデル

Tanghui Jia, Dongyu Yan, Dehao Hao, et al.

mimic-video：汎用的なロボット制御のためのビデオ・アクションモデル—VLAsを超えた枠組み

ロボティクス

エムボディドインテリジェンス

Jonas Pai, Liam Achenbach, Victoriano Montesinos, et al.

HY-Motion 1.0：テキストからモーション生成へのフローマッチングモデルのスケーリング

拡散モデル

Yuxin Wen, Qing Shuai, Di Kang, et al.

SurgWorld：ワールドモデリングを用いた動画からの外科ロボット方策学習

ロボティクス

エムボディドインテリジェンス

Yufan He, Pengfei Guo, Mengya Xu, et al.

SpotEdit：拡散変換器における選択的領域編集

拡散モデル

Zhibin Qin, Zhenxiong Tan, Zeqing Wang, et al.

拡散モデルは透過性を理解する：動画拡散モデルを用いた透過物体の深度および法線推定

拡散モデル

Shaocong Xu, Songlin Wei, Qizhe Wei, et al.

SmartSnap：自己検証型エージェントにおける能動的証拠探索

エージェント

Shaofei Cai, Yulei Qin, Haojia Lin, et al.

Yume-1.5：テキスト制御型インタラクティブな世界生成モデル

テキストから動画

拡散モデル

Xiaofeng Mao, Zhen Li, Chuanhao Li, et al.

アバター・フォースイング：自然な会話を実現するリアルタイム対話型ヘッドアバター生成

NeoVerse：リアルワールドの単眼動画を活用した4Dワールドモデルの強化

Youtu-Agent：自動生成とハイブリッドポリシー最適化によるエージェント生産性のスケーリング

IQuest-Coder-V1 技術報告

再帰型言語モデル

FlowBlending：段階認識型マルチモデルサンプリングによる高速かつ高忠実度の動画生成

Dream2Flow：3Dオブジェクトフローを用いたビデオ生成とオープンワールド操作の橋渡し

拡散LLMにおける離散性の役割

DiffThinker：拡散モデルを用いた生成型マルチモーダル推論へ向けて

動的大型概念モデル：適応型意味空間における潜在的推論

長文脈複雑関係モデリングにおけるハイパーグラフベースメモリを用いたマルチステップRAGの改善

AIが脳に出会う：認知神経科学から自律エージェントへ至る記憶システム

スケーラビリティの向上による開かれたエンドリーディング推論による未来予測

GaMO：スパースビュー3D再構成のための幾何学的注意型マルチビュー拡散外挿

mHC：多様体制約付きハイパーパス

Let It Flow: ロックンロールにおけるエージェンティック・クラフティング、オープンエージェンティック・ラーニングエコシステム内でのROMEモデル構築

Youtu-LLM：軽量型大規模言語モデルにおけるネイティブなエージェント機能の潜在能力を解き放つ

GateBreaker：Mixture-of-Expert LLMsにおけるGate誘導型攻撃

GraphLocator：グラフ誘導型因果推論を用いた問題局所化

RLVRにおけるパラメータ効率的な手法の評価

エンドツーエンドテスト時学習による長文脈処理

DreamOmni3：スクリブルベースの編集と生成

UltraShape 1.0：スケーラブルな幾何学的精緻化を用いた高忠実度3D形状生成

mimic-video：汎用的なロボット制御のためのビデオ・アクションモデル—VLAsを超えた枠組み

HY-Motion 1.0：テキストからモーション生成へのフローマッチングモデルのスケーリング

SurgWorld：ワールドモデリングを用いた動画からの外科ロボット方策学習

SpotEdit：拡散変換器における選択的領域編集

拡散モデルは透過性を理解する：動画拡散モデルを用いた透過物体の深度および法線推定

SmartSnap：自己検証型エージェントにおける能動的証拠探索

Yume-1.5：テキスト制御型インタラクティブな世界生成モデル

アバター・フォースイング：自然な会話を実現するリアルタイム対話型ヘッドアバター生成

NeoVerse：リアルワールドの単眼動画を活用した4Dワールドモデルの強化

Youtu-Agent：自動生成とハイブリッドポリシー最適化によるエージェント生産性のスケーリング

IQuest-Coder-V1 技術報告

再帰型言語モデル

FlowBlending：段階認識型マルチモデルサンプリングによる高速かつ高忠実度の動画生成

Dream2Flow：3Dオブジェクトフローを用いたビデオ生成とオープンワールド操作の橋渡し

拡散LLMにおける離散性の役割

DiffThinker：拡散モデルを用いた生成型マルチモーダル推論へ向けて

動的大型概念モデル：適応型意味空間における潜在的推論

長文脈複雑関係モデリングにおけるハイパーグラフベースメモリを用いたマルチステップRAGの改善

AIが脳に出会う：認知神経科学から自律エージェントへ至る記憶システム

スケーラビリティの向上による開かれたエンドリーディング推論による未来予測

GaMO：スパースビュー3D再構成のための幾何学的注意型マルチビュー拡散外挿

mHC：多様体制約付きハイパーパス

Let It Flow: ロックンロールにおけるエージェンティック・クラフティング、オープンエージェンティック・ラーニングエコシステム内でのROMEモデル構築

Youtu-LLM：軽量型大規模言語モデルにおけるネイティブなエージェント機能の潜在能力を解き放つ

GateBreaker：Mixture-of-Expert LLMsにおけるGate誘導型攻撃

GraphLocator：グラフ誘導型因果推論を用いた問題局所化

RLVRにおけるパラメータ効率的な手法の評価

エンドツーエンドテスト時学習による長文脈処理

DreamOmni3：スクリブルベースの編集と生成

UltraShape 1.0：スケーラブルな幾何学的精緻化を用いた高忠実度3D形状生成

mimic-video：汎用的なロボット制御のためのビデオ・アクションモデル—VLAsを超えた枠組み

HY-Motion 1.0：テキストからモーション生成へのフローマッチングモデルのスケーリング

SurgWorld：ワールドモデリングを用いた動画からの外科ロボット方策学習

SpotEdit：拡散変換器における選択的領域編集

拡散モデルは透過性を理解する：動画拡散モデルを用いた透過物体の深度および法線推定

SmartSnap：自己検証型エージェントにおける能動的証拠探索

Yume-1.5：テキスト制御型インタラクティブな世界生成モデル