HyperAI

メイン

GPU

コンソール
Studio
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

人工知能の未来を築く

概要

当社についてサポートデータセットのヘルプ

製品

ニュース論文ノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

メイン

GPU

コンソール
Studio
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

人工知能の未来を築く

概要

当社についてサポートデータセットのヘルプ

製品

ニュース論文ノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)

ラックヘッドアンカリング：音声駆動型人間アニメーションにおけるキャラクター個体性の保持

ラックヘッドアンカリング：音声駆動型人間アニメーションにおけるキャラクター個体性の保持

マルチモーダル

Junyoung Seo, Rodrigo Mira, Alexandros Haliassos, et al.

VITA-E：同時視覚、聴覚、発話および行動を伴う自然なエンボディドインタラクション

VITA-E：同時視覚、聴覚、発話および行動を伴う自然なエンボディドインタラクション

エージェント

エムボディドインテリジェンス

Xiaoyu Liu, Chaoyou Fu, Chi Yan, et al.

FARMER：画素上におけるフロー自己回帰型トランスフォーマー

Guangting Zheng, Qinyu Zhao, Tao Yang, et al.

データエージェントに関する総説：新たなパラダイムか、過大評価されたブームか？

エージェント

Yizhang Zhu, Liangwei Wang, Chenyu Yang, et al.

ReCode：包括する粒度制御のための計画と実行の統一

コード生成

Zhaoyang Yu, Jiayi Zhang, Huixue Su, et al.

コンチェルト：2次元-3次元連合自己教師学習が空間表現を生み出す

マルチモーダル表現

コンピュータビジョン

Yujia Zhang, Xiaoyang Wu, Yixing Lao, et al.

マゼラン：潜在空間探索および新規性生成のための誘導付きMCTS

テキスト生成

DEEDEE：分布外動態の高速かつスケーラブルな検出

モデリング

Tala Aljaafari, Varun Kanade, Philip Torr, et al.

トークン順列を用いたスパーサーなブロックスパース注意力

Xinghao Wang, Pengyu Wang, Dong Zhang, et al.

AGIの定義

ベンチマーク

Dan Hendrycks, Dawn Song, Christian Szegedy, et al.

ノイズ除去から精緻化へ：視覚言語拡散モデルのための補正フレームワーク

拡散モデル

マルチモーダル

Yatai Ji, Teng Wang, Yuying Ge, et al.

ステップバイステップ、チャンクごとに最適化：テキストから画像生成におけるチャンクレベルGRPO

テキストから画像生成

Yifu Luo, Penghui Du, Bo Li, et al.

ビデオ・アス・プロンプト：ビデオ生成における統一された意味制御

画像から動画生成

Yuxuan Bian, Xin Chen, Zenan Li, et al.

DeepAgent：スケーラブルなツールセットを備えた汎用推論エージェント

エージェント

Xiaoxi Li, Wenxiang Jiao, Jiarui Jin, et al.

不確実性を考慮した多目的強化学習誘導型拡散モデルによる3Dデ・ノボ分子設計

拡散モデル

Lianghong Chen, Dongkyu Eugene Kim, Mike Domaratzki, et al.

Reac-Discovery：連続Flow型触媒反応装置の発見および最適化をAIが駆動するプラットフォーム

サイエンスのためのAI

モデリング

Cristopher Tinajero, Marcileia Zanatta, Julián E. Sánchez-Velandia, et al.

BoltzGen：ユニバーサルな結合体設計への道

サイエンスのためのAI

ディープラーニング

Hannes Stark, Felix Faltings, MinGyu Choi, et al.

HSCodeComp：階層的ルール適用におけるディープサーチエージェント向けの現実的で専門的水準のベンチマーク

ベンチマーク

データセット

Yiqian Yang, Tian Lan, Qianghuai Jia, et al.

DyPE：超高解像度拡散における動的位置外挿

拡散モデル

Noam Issachar, Guy Yariv, Sagie Benaim, et al.

HoloCine：映画的マルチショット長時間動画物語の包括的生成

テキストから動画

Yihao Meng, Hao Ouyang, Yue Yu, et al.

Open-o3 Video：明示的な時空間証拠を用いた根拠のある動画推論

ビデオ理解

Jiahao Meng, Xiangtai Li, Haochen Wang, et al.

AdaSPEC：効率的な推測デコーダーのための選択的知識蒸留

Yuezhou Hu, Jiaxin Guo, Xinyu Feng, et al.

0.1ドル未満での人間-エージェント協働型ペーパートゥーページ作成

エージェント

Qianli Ma, Siyu Wang, Yilin Chen, et al.

マルチモーダル

Ling Xing, Alex Jinpeng Wang, Rui Yan, et al.

視覚質問応答

Chao Huang, Zeliang Zhang, Jiang Liu, et al.

言語モデルは単射であり、したがって可逆である

自然言語処理

Giorgos Nikolaou, Tommaso Mencattini, Donato Crisostomi, et al.

フリートランスフォーマー

François Fleuret

機械学習を用いた量子処理ユニット（QPU）処理時間の予測

モデル学習

Lucy Xing, Sanjay Vishwakarma, David Kremer, et al.

量子エルゴード性の端における建設的干渉の観測

サイエンスのためのAI

モデリング

Google Quantum AI and Collaborators

VideoAgentTrek：ラベルなし動画からのコンピュータ利用事前学習

人間-コンピュータインタラクション

Dunjie Lu, Yiheng Xu, Junli Wang, et al.

GigaBrain-0：世界モデル駆動型の視覚言語行動モデル

エムボディドインテリジェンス

ロボティクス

GigaBrain Team, Angen Ye, Boyuan Wang, et al.

LoongRL：長文脈における高度な推論のための強化学習

Siyuan Wang, Gaokai Zhang, Li Lyna Zhang, et al.

ラックヘッドアンカリング：音声駆動型人間アニメーションにおけるキャラクター個体性の保持

ラックヘッドアンカリング：音声駆動型人間アニメーションにおけるキャラクター個体性の保持

マルチモーダル

Junyoung Seo, Rodrigo Mira, Alexandros Haliassos, et al.

VITA-E：同時視覚、聴覚、発話および行動を伴う自然なエンボディドインタラクション

VITA-E：同時視覚、聴覚、発話および行動を伴う自然なエンボディドインタラクション

エージェント

エムボディドインテリジェンス

Xiaoyu Liu, Chaoyou Fu, Chi Yan, et al.

FARMER：画素上におけるフロー自己回帰型トランスフォーマー

Guangting Zheng, Qinyu Zhao, Tao Yang, et al.

データエージェントに関する総説：新たなパラダイムか、過大評価されたブームか？

エージェント

Yizhang Zhu, Liangwei Wang, Chenyu Yang, et al.

ReCode：包括する粒度制御のための計画と実行の統一

コード生成

Zhaoyang Yu, Jiayi Zhang, Huixue Su, et al.

コンチェルト：2次元-3次元連合自己教師学習が空間表現を生み出す

マルチモーダル表現

コンピュータビジョン

Yujia Zhang, Xiaoyang Wu, Yixing Lao, et al.

マゼラン：潜在空間探索および新規性生成のための誘導付きMCTS

テキスト生成

DEEDEE：分布外動態の高速かつスケーラブルな検出

モデリング

Tala Aljaafari, Varun Kanade, Philip Torr, et al.

トークン順列を用いたスパーサーなブロックスパース注意力

Xinghao Wang, Pengyu Wang, Dong Zhang, et al.

AGIの定義

ベンチマーク

Dan Hendrycks, Dawn Song, Christian Szegedy, et al.

ノイズ除去から精緻化へ：視覚言語拡散モデルのための補正フレームワーク

拡散モデル

マルチモーダル

Yatai Ji, Teng Wang, Yuying Ge, et al.

ステップバイステップ、チャンクごとに最適化：テキストから画像生成におけるチャンクレベルGRPO

テキストから画像生成

Yifu Luo, Penghui Du, Bo Li, et al.

ビデオ・アス・プロンプト：ビデオ生成における統一された意味制御

画像から動画生成

Yuxuan Bian, Xin Chen, Zenan Li, et al.

DeepAgent：スケーラブルなツールセットを備えた汎用推論エージェント

エージェント

Xiaoxi Li, Wenxiang Jiao, Jiarui Jin, et al.

不確実性を考慮した多目的強化学習誘導型拡散モデルによる3Dデ・ノボ分子設計

拡散モデル

Lianghong Chen, Dongkyu Eugene Kim, Mike Domaratzki, et al.

Reac-Discovery：連続Flow型触媒反応装置の発見および最適化をAIが駆動するプラットフォーム

サイエンスのためのAI

モデリング

Cristopher Tinajero, Marcileia Zanatta, Julián E. Sánchez-Velandia, et al.

BoltzGen：ユニバーサルな結合体設計への道

サイエンスのためのAI

ディープラーニング

Hannes Stark, Felix Faltings, MinGyu Choi, et al.

HSCodeComp：階層的ルール適用におけるディープサーチエージェント向けの現実的で専門的水準のベンチマーク

ベンチマーク

データセット

Yiqian Yang, Tian Lan, Qianghuai Jia, et al.

DyPE：超高解像度拡散における動的位置外挿

拡散モデル

Noam Issachar, Guy Yariv, Sagie Benaim, et al.

HoloCine：映画的マルチショット長時間動画物語の包括的生成

テキストから動画

Yihao Meng, Hao Ouyang, Yue Yu, et al.

Open-o3 Video：明示的な時空間証拠を用いた根拠のある動画推論

ビデオ理解

Jiahao Meng, Xiangtai Li, Haochen Wang, et al.

AdaSPEC：効率的な推測デコーダーのための選択的知識蒸留

Yuezhou Hu, Jiaxin Guo, Xinyu Feng, et al.

0.1ドル未満での人間-エージェント協働型ペーパートゥーページ作成

エージェント

Qianli Ma, Siyu Wang, Yilin Chen, et al.

マルチモーダル

Ling Xing, Alex Jinpeng Wang, Rui Yan, et al.

視覚質問応答

Chao Huang, Zeliang Zhang, Jiang Liu, et al.

言語モデルは単射であり、したがって可逆である

自然言語処理

Giorgos Nikolaou, Tommaso Mencattini, Donato Crisostomi, et al.

フリートランスフォーマー

François Fleuret

機械学習を用いた量子処理ユニット（QPU）処理時間の予測

モデル学習

Lucy Xing, Sanjay Vishwakarma, David Kremer, et al.

量子エルゴード性の端における建設的干渉の観測

サイエンスのためのAI

モデリング

Google Quantum AI and Collaborators

VideoAgentTrek：ラベルなし動画からのコンピュータ利用事前学習

人間-コンピュータインタラクション

Dunjie Lu, Yiheng Xu, Junli Wang, et al.

GigaBrain-0：世界モデル駆動型の視覚言語行動モデル

エムボディドインテリジェンス

ロボティクス

GigaBrain Team, Angen Ye, Boyuan Wang, et al.

LoongRL：長文脈における高度な推論のための強化学習

Siyuan Wang, Gaokai Zhang, Li Lyna Zhang, et al.

FARMER：画素上におけるフロー自己回帰型トランスフォーマー

データエージェントに関する総説：新たなパラダイムか、過大評価されたブームか？

ReCode：包括する粒度制御のための計画と実行の統一

コンチェルト：2次元-3次元連合自己教師学習が空間表現を生み出す

マゼラン：潜在空間探索および新規性生成のための誘導付きMCTS

DEEDEE：分布外動態の高速かつスケーラブルな検出

トークン順列を用いたスパーサーなブロックスパース注意力

AGIの定義

ノイズ除去から精緻化へ：視覚言語拡散モデルのための補正フレームワーク

ステップバイステップ、チャンクごとに最適化：テキストから画像生成におけるチャンクレベルGRPO

ビデオ・アス・プロンプト：ビデオ生成における統一された意味制御

DeepAgent：スケーラブルなツールセットを備えた汎用推論エージェント

不確実性を考慮した多目的強化学習誘導型拡散モデルによる3Dデ・ノボ分子設計

Reac-Discovery：連続Flow型触媒反応装置の発見および最適化をAIが駆動するプラットフォーム

BoltzGen：ユニバーサルな結合体設計への道

HSCodeComp：階層的ルール適用におけるディープサーチエージェント向けの現実的で専門的水準のベンチマーク

DyPE：超高解像度拡散における動的位置外挿

HoloCine：映画的マルチショット長時間動画物語の包括的生成

Open-o3 Video：明示的な時空間証拠を用いた根拠のある動画推論

AdaSPEC：効率的な推測デコーダーのための選択的知識蒸留

0.1ドル未満での人間-エージェント協働型ペーパートゥーページ作成

テキストを参照：トークン化から視覚的読解へ

方向性推論注入によるMLLMのファインチューニング

言語モデルは単射であり、したがって可逆である

フリートランスフォーマー

機械学習を用いた量子処理ユニット（QPU）処理時間の予測

量子エルゴード性の端における建設的干渉の観測

VideoAgentTrek：ラベルなし動画からのコンピュータ利用事前学習

GigaBrain-0：世界モデル駆動型の視覚言語行動モデル

LoongRL：長文脈における高度な推論のための強化学習

FARMER：画素上におけるフロー自己回帰型トランスフォーマー

データエージェントに関する総説：新たなパラダイムか、過大評価されたブームか？

ReCode：包括する粒度制御のための計画と実行の統一

コンチェルト：2次元-3次元連合自己教師学習が空間表現を生み出す

マゼラン：潜在空間探索および新規性生成のための誘導付きMCTS

DEEDEE：分布外動態の高速かつスケーラブルな検出

トークン順列を用いたスパーサーなブロックスパース注意力

AGIの定義

ノイズ除去から精緻化へ：視覚言語拡散モデルのための補正フレームワーク

ステップバイステップ、チャンクごとに最適化：テキストから画像生成におけるチャンクレベルGRPO

ビデオ・アス・プロンプト：ビデオ生成における統一された意味制御

DeepAgent：スケーラブルなツールセットを備えた汎用推論エージェント

不確実性を考慮した多目的強化学習誘導型拡散モデルによる3Dデ・ノボ分子設計

Reac-Discovery：連続Flow型触媒反応装置の発見および最適化をAIが駆動するプラットフォーム

BoltzGen：ユニバーサルな結合体設計への道

HSCodeComp：階層的ルール適用におけるディープサーチエージェント向けの現実的で専門的水準のベンチマーク

DyPE：超高解像度拡散における動的位置外挿

HoloCine：映画的マルチショット長時間動画物語の包括的生成

Open-o3 Video：明示的な時空間証拠を用いた根拠のある動画推論

AdaSPEC：効率的な推測デコーダーのための選択的知識蒸留

0.1ドル未満での人間-エージェント協働型ペーパートゥーページ作成

テキストを参照：トークン化から視覚的読解へ

方向性推論注入によるMLLMのファインチューニング

言語モデルは単射であり、したがって可逆である

フリートランスフォーマー

機械学習を用いた量子処理ユニット（QPU）処理時間の予測

量子エルゴード性の端における建設的干渉の観測

VideoAgentTrek：ラベルなし動画からのコンピュータ利用事前学習

GigaBrain-0：世界モデル駆動型の視覚言語行動モデル

LoongRL：長文脈における高度な推論のための強化学習