HyperAI

メイン

GPU

コンソール
Studio
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

人工知能の未来を築く

概要

当社についてサポートデータセットのヘルプ

製品

ニュース論文ノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

メイン

GPU

コンソール
Studio
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

人工知能の未来を築く

概要

当社についてサポートデータセットのヘルプ

製品

ニュース論文ノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)

SSRB：大規模な異種の準構造化データに対する直接的な自然言語クエリ

SSRB：大規模な異種の準構造化データに対する直接的な自然言語クエリ

検索拡張生成

自然言語処理

Xin Zhang, Mingxin Li, Yanzhao Zhang, et al.

MUVR：マルチモーダルな未加工動画のリトリーバルを評価するベンチマークと、マルチレベルの視覚的対応関係

MUVR：マルチモーダルな未加工動画のリトリーバルを評価するベンチマークと、マルチレベルの視覚的対応関係

視覚質問応答

マルチモーダル表現

Yue Feng, Jinwei Hu, Qijia Lu, et al.

Geminiロボティクス政策のVeoワールドシミュレータにおける評価

ビデオ理解

ロボティクス

Coline Devin, Yilun Du, Debidatta Dwibedi, et al.

MotionEdit：モーション中心型画像編集のベンチマークと学習

画像間変換

Yixin Wan, Lei Ke, Wenhao Yu, et al.

オリンピックレベルの幾何学大規模言語モデルエージェントの実現を目的とした、複雑性ブースティング強化学習によるアプローチ

視覚質問応答

エージェント

Haiteng Zhao, Junhao Shen, Yiming Zhang, et al.

OPV：効率的な長文の思考過程検証を目的とした成果に基づくプロセス検証器

Zijian Wu, Lingkai Kong, Wenwei Zhang, et al.

テキストから3D生成へのRL導入は、本当に準備ができているか？プログレッシブな検証

Yiwen Tang, Zoey Guo, Kaixin Zhu, et al.

オリンピックレベルの数学問題解決のための長期予測推論エージェント

Songyang Gao, Yuzhe Gu, Zijian Wu, et al.

T-pro 2.0：効率的なロシア語ハイブリッド推論モデルおよび実験環境

Dmitrii Stoianov, Danil Taranets, Olga Tsymboi, et al.

AutoGLM：GUI向け自律型ファウンデーションエージェント

エージェント

Xiao Liu, Bo Qin, Dongzhu Liang, et al.

OpenGU：グラフアンリーニングのための包括的ベンチマーク

ベンチマーク

Bowen Fan, Yuming Ai, Xunkai Li, et al.

事前学習、中間学習および強化学習が推論言語モデルに与える相互作用

Charlie Zhang, Graham Neubig, Xiang Yue

DeepCode：オープン・エイジェンティック・コーディング

コード生成

検索拡張生成

Zongwei Li, Zhonghang Li, Zirui Guo, et al.

InfiniteVL：線形AttentionとスパースAttentionの統合による、高効率かつ無制限入力の視覚言語モデル

Hongyuan Tao, Bencheng Liao, Shaoyu Chen, et al.

OmniPSD：Diffusion Transformerを用いた階層的PSD生成

拡散モデル

Cheng Liu, Yiren Song, Haofan Wang, et al.

HiF-VLA：視覚・言語・行動モデルにおける運動表現を用いた後知恵、洞察、先見性

ロボティクス

Minghui Lin, Pengxiang Ding, Shu Wang, et al.

アービトラージ：アドバンテージ認識型予測を活用した効率的な推論

Monishwaran Maheswaran, Rishabh Tiwari, Yuezhou Hu, et al.

画像および動画からのコンセプトの組み合わせ：コンセプトプロンプト結合によるアプローチ

マルチモーダル

Xianghao Kong, Zeyu Zhang, Yuwei Guo, et al.

StereoWorld：ジオメトリーに配慮したモノクロナルからステレオ動画生成

Ke Xing, Longfei Li, Yuyang Yin, et al.

ウラニア：AI利用に関する差分プライバシーに基づく洞察

ベンチマーク

Daogao Liu, Edith Cohen, Badih Ghazi, et al.

誠実さを学習するためのLLMの訓練：告白を通じて

監視付き微調整

Manas Joglekar, Jeremy Chen, Gabriel Wu, et al.

生産におけるエージェントの測定

エージェント

Melissa Z. Pan, Negar Arabzadeh, Riccardo Cogo, et al.

PolyMath：多言語文脈における数学的推論の評価

Yiming Wang, Pei Zhang, Jialong Tang, et al.

ThreadWeaver: 言語モデルにおける効率的な並列推論のための適応的スレッド化

Long Lian, Sida Wang, Felix Juefei-Xu, et al.

SPARK：参照なし強化学習における段階的プロセス認識報酬

監視付き微調整

Salman Rahman, Sruthi Gorantla, Arpit Gupta, et al.

OneStory: アダプティブメモリを用いた一貫性のあるマルチショット動画生成

画像から動画生成

Zhaochong An, Menglin Jia, Haonan Qiu, et al.

ソース動画のリアリズムを保持する：映画級品質の高精細な顔交換

ビデオ処理

コンピュータビジョン

Zekai Luo, Zongze Du, Zhouhang Zhu, et al.

ビジョナリー：WebGPU対応ガウススプラッティングプラットフォーム上に構築された世界モデルキャリア

Yuning Gong, Yifei Liu, Yifan Zhan, et al.

Wan-Move：潜在軌道ガイダンスを用いた運動制御可能な動画生成

画像から動画生成

Ruihang Chu, Yefei He, Zhekai Chen, et al.

ソフト適応型方策最適化

Chang Gao, Chujie Zheng, Xiong-Hui Chen, et al.

スケーリングによるゼロショット参照から動画生成

テキストから動画

Zijian Zhou, Shikun Liu, Haozhe Liu, et al.

Voxify3D：ピクセルアートがボクセルレンダリングと融合する

画像間変換

Yi-Chuan Huang, Jiewen Chan, Hao-Jen Chien, et al.

SSRB：大規模な異種の準構造化データに対する直接的な自然言語クエリ

SSRB：大規模な異種の準構造化データに対する直接的な自然言語クエリ

検索拡張生成

自然言語処理

Xin Zhang, Mingxin Li, Yanzhao Zhang, et al.

MUVR：マルチモーダルな未加工動画のリトリーバルを評価するベンチマークと、マルチレベルの視覚的対応関係

MUVR：マルチモーダルな未加工動画のリトリーバルを評価するベンチマークと、マルチレベルの視覚的対応関係

視覚質問応答

マルチモーダル表現

Yue Feng, Jinwei Hu, Qijia Lu, et al.

Geminiロボティクス政策のVeoワールドシミュレータにおける評価

ビデオ理解

ロボティクス

Coline Devin, Yilun Du, Debidatta Dwibedi, et al.

MotionEdit：モーション中心型画像編集のベンチマークと学習

画像間変換

Yixin Wan, Lei Ke, Wenhao Yu, et al.

オリンピックレベルの幾何学大規模言語モデルエージェントの実現を目的とした、複雑性ブースティング強化学習によるアプローチ

視覚質問応答

エージェント

Haiteng Zhao, Junhao Shen, Yiming Zhang, et al.

OPV：効率的な長文の思考過程検証を目的とした成果に基づくプロセス検証器

Zijian Wu, Lingkai Kong, Wenwei Zhang, et al.

テキストから3D生成へのRL導入は、本当に準備ができているか？プログレッシブな検証

Yiwen Tang, Zoey Guo, Kaixin Zhu, et al.

オリンピックレベルの数学問題解決のための長期予測推論エージェント

Songyang Gao, Yuzhe Gu, Zijian Wu, et al.

T-pro 2.0：効率的なロシア語ハイブリッド推論モデルおよび実験環境

Dmitrii Stoianov, Danil Taranets, Olga Tsymboi, et al.

AutoGLM：GUI向け自律型ファウンデーションエージェント

エージェント

Xiao Liu, Bo Qin, Dongzhu Liang, et al.

OpenGU：グラフアンリーニングのための包括的ベンチマーク

ベンチマーク

Bowen Fan, Yuming Ai, Xunkai Li, et al.

事前学習、中間学習および強化学習が推論言語モデルに与える相互作用

Charlie Zhang, Graham Neubig, Xiang Yue

DeepCode：オープン・エイジェンティック・コーディング

コード生成

検索拡張生成

Zongwei Li, Zhonghang Li, Zirui Guo, et al.

InfiniteVL：線形AttentionとスパースAttentionの統合による、高効率かつ無制限入力の視覚言語モデル

Hongyuan Tao, Bencheng Liao, Shaoyu Chen, et al.

OmniPSD：Diffusion Transformerを用いた階層的PSD生成

拡散モデル

Cheng Liu, Yiren Song, Haofan Wang, et al.

HiF-VLA：視覚・言語・行動モデルにおける運動表現を用いた後知恵、洞察、先見性

ロボティクス

Minghui Lin, Pengxiang Ding, Shu Wang, et al.

アービトラージ：アドバンテージ認識型予測を活用した効率的な推論

Monishwaran Maheswaran, Rishabh Tiwari, Yuezhou Hu, et al.

画像および動画からのコンセプトの組み合わせ：コンセプトプロンプト結合によるアプローチ

マルチモーダル

Xianghao Kong, Zeyu Zhang, Yuwei Guo, et al.

StereoWorld：ジオメトリーに配慮したモノクロナルからステレオ動画生成

Ke Xing, Longfei Li, Yuyang Yin, et al.

ウラニア：AI利用に関する差分プライバシーに基づく洞察

ベンチマーク

Daogao Liu, Edith Cohen, Badih Ghazi, et al.

誠実さを学習するためのLLMの訓練：告白を通じて

監視付き微調整

Manas Joglekar, Jeremy Chen, Gabriel Wu, et al.

生産におけるエージェントの測定

エージェント

Melissa Z. Pan, Negar Arabzadeh, Riccardo Cogo, et al.

PolyMath：多言語文脈における数学的推論の評価

Yiming Wang, Pei Zhang, Jialong Tang, et al.

ThreadWeaver: 言語モデルにおける効率的な並列推論のための適応的スレッド化

Long Lian, Sida Wang, Felix Juefei-Xu, et al.

SPARK：参照なし強化学習における段階的プロセス認識報酬

監視付き微調整

Salman Rahman, Sruthi Gorantla, Arpit Gupta, et al.

OneStory: アダプティブメモリを用いた一貫性のあるマルチショット動画生成

画像から動画生成

Zhaochong An, Menglin Jia, Haonan Qiu, et al.

ソース動画のリアリズムを保持する：映画級品質の高精細な顔交換

ビデオ処理

コンピュータビジョン

Zekai Luo, Zongze Du, Zhouhang Zhu, et al.

ビジョナリー：WebGPU対応ガウススプラッティングプラットフォーム上に構築された世界モデルキャリア

Yuning Gong, Yifei Liu, Yifan Zhan, et al.

Wan-Move：潜在軌道ガイダンスを用いた運動制御可能な動画生成

画像から動画生成

Ruihang Chu, Yefei He, Zhekai Chen, et al.

ソフト適応型方策最適化

Chang Gao, Chujie Zheng, Xiong-Hui Chen, et al.

スケーリングによるゼロショット参照から動画生成

テキストから動画

Zijian Zhou, Shikun Liu, Haozhe Liu, et al.

Voxify3D：ピクセルアートがボクセルレンダリングと融合する

画像間変換

Yi-Chuan Huang, Jiewen Chan, Hao-Jen Chien, et al.

Geminiロボティクス政策のVeoワールドシミュレータにおける評価

MotionEdit：モーション中心型画像編集のベンチマークと学習

オリンピックレベルの幾何学大規模言語モデルエージェントの実現を目的とした、複雑性ブースティング強化学習によるアプローチ

OPV：効率的な長文の思考過程検証を目的とした成果に基づくプロセス検証器

テキストから3D生成へのRL導入は、本当に準備ができているか？プログレッシブな検証

オリンピックレベルの数学問題解決のための長期予測推論エージェント

T-pro 2.0：効率的なロシア語ハイブリッド推論モデルおよび実験環境

AutoGLM：GUI向け自律型ファウンデーションエージェント

OpenGU：グラフアンリーニングのための包括的ベンチマーク

事前学習、中間学習および強化学習が推論言語モデルに与える相互作用

DeepCode：オープン・エイジェンティック・コーディング

InfiniteVL：線形AttentionとスパースAttentionの統合による、高効率かつ無制限入力の視覚言語モデル

OmniPSD：Diffusion Transformerを用いた階層的PSD生成

HiF-VLA：視覚・言語・行動モデルにおける運動表現を用いた後知恵、洞察、先見性

アービトラージ：アドバンテージ認識型予測を活用した効率的な推論

画像および動画からのコンセプトの組み合わせ：コンセプトプロンプト結合によるアプローチ

StereoWorld：ジオメトリーに配慮したモノクロナルからステレオ動画生成

ウラニア：AI利用に関する差分プライバシーに基づく洞察

誠実さを学習するためのLLMの訓練：告白を通じて

生産におけるエージェントの測定

PolyMath：多言語文脈における数学的推論の評価

ThreadWeaver: 言語モデルにおける効率的な並列推論のための適応的スレッド化

SPARK：参照なし強化学習における段階的プロセス認識報酬

OneStory: アダプティブメモリを用いた一貫性のあるマルチショット動画生成

ソース動画のリアリズムを保持する：映画級品質の高精細な顔交換

ビジョナリー：WebGPU対応ガウススプラッティングプラットフォーム上に構築された世界モデルキャリア

Wan-Move：潜在軌道ガイダンスを用いた運動制御可能な動画生成

ソフト適応型方策最適化

スケーリングによるゼロショット参照から動画生成

Voxify3D：ピクセルアートがボクセルレンダリングと融合する

Geminiロボティクス政策のVeoワールドシミュレータにおける評価

MotionEdit：モーション中心型画像編集のベンチマークと学習

オリンピックレベルの幾何学大規模言語モデルエージェントの実現を目的とした、複雑性ブースティング強化学習によるアプローチ

OPV：効率的な長文の思考過程検証を目的とした成果に基づくプロセス検証器

テキストから3D生成へのRL導入は、本当に準備ができているか？プログレッシブな検証

オリンピックレベルの数学問題解決のための長期予測推論エージェント

T-pro 2.0：効率的なロシア語ハイブリッド推論モデルおよび実験環境

AutoGLM：GUI向け自律型ファウンデーションエージェント

OpenGU：グラフアンリーニングのための包括的ベンチマーク

事前学習、中間学習および強化学習が推論言語モデルに与える相互作用

DeepCode：オープン・エイジェンティック・コーディング

InfiniteVL：線形AttentionとスパースAttentionの統合による、高効率かつ無制限入力の視覚言語モデル

OmniPSD：Diffusion Transformerを用いた階層的PSD生成

HiF-VLA：視覚・言語・行動モデルにおける運動表現を用いた後知恵、洞察、先見性

アービトラージ：アドバンテージ認識型予測を活用した効率的な推論

画像および動画からのコンセプトの組み合わせ：コンセプトプロンプト結合によるアプローチ

StereoWorld：ジオメトリーに配慮したモノクロナルからステレオ動画生成

ウラニア：AI利用に関する差分プライバシーに基づく洞察

誠実さを学習するためのLLMの訓練：告白を通じて

生産におけるエージェントの測定

PolyMath：多言語文脈における数学的推論の評価

ThreadWeaver: 言語モデルにおける効率的な並列推論のための適応的スレッド化

SPARK：参照なし強化学習における段階的プロセス認識報酬

OneStory: アダプティブメモリを用いた一貫性のあるマルチショット動画生成

ソース動画のリアリズムを保持する：映画級品質の高精細な顔交換

ビジョナリー：WebGPU対応ガウススプラッティングプラットフォーム上に構築された世界モデルキャリア

Wan-Move：潜在軌道ガイダンスを用いた運動制御可能な動画生成

ソフト適応型方策最適化

スケーリングによるゼロショット参照から動画生成

Voxify3D：ピクセルアートがボクセルレンダリングと融合する