HyperAI

メイン

GPU

コンソール
Studio
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

人工知能の未来を築く

概要

当社についてサポートデータセットのヘルプ

製品

ニュース論文ノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

メイン

GPU

コンソール
Studio
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

人工知能の未来を築く

概要

当社についてサポートデータセットのヘルプ

製品

ニュース論文ノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)

PixNerd：ピクセルニューラルフィールドドリフト

PixNerd：ピクセルニューラルフィールドドリフト

拡散モデル

Shuai Wang, Ziteng Gao, Chenhui Zhu, et al.

固定を越えて：拡散大規模言語モデル向け可変長ノイズ除去

固定を越えて：拡散大規模言語モデル向け可変長ノイズ除去

拡散モデル

Jinsong Li, Xiaoyi Dong, Yuhang Zang, et al.

Cognitive Kernel-Pro：深層研究エージェントおよびエージェント基盤モデル訓練のためのフレームワーク

エージェント

Tianqing Fang, Zhisong Zhang, Xiaoyang Wang, et al.

共同制作AI：拡張的で参加型のライフサイクルへ

人間-コンピュータインタラクション

アルゴリズム

Rashid Mushkani, Hugo Berard, Toumadher Ammar, et al.

iLRM：反復型大規模3D再構成モデル

Gyeongjin Kang, Seungtae Nam, Xiangyu Sun, et al.

villa-X：視覚言語行動モデルにおける潜在行動モデリングの強化

ロボティクス

ビデオ理解

Xiaoyu Chen, Hangxing Wei, Pushi Zhang, et al.

C3：複雑な対話における課題を探究するスプーケン対話モデル向け二か国語ベンチマーク

ベンチマーク

データセット

Chengqian Ma, Wei Tao, Yiwen Guo

RecGPT 技術報告

検索拡張生成

Chao Yi, Dian Chen, Gaoyang Guo, et al.

Phi-Groundテクニカルレポート：GUIグラウンディングにおける認識の進展

マルチモーダル

Miaosen Zhang, Ziqiang Xu, Jialiang Zhu, et al.

Seed-Prover：自動定理証明における深く広い推論

Luoxin Chen, Jinming Gu, Liankai Huang, et al.

野生における合成音声検出における「少即是多」

Nicholas Andrews, Matthew Wiesner, Sanjeev Khudanpur, et al.

ソリューション認識型とグローバルなReLU選択：部分MILPがDNN検証において再び力を発揮する

ディープラーニング

畳み込みニューラルネットワーク

Yuke Liao, Blaise Genest, Kuldeep Meel, et al.

CoT-Self-Instruct：推論および非推論タスク向け高品質な合成プロンプトの構築

Ping Yu, Jack Lanchantin, Tianlu Wang, et al.

参照音声視覚セグメンテーションにおけるオムニモーダル表現と推論の実現へ

マルチモーダル

ビデオ理解

Kaining Ying, Henghui Ding, Guanquan Jie, et al.

弱教師付きで、未知のドメインへの空中画像向け車両検出器の適応

オブジェクト検出

リモートセンシング

Xiao Fang, Minhyek Jeon, Zheyang Qin, et al.

VL-Cogito：高度なマルチモーダル推論のためのプログレッシブカリキュラム強化学習

Ruifeng Yuan, Chenghao Xiao, Sicong Leng, et al.

Falcon-H1：効率性と性能を再定義するハイブリッドヘッド言語モデルの家族

Jingwei Zuo, Maksim Velikanov, Ilyas Chahed, et al.

BANG：生成的分解ダイナミクスを用いた3Dアセットの分割

Longwen Zhang, Qixuan Zhang, Haoran Jiang, et al.

ScreenCoder：モジュール型マルチモーダルエージェントを活用したフロントエンド自動化のための視覚からコード生成の進展

コード生成

マルチモーダル

Yilei Jiang, Yaozhi Zheng, Yuxuan Wan, et al.

MIRepNet：EEGを用いた運動想起分類のためのパイプラインおよび基礎モデル

ディープラーニング

畳み込みニューラルネットワーク

Dingkun Liu, Zhu Chen, Jingwei Luo, et al.

ChemDFM-R：原子化化学知識を統合した化学推論型言語モデル

Zihan Zhao, Bo Chen, Ziping Wan, et al.

X-Omni：強化学習が離散自己回帰型画像生成モデルを再び優れたものにした

拡散モデル

Zigang Geng, Yibing Wang, Yeyao Ma, et al.

HunyuanWorld 1.0：言語またはピクセルから没入型で探索可能かつインタラクティブな3D世界を生成する

HunyuanWorld Team, Zhenwei Wang, Yuhao Liu, et al.

AlphaEarth Foundations：疎なラベルデータからの高精度かつ効率的な全球マッピングを実現する埋め込み場モデル

サイエンスのためのAI

リモートセンシング

Christopher F. Brown, Michal R. Kazmierski, Valerie J. Pasquarella, et al.

説明可能なディープラーニングモデルを用いた長期的なENSO予測への道標

ディープラーニング

畳み込みニューラルネットワーク

Qi Chen, Yinghao Cui, Guobin Hong, et al.

OmniArch：科学計算のためのファウンデーションモデル構築

サイエンスのためのAI

Tianyu Chen, Haoyi Zhou, Ying Li, et al.

UI-AGILE：GUIエージェントの強化学習と正確な推論時における接地の進展

監視付き微調整

マルチモーダル

Shuquan Lian, Yuhang Wu, Jia Ma, et al.

DualSG：デュアルストリーム・エクスプレシット・セマンティック・ガイドド多変量時系列予測フレームワーク

自然言語処理

Kuiye Ding, Fanda Fan, Yao Wang, et al.

トークンが多すぎるとき：画像、動画、音声におけるマルチモーダル長文脈トークン圧縮の調査

コンピュータビジョン

Kele Shao, Keda Tao, Kejia Zhang, et al.

SmallThinker: ローカル配備に特化してネイティブに訓練された効率的な大規模言語モデルのファミリー

Yixin Song, Zhenliang Xue, Dongliang Wei, et al.

4D空間知能の再構築：サーベイ

コンピュータビジョン

ビデオ理解

Yukang Cao, Jiahao Lu, Zhisheng Huang, et al.

Rep-MTL：表現レベルのタスクサリエンシーの力を解放するマルチタスク学習

マルチタスク学習

ニューラルネットワーク

Zedong Wang, Siyuan Li, Dan Xu

PixNerd：ピクセルニューラルフィールドドリフト

PixNerd：ピクセルニューラルフィールドドリフト

拡散モデル

Shuai Wang, Ziteng Gao, Chenhui Zhu, et al.

固定を越えて：拡散大規模言語モデル向け可変長ノイズ除去

固定を越えて：拡散大規模言語モデル向け可変長ノイズ除去

拡散モデル

Jinsong Li, Xiaoyi Dong, Yuhang Zang, et al.

Cognitive Kernel-Pro：深層研究エージェントおよびエージェント基盤モデル訓練のためのフレームワーク

エージェント

Tianqing Fang, Zhisong Zhang, Xiaoyang Wang, et al.

共同制作AI：拡張的で参加型のライフサイクルへ

人間-コンピュータインタラクション

アルゴリズム

Rashid Mushkani, Hugo Berard, Toumadher Ammar, et al.

iLRM：反復型大規模3D再構成モデル

Gyeongjin Kang, Seungtae Nam, Xiangyu Sun, et al.

villa-X：視覚言語行動モデルにおける潜在行動モデリングの強化

ロボティクス

ビデオ理解

Xiaoyu Chen, Hangxing Wei, Pushi Zhang, et al.

C3：複雑な対話における課題を探究するスプーケン対話モデル向け二か国語ベンチマーク

ベンチマーク

データセット

Chengqian Ma, Wei Tao, Yiwen Guo

RecGPT 技術報告

検索拡張生成

Chao Yi, Dian Chen, Gaoyang Guo, et al.

Phi-Groundテクニカルレポート：GUIグラウンディングにおける認識の進展

マルチモーダル

Miaosen Zhang, Ziqiang Xu, Jialiang Zhu, et al.

Seed-Prover：自動定理証明における深く広い推論

Luoxin Chen, Jinming Gu, Liankai Huang, et al.

野生における合成音声検出における「少即是多」

Nicholas Andrews, Matthew Wiesner, Sanjeev Khudanpur, et al.

ソリューション認識型とグローバルなReLU選択：部分MILPがDNN検証において再び力を発揮する

ディープラーニング

畳み込みニューラルネットワーク

Yuke Liao, Blaise Genest, Kuldeep Meel, et al.

CoT-Self-Instruct：推論および非推論タスク向け高品質な合成プロンプトの構築

Ping Yu, Jack Lanchantin, Tianlu Wang, et al.

参照音声視覚セグメンテーションにおけるオムニモーダル表現と推論の実現へ

マルチモーダル

ビデオ理解

Kaining Ying, Henghui Ding, Guanquan Jie, et al.

弱教師付きで、未知のドメインへの空中画像向け車両検出器の適応

オブジェクト検出

リモートセンシング

Xiao Fang, Minhyek Jeon, Zheyang Qin, et al.

VL-Cogito：高度なマルチモーダル推論のためのプログレッシブカリキュラム強化学習

Ruifeng Yuan, Chenghao Xiao, Sicong Leng, et al.

Falcon-H1：効率性と性能を再定義するハイブリッドヘッド言語モデルの家族

Jingwei Zuo, Maksim Velikanov, Ilyas Chahed, et al.

BANG：生成的分解ダイナミクスを用いた3Dアセットの分割

Longwen Zhang, Qixuan Zhang, Haoran Jiang, et al.

ScreenCoder：モジュール型マルチモーダルエージェントを活用したフロントエンド自動化のための視覚からコード生成の進展

コード生成

マルチモーダル

Yilei Jiang, Yaozhi Zheng, Yuxuan Wan, et al.

MIRepNet：EEGを用いた運動想起分類のためのパイプラインおよび基礎モデル

ディープラーニング

畳み込みニューラルネットワーク

Dingkun Liu, Zhu Chen, Jingwei Luo, et al.

ChemDFM-R：原子化化学知識を統合した化学推論型言語モデル

Zihan Zhao, Bo Chen, Ziping Wan, et al.

X-Omni：強化学習が離散自己回帰型画像生成モデルを再び優れたものにした

拡散モデル

Zigang Geng, Yibing Wang, Yeyao Ma, et al.

HunyuanWorld 1.0：言語またはピクセルから没入型で探索可能かつインタラクティブな3D世界を生成する

HunyuanWorld Team, Zhenwei Wang, Yuhao Liu, et al.

AlphaEarth Foundations：疎なラベルデータからの高精度かつ効率的な全球マッピングを実現する埋め込み場モデル

サイエンスのためのAI

リモートセンシング

Christopher F. Brown, Michal R. Kazmierski, Valerie J. Pasquarella, et al.

説明可能なディープラーニングモデルを用いた長期的なENSO予測への道標

ディープラーニング

畳み込みニューラルネットワーク

Qi Chen, Yinghao Cui, Guobin Hong, et al.

OmniArch：科学計算のためのファウンデーションモデル構築

サイエンスのためのAI

Tianyu Chen, Haoyi Zhou, Ying Li, et al.

UI-AGILE：GUIエージェントの強化学習と正確な推論時における接地の進展

監視付き微調整

マルチモーダル

Shuquan Lian, Yuhang Wu, Jia Ma, et al.

DualSG：デュアルストリーム・エクスプレシット・セマンティック・ガイドド多変量時系列予測フレームワーク

自然言語処理

Kuiye Ding, Fanda Fan, Yao Wang, et al.

トークンが多すぎるとき：画像、動画、音声におけるマルチモーダル長文脈トークン圧縮の調査

コンピュータビジョン

Kele Shao, Keda Tao, Kejia Zhang, et al.

SmallThinker: ローカル配備に特化してネイティブに訓練された効率的な大規模言語モデルのファミリー

Yixin Song, Zhenliang Xue, Dongliang Wei, et al.

4D空間知能の再構築：サーベイ

コンピュータビジョン

ビデオ理解

Yukang Cao, Jiahao Lu, Zhisheng Huang, et al.

Rep-MTL：表現レベルのタスクサリエンシーの力を解放するマルチタスク学習

マルチタスク学習

ニューラルネットワーク

Zedong Wang, Siyuan Li, Dan Xu

Cognitive Kernel-Pro：深層研究エージェントおよびエージェント基盤モデル訓練のためのフレームワーク

共同制作AI：拡張的で参加型のライフサイクルへ

iLRM：反復型大規模3D再構成モデル

villa-X：視覚言語行動モデルにおける潜在行動モデリングの強化

C3：複雑な対話における課題を探究するスプーケン対話モデル向け二か国語ベンチマーク

RecGPT 技術報告

Phi-Groundテクニカルレポート：GUIグラウンディングにおける認識の進展

Seed-Prover：自動定理証明における深く広い推論

野生における合成音声検出における「少即是多」

ソリューション認識型とグローバルなReLU選択：部分MILPがDNN検証において再び力を発揮する

CoT-Self-Instruct：推論および非推論タスク向け高品質な合成プロンプトの構築

参照音声視覚セグメンテーションにおけるオムニモーダル表現と推論の実現へ

弱教師付きで、未知のドメインへの空中画像向け車両検出器の適応

VL-Cogito：高度なマルチモーダル推論のためのプログレッシブカリキュラム強化学習

Falcon-H1：効率性と性能を再定義するハイブリッドヘッド言語モデルの家族

BANG：生成的分解ダイナミクスを用いた3Dアセットの分割

ScreenCoder：モジュール型マルチモーダルエージェントを活用したフロントエンド自動化のための視覚からコード生成の進展

MIRepNet：EEGを用いた運動想起分類のためのパイプラインおよび基礎モデル

ChemDFM-R：原子化化学知識を統合した化学推論型言語モデル

X-Omni：強化学習が離散自己回帰型画像生成モデルを再び優れたものにした

HunyuanWorld 1.0：言語またはピクセルから没入型で探索可能かつインタラクティブな3D世界を生成する

AlphaEarth Foundations：疎なラベルデータからの高精度かつ効率的な全球マッピングを実現する埋め込み場モデル

説明可能なディープラーニングモデルを用いた長期的なENSO予測への道標

OmniArch：科学計算のためのファウンデーションモデル構築

UI-AGILE：GUIエージェントの強化学習と正確な推論時における接地の進展

DualSG：デュアルストリーム・エクスプレシット・セマンティック・ガイドド多変量時系列予測フレームワーク

トークンが多すぎるとき：画像、動画、音声におけるマルチモーダル長文脈トークン圧縮の調査

SmallThinker: ローカル配備に特化してネイティブに訓練された効率的な大規模言語モデルのファミリー

4D空間知能の再構築：サーベイ

Rep-MTL：表現レベルのタスクサリエンシーの力を解放するマルチタスク学習

Cognitive Kernel-Pro：深層研究エージェントおよびエージェント基盤モデル訓練のためのフレームワーク

共同制作AI：拡張的で参加型のライフサイクルへ

iLRM：反復型大規模3D再構成モデル

villa-X：視覚言語行動モデルにおける潜在行動モデリングの強化

C3：複雑な対話における課題を探究するスプーケン対話モデル向け二か国語ベンチマーク

RecGPT 技術報告

Phi-Groundテクニカルレポート：GUIグラウンディングにおける認識の進展

Seed-Prover：自動定理証明における深く広い推論

野生における合成音声検出における「少即是多」

ソリューション認識型とグローバルなReLU選択：部分MILPがDNN検証において再び力を発揮する

CoT-Self-Instruct：推論および非推論タスク向け高品質な合成プロンプトの構築

参照音声視覚セグメンテーションにおけるオムニモーダル表現と推論の実現へ

弱教師付きで、未知のドメインへの空中画像向け車両検出器の適応

VL-Cogito：高度なマルチモーダル推論のためのプログレッシブカリキュラム強化学習

Falcon-H1：効率性と性能を再定義するハイブリッドヘッド言語モデルの家族

BANG：生成的分解ダイナミクスを用いた3Dアセットの分割

ScreenCoder：モジュール型マルチモーダルエージェントを活用したフロントエンド自動化のための視覚からコード生成の進展

MIRepNet：EEGを用いた運動想起分類のためのパイプラインおよび基礎モデル

ChemDFM-R：原子化化学知識を統合した化学推論型言語モデル

X-Omni：強化学習が離散自己回帰型画像生成モデルを再び優れたものにした

HunyuanWorld 1.0：言語またはピクセルから没入型で探索可能かつインタラクティブな3D世界を生成する

AlphaEarth Foundations：疎なラベルデータからの高精度かつ効率的な全球マッピングを実現する埋め込み場モデル

説明可能なディープラーニングモデルを用いた長期的なENSO予測への道標

OmniArch：科学計算のためのファウンデーションモデル構築

UI-AGILE：GUIエージェントの強化学習と正確な推論時における接地の進展

DualSG：デュアルストリーム・エクスプレシット・セマンティック・ガイドド多変量時系列予測フレームワーク

トークンが多すぎるとき：画像、動画、音声におけるマルチモーダル長文脈トークン圧縮の調査

SmallThinker: ローカル配備に特化してネイティブに訓練された効率的な大規模言語モデルのファミリー

4D空間知能の再構築：サーベイ

Rep-MTL：表現レベルのタスクサリエンシーの力を解放するマルチタスク学習