HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
共同制作AI:拡張的で参加型のライフサイクルへ
人間-コンピュータインタラクション
アルゴリズム
Rashid Mushkani, Hugo Berard, Toumadher Ammar, et al.
iLRM:反復型大規模3D再構成モデル
Transformer
3D生成
Gyeongjin Kang, Seungtae Nam, Xiangyu Sun, et al.
villa-X:視覚言語行動モデルにおける潜在行動モデリングの強化
ロボティクス
ビデオ理解
Xiaoyu Chen, Hangxing Wei, Pushi Zhang, et al.
C3:複雑な対話における課題を探究するスプーケン対話モデル向け二か国語ベンチマーク
ベンチマーク
データセット
Chengqian Ma, Wei Tao, Yiwen Guo
RecGPT 技術報告
LLM
検索拡張生成
Chao Yi, Dian Chen, Gaoyang Guo, et al.
Phi-Groundテクニカルレポート:GUIグラウンディングにおける認識の進展
マルチモーダル
画像理解
Miaosen Zhang, Ziqiang Xu, Jialiang Zhu, et al.
Seed-Prover:自動定理証明における深く広い推論
LLM
Reasoning
Luoxin Chen, Jinming Gu, Liankai Huang, et al.
野生における合成音声検出における「少即是多」
Text-to-Speech
合成
Nicholas Andrews, Matthew Wiesner, Sanjeev Khudanpur, et al.
ソリューション認識型とグローバルなReLU選択:部分MILPがDNN検証において再び力を発揮する
ディープラーニング
畳み込みニューラルネットワーク
Yuke Liao, Blaise Genest, Kuldeep Meel, et al.
CoT-Self-Instruct:推論および非推論タスク向け高品質な合成プロンプトの構築
LLM
Reasoning
Ping Yu, Jack Lanchantin, Tianlu Wang, et al.
参照音声視覚セグメンテーションにおけるオムニモーダル表現と推論の実現へ
マルチモーダル
ビデオ理解
Kaining Ying, Henghui Ding, Guanquan Jie, et al.
弱教師付きで、未知のドメインへの空中画像向け車両検出器の適応
オブジェクト検出
リモートセンシング
Xiao Fang, Minhyek Jeon, Zheyang Qin, et al.
VL-Cogito:高度なマルチモーダル推論のためのプログレッシブカリキュラム強化学習
強化学習
Reasoning
Ruifeng Yuan, Chenghao Xiao, Sicong Leng, et al.
Falcon-H1:効率性と性能を再定義するハイブリッドヘッド言語モデルの家族
LLM
Transformer
Jingwei Zuo, Maksim Velikanov, Ilyas Chahed, et al.
BANG:生成的分解ダイナミクスを用いた3Dアセットの分割
3D生成
3Dモデル
Longwen Zhang, Qixuan Zhang, Haoran Jiang, et al.
ScreenCoder:モジュール型マルチモーダルエージェントを活用したフロントエンド自動化のための視覚からコード生成の進展
コード生成
マルチモーダル
Yilei Jiang, Yaozhi Zheng, Yuxuan Wan, et al.
MIRepNet:EEGを用いた運動想起分類のためのパイプラインおよび基礎モデル
ディープラーニング
畳み込みニューラルネットワーク
Dingkun Liu, Zhu Chen, Jingwei Luo, et al.
ChemDFM-R:原子化化学知識を統合した化学推論型言語モデル
LLM
Reasoning
Zihan Zhao, Bo Chen, Ziping Wan, et al.
X-Omni:強化学習が離散自己回帰型画像生成モデルを再び優れたものにした
画像生成
拡散モデル
Zigang Geng, Yibing Wang, Yeyao Ma, et al.
HunyuanWorld 1.0:言語またはピクセルから没入型で探索可能かつインタラクティブな3D世界を生成する
3D生成
3Dモデル
HunyuanWorld Team, Zhenwei Wang, Yuhao Liu, et al.
AlphaEarth Foundations:疎なラベルデータからの高精度かつ効率的な全球マッピングを実現する埋め込み場モデル
サイエンスのためのAI
リモートセンシング
Christopher F. Brown, Michal R. Kazmierski, Valerie J. Pasquarella, et al.
説明可能なディープラーニングモデルを用いた長期的なENSO予測への道標
ディープラーニング
畳み込みニューラルネットワーク
Qi Chen, Yinghao Cui, Guobin Hong, et al.
OmniArch:科学計算のためのファウンデーションモデル構築
サイエンスのためのAI
Transformer
Tianyu Chen, Haoyi Zhou, Ying Li, et al.
UI-AGILE:GUIエージェントの強化学習と正確な推論時における接地の進展
監視付き微調整
マルチモーダル
Shuquan Lian, Yuhang Wu, Jia Ma, et al.
DualSG:デュアルストリーム・エクスプレシット・セマンティック・ガイドド多変量時系列予測フレームワーク
LLM
自然言語処理
Kuiye Ding, Fanda Fan, Yao Wang, et al.
トークンが多すぎるとき:画像、動画、音声におけるマルチモーダル長文脈トークン圧縮の調査
Transformer
コンピュータビジョン
Kele Shao, Keda Tao, Kejia Zhang, et al.
SmallThinker: ローカル配備に特化してネイティブに訓練された効率的な大規模言語モデルのファミリー
LLM
Transformer
Yixin Song, Zhenliang Xue, Dongliang Wei, et al.
4D空間知能の再構築:サーベイ
コンピュータビジョン
ビデオ理解
Yukang Cao, Jiahao Lu, Zhisheng Huang, et al.
Rep-MTL:表現レベルのタスクサリエンシーの力を解放するマルチタスク学習
マルチタスク学習
ニューラルネットワーク
Zedong Wang, Siyuan Li, Dan Xu
ARC-Hunyuan-Video-7B:現実世界のショートビデオの構造化理解
ビデオ理解
Video Captioning
Yuying Ge, Yixiao Ge, Chen Li, et al.
エージェント型強化政策最適化
強化学習
エージェント
Guanting Dong, Hangyu Mao, Kai Ma, et al.
仕様の自己修正:テスト時における改善を通じた文脈内報酬の悪用の軽減
LLM
DeepSeek
Víctor Gallego
1
35
36
37
38
39
40
41
47
共同制作AI:拡張的で参加型のライフサイクルへ
人間-コンピュータインタラクション
アルゴリズム
Rashid Mushkani, Hugo Berard, Toumadher Ammar, et al.
iLRM:反復型大規模3D再構成モデル
Transformer
3D生成
Gyeongjin Kang, Seungtae Nam, Xiangyu Sun, et al.
villa-X:視覚言語行動モデルにおける潜在行動モデリングの強化
ロボティクス
ビデオ理解
Xiaoyu Chen, Hangxing Wei, Pushi Zhang, et al.
C3:複雑な対話における課題を探究するスプーケン対話モデル向け二か国語ベンチマーク
ベンチマーク
データセット
Chengqian Ma, Wei Tao, Yiwen Guo
RecGPT 技術報告
LLM
検索拡張生成
Chao Yi, Dian Chen, Gaoyang Guo, et al.
Phi-Groundテクニカルレポート:GUIグラウンディングにおける認識の進展
マルチモーダル
画像理解
Miaosen Zhang, Ziqiang Xu, Jialiang Zhu, et al.
Seed-Prover:自動定理証明における深く広い推論
LLM
Reasoning
Luoxin Chen, Jinming Gu, Liankai Huang, et al.
野生における合成音声検出における「少即是多」
Text-to-Speech
合成
Nicholas Andrews, Matthew Wiesner, Sanjeev Khudanpur, et al.
ソリューション認識型とグローバルなReLU選択:部分MILPがDNN検証において再び力を発揮する
ディープラーニング
畳み込みニューラルネットワーク
Yuke Liao, Blaise Genest, Kuldeep Meel, et al.
CoT-Self-Instruct:推論および非推論タスク向け高品質な合成プロンプトの構築
LLM
Reasoning
Ping Yu, Jack Lanchantin, Tianlu Wang, et al.
参照音声視覚セグメンテーションにおけるオムニモーダル表現と推論の実現へ
マルチモーダル
ビデオ理解
Kaining Ying, Henghui Ding, Guanquan Jie, et al.
弱教師付きで、未知のドメインへの空中画像向け車両検出器の適応
オブジェクト検出
リモートセンシング
Xiao Fang, Minhyek Jeon, Zheyang Qin, et al.
VL-Cogito:高度なマルチモーダル推論のためのプログレッシブカリキュラム強化学習
強化学習
Reasoning
Ruifeng Yuan, Chenghao Xiao, Sicong Leng, et al.
Falcon-H1:効率性と性能を再定義するハイブリッドヘッド言語モデルの家族
LLM
Transformer
Jingwei Zuo, Maksim Velikanov, Ilyas Chahed, et al.
BANG:生成的分解ダイナミクスを用いた3Dアセットの分割
3D生成
3Dモデル
Longwen Zhang, Qixuan Zhang, Haoran Jiang, et al.
ScreenCoder:モジュール型マルチモーダルエージェントを活用したフロントエンド自動化のための視覚からコード生成の進展
コード生成
マルチモーダル
Yilei Jiang, Yaozhi Zheng, Yuxuan Wan, et al.
MIRepNet:EEGを用いた運動想起分類のためのパイプラインおよび基礎モデル
ディープラーニング
畳み込みニューラルネットワーク
Dingkun Liu, Zhu Chen, Jingwei Luo, et al.
ChemDFM-R:原子化化学知識を統合した化学推論型言語モデル
LLM
Reasoning
Zihan Zhao, Bo Chen, Ziping Wan, et al.
X-Omni:強化学習が離散自己回帰型画像生成モデルを再び優れたものにした
画像生成
拡散モデル
Zigang Geng, Yibing Wang, Yeyao Ma, et al.
HunyuanWorld 1.0:言語またはピクセルから没入型で探索可能かつインタラクティブな3D世界を生成する
3D生成
3Dモデル
HunyuanWorld Team, Zhenwei Wang, Yuhao Liu, et al.
AlphaEarth Foundations:疎なラベルデータからの高精度かつ効率的な全球マッピングを実現する埋め込み場モデル
サイエンスのためのAI
リモートセンシング
Christopher F. Brown, Michal R. Kazmierski, Valerie J. Pasquarella, et al.
説明可能なディープラーニングモデルを用いた長期的なENSO予測への道標
ディープラーニング
畳み込みニューラルネットワーク
Qi Chen, Yinghao Cui, Guobin Hong, et al.
OmniArch:科学計算のためのファウンデーションモデル構築
サイエンスのためのAI
Transformer
Tianyu Chen, Haoyi Zhou, Ying Li, et al.
UI-AGILE:GUIエージェントの強化学習と正確な推論時における接地の進展
監視付き微調整
マルチモーダル
Shuquan Lian, Yuhang Wu, Jia Ma, et al.
DualSG:デュアルストリーム・エクスプレシット・セマンティック・ガイドド多変量時系列予測フレームワーク
LLM
自然言語処理
Kuiye Ding, Fanda Fan, Yao Wang, et al.
トークンが多すぎるとき:画像、動画、音声におけるマルチモーダル長文脈トークン圧縮の調査
Transformer
コンピュータビジョン
Kele Shao, Keda Tao, Kejia Zhang, et al.
SmallThinker: ローカル配備に特化してネイティブに訓練された効率的な大規模言語モデルのファミリー
LLM
Transformer
Yixin Song, Zhenliang Xue, Dongliang Wei, et al.
4D空間知能の再構築:サーベイ
コンピュータビジョン
ビデオ理解
Yukang Cao, Jiahao Lu, Zhisheng Huang, et al.
Rep-MTL:表現レベルのタスクサリエンシーの力を解放するマルチタスク学習
マルチタスク学習
ニューラルネットワーク
Zedong Wang, Siyuan Li, Dan Xu
ARC-Hunyuan-Video-7B:現実世界のショートビデオの構造化理解
ビデオ理解
Video Captioning
Yuying Ge, Yixiao Ge, Chen Li, et al.
エージェント型強化政策最適化
強化学習
エージェント
Guanting Dong, Hangyu Mao, Kai Ma, et al.
仕様の自己修正:テスト時における改善を通じた文脈内報酬の悪用の軽減
LLM
DeepSeek
Víctor Gallego
1
35
36
37
38
39
40
41
47