HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
MSRNet:偽装物体検出のためのマルチスケール再帰的ネットワーク
オブジェクト検出
セマンティックセグメンテーション
Leena Alghamdi, Muhammad Usman, Hafeez Anwar, et al.
予算考慮型のツール利用は効果的なAgentスケーリングを可能にする
エージェント
LLM
Tengxiao Liu, Zifeng Wang, Jin Miao, et al.
動画内指示:生成制御としての視覚信号
画像から動画生成
動画生成
Gongfan Fang, Xinyin Ma, Xinchao Wang
DR Tulu:深層リサーチのための進化的ルーブリックを用いた強化学習
強化学習
インテリジェントな質問応答
Rulin Shao, Akari Asai, Shannon Zejiang Shen, et al.
AICC:HTML解析の精緻化とモデル性能の向上 —— モデルベースのHTMLパーサーにより構築された7.3TのAI-Readyコーパス
LLM
ドキュメント理解
Ren Ma, Jiantao Qiu, Chao Xu, et al.
UltraFlux:多様なアスペクト比に対応した高品質なネイティブ4Kテキスト画像生成のためのデータ・モデル協調設計
テキストから画像生成
拡散モデル
Tian Ye, Song Fei, Lei Zhu
DeCo:エンドツーエンド画像生成のための周波数分離ピクセル拡散
拡散モデル
画像生成
Zehong Ma, Longhui Wei, Shuai Wang, et al.
生成的ユーザーインターフェースの判定者としてのComputer-Use Agent
エージェント
コード生成
Kevin Qinghong Lin, Siyuan Hu, Linjie Li, et al.
AutoEnv:環境横断的なAgent学習を測定するための自動化環境
強化学習
エージェント
Jiayi Zhang, Yiran Peng, Fanqi Kong, et al.
Deep Researchによる汎用Agentメモリ
検索拡張生成
エージェント
B. Y. Yan, Chaofan Li, Hongjin Qian, et al.
VIRAL:人型ロボットの運動操作におけるスケールアップ型視覚シミュレーションから現実への展開
強化学習
コンピュータビジョン
Tairan He, Zi Wang, Haoru Xue, et al.
MIST:教師あり学習による相互情報量
ニューラルネットワーク
ディープラーニング
German Gritsai, Megan Richards, Maxime Méloux, et al.
Multi-Agentディープリサーチ:M-GRPOを用いたMulti-Agentシステムの学習
強化学習
エージェント
Haoyang Hong, Jiajun Yin, Yuan Wang, et al.
データなしのフローマップ蒸留
拡散モデル
合成
Shangyuan Tong, Nanye Ma, Saining Xie, et al.
フニエンOCR 技術報告
OCR
視覚質問応答
Tencent Hunyuan Vision Team, Jie Jiang, Linus, et al.
PhysToolBench:MLLMsにおける物理ツール理解のベンチマーク
視覚質問応答
ベンチマーク
Zixin Zhang, Kanghao Chen, Xingwang Lin, et al.
ハクスリー・ゲーデル機械:最適自己改善機械の近似による人間レベルのコーディングエージェントの開発
エージェント
人工知能
Wenyi Wang, Piotr Piękos, Li Nanbo, et al.
空間的超感応を用いずに空間的超感応を解く
ビデオ理解
コンピュータビジョン
Vishaal Udandarao, Shyamgopal Karthik, Surabhi S. Nath, et al.
Parrot:出力の真実性に対する説得および同意への頑健性評価——LLMsのための迎合性頑健性ベンチマーク
LLM
ベンチマーク
Yusuf Çelebi, Mahmoud El Hussieni, Özay Ezerceli
O-Mem:パーソナライズされた長期ホライゾンの自己進化型Agentのためのオムニメモリシステム
LLM
ベンチマーク
Piaohong Wang, Motong Tian, Jiaxian Li, et al.
テキストの内在的次元の解明:学術要旨から創作物語まで
LLM
自然言語処理
Vladislav Pedashenko, Laida Kushnareva, Yana Khassan Nibal, et al.
SAM 3:概念を用いたSegment Anything
コンピュータビジョン
セマンティックセグメンテーション
Nicolas Carion, Laura Gustafson, Yuan-Ting Hu, et al.
GeoVista:地理的位置特定のためのWeb拡張型Agent視覚的推論
エージェント
検索拡張生成
Yikun Wang, Zuyan Liu, Ziyi Wang, et al.
OpenMMReasoner:オープンかつ汎用的なレシピによるマルチモーダル推論のフロンティアの開拓
監視付き微調整
Reasoning
Kaichen Zhang, Keming Wu, Zuhao Yang, et al.
HiPO:大規模言語モデルにおける動的推論向けハイブリッド方策最適化
Reasoning
強化学習
Ken Deng, Zizheng Zhan, Wen Xiang, et al.
SERES:スパースな視点からの意味認識型ニューラル再構成
3D生成
コンピュータビジョン
Bo Xu, Yuhu Guo, Yuchao Wang, et al.
SDAR:スケーラブルなシーケンス生成のための相乗効果を持つ拡散-自己回帰パラダイム
拡散モデル
モデル学習
Shuang Cheng, Yihan Bian, Dawei Liu, et al.
MultiPL-MoE:ハイブリッドMixture-of-Expertsによる大規模言語モデルの多プログラミング・多言語拡張
LLM
コード生成
Qing Wang, Xue Han, Jiahui Wang, et al.
CapRL:強化学習を用いた密集画像記述能力の促進
画像説明
視覚質問応答
Long Xing, Xiaoyi Dong, Yuhang Zang, et al.
離散拡散発散指令による超高速言語生成
拡散モデル
テキスト生成
Haoyang Zheng, Xinyang Liu, Cindy Xiangrui Kong, et al.
DisCO:識別的制約最適化を用いた大規模推論モデルの強化
強化学習
Reasoning
Gang Li, Ming Lin, Tomer Galanti, et al.
QSVD:低精度視覚言語モデルにおける統合的クエリ・キー・バリュー重み圧縮のための効率的低ランク近似
Transformer
視覚質問応答
Yutong Wang, Haiyu Wang, Sai Qian Zhang
1
11
12
13
14
15
16
17
47
MSRNet:偽装物体検出のためのマルチスケール再帰的ネットワーク
オブジェクト検出
セマンティックセグメンテーション
Leena Alghamdi, Muhammad Usman, Hafeez Anwar, et al.
予算考慮型のツール利用は効果的なAgentスケーリングを可能にする
エージェント
LLM
Tengxiao Liu, Zifeng Wang, Jin Miao, et al.
動画内指示:生成制御としての視覚信号
画像から動画生成
動画生成
Gongfan Fang, Xinyin Ma, Xinchao Wang
DR Tulu:深層リサーチのための進化的ルーブリックを用いた強化学習
強化学習
インテリジェントな質問応答
Rulin Shao, Akari Asai, Shannon Zejiang Shen, et al.
AICC:HTML解析の精緻化とモデル性能の向上 —— モデルベースのHTMLパーサーにより構築された7.3TのAI-Readyコーパス
LLM
ドキュメント理解
Ren Ma, Jiantao Qiu, Chao Xu, et al.
UltraFlux:多様なアスペクト比に対応した高品質なネイティブ4Kテキスト画像生成のためのデータ・モデル協調設計
テキストから画像生成
拡散モデル
Tian Ye, Song Fei, Lei Zhu
DeCo:エンドツーエンド画像生成のための周波数分離ピクセル拡散
拡散モデル
画像生成
Zehong Ma, Longhui Wei, Shuai Wang, et al.
生成的ユーザーインターフェースの判定者としてのComputer-Use Agent
エージェント
コード生成
Kevin Qinghong Lin, Siyuan Hu, Linjie Li, et al.
AutoEnv:環境横断的なAgent学習を測定するための自動化環境
強化学習
エージェント
Jiayi Zhang, Yiran Peng, Fanqi Kong, et al.
Deep Researchによる汎用Agentメモリ
検索拡張生成
エージェント
B. Y. Yan, Chaofan Li, Hongjin Qian, et al.
VIRAL:人型ロボットの運動操作におけるスケールアップ型視覚シミュレーションから現実への展開
強化学習
コンピュータビジョン
Tairan He, Zi Wang, Haoru Xue, et al.
MIST:教師あり学習による相互情報量
ニューラルネットワーク
ディープラーニング
German Gritsai, Megan Richards, Maxime Méloux, et al.
Multi-Agentディープリサーチ:M-GRPOを用いたMulti-Agentシステムの学習
強化学習
エージェント
Haoyang Hong, Jiajun Yin, Yuan Wang, et al.
データなしのフローマップ蒸留
拡散モデル
合成
Shangyuan Tong, Nanye Ma, Saining Xie, et al.
フニエンOCR 技術報告
OCR
視覚質問応答
Tencent Hunyuan Vision Team, Jie Jiang, Linus, et al.
PhysToolBench:MLLMsにおける物理ツール理解のベンチマーク
視覚質問応答
ベンチマーク
Zixin Zhang, Kanghao Chen, Xingwang Lin, et al.
ハクスリー・ゲーデル機械:最適自己改善機械の近似による人間レベルのコーディングエージェントの開発
エージェント
人工知能
Wenyi Wang, Piotr Piękos, Li Nanbo, et al.
空間的超感応を用いずに空間的超感応を解く
ビデオ理解
コンピュータビジョン
Vishaal Udandarao, Shyamgopal Karthik, Surabhi S. Nath, et al.
Parrot:出力の真実性に対する説得および同意への頑健性評価——LLMsのための迎合性頑健性ベンチマーク
LLM
ベンチマーク
Yusuf Çelebi, Mahmoud El Hussieni, Özay Ezerceli
O-Mem:パーソナライズされた長期ホライゾンの自己進化型Agentのためのオムニメモリシステム
LLM
ベンチマーク
Piaohong Wang, Motong Tian, Jiaxian Li, et al.
テキストの内在的次元の解明:学術要旨から創作物語まで
LLM
自然言語処理
Vladislav Pedashenko, Laida Kushnareva, Yana Khassan Nibal, et al.
SAM 3:概念を用いたSegment Anything
コンピュータビジョン
セマンティックセグメンテーション
Nicolas Carion, Laura Gustafson, Yuan-Ting Hu, et al.
GeoVista:地理的位置特定のためのWeb拡張型Agent視覚的推論
エージェント
検索拡張生成
Yikun Wang, Zuyan Liu, Ziyi Wang, et al.
OpenMMReasoner:オープンかつ汎用的なレシピによるマルチモーダル推論のフロンティアの開拓
監視付き微調整
Reasoning
Kaichen Zhang, Keming Wu, Zuhao Yang, et al.
HiPO:大規模言語モデルにおける動的推論向けハイブリッド方策最適化
Reasoning
強化学習
Ken Deng, Zizheng Zhan, Wen Xiang, et al.
SERES:スパースな視点からの意味認識型ニューラル再構成
3D生成
コンピュータビジョン
Bo Xu, Yuhu Guo, Yuchao Wang, et al.
SDAR:スケーラブルなシーケンス生成のための相乗効果を持つ拡散-自己回帰パラダイム
拡散モデル
モデル学習
Shuang Cheng, Yihan Bian, Dawei Liu, et al.
MultiPL-MoE:ハイブリッドMixture-of-Expertsによる大規模言語モデルの多プログラミング・多言語拡張
LLM
コード生成
Qing Wang, Xue Han, Jiahui Wang, et al.
CapRL:強化学習を用いた密集画像記述能力の促進
画像説明
視覚質問応答
Long Xing, Xiaoyi Dong, Yuhang Zang, et al.
離散拡散発散指令による超高速言語生成
拡散モデル
テキスト生成
Haoyang Zheng, Xinyang Liu, Cindy Xiangrui Kong, et al.
DisCO:識別的制約最適化を用いた大規模推論モデルの強化
強化学習
Reasoning
Gang Li, Ming Lin, Tomer Galanti, et al.
QSVD:低精度視覚言語モデルにおける統合的クエリ・キー・バリュー重み圧縮のための効率的低ランク近似
Transformer
視覚質問応答
Yutong Wang, Haiyu Wang, Sai Qian Zhang
1
11
12
13
14
15
16
17
47