HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
WeDLM:高速推論を実現するための拡散言語モデルと標準的な因果アテンションの調和
拡散モデル
LLM
Aiwei Liu, Minghua He, Shaoxun Zeng, et al.
Fun-ASR 技術報告
LLM
音声認識
Keyu An, Yanni Chen, Zhigao Chen, et al.
Geminiを活用した科学研究の加速:事例研究と一般的な手法
サイエンスのためのAI
LLM
David P. Woodruff, Vincent Cohen-Addad, Lalit Jain, et al.
戦略入札を用いた小規模エージェントのスケーリング
エージェント
LLM
Lisa Alazraki, William F. Shen, Yoram Bachrach, et al.
バイブAIGC:エージェント統合によるコンテンツ生成の新たなパラダイム
エージェント
マルチモーダル
Jiaheng Liu, Yuanxing Zhang, Shihao Li, et al.
PaperSearchQA:RLVRを用いた科学論文における検索と推論の学習
検索拡張生成
サイエンスのためのAI
James Burgess, Jan N. Hansen, Duo Peng, et al.
EgoActor:視覚言語モデルを活用した空間認識型自己中心行動へのタスク計画の根拠化による人間型ロボット向けアプローチ
マルチモーダル
視覚質問応答
Yu Bai, MingMing Yu, Chaojie Li, et al.
A-RAG:階層的リトリーブインターフェースを活用したエージェント型リトリーブ増強生成のスケーラビリティ向上
検索拡張生成
エージェント
Mingxuan Du, Benfeng Xu, Chiwei Zhu, et al.
Quant VideoGen:2ビットKVキャッシュ量子化を用いた自己回帰型長時間動画生成
動画生成
拡散モデル
Haocheng Xi, Shuo Yang, Yilong Zhao, et al.
SoMA:ロボット柔体操作における現実世界からシミュレーションへのニューラルシミュレータ
ロボティクス
深度推定
Mu Huang, Hui Wang, Kerui Ren, et al.
3Dアウェアな暗黙的モーション制御を用いた視点適応型人体動画生成
動画生成
3D生成
Zhixue Fang, Xu He, Songlin Tang, et al.
daVinci-Agency:長期スパンのエージェンシー・データを効率的に活用する
LLM
監視付き微調整
Mohan Jiang, Dayuan Fu, Junhao Shi, et al.
世界モデルに関する研究は、単に特定のタスクに世界知識を注入するものにとどまらない
モデリング
エムボディドインテリジェンス
Bohan Zeng, Kaixin Zhu, Daili Hua, et al.
AOrchestra:エージェントオーケストレーションにおけるサブエージェント作成の自動化
エージェント
インテリジェントな質問応答
Jianhao Ruan, Zhihao Xu, Yiran Peng, et al.
チェーン・オブ・シンキングにおけるグローバル・プランの不在:LLMの潜在的計画ホライズンの解明
LLM
Reasoning
Liyan Xu, Mo Yu, Fandong Meng, et al.
CodeOCR:視覚言語モデルのコード理解における有効性について
マルチモーダル
OCR
Yuling Shi, Chaoxiang Xie, Zhensu Sun, et al.
DeepPlanning:検証可能な制約条件を用いた長期予測エージェント計画のベンチマーク
エージェント
LLM
Yinger Zhang, Shutong Jiang, Renhao Li, et al.
CL-bench:コンテキスト学習のためのベンチマーク
LLM
インテリジェントな質問応答
Shihan Dou, Ming Zhang, Zhangyue Yin, et al.
自己蒸留を用いた強化学習
強化学習
検索拡張生成
Jonas Hübotter, Frederike Lübeck, Lejs Behric, et al.
チャットボットを社交的コンパニオンとして:人々が機械における意識、人間らしさ、および社会的健康上の利点をどのように認識しているか
人間-コンピュータインタラクション
心理学
Rose E. Guingrich, Michael S. A. Graziano
POPE:専用オンポリシー探索を活用した難問における推論の学習
強化学習
Reasoning
Yuxiao Qu, Amrith Setlur, Virginia Smith, et al.
UniReason 1.0:世界知識の整合型画像生成および編集を実現する統一推論フレームワーク
テキストから画像生成
マルチモーダル
Dianyi Wang, Chaofan Ma, Feng Han, et al.
ループを閉じる:RPG-Encoderを用いたユニバーサルリポジトリ表現
コード生成
マルチモーダル表現
Jane Luo, Chengyu Yin, Xin Zhang, et al.
ビジョン・ディープリサーチベンチマーク:マルチモーダル大規模言語モデルにおける視覚的およびテキスト検索の再考
視覚質問応答
マルチモーダル
Yu Zeng, Wenxuan Huang, Zhen Fang, et al.
ビジョン・ディープリサーチ:マルチモーダル大規模言語モデルにおけるディープリサーチ能力の促進
検索拡張生成
視覚質問応答
Wenxuan Huang, Yu Zeng, Qiuchen Wang, et al.
Kimi K2.5:視覚的エージェント知能
マルチモーダル
マルチモーダル表現
Kimi Team, Tongtong Bai, Yifan Bai, et al.
Green-VLA:汎用ロボット向けの段階的ビジュアル・言語・アクションモデル
マルチモーダル
Any-to-Any
I. Apanasevich, M. Artemyev, R. Babakyan, et al.
PaperBanana:AI研究者のための学術図解の自動化
テキストから画像生成
サイエンスのためのAI
Dawei Zhu, Rui Meng, Yale Song, et al.
Geminiを用いた準自律的数学発見:Erdős問題に関する事例研究
サイエンスのためのAI
数学
Tony Feng, Trieu Trinh, Garrett Bingham, et al.
潜在チェーン・オブ・シンキングを計画として:推論と言語化を分離する
LLM
Reasoning
Jiecong Wang, Hao Peng, Chunyang Liu
リアルタイム対応型の意味論を超える報酬モデル
強化学習
LLM
Zixuan Huang, Xin Xia, Yuxi Ren, et al.
DenseGRPO:フローマッチングモデルの整合性向上のためのスパースからディンスな報酬へ
拡散モデル
監視付き微調整
Haoyou Deng, Keyu Yan, Chaojie Mao, et al.
1
2
3
4
48
WeDLM:高速推論を実現するための拡散言語モデルと標準的な因果アテンションの調和
拡散モデル
LLM
Aiwei Liu, Minghua He, Shaoxun Zeng, et al.
Fun-ASR 技術報告
LLM
音声認識
Keyu An, Yanni Chen, Zhigao Chen, et al.
Geminiを活用した科学研究の加速:事例研究と一般的な手法
サイエンスのためのAI
LLM
David P. Woodruff, Vincent Cohen-Addad, Lalit Jain, et al.
戦略入札を用いた小規模エージェントのスケーリング
エージェント
LLM
Lisa Alazraki, William F. Shen, Yoram Bachrach, et al.
バイブAIGC:エージェント統合によるコンテンツ生成の新たなパラダイム
エージェント
マルチモーダル
Jiaheng Liu, Yuanxing Zhang, Shihao Li, et al.
PaperSearchQA:RLVRを用いた科学論文における検索と推論の学習
検索拡張生成
サイエンスのためのAI
James Burgess, Jan N. Hansen, Duo Peng, et al.
EgoActor:視覚言語モデルを活用した空間認識型自己中心行動へのタスク計画の根拠化による人間型ロボット向けアプローチ
マルチモーダル
視覚質問応答
Yu Bai, MingMing Yu, Chaojie Li, et al.
A-RAG:階層的リトリーブインターフェースを活用したエージェント型リトリーブ増強生成のスケーラビリティ向上
検索拡張生成
エージェント
Mingxuan Du, Benfeng Xu, Chiwei Zhu, et al.
Quant VideoGen:2ビットKVキャッシュ量子化を用いた自己回帰型長時間動画生成
動画生成
拡散モデル
Haocheng Xi, Shuo Yang, Yilong Zhao, et al.
SoMA:ロボット柔体操作における現実世界からシミュレーションへのニューラルシミュレータ
ロボティクス
深度推定
Mu Huang, Hui Wang, Kerui Ren, et al.
3Dアウェアな暗黙的モーション制御を用いた視点適応型人体動画生成
動画生成
3D生成
Zhixue Fang, Xu He, Songlin Tang, et al.
daVinci-Agency:長期スパンのエージェンシー・データを効率的に活用する
LLM
監視付き微調整
Mohan Jiang, Dayuan Fu, Junhao Shi, et al.
世界モデルに関する研究は、単に特定のタスクに世界知識を注入するものにとどまらない
モデリング
エムボディドインテリジェンス
Bohan Zeng, Kaixin Zhu, Daili Hua, et al.
AOrchestra:エージェントオーケストレーションにおけるサブエージェント作成の自動化
エージェント
インテリジェントな質問応答
Jianhao Ruan, Zhihao Xu, Yiran Peng, et al.
チェーン・オブ・シンキングにおけるグローバル・プランの不在:LLMの潜在的計画ホライズンの解明
LLM
Reasoning
Liyan Xu, Mo Yu, Fandong Meng, et al.
CodeOCR:視覚言語モデルのコード理解における有効性について
マルチモーダル
OCR
Yuling Shi, Chaoxiang Xie, Zhensu Sun, et al.
DeepPlanning:検証可能な制約条件を用いた長期予測エージェント計画のベンチマーク
エージェント
LLM
Yinger Zhang, Shutong Jiang, Renhao Li, et al.
CL-bench:コンテキスト学習のためのベンチマーク
LLM
インテリジェントな質問応答
Shihan Dou, Ming Zhang, Zhangyue Yin, et al.
自己蒸留を用いた強化学習
強化学習
検索拡張生成
Jonas Hübotter, Frederike Lübeck, Lejs Behric, et al.
チャットボットを社交的コンパニオンとして:人々が機械における意識、人間らしさ、および社会的健康上の利点をどのように認識しているか
人間-コンピュータインタラクション
心理学
Rose E. Guingrich, Michael S. A. Graziano
POPE:専用オンポリシー探索を活用した難問における推論の学習
強化学習
Reasoning
Yuxiao Qu, Amrith Setlur, Virginia Smith, et al.
UniReason 1.0:世界知識の整合型画像生成および編集を実現する統一推論フレームワーク
テキストから画像生成
マルチモーダル
Dianyi Wang, Chaofan Ma, Feng Han, et al.
ループを閉じる:RPG-Encoderを用いたユニバーサルリポジトリ表現
コード生成
マルチモーダル表現
Jane Luo, Chengyu Yin, Xin Zhang, et al.
ビジョン・ディープリサーチベンチマーク:マルチモーダル大規模言語モデルにおける視覚的およびテキスト検索の再考
視覚質問応答
マルチモーダル
Yu Zeng, Wenxuan Huang, Zhen Fang, et al.
ビジョン・ディープリサーチ:マルチモーダル大規模言語モデルにおけるディープリサーチ能力の促進
検索拡張生成
視覚質問応答
Wenxuan Huang, Yu Zeng, Qiuchen Wang, et al.
Kimi K2.5:視覚的エージェント知能
マルチモーダル
マルチモーダル表現
Kimi Team, Tongtong Bai, Yifan Bai, et al.
Green-VLA:汎用ロボット向けの段階的ビジュアル・言語・アクションモデル
マルチモーダル
Any-to-Any
I. Apanasevich, M. Artemyev, R. Babakyan, et al.
PaperBanana:AI研究者のための学術図解の自動化
テキストから画像生成
サイエンスのためのAI
Dawei Zhu, Rui Meng, Yale Song, et al.
Geminiを用いた準自律的数学発見:Erdős問題に関する事例研究
サイエンスのためのAI
数学
Tony Feng, Trieu Trinh, Garrett Bingham, et al.
潜在チェーン・オブ・シンキングを計画として:推論と言語化を分離する
LLM
Reasoning
Jiecong Wang, Hao Peng, Chunyang Liu
リアルタイム対応型の意味論を超える報酬モデル
強化学習
LLM
Zixuan Huang, Xin Xia, Yuxi Ren, et al.
DenseGRPO:フローマッチングモデルの整合性向上のためのスパースからディンスな報酬へ
拡散モデル
監視付き微調整
Haoyou Deng, Keyu Yan, Chaojie Mao, et al.
1
2
3
4
48