HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
GVPO:大規模言語モデル微調整のためのグループ分散方策最適化
Preference Modeling
モデル学習
Kaichen Zhang, Yuzhong Hong, Junwei Bao, et al.
ReCA:リアルタイムかつ効率的な協調型身体的自律エージェントのための統合的加速手法
エムボディドインテリジェンス
ロボティクス
Zishen Wan, Yuhang Du, Mohamed Ibrahim, et al.
DexFlyWheel:多指灵巧操作向けスケーラブルかつ自己改善型データ生成フレームワーク
ロボティクス
強化学習
Kefei Zhu, Fengshuo Bai, YuanHao Xiang, et al.
NovaFlow:生成動画からの行動可能フローを用いたゼロショット操作
Any-to-Any
テキストから動画
Hongyu Li, Lingfeng Sun, Yafei Hu, et al.
TreeSynth:木構造を用いた部分空間分割による新規多様なデータの合成
合成
データセット
Sheng Wang, Pengan Chen, Jingqi Zhou, et al.
GTA:大規模言語モデルを用いたテキスト分類のための教師付きガイド付き強化学習
監視付き微調整
強化学習
Ivan Anishchenko, Yakov Kipnis, Indrek Kalvet, et al.
PLACERを用いたタンパク質-低分子の構造集合体のモデリング
ディープラーニング
モデリング
Ivan Anishchenko, Yakov Kipnis, Indrek Kalvet, et al.
エージェンティック・コンテキスト工学:自己改善型言語モデルのための進化するコンテキスト
エージェント
LLM
Qizheng Zhang, Changran Hu, Shubhangi Upasani, et al.
DiaMoE-TTS:Mixture-of-Expertsとパラメータ効率的なゼロショット適応を備えた統一的IPAベースの方言TTSフレームワーク
Text-to-Speech
Any-to-Any
Ziqi Chen, Gongyu Chen, Yihua Wang, et al.
AI支援AR組立:拡張現実を用いた組立におけるオブジェクト認識とコンピュータビジョン
オブジェクト検出
オブジェクト認識
Alexander Htet Kyaw, Haotian Ma, Sasa Zivkovic, et al.
ハイベイクイン・ザ・ヘイストック
LLM
ベンチマーク
Rishi Rajesh Shah, Chen Henry Wu, Shashwat Saxena, et al.
CritiCal:批判はLLMの不確実性または信頼度の補正に役立つだろうか?
LLM
Reasoning
Qing Zong, Jiayu Liu, Tianshi Zheng, et al.
大規模な視覚言語モデルにおける幻覚現象の軽減のためのテキスト埋め込みの精緻化
マルチモーダル
マルチモーダル表現
Aakriti Agrawal, Gouthaman KV, Rohith Aralikatti, et al.
視覚空間的チューニング
マルチモーダル
マルチモーダル表現
Rui Yang, Ziyu Zhu, Yanwei Li, et al.
良すぎることの悪さ:大規模言語モデルが悪役を演じることに失敗する理由
LLM
データセット
Zihao Yi, Qingxuan Jiang, Ruotian Ma, et al.
DeepEyesV2:エージェント型マルチモーダルモデルへの道
エージェント
LLM
Jack Hong, Chenxiao Zhao, ChengLin Zhu, et al.
機械学習を用いた連続血糖測定による代謝サブフェノタイプの同定と精密なライフスタイル変容の支援
ディープラーニング
モデリング
Ahmed A. Metwally, Heyjun Park, Yue Wu, et al.
テスト時に事前学習データを再利用することはコンピュート倍増要因である
LLM
検索拡張生成
Alex Fang, Thomas Voice, Ruoming Pang, et al.
NVIDIA Nemotron Nano V2 VL
LLM
マルチモーダル
NVIDIA, Amala Sanjay Deshmukh, Kateryna Chumachenko, et al.
CostBench:大規模言語モデルのツール利用エージェントにおける動的環境下での多ターンにわたるコスト最適な計画と適応の評価
エージェント
ベンチマーク
Jiayu Liu, Cheng Qian, Zhaochen Su, et al.
Cambrian-S:動画における空間スーパーセンシングへの道
ビデオ理解
マルチモーダル
Shusheng Yang, Jihan Yang, Pinzhi Huang, et al.
経験合成を用いたエージェント学習のスケーリング
強化学習
エージェント
Zhaorun Chen, Zhuokai Zhao, Kai Zhang, et al.
V-Thinker:画像を用いたインタラクティブな思考
Reasoning
エージェント
Runqi Qiao, Qiuna Tan, Minghan Yang, et al.
ビデオによる思考:ビデオ生成を新たなマルチモーダル推論枠組みとして
動画生成
マルチモーダル
Jingqi Tong, Yurong Mou, Hangcheng Li, et al.
琥珀酸バイオ分子シミュレーションの最新動向
タンパク質
生物分子
David A. Case, David S. Cerutti, Vinicius Wilian D. Cruzeiro, et al.
UltraHR-100K:大規模で高品質なデータセットを活用したUHR画像合成の向上
テキストから画像生成
拡散モデル
Chen Zhao, En Ci, Yunzhe Xu, et al.
5次元から多数次元へ:大規模言語モデルを用いた精密かつ解釈可能な心理的プロファイリング
LLM
Reasoning
Yi-Fei Liu, Yi-Long Lu, Di He, et al.
テキスト、音声、画像、動画のマルチモーダル生成のためのノードベース編集
マルチモーダル
マルチモーダル表現
Alexander Htet Kyaw, Lenin Ravindranath Sivalingam
DR. WELL:身体化LLMを用いたマルチエージェント協働のための記号的ワールドモデルを用いた動的推論と学習
エージェント
Reasoning
Narjes Nourzad, Hanqing Yang, Shiyu Chen, et al.
Orion-MSP:テーブル型のコンテキスト内学習のための多スケールスパースアテンション
Transformer
ディープラーニング
Mohamed Bouadi, Pratinav Seth, Aditya Tanna, et al.
TabTune:テーブル型基礎モデルの推論およびファインチューニングを統合したライブラリ
監視付き微調整
ベンチマーク
Aditya Tanna, Pratinav Seth, Mohamed Bouadi, et al.
Step-Audio-EditX 技術報告
Text-to-Speech
合成
Chao Yan, Boyong Wu, Peng Yang, et al.
1
16
17
18
19
20
21
22
48
GVPO:大規模言語モデル微調整のためのグループ分散方策最適化
Preference Modeling
モデル学習
Kaichen Zhang, Yuzhong Hong, Junwei Bao, et al.
ReCA:リアルタイムかつ効率的な協調型身体的自律エージェントのための統合的加速手法
エムボディドインテリジェンス
ロボティクス
Zishen Wan, Yuhang Du, Mohamed Ibrahim, et al.
DexFlyWheel:多指灵巧操作向けスケーラブルかつ自己改善型データ生成フレームワーク
ロボティクス
強化学習
Kefei Zhu, Fengshuo Bai, YuanHao Xiang, et al.
NovaFlow:生成動画からの行動可能フローを用いたゼロショット操作
Any-to-Any
テキストから動画
Hongyu Li, Lingfeng Sun, Yafei Hu, et al.
TreeSynth:木構造を用いた部分空間分割による新規多様なデータの合成
合成
データセット
Sheng Wang, Pengan Chen, Jingqi Zhou, et al.
GTA:大規模言語モデルを用いたテキスト分類のための教師付きガイド付き強化学習
監視付き微調整
強化学習
Ivan Anishchenko, Yakov Kipnis, Indrek Kalvet, et al.
PLACERを用いたタンパク質-低分子の構造集合体のモデリング
ディープラーニング
モデリング
Ivan Anishchenko, Yakov Kipnis, Indrek Kalvet, et al.
エージェンティック・コンテキスト工学:自己改善型言語モデルのための進化するコンテキスト
エージェント
LLM
Qizheng Zhang, Changran Hu, Shubhangi Upasani, et al.
DiaMoE-TTS:Mixture-of-Expertsとパラメータ効率的なゼロショット適応を備えた統一的IPAベースの方言TTSフレームワーク
Text-to-Speech
Any-to-Any
Ziqi Chen, Gongyu Chen, Yihua Wang, et al.
AI支援AR組立:拡張現実を用いた組立におけるオブジェクト認識とコンピュータビジョン
オブジェクト検出
オブジェクト認識
Alexander Htet Kyaw, Haotian Ma, Sasa Zivkovic, et al.
ハイベイクイン・ザ・ヘイストック
LLM
ベンチマーク
Rishi Rajesh Shah, Chen Henry Wu, Shashwat Saxena, et al.
CritiCal:批判はLLMの不確実性または信頼度の補正に役立つだろうか?
LLM
Reasoning
Qing Zong, Jiayu Liu, Tianshi Zheng, et al.
大規模な視覚言語モデルにおける幻覚現象の軽減のためのテキスト埋め込みの精緻化
マルチモーダル
マルチモーダル表現
Aakriti Agrawal, Gouthaman KV, Rohith Aralikatti, et al.
視覚空間的チューニング
マルチモーダル
マルチモーダル表現
Rui Yang, Ziyu Zhu, Yanwei Li, et al.
良すぎることの悪さ:大規模言語モデルが悪役を演じることに失敗する理由
LLM
データセット
Zihao Yi, Qingxuan Jiang, Ruotian Ma, et al.
DeepEyesV2:エージェント型マルチモーダルモデルへの道
エージェント
LLM
Jack Hong, Chenxiao Zhao, ChengLin Zhu, et al.
機械学習を用いた連続血糖測定による代謝サブフェノタイプの同定と精密なライフスタイル変容の支援
ディープラーニング
モデリング
Ahmed A. Metwally, Heyjun Park, Yue Wu, et al.
テスト時に事前学習データを再利用することはコンピュート倍増要因である
LLM
検索拡張生成
Alex Fang, Thomas Voice, Ruoming Pang, et al.
NVIDIA Nemotron Nano V2 VL
LLM
マルチモーダル
NVIDIA, Amala Sanjay Deshmukh, Kateryna Chumachenko, et al.
CostBench:大規模言語モデルのツール利用エージェントにおける動的環境下での多ターンにわたるコスト最適な計画と適応の評価
エージェント
ベンチマーク
Jiayu Liu, Cheng Qian, Zhaochen Su, et al.
Cambrian-S:動画における空間スーパーセンシングへの道
ビデオ理解
マルチモーダル
Shusheng Yang, Jihan Yang, Pinzhi Huang, et al.
経験合成を用いたエージェント学習のスケーリング
強化学習
エージェント
Zhaorun Chen, Zhuokai Zhao, Kai Zhang, et al.
V-Thinker:画像を用いたインタラクティブな思考
Reasoning
エージェント
Runqi Qiao, Qiuna Tan, Minghan Yang, et al.
ビデオによる思考:ビデオ生成を新たなマルチモーダル推論枠組みとして
動画生成
マルチモーダル
Jingqi Tong, Yurong Mou, Hangcheng Li, et al.
琥珀酸バイオ分子シミュレーションの最新動向
タンパク質
生物分子
David A. Case, David S. Cerutti, Vinicius Wilian D. Cruzeiro, et al.
UltraHR-100K:大規模で高品質なデータセットを活用したUHR画像合成の向上
テキストから画像生成
拡散モデル
Chen Zhao, En Ci, Yunzhe Xu, et al.
5次元から多数次元へ:大規模言語モデルを用いた精密かつ解釈可能な心理的プロファイリング
LLM
Reasoning
Yi-Fei Liu, Yi-Long Lu, Di He, et al.
テキスト、音声、画像、動画のマルチモーダル生成のためのノードベース編集
マルチモーダル
マルチモーダル表現
Alexander Htet Kyaw, Lenin Ravindranath Sivalingam
DR. WELL:身体化LLMを用いたマルチエージェント協働のための記号的ワールドモデルを用いた動的推論と学習
エージェント
Reasoning
Narjes Nourzad, Hanqing Yang, Shiyu Chen, et al.
Orion-MSP:テーブル型のコンテキスト内学習のための多スケールスパースアテンション
Transformer
ディープラーニング
Mohamed Bouadi, Pratinav Seth, Aditya Tanna, et al.
TabTune:テーブル型基礎モデルの推論およびファインチューニングを統合したライブラリ
監視付き微調整
ベンチマーク
Aditya Tanna, Pratinav Seth, Mohamed Bouadi, et al.
Step-Audio-EditX 技術報告
Text-to-Speech
合成
Chao Yan, Boyong Wu, Peng Yang, et al.
1
16
17
18
19
20
21
22
48