HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
テスト時に事前学習データを再利用することはコンピュート倍増要因である
LLM
検索拡張生成
Alex Fang, Thomas Voice, Ruoming Pang, et al.
NVIDIA Nemotron Nano V2 VL
LLM
マルチモーダル
NVIDIA, Amala Sanjay Deshmukh, Kateryna Chumachenko, et al.
CostBench:大規模言語モデルのツール利用エージェントにおける動的環境下での多ターンにわたるコスト最適な計画と適応の評価
エージェント
ベンチマーク
Jiayu Liu, Cheng Qian, Zhaochen Su, et al.
Cambrian-S:動画における空間スーパーセンシングへの道
ビデオ理解
マルチモーダル
Shusheng Yang, Jihan Yang, Pinzhi Huang, et al.
経験合成を用いたエージェント学習のスケーリング
強化学習
エージェント
Zhaorun Chen, Zhuokai Zhao, Kai Zhang, et al.
V-Thinker:画像を用いたインタラクティブな思考
Reasoning
エージェント
Runqi Qiao, Qiuna Tan, Minghan Yang, et al.
ビデオによる思考:ビデオ生成を新たなマルチモーダル推論枠組みとして
動画生成
マルチモーダル
Jingqi Tong, Yurong Mou, Hangcheng Li, et al.
琥珀酸バイオ分子シミュレーションの最新動向
タンパク質
生物分子
David A. Case, David S. Cerutti, Vinicius Wilian D. Cruzeiro, et al.
UltraHR-100K:大規模で高品質なデータセットを活用したUHR画像合成の向上
テキストから画像生成
拡散モデル
Chen Zhao, En Ci, Yunzhe Xu, et al.
5次元から多数次元へ:大規模言語モデルを用いた精密かつ解釈可能な心理的プロファイリング
LLM
Reasoning
Yi-Fei Liu, Yi-Long Lu, Di He, et al.
テキスト、音声、画像、動画のマルチモーダル生成のためのノードベース編集
マルチモーダル
マルチモーダル表現
Alexander Htet Kyaw, Lenin Ravindranath Sivalingam
DR. WELL:身体化LLMを用いたマルチエージェント協働のための記号的ワールドモデルを用いた動的推論と学習
エージェント
Reasoning
Narjes Nourzad, Hanqing Yang, Shiyu Chen, et al.
Orion-MSP:テーブル型のコンテキスト内学習のための多スケールスパースアテンション
Transformer
ディープラーニング
Mohamed Bouadi, Pratinav Seth, Aditya Tanna, et al.
TabTune:テーブル型基礎モデルの推論およびファインチューニングを統合したライブラリ
監視付き微調整
ベンチマーク
Aditya Tanna, Pratinav Seth, Mohamed Bouadi, et al.
Step-Audio-EditX 技術報告
Text-to-Speech
合成
Chao Yan, Boyong Wu, Peng Yang, et al.
LEGO-Eval:ツール拡張を用いた3D身体化環境の合成における細粒度評価へ向けて
マルチモーダル
ベンチマーク
Gyeom Hwangbo, Hyungjoo Chae, Minseok Kang, et al.
UniAVGen:非対称なクロスモーダル相互作用を有する統一音声・映像生成
Any-to-Any
合成
Guozhen Zhang, Zixiang Zhou, Teng Hu, et al.
拡散言語モデルは超データ学習者である
自然言語処理
ディープラーニング
Jinjie Ni, Qian Liu, Longxu Dou, et al.
UNO-Bench:オムニモデルにおける単モーダルとオムニモーダルの構成則を探索するための統一ベンチマーク
ベンチマーク
データセット
Chen Chen, ZeYang Hu, Fengjiao Chen, et al.
拡散モデルを用いた動的人口分布を認識した人間の軌道生成
拡散モデル
モデリング
Qingyue Long, Can Rong, Tong Li, et al.
3D生成AIおよびビジョン言語モデルを用いた多部品オブジェクトのロボットアセンブリ
視覚質問応答
ロボティクス
Alexander Htet Kyaw, Richa Gupta, Dhruv Shah, et al.
コスモス:自律的発見を実現するAIサイエンティスト
エージェント
サイエンスのためのAI
Ludovico Mitchener, Angela Yiu, Benjamin Chang, et al.
短いが劣らない:数学RLVRにおける容易なサンプルを長さ正則化子として用いた節約的推論
LLM
Reasoning
Abdelaziz Bounhar, Hadi Abdine, Evan Dufraisse, et al.
Brain-IT:脳相互作用トランスフォーマーを用いたfMRIからの画像再構成
マルチモーダル
コンピュータビジョン
Roman Beliy, Amit Zalcher, Jonathan Kogman, et al.
モダリティの衝突時:単モダリティ推論の不確実性がMLLMsにおける好ましさの動態を支配するメカニズム
視覚質問応答
Reasoning
Zhuoran Zhang, Tengyue Wang, Xilin Gong, et al.
VLAを盲目にしない:OOD一般化のための視覚表現の整合
マルチモーダル
マルチモーダル表現
Nikita Kachaev, Mikhail Kolosov, Daniil Zelezetsky, et al.
視覚化が推論の第一歩であるとき:視覚的連鎖思考のためのベンチマークMIRA
マルチモーダル
Reasoning
Yiyang Zhou, Haoqin Tu, Zijun Wang, et al.
VCode:記号的視覚表現としてのSVGを用いたマルチモーダルコーディングベンチマーク
コード生成
マルチモーダル
Kevin Qinghong Lin, Yuhao Zheng, Hangyu Ran, et al.
AI生産性指数(APEX)
ベンチマーク
LLM
Bertie Vidgen, Abby Fennelly, Evan Pinnix, et al.
フレーム連鎖:フレーム認識型推論による多モーダルLLMにおける動画理解の進展
ビデオ理解
視覚質問応答
Sara Ghazanfari, Francesco Croce, Nicolas Flammarion, et al.
ロバストな数学的推論への道
ベンチマーク
Reasoning
Thang Luong, Dawsen Hwang, Hoang H. Nguyen, et al.
将来の宇宙基盤型で高スケーラビリティを備えたAIインフラシステム設計へ
高性能計算
サイエンスのためのAI
Blaise Agüera y Arcas, Travis Beals, Maria Biggs, et al.
1
15
16
17
18
19
20
21
47
テスト時に事前学習データを再利用することはコンピュート倍増要因である
LLM
検索拡張生成
Alex Fang, Thomas Voice, Ruoming Pang, et al.
NVIDIA Nemotron Nano V2 VL
LLM
マルチモーダル
NVIDIA, Amala Sanjay Deshmukh, Kateryna Chumachenko, et al.
CostBench:大規模言語モデルのツール利用エージェントにおける動的環境下での多ターンにわたるコスト最適な計画と適応の評価
エージェント
ベンチマーク
Jiayu Liu, Cheng Qian, Zhaochen Su, et al.
Cambrian-S:動画における空間スーパーセンシングへの道
ビデオ理解
マルチモーダル
Shusheng Yang, Jihan Yang, Pinzhi Huang, et al.
経験合成を用いたエージェント学習のスケーリング
強化学習
エージェント
Zhaorun Chen, Zhuokai Zhao, Kai Zhang, et al.
V-Thinker:画像を用いたインタラクティブな思考
Reasoning
エージェント
Runqi Qiao, Qiuna Tan, Minghan Yang, et al.
ビデオによる思考:ビデオ生成を新たなマルチモーダル推論枠組みとして
動画生成
マルチモーダル
Jingqi Tong, Yurong Mou, Hangcheng Li, et al.
琥珀酸バイオ分子シミュレーションの最新動向
タンパク質
生物分子
David A. Case, David S. Cerutti, Vinicius Wilian D. Cruzeiro, et al.
UltraHR-100K:大規模で高品質なデータセットを活用したUHR画像合成の向上
テキストから画像生成
拡散モデル
Chen Zhao, En Ci, Yunzhe Xu, et al.
5次元から多数次元へ:大規模言語モデルを用いた精密かつ解釈可能な心理的プロファイリング
LLM
Reasoning
Yi-Fei Liu, Yi-Long Lu, Di He, et al.
テキスト、音声、画像、動画のマルチモーダル生成のためのノードベース編集
マルチモーダル
マルチモーダル表現
Alexander Htet Kyaw, Lenin Ravindranath Sivalingam
DR. WELL:身体化LLMを用いたマルチエージェント協働のための記号的ワールドモデルを用いた動的推論と学習
エージェント
Reasoning
Narjes Nourzad, Hanqing Yang, Shiyu Chen, et al.
Orion-MSP:テーブル型のコンテキスト内学習のための多スケールスパースアテンション
Transformer
ディープラーニング
Mohamed Bouadi, Pratinav Seth, Aditya Tanna, et al.
TabTune:テーブル型基礎モデルの推論およびファインチューニングを統合したライブラリ
監視付き微調整
ベンチマーク
Aditya Tanna, Pratinav Seth, Mohamed Bouadi, et al.
Step-Audio-EditX 技術報告
Text-to-Speech
合成
Chao Yan, Boyong Wu, Peng Yang, et al.
LEGO-Eval:ツール拡張を用いた3D身体化環境の合成における細粒度評価へ向けて
マルチモーダル
ベンチマーク
Gyeom Hwangbo, Hyungjoo Chae, Minseok Kang, et al.
UniAVGen:非対称なクロスモーダル相互作用を有する統一音声・映像生成
Any-to-Any
合成
Guozhen Zhang, Zixiang Zhou, Teng Hu, et al.
拡散言語モデルは超データ学習者である
自然言語処理
ディープラーニング
Jinjie Ni, Qian Liu, Longxu Dou, et al.
UNO-Bench:オムニモデルにおける単モーダルとオムニモーダルの構成則を探索するための統一ベンチマーク
ベンチマーク
データセット
Chen Chen, ZeYang Hu, Fengjiao Chen, et al.
拡散モデルを用いた動的人口分布を認識した人間の軌道生成
拡散モデル
モデリング
Qingyue Long, Can Rong, Tong Li, et al.
3D生成AIおよびビジョン言語モデルを用いた多部品オブジェクトのロボットアセンブリ
視覚質問応答
ロボティクス
Alexander Htet Kyaw, Richa Gupta, Dhruv Shah, et al.
コスモス:自律的発見を実現するAIサイエンティスト
エージェント
サイエンスのためのAI
Ludovico Mitchener, Angela Yiu, Benjamin Chang, et al.
短いが劣らない:数学RLVRにおける容易なサンプルを長さ正則化子として用いた節約的推論
LLM
Reasoning
Abdelaziz Bounhar, Hadi Abdine, Evan Dufraisse, et al.
Brain-IT:脳相互作用トランスフォーマーを用いたfMRIからの画像再構成
マルチモーダル
コンピュータビジョン
Roman Beliy, Amit Zalcher, Jonathan Kogman, et al.
モダリティの衝突時:単モダリティ推論の不確実性がMLLMsにおける好ましさの動態を支配するメカニズム
視覚質問応答
Reasoning
Zhuoran Zhang, Tengyue Wang, Xilin Gong, et al.
VLAを盲目にしない:OOD一般化のための視覚表現の整合
マルチモーダル
マルチモーダル表現
Nikita Kachaev, Mikhail Kolosov, Daniil Zelezetsky, et al.
視覚化が推論の第一歩であるとき:視覚的連鎖思考のためのベンチマークMIRA
マルチモーダル
Reasoning
Yiyang Zhou, Haoqin Tu, Zijun Wang, et al.
VCode:記号的視覚表現としてのSVGを用いたマルチモーダルコーディングベンチマーク
コード生成
マルチモーダル
Kevin Qinghong Lin, Yuhao Zheng, Hangyu Ran, et al.
AI生産性指数(APEX)
ベンチマーク
LLM
Bertie Vidgen, Abby Fennelly, Evan Pinnix, et al.
フレーム連鎖:フレーム認識型推論による多モーダルLLMにおける動画理解の進展
ビデオ理解
視覚質問応答
Sara Ghazanfari, Francesco Croce, Nicolas Flammarion, et al.
ロバストな数学的推論への道
ベンチマーク
Reasoning
Thang Luong, Dawsen Hwang, Hoang H. Nguyen, et al.
将来の宇宙基盤型で高スケーラビリティを備えたAIインフラシステム設計へ
高性能計算
サイエンスのためのAI
Blaise Agüera y Arcas, Travis Beals, Maria Biggs, et al.
1
15
16
17
18
19
20
21
47