HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
大きな推論モデルは、不完全な思考からより良い整合性を学習する
LLM
Preference Modeling
ShengYun Peng, Eric Smith, Ivan Evtimov, et al.
プログレッシブ一貫性蒸留を用いた効率的なマルチモーダル大規模言語モデル
マルチモーダル
Transformer
Zichen Wen, Shaobo Wang, Yufa Zhou, et al.
アプリエル-1.5-15b-シンカー
マルチモーダル
視覚質問応答
Shruthan Radhakrishna, Aman Tiwari, Aanjaneya Shukla, et al.
StockBench:大規模言語モデルエージェントは現実の市場で株式を利益を上げて取引できるか?
ベンチマーク
LLM
Yanxu Chen, Zijun Yao, Yantao Liu, et al.
インタラクティブなトレーニング:フィードバック駆動型ニューラルネットワーク最適化
モデル学習
人間-コンピュータインタラクション
Wentao Zhang, Yang Young Lu, Yuntian Deng
StealthAttack:密度誘導幻覚を用いたロバストな3Dガウススプラッティング汚染手法
3D生成
3D マシンビジョン
Bo-Hsu Ke, You-Zhe Xie, Yu-Lun Liu, et al.
ExGRPO:経験から推論するための学習
強化学習
LLM
Runzhe Zhan, Yafu Li, Zhi Wang, et al.
Self-Forcing++:分単位スケールの高品質な動画生成へ
拡散モデル
動画生成
Justin Cui, Jie Wu, Ming Li, et al.
LongCodeZip:コード言語モデル向けの長文脈圧縮手法
コード生成
LLM
Yuling Shi, Yichun Qian, Hongyu Zhang, et al.
PIPer:オンライン強化学習を用いたデバイス内環境設定
強化学習
監視付き微調整
Alexander Kovrigin, Aleksandra Eliseeva, Konstantin Grotov, et al.
マルチドメインのテスト時スケーリングにおける報酬モデルの再考
LLM
監視付き微調整
Dong Bok Lee, Seanie Lee, Sangwoo Park, et al.
ナップサックRL:予算配分最適化によるLLMの探索の解放
強化学習
LLM
Ziniu Li, Congliang Chen, Tianyun Yang, et al.
GEM:エージェンティックなLLM向けのギム
LLM
強化学習
Zichen Liu, Anya Sims, Keyu Duan, et al.
VLA-RFT:世界シミュレーターにおける検証済み報酬を用いた視覚言語行動強化学習のファインチューニング
強化学習
エムボディドインテリジェンス
Hengtao Li, Pengxiang Ding, Runze Suo, et al.
DeepSearch:モンテカルロ木探索を用いた検証可能報酬により強化学習のボトルネックを克服する
強化学習
Reasoning
Fang Wu, Weihao Xuan, Heli Qi, et al.
OceanGym:水中エンボディドエージェント向けベンチマーク環境
エムボディドインテリジェンス
マルチモーダル
Yida Xue, Mingjun Mao, Xiangyuan Ru, et al.
TruthRL:強化学習を用いた真実性を促進する大規模言語モデル
強化学習
監視付き微調整
Zhepei Wei, Xiao Yang, Kai Sun, et al.
剪定のギャンブルに勝つ:効率的な教師あり微調整のための同時サンプル・トークン剪定の統一的アプローチ
監視付き微調整
LLM
Shaobo Wang, Jiaming Wang, Jiajun Zhang, et al.
ドラゴンのひよこ:トランスフォーマーと脳モデルの間の欠けていたつながり
Transformer
自然言語処理
Adrian Kosowski, Przemysław Uznański, Jan Chorowski, et al.
ビジョン・ゼロ:戦略的ゲーム化自己対戦を用いたスケーラブルなVLMの自己改善
視覚質問応答
マルチモーダル
Qinsi Wang, Bo Liu, Tianyi Zhou, et al.
MCPMark:現実的で包括的なMCP利用のストレス試験を目的としたベンチマーク
ベンチマーク
エージェント
Zijian Wu, Xiangyan Liu, Xinyuan Zhang, et al.
検証可能な報酬を用いたLLM推論におけるランダム方策評価は十分である
強化学習
Reasoning
Haoran He, Yuxiao Ye, Qingpeng Cai, et al.
ツールユニバースを活用したAI研究者の民主化
エージェント
Reasoning
Shanghua Gao, Richard Zhu, Pengwei Sui, et al.
推論はいつ重要になるのか?モデル性能への推論の寄与を検証する制御実験
Reasoning
監視付き微調整
Nicolas Boizard, Hippolyte Gisserot-Boukhlef, Kevin El-Haddad, et al.
マルチプレイヤーNash選好最適化
Preference Modeling
強化学習
Fang Wu, Xu Huang, Weihao Xuan, et al.
StableToken:耐ノイズ性を備えた意味的音声トークナイザーによる強靭な音声LLMの実現
音声および音声処理
Transformer
Yuhan Song, Linhao Zhang, Chuhan Wu, et al.
SLA:微調整可能な疎行列アテンションを用いた拡散変換器におけるスパース性の超越
拡散モデル
Transformer
Jintao Zhang, Haoxu Wang, Kai Jiang, et al.
SimpleFold:タンパク質の折りたたみは、あなたが思っているよりも簡単です
Transformer
サイエンスのためのAI
Yuyang Wang, Jiarui Lu, Navdeep Jaitly, et al.
POINTS-Reader:ドキュメント変換向けに教師なし適応を実現する視覚言語モデル
ドキュメント理解
マルチモーダル
Yuan Liu, Zhongyin Zhao, Le Tian, et al.
汎用性のある幾何学的画像キャプション生成
画像説明
マルチモーダル
Yue Xin, Wenyuan Wang, Rui Pan, et al.
強化学習による言語モデル計画の利点と課題:理論的視点から
強化学習
監視付き微調整
Siwei Wang, Yifei Shen, Haoran Sun, et al.
言語モデルエージェントのエンパワーメントの推定
LLM
エージェント
Jinyeop Song, Jeff Gore, Max Kleiman-Weiner
1
32
33
34
35
36
37
38
57
大きな推論モデルは、不完全な思考からより良い整合性を学習する
LLM
Preference Modeling
ShengYun Peng, Eric Smith, Ivan Evtimov, et al.
プログレッシブ一貫性蒸留を用いた効率的なマルチモーダル大規模言語モデル
マルチモーダル
Transformer
Zichen Wen, Shaobo Wang, Yufa Zhou, et al.
アプリエル-1.5-15b-シンカー
マルチモーダル
視覚質問応答
Shruthan Radhakrishna, Aman Tiwari, Aanjaneya Shukla, et al.
StockBench:大規模言語モデルエージェントは現実の市場で株式を利益を上げて取引できるか?
ベンチマーク
LLM
Yanxu Chen, Zijun Yao, Yantao Liu, et al.
インタラクティブなトレーニング:フィードバック駆動型ニューラルネットワーク最適化
モデル学習
人間-コンピュータインタラクション
Wentao Zhang, Yang Young Lu, Yuntian Deng
StealthAttack:密度誘導幻覚を用いたロバストな3Dガウススプラッティング汚染手法
3D生成
3D マシンビジョン
Bo-Hsu Ke, You-Zhe Xie, Yu-Lun Liu, et al.
ExGRPO:経験から推論するための学習
強化学習
LLM
Runzhe Zhan, Yafu Li, Zhi Wang, et al.
Self-Forcing++:分単位スケールの高品質な動画生成へ
拡散モデル
動画生成
Justin Cui, Jie Wu, Ming Li, et al.
LongCodeZip:コード言語モデル向けの長文脈圧縮手法
コード生成
LLM
Yuling Shi, Yichun Qian, Hongyu Zhang, et al.
PIPer:オンライン強化学習を用いたデバイス内環境設定
強化学習
監視付き微調整
Alexander Kovrigin, Aleksandra Eliseeva, Konstantin Grotov, et al.
マルチドメインのテスト時スケーリングにおける報酬モデルの再考
LLM
監視付き微調整
Dong Bok Lee, Seanie Lee, Sangwoo Park, et al.
ナップサックRL:予算配分最適化によるLLMの探索の解放
強化学習
LLM
Ziniu Li, Congliang Chen, Tianyun Yang, et al.
GEM:エージェンティックなLLM向けのギム
LLM
強化学習
Zichen Liu, Anya Sims, Keyu Duan, et al.
VLA-RFT:世界シミュレーターにおける検証済み報酬を用いた視覚言語行動強化学習のファインチューニング
強化学習
エムボディドインテリジェンス
Hengtao Li, Pengxiang Ding, Runze Suo, et al.
DeepSearch:モンテカルロ木探索を用いた検証可能報酬により強化学習のボトルネックを克服する
強化学習
Reasoning
Fang Wu, Weihao Xuan, Heli Qi, et al.
OceanGym:水中エンボディドエージェント向けベンチマーク環境
エムボディドインテリジェンス
マルチモーダル
Yida Xue, Mingjun Mao, Xiangyuan Ru, et al.
TruthRL:強化学習を用いた真実性を促進する大規模言語モデル
強化学習
監視付き微調整
Zhepei Wei, Xiao Yang, Kai Sun, et al.
剪定のギャンブルに勝つ:効率的な教師あり微調整のための同時サンプル・トークン剪定の統一的アプローチ
監視付き微調整
LLM
Shaobo Wang, Jiaming Wang, Jiajun Zhang, et al.
ドラゴンのひよこ:トランスフォーマーと脳モデルの間の欠けていたつながり
Transformer
自然言語処理
Adrian Kosowski, Przemysław Uznański, Jan Chorowski, et al.
ビジョン・ゼロ:戦略的ゲーム化自己対戦を用いたスケーラブルなVLMの自己改善
視覚質問応答
マルチモーダル
Qinsi Wang, Bo Liu, Tianyi Zhou, et al.
MCPMark:現実的で包括的なMCP利用のストレス試験を目的としたベンチマーク
ベンチマーク
エージェント
Zijian Wu, Xiangyan Liu, Xinyuan Zhang, et al.
検証可能な報酬を用いたLLM推論におけるランダム方策評価は十分である
強化学習
Reasoning
Haoran He, Yuxiao Ye, Qingpeng Cai, et al.
ツールユニバースを活用したAI研究者の民主化
エージェント
Reasoning
Shanghua Gao, Richard Zhu, Pengwei Sui, et al.
推論はいつ重要になるのか?モデル性能への推論の寄与を検証する制御実験
Reasoning
監視付き微調整
Nicolas Boizard, Hippolyte Gisserot-Boukhlef, Kevin El-Haddad, et al.
マルチプレイヤーNash選好最適化
Preference Modeling
強化学習
Fang Wu, Xu Huang, Weihao Xuan, et al.
StableToken:耐ノイズ性を備えた意味的音声トークナイザーによる強靭な音声LLMの実現
音声および音声処理
Transformer
Yuhan Song, Linhao Zhang, Chuhan Wu, et al.
SLA:微調整可能な疎行列アテンションを用いた拡散変換器におけるスパース性の超越
拡散モデル
Transformer
Jintao Zhang, Haoxu Wang, Kai Jiang, et al.
SimpleFold:タンパク質の折りたたみは、あなたが思っているよりも簡単です
Transformer
サイエンスのためのAI
Yuyang Wang, Jiarui Lu, Navdeep Jaitly, et al.
POINTS-Reader:ドキュメント変換向けに教師なし適応を実現する視覚言語モデル
ドキュメント理解
マルチモーダル
Yuan Liu, Zhongyin Zhao, Le Tian, et al.
汎用性のある幾何学的画像キャプション生成
画像説明
マルチモーダル
Yue Xin, Wenyuan Wang, Rui Pan, et al.
強化学習による言語モデル計画の利点と課題:理論的視点から
強化学習
監視付き微調整
Siwei Wang, Yifei Shen, Haoran Sun, et al.
言語モデルエージェントのエンパワーメントの推定
LLM
エージェント
Jinyeop Song, Jeff Gore, Max Kleiman-Weiner
1
32
33
34
35
36
37
38
57