HyperAI

メイン

GPU

コンソール
Studio
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

人工知能の未来を築く

概要

当社についてサポートデータセットのヘルプ

製品

ニュース論文ノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

メイン

GPU

コンソール
Studio
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

人工知能の未来を築く

概要

当社についてサポートデータセットのヘルプ

製品

ニュース論文ノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)

マイクロスケーリングFP4量子化における「約束」と「実績」の乖離を埋める

マイクロスケーリングFP4量子化における「約束」と「実績」の乖離を埋める

Vage Egiazarian, Roberto L. Castro, Denis Kuznedelev, et al.

マルチモーダル大規模言語モデルにおける自己改善：サーベイ

マルチモーダル大規模言語モデルにおける自己改善：サーベイ

マルチモーダル

Shijian Deng, Kai Wang, Tianyu Yang, et al.

ポリシーを構成せよ！テスト時における分布レベルの組み合わせによる拡散型またはフロー型ロボットポリシーの改善

拡散モデル

ロボティクス

Jiahang Cao, Yize Huang, Hanzhong Guo, et al.

大きな推論モデルは、不完全な思考からより良い整合性を学習する

Preference Modeling

ShengYun Peng, Eric Smith, Ivan Evtimov, et al.

プログレッシブ一貫性蒸留を用いた効率的なマルチモーダル大規模言語モデル

マルチモーダル

Zichen Wen, Shaobo Wang, Yufa Zhou, et al.

アプリエル-1.5-15b-シンカー

マルチモーダル

視覚質問応答

Shruthan Radhakrishna, Aman Tiwari, Aanjaneya Shukla, et al.

StockBench：大規模言語モデルエージェントは現実の市場で株式を利益を上げて取引できるか？

ベンチマーク

Yanxu Chen, Zijun Yao, Yantao Liu, et al.

インタラクティブなトレーニング：フィードバック駆動型ニューラルネットワーク最適化

モデル学習

人間-コンピュータインタラクション

Wentao Zhang, Yang Young Lu, Yuntian Deng

StealthAttack：密度誘導幻覚を用いたロバストな3Dガウススプラッティング汚染手法

3D マシンビジョン

Bo-Hsu Ke, You-Zhe Xie, Yu-Lun Liu, et al.

ExGRPO：経験から推論するための学習

Runzhe Zhan, Yafu Li, Zhi Wang, et al.

Self-Forcing++：分単位スケールの高品質な動画生成へ

拡散モデル

Justin Cui, Jie Wu, Ming Li, et al.

LongCodeZip：コード言語モデル向けの長文脈圧縮手法

コード生成

Yuling Shi, Yichun Qian, Hongyu Zhang, et al.

PIPer：オンライン強化学習を用いたデバイス内環境設定

監視付き微調整

Alexander Kovrigin, Aleksandra Eliseeva, Konstantin Grotov, et al.

マルチドメインのテスト時スケーリングにおける報酬モデルの再考

監視付き微調整

Dong Bok Lee, Seanie Lee, Sangwoo Park, et al.

ナップサックRL：予算配分最適化によるLLMの探索の解放

Ziniu Li, Congliang Chen, Tianyun Yang, et al.

GEM：エージェンティックなLLM向けのギム

Zichen Liu, Anya Sims, Keyu Duan, et al.

VLA-RFT：世界シミュレーターにおける検証済み報酬を用いた視覚言語行動強化学習のファインチューニング

エムボディドインテリジェンス

Hengtao Li, Pengxiang Ding, Runze Suo, et al.

DeepSearch：モンテカルロ木探索を用いた検証可能報酬により強化学習のボトルネックを克服する

Fang Wu, Weihao Xuan, Heli Qi, et al.

OceanGym：水中エンボディドエージェント向けベンチマーク環境

エムボディドインテリジェンス

マルチモーダル

Yida Xue, Mingjun Mao, Xiangyuan Ru, et al.

TruthRL：強化学習を用いた真実性を促進する大規模言語モデル

監視付き微調整

Zhepei Wei, Xiao Yang, Kai Sun, et al.

剪定のギャンブルに勝つ：効率的な教師あり微調整のための同時サンプル・トークン剪定の統一的アプローチ

監視付き微調整

Shaobo Wang, Jiaming Wang, Jiajun Zhang, et al.

ドラゴンのひよこ：トランスフォーマーと脳モデルの間の欠けていたつながり

自然言語処理

Adrian Kosowski, Przemysław Uznański, Jan Chorowski, et al.

ビジョン・ゼロ：戦略的ゲーム化自己対戦を用いたスケーラブルなVLMの自己改善

視覚質問応答

マルチモーダル

Qinsi Wang, Bo Liu, Tianyi Zhou, et al.

MCPMark：現実的で包括的なMCP利用のストレス試験を目的としたベンチマーク

ベンチマーク

エージェント

Zijian Wu, Xiangyan Liu, Xinyuan Zhang, et al.

検証可能な報酬を用いたLLM推論におけるランダム方策評価は十分である

Haoran He, Yuxiao Ye, Qingpeng Cai, et al.

ツールユニバースを活用したAI研究者の民主化

エージェント

Shanghua Gao, Richard Zhu, Pengwei Sui, et al.

推論はいつ重要になるのか？モデル性能への推論の寄与を検証する制御実験

監視付き微調整

Nicolas Boizard, Hippolyte Gisserot-Boukhlef, Kevin El-Haddad, et al.

マルチプレイヤーNash選好最適化

Preference Modeling

Fang Wu, Xu Huang, Weihao Xuan, et al.

StableToken：耐ノイズ性を備えた意味的音声トークナイザーによる強靭な音声LLMの実現

音声および音声処理

Yuhan Song, Linhao Zhang, Chuhan Wu, et al.

SLA：微調整可能な疎行列アテンションを用いた拡散変換器におけるスパース性の超越

拡散モデル

Jintao Zhang, Haoxu Wang, Kai Jiang, et al.

SimpleFold：タンパク質の折りたたみは、あなたが思っているよりも簡単です

サイエンスのためのAI

Yuyang Wang, Jiarui Lu, Navdeep Jaitly, et al.

POINTS-Reader：ドキュメント変換向けに教師なし適応を実現する視覚言語モデル

ドキュメント理解

マルチモーダル

Yuan Liu, Zhongyin Zhao, Le Tian, et al.

マイクロスケーリングFP4量子化における「約束」と「実績」の乖離を埋める

マイクロスケーリングFP4量子化における「約束」と「実績」の乖離を埋める

Vage Egiazarian, Roberto L. Castro, Denis Kuznedelev, et al.

マルチモーダル大規模言語モデルにおける自己改善：サーベイ

マルチモーダル大規模言語モデルにおける自己改善：サーベイ

マルチモーダル

Shijian Deng, Kai Wang, Tianyu Yang, et al.

ポリシーを構成せよ！テスト時における分布レベルの組み合わせによる拡散型またはフロー型ロボットポリシーの改善

拡散モデル

ロボティクス

Jiahang Cao, Yize Huang, Hanzhong Guo, et al.

大きな推論モデルは、不完全な思考からより良い整合性を学習する

Preference Modeling

ShengYun Peng, Eric Smith, Ivan Evtimov, et al.

プログレッシブ一貫性蒸留を用いた効率的なマルチモーダル大規模言語モデル

マルチモーダル

Zichen Wen, Shaobo Wang, Yufa Zhou, et al.

アプリエル-1.5-15b-シンカー

マルチモーダル

視覚質問応答

Shruthan Radhakrishna, Aman Tiwari, Aanjaneya Shukla, et al.

StockBench：大規模言語モデルエージェントは現実の市場で株式を利益を上げて取引できるか？

ベンチマーク

Yanxu Chen, Zijun Yao, Yantao Liu, et al.

インタラクティブなトレーニング：フィードバック駆動型ニューラルネットワーク最適化

モデル学習

人間-コンピュータインタラクション

Wentao Zhang, Yang Young Lu, Yuntian Deng

StealthAttack：密度誘導幻覚を用いたロバストな3Dガウススプラッティング汚染手法

3D マシンビジョン

Bo-Hsu Ke, You-Zhe Xie, Yu-Lun Liu, et al.

ExGRPO：経験から推論するための学習

Runzhe Zhan, Yafu Li, Zhi Wang, et al.

Self-Forcing++：分単位スケールの高品質な動画生成へ

拡散モデル

Justin Cui, Jie Wu, Ming Li, et al.

LongCodeZip：コード言語モデル向けの長文脈圧縮手法

コード生成

Yuling Shi, Yichun Qian, Hongyu Zhang, et al.

PIPer：オンライン強化学習を用いたデバイス内環境設定

監視付き微調整

Alexander Kovrigin, Aleksandra Eliseeva, Konstantin Grotov, et al.

マルチドメインのテスト時スケーリングにおける報酬モデルの再考

監視付き微調整

Dong Bok Lee, Seanie Lee, Sangwoo Park, et al.

ナップサックRL：予算配分最適化によるLLMの探索の解放

Ziniu Li, Congliang Chen, Tianyun Yang, et al.

GEM：エージェンティックなLLM向けのギム

Zichen Liu, Anya Sims, Keyu Duan, et al.

VLA-RFT：世界シミュレーターにおける検証済み報酬を用いた視覚言語行動強化学習のファインチューニング

エムボディドインテリジェンス

Hengtao Li, Pengxiang Ding, Runze Suo, et al.

DeepSearch：モンテカルロ木探索を用いた検証可能報酬により強化学習のボトルネックを克服する

Fang Wu, Weihao Xuan, Heli Qi, et al.

OceanGym：水中エンボディドエージェント向けベンチマーク環境

エムボディドインテリジェンス

マルチモーダル

Yida Xue, Mingjun Mao, Xiangyuan Ru, et al.

TruthRL：強化学習を用いた真実性を促進する大規模言語モデル

監視付き微調整

Zhepei Wei, Xiao Yang, Kai Sun, et al.

剪定のギャンブルに勝つ：効率的な教師あり微調整のための同時サンプル・トークン剪定の統一的アプローチ

監視付き微調整

Shaobo Wang, Jiaming Wang, Jiajun Zhang, et al.

ドラゴンのひよこ：トランスフォーマーと脳モデルの間の欠けていたつながり

自然言語処理

Adrian Kosowski, Przemysław Uznański, Jan Chorowski, et al.

ビジョン・ゼロ：戦略的ゲーム化自己対戦を用いたスケーラブルなVLMの自己改善

視覚質問応答

マルチモーダル

Qinsi Wang, Bo Liu, Tianyi Zhou, et al.

MCPMark：現実的で包括的なMCP利用のストレス試験を目的としたベンチマーク

ベンチマーク

エージェント

Zijian Wu, Xiangyan Liu, Xinyuan Zhang, et al.

検証可能な報酬を用いたLLM推論におけるランダム方策評価は十分である

Haoran He, Yuxiao Ye, Qingpeng Cai, et al.

ツールユニバースを活用したAI研究者の民主化

エージェント

Shanghua Gao, Richard Zhu, Pengwei Sui, et al.

推論はいつ重要になるのか？モデル性能への推論の寄与を検証する制御実験

監視付き微調整

Nicolas Boizard, Hippolyte Gisserot-Boukhlef, Kevin El-Haddad, et al.

マルチプレイヤーNash選好最適化

Preference Modeling

Fang Wu, Xu Huang, Weihao Xuan, et al.

StableToken：耐ノイズ性を備えた意味的音声トークナイザーによる強靭な音声LLMの実現

音声および音声処理

Yuhan Song, Linhao Zhang, Chuhan Wu, et al.

SLA：微調整可能な疎行列アテンションを用いた拡散変換器におけるスパース性の超越

拡散モデル

Jintao Zhang, Haoxu Wang, Kai Jiang, et al.

SimpleFold：タンパク質の折りたたみは、あなたが思っているよりも簡単です

サイエンスのためのAI

Yuyang Wang, Jiarui Lu, Navdeep Jaitly, et al.

POINTS-Reader：ドキュメント変換向けに教師なし適応を実現する視覚言語モデル

ドキュメント理解

マルチモーダル

Yuan Liu, Zhongyin Zhao, Le Tian, et al.

ポリシーを構成せよ！テスト時における分布レベルの組み合わせによる拡散型またはフロー型ロボットポリシーの改善

大きな推論モデルは、不完全な思考からより良い整合性を学習する

プログレッシブ一貫性蒸留を用いた効率的なマルチモーダル大規模言語モデル

アプリエル-1.5-15b-シンカー

StockBench：大規模言語モデルエージェントは現実の市場で株式を利益を上げて取引できるか？

インタラクティブなトレーニング：フィードバック駆動型ニューラルネットワーク最適化

StealthAttack：密度誘導幻覚を用いたロバストな3Dガウススプラッティング汚染手法

ExGRPO：経験から推論するための学習

Self-Forcing++：分単位スケールの高品質な動画生成へ

LongCodeZip：コード言語モデル向けの長文脈圧縮手法

PIPer：オンライン強化学習を用いたデバイス内環境設定

マルチドメインのテスト時スケーリングにおける報酬モデルの再考

ナップサックRL：予算配分最適化によるLLMの探索の解放

GEM：エージェンティックなLLM向けのギム

VLA-RFT：世界シミュレーターにおける検証済み報酬を用いた視覚言語行動強化学習のファインチューニング

DeepSearch：モンテカルロ木探索を用いた検証可能報酬により強化学習のボトルネックを克服する

OceanGym：水中エンボディドエージェント向けベンチマーク環境

TruthRL：強化学習を用いた真実性を促進する大規模言語モデル

剪定のギャンブルに勝つ：効率的な教師あり微調整のための同時サンプル・トークン剪定の統一的アプローチ

ドラゴンのひよこ：トランスフォーマーと脳モデルの間の欠けていたつながり

ビジョン・ゼロ：戦略的ゲーム化自己対戦を用いたスケーラブルなVLMの自己改善

MCPMark：現実的で包括的なMCP利用のストレス試験を目的としたベンチマーク

検証可能な報酬を用いたLLM推論におけるランダム方策評価は十分である

ツールユニバースを活用したAI研究者の民主化

推論はいつ重要になるのか？モデル性能への推論の寄与を検証する制御実験

マルチプレイヤーNash選好最適化

StableToken：耐ノイズ性を備えた意味的音声トークナイザーによる強靭な音声LLMの実現

SLA：微調整可能な疎行列アテンションを用いた拡散変換器におけるスパース性の超越

SimpleFold：タンパク質の折りたたみは、あなたが思っているよりも簡単です

POINTS-Reader：ドキュメント変換向けに教師なし適応を実現する視覚言語モデル

ポリシーを構成せよ！テスト時における分布レベルの組み合わせによる拡散型またはフロー型ロボットポリシーの改善

大きな推論モデルは、不完全な思考からより良い整合性を学習する

プログレッシブ一貫性蒸留を用いた効率的なマルチモーダル大規模言語モデル

アプリエル-1.5-15b-シンカー

StockBench：大規模言語モデルエージェントは現実の市場で株式を利益を上げて取引できるか？

インタラクティブなトレーニング：フィードバック駆動型ニューラルネットワーク最適化

StealthAttack：密度誘導幻覚を用いたロバストな3Dガウススプラッティング汚染手法

ExGRPO：経験から推論するための学習

Self-Forcing++：分単位スケールの高品質な動画生成へ

LongCodeZip：コード言語モデル向けの長文脈圧縮手法

PIPer：オンライン強化学習を用いたデバイス内環境設定

マルチドメインのテスト時スケーリングにおける報酬モデルの再考

ナップサックRL：予算配分最適化によるLLMの探索の解放

GEM：エージェンティックなLLM向けのギム

VLA-RFT：世界シミュレーターにおける検証済み報酬を用いた視覚言語行動強化学習のファインチューニング

DeepSearch：モンテカルロ木探索を用いた検証可能報酬により強化学習のボトルネックを克服する

OceanGym：水中エンボディドエージェント向けベンチマーク環境

TruthRL：強化学習を用いた真実性を促進する大規模言語モデル

剪定のギャンブルに勝つ：効率的な教師あり微調整のための同時サンプル・トークン剪定の統一的アプローチ

ドラゴンのひよこ：トランスフォーマーと脳モデルの間の欠けていたつながり

ビジョン・ゼロ：戦略的ゲーム化自己対戦を用いたスケーラブルなVLMの自己改善

MCPMark：現実的で包括的なMCP利用のストレス試験を目的としたベンチマーク

検証可能な報酬を用いたLLM推論におけるランダム方策評価は十分である

ツールユニバースを活用したAI研究者の民主化

推論はいつ重要になるのか？モデル性能への推論の寄与を検証する制御実験

マルチプレイヤーNash選好最適化

StableToken：耐ノイズ性を備えた意味的音声トークナイザーによる強靭な音声LLMの実現

SLA：微調整可能な疎行列アテンションを用いた拡散変換器におけるスパース性の超越

SimpleFold：タンパク質の折りたたみは、あなたが思っているよりも簡単です

POINTS-Reader：ドキュメント変換向けに教師なし適応を実現する視覚言語モデル