HyperAI

メイン

GPU

コンソール
Studio
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

人工知能の未来を築く

概要

当社についてサポートデータセットのヘルプ

製品

ニュース論文ノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

メイン

GPU

コンソール
Studio
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

人工知能の未来を築く

概要

当社についてサポートデータセットのヘルプ

製品

ニュース論文ノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)

考える時間を見つける：リアルタイム強化学習における計画予算の学習

考える時間を見つける：リアルタイム強化学習における計画予算の学習

エージェント

Aneesh Muppidi, Firas Darwish, Dylan Cope, et al.

準最適な学習率スケジュールの形状とはどのようなものか？

準最適な学習率スケジュールの形状とはどのようなものか？

ディープラーニング

モデル学習

Hiroki Naganuma, Atish Agarwala, Priya Kasimbeg, et al.

IIDを超えて：表形式基盤モデルは本当にどれほど汎用的か？

ベンチマーク

データセット

Lennart Purucker, Andrej Tschalzev, Nick Erickson, et al.

ReFreeKV: 閾値フリーなKVキャッシュ圧縮を目指して

Xuanfan Ni, Liyan Xu, Chenyang Lyu, et al.

TUA-Bench: 汎用端末操作エージェントのためのベンチマーク

ベンチマーク

エージェント

Shoufa Chen, Luyuan Wang, Xuan Yang, et al.

パラメータではなくホライズンをスケールする：35Bエージェントで1兆パラメータ級の性能を達成

エージェント

監視付き微調整

Agents-A1 Team, Zongsheng Cao, Bihao Zhan, et al.

LiveEdit: リアルタイム拡散ベースストリーミング動画編集に向けて

拡散モデル

ビデオ処理

Xinyu Wang, Chongbo Zhao, Fangneng Zhan, et al.

エージェント的棄権：エージェントは行動する代わりに停止すべき時を知っているか？

エージェント

Han Luo, Bingbing Wen, Lucy Lu Wang

EVA-Bench: 音声エージェント評価のための新たなエンドツーエンドフレームワーク

ベンチマーク

エージェント

Tara Bogavelli, Gabrielle Gauthier Melançon, Katrina Stankiewicz, et al.

SingGuard: 動的推論を備えたポリシー適応型マルチモーダルLLMガードレール

マルチモーダル

SingGuard Team, Yan Hong, Hongcheng Li, et al.

潜在思考の形式化：LLMsにおける思考表現の四つの公理

Fahd Seddik, Fatemeh Fard

MultiHashFormer: ハッシュベースの生成言語モデル

テキスト生成

Huiyin Xue, Atsuki Yamaguchi, Nikolaos Aletras

Qwen-Image-2.0-RL 技術報告

拡散モデル

テキストから画像生成

Yixian Xu, Kaiyuan Gao, Yuxiang Chen, et al.

橋渡し動作としての並進移動：人間からロボットへの操作スキルの伝達

ロボティクス

マルチモーダル

Sijin Chen, Kaixuan Jiang, Haixin Shi, et al.

PhysisForcing: ロボット操作のための物理強化型世界シミュレータ

拡散モデル

Peiwen Zhang, Yufan Deng, Shangkun Sun, et al.

OpenTME: TCGA由来のAI駆動H&E腫瘍微小環境プロファイルのオープンデータセット

データセット

Maaike Galama, Nina Kozar-Gillan, Christina Embacher, et al.

FlashAttention-4: 非対称ハードウェア拡張のためのアルゴリズムとカーネルパイプラインの共同設計

Ted Zadouri, Markus Hoehnerbach, Jay Shah, et al.

DSpark：半自己回帰的生成による自信スケジュール型擬似推論

テキスト生成

Xin Cheng, Xingkai Yu, Chenze Shao, et al.

ViQ: 任意の解像度におけるテキストと整合した視覚量子化表現

マルチモーダル表現

Xumin Yu, Zuyan Liu, Zhenyu Yang, et al.

検証の地平線：コーディングagent報酬に対する銀の弾丸はない

コード生成

エージェント

Binghai Wang, Chenlong Zhang, Dayiheng Liu, et al.

Qwen-Image-Agent: 実世界における画像生成のコンテキストギャップを埋める

テキストから画像生成

Zekai Zhang, Jiahao Li, Jie Zhang, et al.

OPID: エージェント型強化学習のためのオンポリシースキル蒸留

エージェント

Shuo Yang, Jinyang Wu, Zhengxi Lu, et al.

ロボット制御のための文脈内世界モデル

マルチモーダル

マシンビジョン

Siyin Wang, Junhao Shi, Senyu Fei, et al.

DanceOPD: オンポリシー生成フィールド蒸留

テキストから画像生成

Wei Zhou, Xiongwei Zhu, Zelin Xu, et al.

Autodata: 高品質な合成データを作成するためのエージェント型データサイエンティスト

監視付き微調整

Ilia Kulikov, Chenxi Whitehouse, Tianhao Wu, et al.

大規模言語拡散モデルの改良

拡散モデル

テキスト生成

Shen Nie, Qiyang Min, Shaoxuan Xu, et al.

OCR推論はどれほど堅牢か？視覚摂動下におけるビジョン・ランゲージモデルのOCR推論堅牢性の評価

ドキュメント理解

Yuxing Cheng, Yuan Wu, Yi Chang

RoboAtlas: 文脈対応アクティブSLAM

マルチモーダル

3D マシンビジョン

Alexander Schperberg, Shivam K. Panda, Abraham P. Vinod, et al.

意図を考慮したシーン表現による群衆におけるロボット視覚ナビゲーションの学習

Han Bao, Bingyi Xia, Hanjing Ye, et al.

ディープ強化学習強化型イベントトリガー型データ駆動型予測制御のための3次元ケーブル駆動型ソフトロボットアーム

ロボティクス

Cheng Ouyang, Moeen Ul Islam, Kaixiang Zhang, et al.

自然なアングロッキング：事前学習においてどのルールが生き残るかに対する非対称な制御

モデル学習

Juliana Li, Diya Sreedhar

任意の非負整数は三角数、五角数、および七角数の和である

Yichuan Cao, Dakai Guo, Ruichen Qiu, et al.

考える時間を見つける：リアルタイム強化学習における計画予算の学習

考える時間を見つける：リアルタイム強化学習における計画予算の学習

エージェント

Aneesh Muppidi, Firas Darwish, Dylan Cope, et al.

準最適な学習率スケジュールの形状とはどのようなものか？

準最適な学習率スケジュールの形状とはどのようなものか？

ディープラーニング

モデル学習

Hiroki Naganuma, Atish Agarwala, Priya Kasimbeg, et al.

IIDを超えて：表形式基盤モデルは本当にどれほど汎用的か？

ベンチマーク

データセット

Lennart Purucker, Andrej Tschalzev, Nick Erickson, et al.

ReFreeKV: 閾値フリーなKVキャッシュ圧縮を目指して

Xuanfan Ni, Liyan Xu, Chenyang Lyu, et al.

TUA-Bench: 汎用端末操作エージェントのためのベンチマーク

ベンチマーク

エージェント

Shoufa Chen, Luyuan Wang, Xuan Yang, et al.

パラメータではなくホライズンをスケールする：35Bエージェントで1兆パラメータ級の性能を達成

エージェント

監視付き微調整

Agents-A1 Team, Zongsheng Cao, Bihao Zhan, et al.

LiveEdit: リアルタイム拡散ベースストリーミング動画編集に向けて

拡散モデル

ビデオ処理

Xinyu Wang, Chongbo Zhao, Fangneng Zhan, et al.

エージェント的棄権：エージェントは行動する代わりに停止すべき時を知っているか？

エージェント

Han Luo, Bingbing Wen, Lucy Lu Wang

EVA-Bench: 音声エージェント評価のための新たなエンドツーエンドフレームワーク

ベンチマーク

エージェント

Tara Bogavelli, Gabrielle Gauthier Melançon, Katrina Stankiewicz, et al.

SingGuard: 動的推論を備えたポリシー適応型マルチモーダルLLMガードレール

マルチモーダル

SingGuard Team, Yan Hong, Hongcheng Li, et al.

潜在思考の形式化：LLMsにおける思考表現の四つの公理

Fahd Seddik, Fatemeh Fard

MultiHashFormer: ハッシュベースの生成言語モデル

テキスト生成

Huiyin Xue, Atsuki Yamaguchi, Nikolaos Aletras

Qwen-Image-2.0-RL 技術報告

拡散モデル

テキストから画像生成

Yixian Xu, Kaiyuan Gao, Yuxiang Chen, et al.

橋渡し動作としての並進移動：人間からロボットへの操作スキルの伝達

ロボティクス

マルチモーダル

Sijin Chen, Kaixuan Jiang, Haixin Shi, et al.

PhysisForcing: ロボット操作のための物理強化型世界シミュレータ

拡散モデル

Peiwen Zhang, Yufan Deng, Shangkun Sun, et al.

OpenTME: TCGA由来のAI駆動H&E腫瘍微小環境プロファイルのオープンデータセット

データセット

Maaike Galama, Nina Kozar-Gillan, Christina Embacher, et al.

FlashAttention-4: 非対称ハードウェア拡張のためのアルゴリズムとカーネルパイプラインの共同設計

Ted Zadouri, Markus Hoehnerbach, Jay Shah, et al.

DSpark：半自己回帰的生成による自信スケジュール型擬似推論

テキスト生成

Xin Cheng, Xingkai Yu, Chenze Shao, et al.

ViQ: 任意の解像度におけるテキストと整合した視覚量子化表現

マルチモーダル表現

Xumin Yu, Zuyan Liu, Zhenyu Yang, et al.

検証の地平線：コーディングagent報酬に対する銀の弾丸はない

コード生成

エージェント

Binghai Wang, Chenlong Zhang, Dayiheng Liu, et al.

Qwen-Image-Agent: 実世界における画像生成のコンテキストギャップを埋める

テキストから画像生成

Zekai Zhang, Jiahao Li, Jie Zhang, et al.

OPID: エージェント型強化学習のためのオンポリシースキル蒸留

エージェント

Shuo Yang, Jinyang Wu, Zhengxi Lu, et al.

ロボット制御のための文脈内世界モデル

マルチモーダル

マシンビジョン

Siyin Wang, Junhao Shi, Senyu Fei, et al.

DanceOPD: オンポリシー生成フィールド蒸留

テキストから画像生成

Wei Zhou, Xiongwei Zhu, Zelin Xu, et al.

Autodata: 高品質な合成データを作成するためのエージェント型データサイエンティスト

監視付き微調整

Ilia Kulikov, Chenxi Whitehouse, Tianhao Wu, et al.

大規模言語拡散モデルの改良

拡散モデル

テキスト生成

Shen Nie, Qiyang Min, Shaoxuan Xu, et al.

OCR推論はどれほど堅牢か？視覚摂動下におけるビジョン・ランゲージモデルのOCR推論堅牢性の評価

ドキュメント理解

Yuxing Cheng, Yuan Wu, Yi Chang

RoboAtlas: 文脈対応アクティブSLAM

マルチモーダル

3D マシンビジョン

Alexander Schperberg, Shivam K. Panda, Abraham P. Vinod, et al.

意図を考慮したシーン表現による群衆におけるロボット視覚ナビゲーションの学習

Han Bao, Bingyi Xia, Hanjing Ye, et al.

ディープ強化学習強化型イベントトリガー型データ駆動型予測制御のための3次元ケーブル駆動型ソフトロボットアーム

ロボティクス

Cheng Ouyang, Moeen Ul Islam, Kaixiang Zhang, et al.

自然なアングロッキング：事前学習においてどのルールが生き残るかに対する非対称な制御

モデル学習

Juliana Li, Diya Sreedhar

任意の非負整数は三角数、五角数、および七角数の和である

Yichuan Cao, Dakai Guo, Ruichen Qiu, et al.

IIDを超えて：表形式基盤モデルは本当にどれほど汎用的か？

ReFreeKV: 閾値フリーなKVキャッシュ圧縮を目指して

TUA-Bench: 汎用端末操作エージェントのためのベンチマーク

パラメータではなくホライズンをスケールする：35Bエージェントで1兆パラメータ級の性能を達成

LiveEdit: リアルタイム拡散ベースストリーミング動画編集に向けて

エージェント的棄権：エージェントは行動する代わりに停止すべき時を知っているか？

EVA-Bench: 音声エージェント評価のための新たなエンドツーエンドフレームワーク

SingGuard: 動的推論を備えたポリシー適応型マルチモーダルLLMガードレール

潜在思考の形式化：LLMsにおける思考表現の四つの公理

MultiHashFormer: ハッシュベースの生成言語モデル

Qwen-Image-2.0-RL 技術報告

橋渡し動作としての並進移動：人間からロボットへの操作スキルの伝達

PhysisForcing: ロボット操作のための物理強化型世界シミュレータ

OpenTME: TCGA由来のAI駆動H&E腫瘍微小環境プロファイルのオープンデータセット

FlashAttention-4: 非対称ハードウェア拡張のためのアルゴリズムとカーネルパイプラインの共同設計

DSpark：半自己回帰的生成による自信スケジュール型擬似推論

ViQ: 任意の解像度におけるテキストと整合した視覚量子化表現

検証の地平線：コーディングagent報酬に対する銀の弾丸はない

Qwen-Image-Agent: 実世界における画像生成のコンテキストギャップを埋める

OPID: エージェント型強化学習のためのオンポリシースキル蒸留

ロボット制御のための文脈内世界モデル

DanceOPD: オンポリシー生成フィールド蒸留

Autodata: 高品質な合成データを作成するためのエージェント型データサイエンティスト

大規模言語拡散モデルの改良

OCR推論はどれほど堅牢か？視覚摂動下におけるビジョン・ランゲージモデルのOCR推論堅牢性の評価

RoboAtlas: 文脈対応アクティブSLAM

意図を考慮したシーン表現による群衆におけるロボット視覚ナビゲーションの学習

ディープ強化学習強化型イベントトリガー型データ駆動型予測制御のための3次元ケーブル駆動型ソフトロボットアーム

自然なアングロッキング：事前学習においてどのルールが生き残るかに対する非対称な制御

任意の非負整数は三角数、五角数、および七角数の和である

IIDを超えて：表形式基盤モデルは本当にどれほど汎用的か？

ReFreeKV: 閾値フリーなKVキャッシュ圧縮を目指して

TUA-Bench: 汎用端末操作エージェントのためのベンチマーク

パラメータではなくホライズンをスケールする：35Bエージェントで1兆パラメータ級の性能を達成

LiveEdit: リアルタイム拡散ベースストリーミング動画編集に向けて

エージェント的棄権：エージェントは行動する代わりに停止すべき時を知っているか？

EVA-Bench: 音声エージェント評価のための新たなエンドツーエンドフレームワーク

SingGuard: 動的推論を備えたポリシー適応型マルチモーダルLLMガードレール

潜在思考の形式化：LLMsにおける思考表現の四つの公理

MultiHashFormer: ハッシュベースの生成言語モデル

Qwen-Image-2.0-RL 技術報告

橋渡し動作としての並進移動：人間からロボットへの操作スキルの伝達

PhysisForcing: ロボット操作のための物理強化型世界シミュレータ

OpenTME: TCGA由来のAI駆動H&E腫瘍微小環境プロファイルのオープンデータセット

FlashAttention-4: 非対称ハードウェア拡張のためのアルゴリズムとカーネルパイプラインの共同設計

DSpark：半自己回帰的生成による自信スケジュール型擬似推論

ViQ: 任意の解像度におけるテキストと整合した視覚量子化表現

検証の地平線：コーディングagent報酬に対する銀の弾丸はない

Qwen-Image-Agent: 実世界における画像生成のコンテキストギャップを埋める

OPID: エージェント型強化学習のためのオンポリシースキル蒸留

ロボット制御のための文脈内世界モデル

DanceOPD: オンポリシー生成フィールド蒸留

Autodata: 高品質な合成データを作成するためのエージェント型データサイエンティスト

大規模言語拡散モデルの改良

OCR推論はどれほど堅牢か？視覚摂動下におけるビジョン・ランゲージモデルのOCR推論堅牢性の評価

RoboAtlas: 文脈対応アクティブSLAM

意図を考慮したシーン表現による群衆におけるロボット視覚ナビゲーションの学習

ディープ強化学習強化型イベントトリガー型データ駆動型予測制御のための3次元ケーブル駆動型ソフトロボットアーム

自然なアングロッキング：事前学習においてどのルールが生き残るかに対する非対称な制御

任意の非負整数は三角数、五角数、および七角数の和である