HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
難易度認識型GRPOと多面的質問再構成を活用した数学的推論の向上
強化学習
Reasoning
Yanqi Dai, Yuxiang Ji, Xiao Zhang, et al.
ショートウィンドウアテンションにより長期記憶が可能となる
Transformer
モデル学習
Loïc Cabannes, Maximilian Beck, Gergely Szilvasy, et al.
World Craft:テキストによる可視化可能な世界を創出するエージェントフレームワーク
エージェント
3D生成
Jianwen Sun, Yukang Feng, Kaining Ying, et al.
視覚生成がマルチモーダル・ワールド・モデルを通じて人間のような推論を解き放つ
マルチモーダル
Reasoning
Jialong Wu, Xiaoying Zhang, Hongyi Yuan, et al.
マスク深度モデリングによる空間認識
深度推定
認識
Bin Tan, Changjiang Sun, Xiage Qin, et al.
実用的なVLA基盤モデル
ロボティクス
エムボディドインテリジェンス
Wei Wu, Fan Lu, Yunnan Wang, et al.
AdaReasoner:反復的視覚推論のための動的ツールオーケストレーション
Reasoning
LLM
Mingyang Song, Haoyu Sun, Jiawei Gu, et al.
AgentDoG:AIエージェントの安全性およびセキュリティを 위한診断ガードレールフレームワーク
エージェント
ベンチマーク
Dongrui Liu, Qihan Ren, Chen Qian, et al.
ARCEE TRINITY ラージテクニカルレポート
LLM
モデル学習
Varun Singh, Lucas Krauss, Sami Jaghouar, et al.
自分自身を学ぶように教える:学習可能性の限界における推論
強化学習
Reasoning
Shobhita Sundaram, John Quan, Ariel Kwiatkowski, et al.
ATLAS:多言語事前学習、微調整および多言語性の呪いの解読のための適応的転送スケーリング則
LLM
言語
Shayne Longpre, Sneha Kudugunta, Niklas Muennighoff, et al.
iFSQ:1行のコードで画像生成向けFSQを改善する
画像生成
拡散モデル
Bin Lin, Zongjian Li, Yuwei Niu, et al.
エラスティックアテンション:効率的なTransformerにおけるテスト時適応型スパース比
Transformer
LLM
Zecheng Tang, Quantong Qiu, Yi Yang, et al.
科学的画像合成:ベンチマーク、手法論、および下流タスクにおける有用性
テキストから画像生成
拡散モデル
Honglin Lin, Chonghan Qin, Zheng Liu, et al.
スクリプトがすべてである:長期にわたる対話から映像化動画生成を実現するエージェントフレームワーク
テキストから動画
動画生成
Chenyu Mu, Xin He, Qu Yang, et al.
daVinci-Dev:ソフトウェアエンジニアリングにおけるエージェントネイティブな中間訓練
エージェント
LLM
Ji Zeng, Dayuan Fu, Tiantian Mi, et al.
LLMはあなたの混乱を整理できるか?LLMを用いたアプリケーション対応データ準備のサーベイ
LLM
自然言語処理
Wei Zhou, Jun Zhou, Haoyu Wang, et al.
DeepSeek-OCR 2:視覚的因果フロー
DeepSeek
ドキュメント理解
Haoran Wei, Yaofeng Sun, Yukun Li
テスト時に発見するための学習
強化学習
LLM
Mert Yuksekgonul, Daniel Koceja, Xinhao Li, et al.
保護された出力に対するファインチューニングによる有害な能力の引き出し
監視付き微調整
オープンソース
Jackson Kaunismaa, Avery Griffin, John Hughes, et al.
Memory-V2V:メモリを活用したビデオtoビデオ拡散モデルの拡張
拡散モデル
ビデオ処理
Dohun Lee, Chun-Hao Paul Huang, Xuelin Chen, et al.
推論時スケーリングによる検証:テスト時ルーブリックガイド付き検証を用いた自己進化型ディープリサーチエージェント
エージェント
LLM
Yuxuan Wan, Tianqing Fang, Zaitang Li, et al.
VisGym:多モーダルエージェント向けの多様性・カスタマイズ性・スケーラビリティを兼ね備えた環境
エージェント
エムボディドインテリジェンス
Zirui Wang, Junyi Zhang, Jiaxin Ge, et al.
TwinBrainVLA:非対称Mixture-of-Transformersを活用した汎用VLMの能力を体現型タスクに解放する
ロボティクス
エムボディドインテリジェンス
Bin Yu, Shijie Lian, Xiaopeng Lin, et al.
SWE-Pruner:コーディングエージェント向け自己適応的コンテキストプルーニング
エージェント
コード生成
Yuhang Wang, Yuling Shi, Mo Yang, et al.
LongCat-Flash-Thinking-2601 技術報告
エージェント
Reasoning
Meituan LongCat Team, Anchun Gui, Bei Li, et al.
言語モデルはスケーリング則を発見できるか?
エージェント
LLM
Haowei Lin, Haotian Ye, Wenzheng Feng, et al.
コスモス・ポリシー:視覚運動制御および計画のための動画モデルのファインチューニング
動画生成
ロボティクス
Moo Jin Kim, Yihuai Gao, Tsung-Yi Lin, et al.
表現自己符号化器を用いたテキストから画像への拡散Transformerのスケーリング
テキストから画像生成
拡散モデル
Shengbang Tong, Boyang Zheng, Ziteng Wang, et al.
BayesianVLA:潜在行動クエリを用いた視覚言語行動モデルのベイズ分解
ロボティクス
マルチモーダル表現
Shijie Lian, Bin Yu, Xiaopeng Lin, et al.
柔軟性の罠:拡散言語モデルにおける推論可能性を制限する任意の順序制限の理由
拡散モデル
Reasoning
Zanlin Ni, Shenzhi Wang, Yang Yue, et al.
LLM-in-Sandboxが汎用エージェント型知能を引き出す
エージェント
LLM
Daixuan Cheng, Shaohan Huang, Yuxian Gu, et al.
1
2
3
4
5
6
49
難易度認識型GRPOと多面的質問再構成を活用した数学的推論の向上
強化学習
Reasoning
Yanqi Dai, Yuxiang Ji, Xiao Zhang, et al.
ショートウィンドウアテンションにより長期記憶が可能となる
Transformer
モデル学習
Loïc Cabannes, Maximilian Beck, Gergely Szilvasy, et al.
World Craft:テキストによる可視化可能な世界を創出するエージェントフレームワーク
エージェント
3D生成
Jianwen Sun, Yukang Feng, Kaining Ying, et al.
視覚生成がマルチモーダル・ワールド・モデルを通じて人間のような推論を解き放つ
マルチモーダル
Reasoning
Jialong Wu, Xiaoying Zhang, Hongyi Yuan, et al.
マスク深度モデリングによる空間認識
深度推定
認識
Bin Tan, Changjiang Sun, Xiage Qin, et al.
実用的なVLA基盤モデル
ロボティクス
エムボディドインテリジェンス
Wei Wu, Fan Lu, Yunnan Wang, et al.
AdaReasoner:反復的視覚推論のための動的ツールオーケストレーション
Reasoning
LLM
Mingyang Song, Haoyu Sun, Jiawei Gu, et al.
AgentDoG:AIエージェントの安全性およびセキュリティを 위한診断ガードレールフレームワーク
エージェント
ベンチマーク
Dongrui Liu, Qihan Ren, Chen Qian, et al.
ARCEE TRINITY ラージテクニカルレポート
LLM
モデル学習
Varun Singh, Lucas Krauss, Sami Jaghouar, et al.
自分自身を学ぶように教える:学習可能性の限界における推論
強化学習
Reasoning
Shobhita Sundaram, John Quan, Ariel Kwiatkowski, et al.
ATLAS:多言語事前学習、微調整および多言語性の呪いの解読のための適応的転送スケーリング則
LLM
言語
Shayne Longpre, Sneha Kudugunta, Niklas Muennighoff, et al.
iFSQ:1行のコードで画像生成向けFSQを改善する
画像生成
拡散モデル
Bin Lin, Zongjian Li, Yuwei Niu, et al.
エラスティックアテンション:効率的なTransformerにおけるテスト時適応型スパース比
Transformer
LLM
Zecheng Tang, Quantong Qiu, Yi Yang, et al.
科学的画像合成:ベンチマーク、手法論、および下流タスクにおける有用性
テキストから画像生成
拡散モデル
Honglin Lin, Chonghan Qin, Zheng Liu, et al.
スクリプトがすべてである:長期にわたる対話から映像化動画生成を実現するエージェントフレームワーク
テキストから動画
動画生成
Chenyu Mu, Xin He, Qu Yang, et al.
daVinci-Dev:ソフトウェアエンジニアリングにおけるエージェントネイティブな中間訓練
エージェント
LLM
Ji Zeng, Dayuan Fu, Tiantian Mi, et al.
LLMはあなたの混乱を整理できるか?LLMを用いたアプリケーション対応データ準備のサーベイ
LLM
自然言語処理
Wei Zhou, Jun Zhou, Haoyu Wang, et al.
DeepSeek-OCR 2:視覚的因果フロー
DeepSeek
ドキュメント理解
Haoran Wei, Yaofeng Sun, Yukun Li
テスト時に発見するための学習
強化学習
LLM
Mert Yuksekgonul, Daniel Koceja, Xinhao Li, et al.
保護された出力に対するファインチューニングによる有害な能力の引き出し
監視付き微調整
オープンソース
Jackson Kaunismaa, Avery Griffin, John Hughes, et al.
Memory-V2V:メモリを活用したビデオtoビデオ拡散モデルの拡張
拡散モデル
ビデオ処理
Dohun Lee, Chun-Hao Paul Huang, Xuelin Chen, et al.
推論時スケーリングによる検証:テスト時ルーブリックガイド付き検証を用いた自己進化型ディープリサーチエージェント
エージェント
LLM
Yuxuan Wan, Tianqing Fang, Zaitang Li, et al.
VisGym:多モーダルエージェント向けの多様性・カスタマイズ性・スケーラビリティを兼ね備えた環境
エージェント
エムボディドインテリジェンス
Zirui Wang, Junyi Zhang, Jiaxin Ge, et al.
TwinBrainVLA:非対称Mixture-of-Transformersを活用した汎用VLMの能力を体現型タスクに解放する
ロボティクス
エムボディドインテリジェンス
Bin Yu, Shijie Lian, Xiaopeng Lin, et al.
SWE-Pruner:コーディングエージェント向け自己適応的コンテキストプルーニング
エージェント
コード生成
Yuhang Wang, Yuling Shi, Mo Yang, et al.
LongCat-Flash-Thinking-2601 技術報告
エージェント
Reasoning
Meituan LongCat Team, Anchun Gui, Bei Li, et al.
言語モデルはスケーリング則を発見できるか?
エージェント
LLM
Haowei Lin, Haotian Ye, Wenzheng Feng, et al.
コスモス・ポリシー:視覚運動制御および計画のための動画モデルのファインチューニング
動画生成
ロボティクス
Moo Jin Kim, Yihuai Gao, Tsung-Yi Lin, et al.
表現自己符号化器を用いたテキストから画像への拡散Transformerのスケーリング
テキストから画像生成
拡散モデル
Shengbang Tong, Boyang Zheng, Ziteng Wang, et al.
BayesianVLA:潜在行動クエリを用いた視覚言語行動モデルのベイズ分解
ロボティクス
マルチモーダル表現
Shijie Lian, Bin Yu, Xiaopeng Lin, et al.
柔軟性の罠:拡散言語モデルにおける推論可能性を制限する任意の順序制限の理由
拡散モデル
Reasoning
Zanlin Ni, Shenzhi Wang, Yang Yue, et al.
LLM-in-Sandboxが汎用エージェント型知能を引き出す
エージェント
LLM
Daixuan Cheng, Shaohan Huang, Yuxian Gu, et al.
1
2
3
4
5
6
49