HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
Qwen3-ASR 技術報告
音声および音声処理
LLM
Xian Shi, Xiong Wang, Zhifang Guo, et al.
インサイトエージェント:データインサイトを実現するLLMベースのマルチエージェントシステム
エージェント
インテリジェントな質問応答
Jincheng Bai, Zhenyu Zhang, Jennifer Zhang, et al.
ピクセルレベルのVLM Perception を実現するためのシンプルなポイント予測
画像分割
マルチモーダル表現
Tianhui Song, Haoyu Lu, Hao Yang, et al.
Youtu-VL:統一された視覚言語監督による視覚的潜在能力の解放
マルチモーダル表現
Any-to-Any
Zhixiang Wei, Yi Li, Zhehan Kan, et al.
Innovator-VL:科学発見を目的としたマルチモーダル大規模言語モデル
マルチモーダル表現
インテリジェントな質問応答
Zichen Wen, Boxue Yang, Shuang Chen, et al.
オープンソース・ワールドモデルの進展
動画生成
オープンソース
Robbyant Team, Zelin Gao, Qiuyu Wang, et al.
難易度認識型GRPOと多面的質問再構成を活用した数学的推論の向上
強化学習
Reasoning
Yanqi Dai, Yuxiang Ji, Xiao Zhang, et al.
エムベッディングのスケーリングは、言語モデルにおいてエキスパートのスケーリングを上回る
LLM
Transformer
Hong Liu, Jiaqi Zhang, Chao Wang, et al.
ショートウィンドウアテンションにより長期記憶が可能となる
Transformer
モデル学習
Loïc Cabannes, Maximilian Beck, Gergely Szilvasy, et al.
World Craft:テキストによる可視化可能な世界を創出するエージェントフレームワーク
エージェント
3D生成
Jianwen Sun, Yukang Feng, Kaining Ying, et al.
視覚生成がマルチモーダル・ワールド・モデルを通じて人間のような推論を解き放つ
マルチモーダル
Reasoning
Jialong Wu, Xiaoying Zhang, Hongyi Yuan, et al.
マスク深度モデリングによる空間認識
深度推定
認識
Bin Tan, Changjiang Sun, Xiage Qin, et al.
実用的なVLA基盤モデル
ロボティクス
エムボディドインテリジェンス
Wei Wu, Fan Lu, Yunnan Wang, et al.
AdaReasoner:反復的視覚推論のための動的ツールオーケストレーション
Reasoning
LLM
Mingyang Song, Haoyu Sun, Jiawei Gu, et al.
AgentDoG:AIエージェントの安全性およびセキュリティを 위한診断ガードレールフレームワーク
エージェント
ベンチマーク
Dongrui Liu, Qihan Ren, Chen Qian, et al.
ARCEE TRINITY ラージテクニカルレポート
LLM
モデル学習
Varun Singh, Lucas Krauss, Sami Jaghouar, et al.
自分自身を学ぶように教える:学習可能性の限界における推論
強化学習
Reasoning
Shobhita Sundaram, John Quan, Ariel Kwiatkowski, et al.
ATLAS:多言語事前学習、微調整および多言語性の呪いの解読のための適応的転送スケーリング則
LLM
言語
Shayne Longpre, Sneha Kudugunta, Niklas Muennighoff, et al.
iFSQ:1行のコードで画像生成向けFSQを改善する
画像生成
拡散モデル
Bin Lin, Zongjian Li, Yuwei Niu, et al.
エラスティックアテンション:効率的なTransformerにおけるテスト時適応型スパース比
Transformer
LLM
Zecheng Tang, Quantong Qiu, Yi Yang, et al.
科学的画像合成:ベンチマーク、手法論、および下流タスクにおける有用性
テキストから画像生成
拡散モデル
Honglin Lin, Chonghan Qin, Zheng Liu, et al.
スクリプトがすべてである:長期にわたる対話から映像化動画生成を実現するエージェントフレームワーク
テキストから動画
動画生成
Chenyu Mu, Xin He, Qu Yang, et al.
daVinci-Dev:ソフトウェアエンジニアリングにおけるエージェントネイティブな中間訓練
エージェント
LLM
Ji Zeng, Dayuan Fu, Tiantian Mi, et al.
LLMはあなたの混乱を整理できるか?LLMを用いたアプリケーション対応データ準備のサーベイ
LLM
自然言語処理
Wei Zhou, Jun Zhou, Haoyu Wang, et al.
DeepSeek-OCR 2:視覚的因果フロー
DeepSeek
ドキュメント理解
Haoran Wei, Yaofeng Sun, Yukun Li
テスト時に発見するための学習
強化学習
LLM
Mert Yuksekgonul, Daniel Koceja, Xinhao Li, et al.
保護された出力に対するファインチューニングによる有害な能力の引き出し
監視付き微調整
オープンソース
Jackson Kaunismaa, Avery Griffin, John Hughes, et al.
Memory-V2V:メモリを活用したビデオtoビデオ拡散モデルの拡張
拡散モデル
ビデオ処理
Dohun Lee, Chun-Hao Paul Huang, Xuelin Chen, et al.
推論時スケーリングによる検証:テスト時ルーブリックガイド付き検証を用いた自己進化型ディープリサーチエージェント
エージェント
LLM
Yuxuan Wan, Tianqing Fang, Zaitang Li, et al.
VisGym:多モーダルエージェント向けの多様性・カスタマイズ性・スケーラビリティを兼ね備えた環境
エージェント
エムボディドインテリジェンス
Zirui Wang, Junyi Zhang, Jiaxin Ge, et al.
TwinBrainVLA:非対称Mixture-of-Transformersを活用した汎用VLMの能力を体現型タスクに解放する
ロボティクス
エムボディドインテリジェンス
Bin Yu, Shijie Lian, Xiaopeng Lin, et al.
SWE-Pruner:コーディングエージェント向け自己適応的コンテキストプルーニング
エージェント
コード生成
Yuhang Wang, Yuling Shi, Mo Yang, et al.
1
2
3
4
47
Qwen3-ASR 技術報告
音声および音声処理
LLM
Xian Shi, Xiong Wang, Zhifang Guo, et al.
インサイトエージェント:データインサイトを実現するLLMベースのマルチエージェントシステム
エージェント
インテリジェントな質問応答
Jincheng Bai, Zhenyu Zhang, Jennifer Zhang, et al.
ピクセルレベルのVLM Perception を実現するためのシンプルなポイント予測
画像分割
マルチモーダル表現
Tianhui Song, Haoyu Lu, Hao Yang, et al.
Youtu-VL:統一された視覚言語監督による視覚的潜在能力の解放
マルチモーダル表現
Any-to-Any
Zhixiang Wei, Yi Li, Zhehan Kan, et al.
Innovator-VL:科学発見を目的としたマルチモーダル大規模言語モデル
マルチモーダル表現
インテリジェントな質問応答
Zichen Wen, Boxue Yang, Shuang Chen, et al.
オープンソース・ワールドモデルの進展
動画生成
オープンソース
Robbyant Team, Zelin Gao, Qiuyu Wang, et al.
難易度認識型GRPOと多面的質問再構成を活用した数学的推論の向上
強化学習
Reasoning
Yanqi Dai, Yuxiang Ji, Xiao Zhang, et al.
エムベッディングのスケーリングは、言語モデルにおいてエキスパートのスケーリングを上回る
LLM
Transformer
Hong Liu, Jiaqi Zhang, Chao Wang, et al.
ショートウィンドウアテンションにより長期記憶が可能となる
Transformer
モデル学習
Loïc Cabannes, Maximilian Beck, Gergely Szilvasy, et al.
World Craft:テキストによる可視化可能な世界を創出するエージェントフレームワーク
エージェント
3D生成
Jianwen Sun, Yukang Feng, Kaining Ying, et al.
視覚生成がマルチモーダル・ワールド・モデルを通じて人間のような推論を解き放つ
マルチモーダル
Reasoning
Jialong Wu, Xiaoying Zhang, Hongyi Yuan, et al.
マスク深度モデリングによる空間認識
深度推定
認識
Bin Tan, Changjiang Sun, Xiage Qin, et al.
実用的なVLA基盤モデル
ロボティクス
エムボディドインテリジェンス
Wei Wu, Fan Lu, Yunnan Wang, et al.
AdaReasoner:反復的視覚推論のための動的ツールオーケストレーション
Reasoning
LLM
Mingyang Song, Haoyu Sun, Jiawei Gu, et al.
AgentDoG:AIエージェントの安全性およびセキュリティを 위한診断ガードレールフレームワーク
エージェント
ベンチマーク
Dongrui Liu, Qihan Ren, Chen Qian, et al.
ARCEE TRINITY ラージテクニカルレポート
LLM
モデル学習
Varun Singh, Lucas Krauss, Sami Jaghouar, et al.
自分自身を学ぶように教える:学習可能性の限界における推論
強化学習
Reasoning
Shobhita Sundaram, John Quan, Ariel Kwiatkowski, et al.
ATLAS:多言語事前学習、微調整および多言語性の呪いの解読のための適応的転送スケーリング則
LLM
言語
Shayne Longpre, Sneha Kudugunta, Niklas Muennighoff, et al.
iFSQ:1行のコードで画像生成向けFSQを改善する
画像生成
拡散モデル
Bin Lin, Zongjian Li, Yuwei Niu, et al.
エラスティックアテンション:効率的なTransformerにおけるテスト時適応型スパース比
Transformer
LLM
Zecheng Tang, Quantong Qiu, Yi Yang, et al.
科学的画像合成:ベンチマーク、手法論、および下流タスクにおける有用性
テキストから画像生成
拡散モデル
Honglin Lin, Chonghan Qin, Zheng Liu, et al.
スクリプトがすべてである:長期にわたる対話から映像化動画生成を実現するエージェントフレームワーク
テキストから動画
動画生成
Chenyu Mu, Xin He, Qu Yang, et al.
daVinci-Dev:ソフトウェアエンジニアリングにおけるエージェントネイティブな中間訓練
エージェント
LLM
Ji Zeng, Dayuan Fu, Tiantian Mi, et al.
LLMはあなたの混乱を整理できるか?LLMを用いたアプリケーション対応データ準備のサーベイ
LLM
自然言語処理
Wei Zhou, Jun Zhou, Haoyu Wang, et al.
DeepSeek-OCR 2:視覚的因果フロー
DeepSeek
ドキュメント理解
Haoran Wei, Yaofeng Sun, Yukun Li
テスト時に発見するための学習
強化学習
LLM
Mert Yuksekgonul, Daniel Koceja, Xinhao Li, et al.
保護された出力に対するファインチューニングによる有害な能力の引き出し
監視付き微調整
オープンソース
Jackson Kaunismaa, Avery Griffin, John Hughes, et al.
Memory-V2V:メモリを活用したビデオtoビデオ拡散モデルの拡張
拡散モデル
ビデオ処理
Dohun Lee, Chun-Hao Paul Huang, Xuelin Chen, et al.
推論時スケーリングによる検証:テスト時ルーブリックガイド付き検証を用いた自己進化型ディープリサーチエージェント
エージェント
LLM
Yuxuan Wan, Tianqing Fang, Zaitang Li, et al.
VisGym:多モーダルエージェント向けの多様性・カスタマイズ性・スケーラビリティを兼ね備えた環境
エージェント
エムボディドインテリジェンス
Zirui Wang, Junyi Zhang, Jiaxin Ge, et al.
TwinBrainVLA:非対称Mixture-of-Transformersを活用した汎用VLMの能力を体現型タスクに解放する
ロボティクス
エムボディドインテリジェンス
Bin Yu, Shijie Lian, Xiaopeng Lin, et al.
SWE-Pruner:コーディングエージェント向け自己適応的コンテキストプルーニング
エージェント
コード生成
Yuhang Wang, Yuling Shi, Mo Yang, et al.
1
2
3
4
47