HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
Droplet3D:動画から得られる常識的事前知識が3D生成を促進する
3D生成
ビデオ理解
Xiaochuan Li, Guoguang Du, Runze Zhang, et al.
A.S.E:AI生成コードにおけるセキュリティ評価を目的としたリポジトリレベルのベンチマーク
コード生成
ベンチマーク
Keke Lian, Bin Wang, Lei Zhang, et al.
EmbodiedOneVision:汎用ロボット制御のためのインタリーブド視覚-テキスト-アクション事前学習
エージェント
エムボディドインテリジェンス
Delin Qu, Haoming Song, Qizhi Chen, et al.
R-4B:バイモードアニーリングと強化学習を用いたMLLMsにおける汎用自己思考能力のインセンティブ化
マルチモーダル
Reasoning
Jie Jiang, Qi Yang, Bolin Ni, et al.
小さな言語モデルにおける創造的ライティングの喚起:LLM-as-a-Judge とマルチエージェントによる報酬の精緻化
監視付き微調整
Preference Modeling
Xiaolong Wei, Bo Lu, Xingyu Zhang, et al.
TMUAD:テキストメモリバンクを用いた統合異常検出モデルにおける論理機能の強化
コンピュータビジョン
画像理解
Jiawei Liu, Jiahe Hou, Wei Wang, et al.
思考過程のダイナミクスの分析:能動的誘導か、不誠実な後向きの合理化か?
LLM
監視付き微調整
Samuel Lewis-Lim, Xingwei Tan, Zhixue Zhao, et al.
AWorld:エージェント型AIのトレーニングレシピの調整
エージェント
ベンチマーク
Chengyue Yu, Siyuan Lu, Chenyi Zhuang, et al.
MCP-Bench:MCPサーバーを活用した複雑な現実世界タスクにおけるツール利用型LLMエージェントのベンチマーク手法
ベンチマーク
エージェント
Zhenting Wang, Qi Chang, Hemani Patel, et al.
rStar2エージェント:エージェンティックリーズニング技術報告書
エージェント
強化学習
Ning Shang, Yifei Liu, Yi Zhu, et al.
Pref-GRPO:安定したテキストto画像強化学習のためのペアワイズ・プレファレンス報酬ベースのGRPO
テキストから画像生成
Preference Modeling
Yibin Wang, Zhimin Li, Yuhang Zang, et al.
MobileCLIP2:マルチモーダル強化学習の向上
マルチモーダル
画像説明
Fartash Faghri, Pavan Kumar Anasosalu Vasu, Cem Koc, et al.
AI-AI美的協働:明示的な象徴意識と顕在する文法形成
人工知能
自然言語処理
Nicanor I. Moldovan
視線を心へ:rPPGおよび健康バイオマーカー推定のためのマルチビュー動画データセット
コンピュータビジョン
ビデオ理解
Konstantin Egorov, Stepan Botman, Pavel Blinov, et al.
次に出現するトークンの順序予測が言語モデルの性能向上に寄与する
Transformer
モデル学習
Zayd M. K. Zuhri, Erland Hilman Fuadi, Alham Fikri Aji
MIDAS:リアルタイム自己回帰型動画生成を活用したマルチモーダルインタラクティブなデジタル人間合成
テキストから動画
Any-to-Any
Ming Chen, Liyuan Cui, Wenyuan Zhang, et al.
離散拡散VLA:視覚言語行動方策における行動復元に離散拡散を導入する
拡散モデル
Transformer
Zhixuan Liang, Yizhuo Li, Tianshuo Yang, et al.
推論分解を用いた自己報酬付き視覚言語モデル
視覚質問応答
Reasoning
Zongxia Li, Wenhao Yu, Chengsong Huang, et al.
転写を越えて:音声認識におけるメカニズム解釈可能性
Transformer
ディープラーニング
Neta Glazer, Yael Segal-Feldman, Hilit Segev, et al.
CODA:分離型強化学習を用いた二大脳コンピュータ利用エージェントにおける大脳と小脳の連携
エージェント
強化学習
Zeyi Sun, Yuhang Cao, Jianze Liang, et al.
WebSight:ロバストなWebエージェント向けのビジョンファーストアーキテクチャ
エージェント
Any-to-Any
Tanvir Bhathal, Asanshay Gupta
UltraMemV2:1200億パラメータにスケーリングするメモリネットワークと優れた長文脈学習
Transformer
LLM
Zihao Huang, Yu Bao, Qiyang Min, et al.
ヘルメス4 技術報告
Reasoning
LLM
Ryan Teknium, Roger Jin, Jai Suphavadeeprasit, et al.
OmniHuman-1.5:認知シミュレーションによるアバターへの能動的思考の植え込み
マルチモーダル表現
Text-to-Speech
Jianwen Jiang, Weihong Zeng, Zerong Zheng, et al.
VoxHammer:ネイティブ3D空間における訓練不要な高精度・一貫性のある3D編集
3D生成
拡散モデル
Lin Li, Zehuan Huang, Haoran Feng, et al.
CMPhysBench:凝縮系物理学における大規模言語モデルの評価のためのベンチマーク
ベンチマーク
LLM
Weida Wang, Dongchen Huang, Jiatong Li, et al.
TreePO:ヒューリスティック木ベースモデリングによる方策最適化と効果性、推論効率のギャップ解消
強化学習
Reasoning
Yizhi Li, Qingshui Gu, Zhoufutu Wen, et al.
Nemotron-CC-Math:1330億トークン規模の高品質な数学向け事前学習データセット
LLM
数学
Rabeeh Karimi Mahabadi, Sanjeev Satheesh, Shrimai Prabhumoye, et al.
ツール統合型推論の理解
Reasoning
LLM
Heng Lin, Zhongwen Xu
スペーサー:設計された科学的インスピレーションへ向けて
LLM
テキスト生成
Minhyeong Lee, Suyoung Hwang, Seunghyun Moon, et al.
記憶を超えて:再帰性、記憶、およびテスト時計算スケーリングを活用した推論深度の拡張
LLM
Transformer
Ivan Rodkin, Daniil Orel, Konstantin Smirnov, et al.
バイブボイス技術報告書
Text-to-Speech
合成
Zhiliang Peng, Jianwei Yu, Wenhui Wang, et al.
1
29
30
31
32
33
34
35
47
Droplet3D:動画から得られる常識的事前知識が3D生成を促進する
3D生成
ビデオ理解
Xiaochuan Li, Guoguang Du, Runze Zhang, et al.
A.S.E:AI生成コードにおけるセキュリティ評価を目的としたリポジトリレベルのベンチマーク
コード生成
ベンチマーク
Keke Lian, Bin Wang, Lei Zhang, et al.
EmbodiedOneVision:汎用ロボット制御のためのインタリーブド視覚-テキスト-アクション事前学習
エージェント
エムボディドインテリジェンス
Delin Qu, Haoming Song, Qizhi Chen, et al.
R-4B:バイモードアニーリングと強化学習を用いたMLLMsにおける汎用自己思考能力のインセンティブ化
マルチモーダル
Reasoning
Jie Jiang, Qi Yang, Bolin Ni, et al.
小さな言語モデルにおける創造的ライティングの喚起:LLM-as-a-Judge とマルチエージェントによる報酬の精緻化
監視付き微調整
Preference Modeling
Xiaolong Wei, Bo Lu, Xingyu Zhang, et al.
TMUAD:テキストメモリバンクを用いた統合異常検出モデルにおける論理機能の強化
コンピュータビジョン
画像理解
Jiawei Liu, Jiahe Hou, Wei Wang, et al.
思考過程のダイナミクスの分析:能動的誘導か、不誠実な後向きの合理化か?
LLM
監視付き微調整
Samuel Lewis-Lim, Xingwei Tan, Zhixue Zhao, et al.
AWorld:エージェント型AIのトレーニングレシピの調整
エージェント
ベンチマーク
Chengyue Yu, Siyuan Lu, Chenyi Zhuang, et al.
MCP-Bench:MCPサーバーを活用した複雑な現実世界タスクにおけるツール利用型LLMエージェントのベンチマーク手法
ベンチマーク
エージェント
Zhenting Wang, Qi Chang, Hemani Patel, et al.
rStar2エージェント:エージェンティックリーズニング技術報告書
エージェント
強化学習
Ning Shang, Yifei Liu, Yi Zhu, et al.
Pref-GRPO:安定したテキストto画像強化学習のためのペアワイズ・プレファレンス報酬ベースのGRPO
テキストから画像生成
Preference Modeling
Yibin Wang, Zhimin Li, Yuhang Zang, et al.
MobileCLIP2:マルチモーダル強化学習の向上
マルチモーダル
画像説明
Fartash Faghri, Pavan Kumar Anasosalu Vasu, Cem Koc, et al.
AI-AI美的協働:明示的な象徴意識と顕在する文法形成
人工知能
自然言語処理
Nicanor I. Moldovan
視線を心へ:rPPGおよび健康バイオマーカー推定のためのマルチビュー動画データセット
コンピュータビジョン
ビデオ理解
Konstantin Egorov, Stepan Botman, Pavel Blinov, et al.
次に出現するトークンの順序予測が言語モデルの性能向上に寄与する
Transformer
モデル学習
Zayd M. K. Zuhri, Erland Hilman Fuadi, Alham Fikri Aji
MIDAS:リアルタイム自己回帰型動画生成を活用したマルチモーダルインタラクティブなデジタル人間合成
テキストから動画
Any-to-Any
Ming Chen, Liyuan Cui, Wenyuan Zhang, et al.
離散拡散VLA:視覚言語行動方策における行動復元に離散拡散を導入する
拡散モデル
Transformer
Zhixuan Liang, Yizhuo Li, Tianshuo Yang, et al.
推論分解を用いた自己報酬付き視覚言語モデル
視覚質問応答
Reasoning
Zongxia Li, Wenhao Yu, Chengsong Huang, et al.
転写を越えて:音声認識におけるメカニズム解釈可能性
Transformer
ディープラーニング
Neta Glazer, Yael Segal-Feldman, Hilit Segev, et al.
CODA:分離型強化学習を用いた二大脳コンピュータ利用エージェントにおける大脳と小脳の連携
エージェント
強化学習
Zeyi Sun, Yuhang Cao, Jianze Liang, et al.
WebSight:ロバストなWebエージェント向けのビジョンファーストアーキテクチャ
エージェント
Any-to-Any
Tanvir Bhathal, Asanshay Gupta
UltraMemV2:1200億パラメータにスケーリングするメモリネットワークと優れた長文脈学習
Transformer
LLM
Zihao Huang, Yu Bao, Qiyang Min, et al.
ヘルメス4 技術報告
Reasoning
LLM
Ryan Teknium, Roger Jin, Jai Suphavadeeprasit, et al.
OmniHuman-1.5:認知シミュレーションによるアバターへの能動的思考の植え込み
マルチモーダル表現
Text-to-Speech
Jianwen Jiang, Weihong Zeng, Zerong Zheng, et al.
VoxHammer:ネイティブ3D空間における訓練不要な高精度・一貫性のある3D編集
3D生成
拡散モデル
Lin Li, Zehuan Huang, Haoran Feng, et al.
CMPhysBench:凝縮系物理学における大規模言語モデルの評価のためのベンチマーク
ベンチマーク
LLM
Weida Wang, Dongchen Huang, Jiatong Li, et al.
TreePO:ヒューリスティック木ベースモデリングによる方策最適化と効果性、推論効率のギャップ解消
強化学習
Reasoning
Yizhi Li, Qingshui Gu, Zhoufutu Wen, et al.
Nemotron-CC-Math:1330億トークン規模の高品質な数学向け事前学習データセット
LLM
数学
Rabeeh Karimi Mahabadi, Sanjeev Satheesh, Shrimai Prabhumoye, et al.
ツール統合型推論の理解
Reasoning
LLM
Heng Lin, Zhongwen Xu
スペーサー:設計された科学的インスピレーションへ向けて
LLM
テキスト生成
Minhyeong Lee, Suyoung Hwang, Seunghyun Moon, et al.
記憶を超えて:再帰性、記憶、およびテスト時計算スケーリングを活用した推論深度の拡張
LLM
Transformer
Ivan Rodkin, Daniil Orel, Konstantin Smirnov, et al.
バイブボイス技術報告書
Text-to-Speech
合成
Zhiliang Peng, Jianwei Yu, Wenhui Wang, et al.
1
29
30
31
32
33
34
35
47