HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
GR-Dexter 技術報告
ロボティクス
エムボディドインテリジェンス
Ruoshi Wen, Guangzeng Chen, Zhongren Cui, et al.
VideoAuto-R1:一度の思考で済ませ、二度の回答を行うことで実現する動画自動推論
ビデオ理解
Reasoning
Shuming Liu, Mingchen Zhuge, Changsheng Zhao, et al.
RelayLLM:協調デコードによる効率的な推論
Reasoning
テキスト生成
Chengsong Huang, Tong Zheng, Langlin Huang, et al.
トークンレベルにおけるLLM協働のためのFusionRoute
LLM
テキスト生成
Nuoya Xiong, Yuhang Zhou, Hanqing Zeng, et al.
RL-AWB:低照度夜間シーンにおける自動ホワイトバランス補正のためのディープ強化学習
画像処理
マシンビジョン
Yuan-Kang Lee, Kuan-Lin Chen, Chia-Che Chang, et al.
学習可能なマルチプライヤー:言語モデル行列層のスケーリングを解放する
Transformer
機械学習
Maksim Velikanov, Ilyas Chahed, Jingwei Zuo, et al.
GDPO:マルチリワードRL最適化のためのグループ報酬分解型正規化ポリシー最適化
強化学習
Preference Modeling
Shih-Yang Liu, Xin Dong, Ximing Lu, et al.
MemRL:エピソード記憶上のランタイム強化学習を用いた自己進化型エージェント
強化学習
エージェント
Shengtao Zhang, Jiaqian Wang, Ruiwen Zhou, et al.
失敗から習得へ:ツール利用エージェント向けハードサンプルの生成
エージェント
Reasoning
Bingguang Hao, Zengzhuang Xu, Yuntao Wen, et al.
動的オブジェクトの世界を巧みに編み込む
動画生成
3D生成
Yanzhe Lyu, Chen Geng, Karthik Dharmarajan, et al.
Klear:統合型マルチタスク音声・映像共同生成
テキストから動画
Any-to-Any
Jun Wang, Chunyu Qiang, Yuxin Guo, et al.
Atlas:マルチドメイン複雑推論のための異種モデルおよびツールのオーケストレーション
エージェント
Reasoning
Jinyang Wu, Guocheng Zhai, Ruihan Jin, et al.
Benchmark^2:LLMベンチマークの体系的評価
LLM
データセット
Qi Qian, Chengsong Huang, Jingwen Xu, et al.
MindWatcher:よりスマートなマルチモーダルツール統合推論への道
エージェント
Reasoning
Jiawei Chen, Xintian Shen, Lihao Zheng, et al.
エントロピー適応型ファインチューニング:確信した矛盾の解消による忘却の軽減
監視付き微調整
LLM
Muxi Diao, Lele Yang, Wuxuan Gong, et al.
多様性か精度か?次トークン予測の深い考察
強化学習
監視付き微調整
Haoyuan Wu, Hai Wang, Jiajia Wu, et al.
孔子コードエージェント:現実世界のコードベースにおけるスケーラブルなエージェント構造
エージェント
コード生成
Sherman Wong, Zhenting Qi, Zhaodong Wang, et al.
DreamStyle:ビデオスタイル化のための統合枠組み
画像から動画生成
ビデオ処理
Mengtian Li, Jinshu Chen, Songtao Zhao, et al.
UniCorn:自己生成された教師信号を用いた自己改善型統合型マルチモーダルモデルへの道
テキストから画像生成
画像生成
Ruiyan Han, Zhen Fang, XinYu Sun, et al.
LTX-2:効率的な共同音声視覚基盤モデル
テキストから動画
拡散モデル
Yoav HaCohen, Benny Brazowski, Nisan Chiprut, et al.
SciEvalKit:科学一般知能向けオープンソース評価ツールキット
ベンチマーク
オープンソース
Yiheng Wang, Yixin Chen, Shuo Li, et al.
MOSS Transcribe Diarize:発話者分離を伴う高精度な音声認識
音声および音声処理
LLM
Donghua Yu, Zhengyuan Lin, Chen Yang, et al.
InfiniDepth:ニューラルインプリシットフィールドを用いた任意解像度・細粒度深度推定
深度推定
3D マシンビジョン
Hao Yu, Haotong Lin, Jiawei Wang, et al.
エージェント型AIの適応
エージェント
Reasoning
Pengcheng Jiang, Jiacheng Lin, Zhiyi Shi, et al.
大規模なビデオ計画が汎用的なロボット制御を可能にする
ロボティクス
エムボディドインテリジェンス
Boyuan Chen, Tianyuan Zhang, Haoran Geng, et al.
InfiniteVGGT:無限ストリーム向け視覚幾何学に基づくトランスフォーマー
アーキテクチャ
3D マシンビジョン
Shuai Yuan, Yantai Yang, Xiaotian Yang, et al.
GARDO:報酬ハッキングを伴わずに拡散モデルを強化する
強化学習
拡散モデル
Haoran He, Yuxiao Ye, Jie Liu, et al.
VAR RLの正しさ:視覚的自己回帰生成における非同期な方策の衝突への対処
強化学習
拡散モデル
Shikun Sun, Liao Qu, Huichao Zhang, et al.
DreamID-V:拡散トランスフォーマーを活用した高忠実度顔交換における画像から動画へのギャップの橋渡し
画像から動画生成
拡散モデル
Xu Guo, Fulong Ye, Xinghui Li, et al.
NextFlow:統一された順序モデリングがマルチモーダル理解および生成を活性化する
テキストから画像生成
画像生成
Huichao Zhang, Liao Qu, Yiheng Liu, et al.
K-EXAONE 技術報告
LLM
テキスト生成
Eunbi Choi, Kibong Choi, Seokhee Hong, et al.
ハンガーゲーム論争:マルチエージェントシステムにおける過度な競争の台頭について
エージェント
LLM
Xinbei Ma, Ruotian Ma, Xingyu Chen, et al.
1
3
4
5
6
7
8
9
48
GR-Dexter 技術報告
ロボティクス
エムボディドインテリジェンス
Ruoshi Wen, Guangzeng Chen, Zhongren Cui, et al.
VideoAuto-R1:一度の思考で済ませ、二度の回答を行うことで実現する動画自動推論
ビデオ理解
Reasoning
Shuming Liu, Mingchen Zhuge, Changsheng Zhao, et al.
RelayLLM:協調デコードによる効率的な推論
Reasoning
テキスト生成
Chengsong Huang, Tong Zheng, Langlin Huang, et al.
トークンレベルにおけるLLM協働のためのFusionRoute
LLM
テキスト生成
Nuoya Xiong, Yuhang Zhou, Hanqing Zeng, et al.
RL-AWB:低照度夜間シーンにおける自動ホワイトバランス補正のためのディープ強化学習
画像処理
マシンビジョン
Yuan-Kang Lee, Kuan-Lin Chen, Chia-Che Chang, et al.
学習可能なマルチプライヤー:言語モデル行列層のスケーリングを解放する
Transformer
機械学習
Maksim Velikanov, Ilyas Chahed, Jingwei Zuo, et al.
GDPO:マルチリワードRL最適化のためのグループ報酬分解型正規化ポリシー最適化
強化学習
Preference Modeling
Shih-Yang Liu, Xin Dong, Ximing Lu, et al.
MemRL:エピソード記憶上のランタイム強化学習を用いた自己進化型エージェント
強化学習
エージェント
Shengtao Zhang, Jiaqian Wang, Ruiwen Zhou, et al.
失敗から習得へ:ツール利用エージェント向けハードサンプルの生成
エージェント
Reasoning
Bingguang Hao, Zengzhuang Xu, Yuntao Wen, et al.
動的オブジェクトの世界を巧みに編み込む
動画生成
3D生成
Yanzhe Lyu, Chen Geng, Karthik Dharmarajan, et al.
Klear:統合型マルチタスク音声・映像共同生成
テキストから動画
Any-to-Any
Jun Wang, Chunyu Qiang, Yuxin Guo, et al.
Atlas:マルチドメイン複雑推論のための異種モデルおよびツールのオーケストレーション
エージェント
Reasoning
Jinyang Wu, Guocheng Zhai, Ruihan Jin, et al.
Benchmark^2:LLMベンチマークの体系的評価
LLM
データセット
Qi Qian, Chengsong Huang, Jingwen Xu, et al.
MindWatcher:よりスマートなマルチモーダルツール統合推論への道
エージェント
Reasoning
Jiawei Chen, Xintian Shen, Lihao Zheng, et al.
エントロピー適応型ファインチューニング:確信した矛盾の解消による忘却の軽減
監視付き微調整
LLM
Muxi Diao, Lele Yang, Wuxuan Gong, et al.
多様性か精度か?次トークン予測の深い考察
強化学習
監視付き微調整
Haoyuan Wu, Hai Wang, Jiajia Wu, et al.
孔子コードエージェント:現実世界のコードベースにおけるスケーラブルなエージェント構造
エージェント
コード生成
Sherman Wong, Zhenting Qi, Zhaodong Wang, et al.
DreamStyle:ビデオスタイル化のための統合枠組み
画像から動画生成
ビデオ処理
Mengtian Li, Jinshu Chen, Songtao Zhao, et al.
UniCorn:自己生成された教師信号を用いた自己改善型統合型マルチモーダルモデルへの道
テキストから画像生成
画像生成
Ruiyan Han, Zhen Fang, XinYu Sun, et al.
LTX-2:効率的な共同音声視覚基盤モデル
テキストから動画
拡散モデル
Yoav HaCohen, Benny Brazowski, Nisan Chiprut, et al.
SciEvalKit:科学一般知能向けオープンソース評価ツールキット
ベンチマーク
オープンソース
Yiheng Wang, Yixin Chen, Shuo Li, et al.
MOSS Transcribe Diarize:発話者分離を伴う高精度な音声認識
音声および音声処理
LLM
Donghua Yu, Zhengyuan Lin, Chen Yang, et al.
InfiniDepth:ニューラルインプリシットフィールドを用いた任意解像度・細粒度深度推定
深度推定
3D マシンビジョン
Hao Yu, Haotong Lin, Jiawei Wang, et al.
エージェント型AIの適応
エージェント
Reasoning
Pengcheng Jiang, Jiacheng Lin, Zhiyi Shi, et al.
大規模なビデオ計画が汎用的なロボット制御を可能にする
ロボティクス
エムボディドインテリジェンス
Boyuan Chen, Tianyuan Zhang, Haoran Geng, et al.
InfiniteVGGT:無限ストリーム向け視覚幾何学に基づくトランスフォーマー
アーキテクチャ
3D マシンビジョン
Shuai Yuan, Yantai Yang, Xiaotian Yang, et al.
GARDO:報酬ハッキングを伴わずに拡散モデルを強化する
強化学習
拡散モデル
Haoran He, Yuxiao Ye, Jie Liu, et al.
VAR RLの正しさ:視覚的自己回帰生成における非同期な方策の衝突への対処
強化学習
拡散モデル
Shikun Sun, Liao Qu, Huichao Zhang, et al.
DreamID-V:拡散トランスフォーマーを活用した高忠実度顔交換における画像から動画へのギャップの橋渡し
画像から動画生成
拡散モデル
Xu Guo, Fulong Ye, Xinghui Li, et al.
NextFlow:統一された順序モデリングがマルチモーダル理解および生成を活性化する
テキストから画像生成
画像生成
Huichao Zhang, Liao Qu, Yiheng Liu, et al.
K-EXAONE 技術報告
LLM
テキスト生成
Eunbi Choi, Kibong Choi, Seokhee Hong, et al.
ハンガーゲーム論争:マルチエージェントシステムにおける過度な競争の台頭について
エージェント
LLM
Xinbei Ma, Ruotian Ma, Xingyu Chen, et al.
1
3
4
5
6
7
8
9
48