HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
動的オブジェクトの世界を巧みに編み込む
動画生成
3D生成
Yanzhe Lyu, Chen Geng, Karthik Dharmarajan, et al.
Klear:統合型マルチタスク音声・映像共同生成
テキストから動画
Any-to-Any
Jun Wang, Chunyu Qiang, Yuxin Guo, et al.
Atlas:マルチドメイン複雑推論のための異種モデルおよびツールのオーケストレーション
エージェント
Reasoning
Jinyang Wu, Guocheng Zhai, Ruihan Jin, et al.
Benchmark^2:LLMベンチマークの体系的評価
LLM
データセット
Qi Qian, Chengsong Huang, Jingwen Xu, et al.
MindWatcher:よりスマートなマルチモーダルツール統合推論への道
エージェント
Reasoning
Jiawei Chen, Xintian Shen, Lihao Zheng, et al.
エントロピー適応型ファインチューニング:確信した矛盾の解消による忘却の軽減
監視付き微調整
LLM
Muxi Diao, Lele Yang, Wuxuan Gong, et al.
多様性か精度か?次トークン予測の深い考察
強化学習
監視付き微調整
Haoyuan Wu, Hai Wang, Jiajia Wu, et al.
孔子コードエージェント:現実世界のコードベースにおけるスケーラブルなエージェント構造
エージェント
コード生成
Sherman Wong, Zhenting Qi, Zhaodong Wang, et al.
DreamStyle:ビデオスタイル化のための統合枠組み
画像から動画生成
ビデオ処理
Mengtian Li, Jinshu Chen, Songtao Zhao, et al.
UniCorn:自己生成された教師信号を用いた自己改善型統合型マルチモーダルモデルへの道
テキストから画像生成
画像生成
Ruiyan Han, Zhen Fang, XinYu Sun, et al.
LTX-2:効率的な共同音声視覚基盤モデル
テキストから動画
拡散モデル
Yoav HaCohen, Benny Brazowski, Nisan Chiprut, et al.
SciEvalKit:科学一般知能向けオープンソース評価ツールキット
ベンチマーク
オープンソース
Yiheng Wang, Yixin Chen, Shuo Li, et al.
MOSS Transcribe Diarize:発話者分離を伴う高精度な音声認識
音声および音声処理
LLM
Donghua Yu, Zhengyuan Lin, Chen Yang, et al.
InfiniDepth:ニューラルインプリシットフィールドを用いた任意解像度・細粒度深度推定
深度推定
3D マシンビジョン
Hao Yu, Haotong Lin, Jiawei Wang, et al.
エージェント型AIの適応
エージェント
Reasoning
Pengcheng Jiang, Jiacheng Lin, Zhiyi Shi, et al.
大規模なビデオ計画が汎用的なロボット制御を可能にする
ロボティクス
エムボディドインテリジェンス
Boyuan Chen, Tianyuan Zhang, Haoran Geng, et al.
InfiniteVGGT:無限ストリーム向け視覚幾何学に基づくトランスフォーマー
アーキテクチャ
3D マシンビジョン
Shuai Yuan, Yantai Yang, Xiaotian Yang, et al.
GARDO:報酬ハッキングを伴わずに拡散モデルを強化する
強化学習
拡散モデル
Haoran He, Yuxiao Ye, Jie Liu, et al.
VAR RLの正しさ:視覚的自己回帰生成における非同期な方策の衝突への対処
強化学習
拡散モデル
Shikun Sun, Liao Qu, Huichao Zhang, et al.
DreamID-V:拡散トランスフォーマーを活用した高忠実度顔交換における画像から動画へのギャップの橋渡し
画像から動画生成
拡散モデル
Xu Guo, Fulong Ye, Xinghui Li, et al.
NextFlow:統一された順序モデリングがマルチモーダル理解および生成を活性化する
テキストから画像生成
画像生成
Huichao Zhang, Liao Qu, Yiheng Liu, et al.
K-EXAONE 技術報告
LLM
テキスト生成
Eunbi Choi, Kibong Choi, Seokhee Hong, et al.
ハンガーゲーム論争:マルチエージェントシステムにおける過度な競争の台頭について
エージェント
LLM
Xinbei Ma, Ruotian Ma, Xingyu Chen, et al.
ルーブリック報酬を用いたAI共同研究者の訓練
エージェント
Reasoning
Shashwat Goel, Rishi Hazra, Dulhan Jayalath, et al.
AdaGaR:動的シーン再構成のための適応型ガボール表現
3D マシンビジョン
深度推定
Jiewen Chan, Zhenjun Zhao, Yu-Lun Liu
幻覚の制御:反事実動画生成によるMLLMの動画理解能力の向上
拡散モデル
ビデオ理解
Zhe Huang, Hao Wen, Aiming Hao, et al.
SenseNova-MARS:強化学習を活用したマルチモーダルエージェント型推論と検索の実現
エージェント
マルチモーダル表現
Yong Xien Chng, Tao Hu, Wenwen Tong, et al.
アバター・フォースイング:自然な会話を実現するリアルタイム対話型ヘッドアバター生成
人間-コンピュータインタラクション
エムボディドインテリジェンス
Taekyung Ki, Sangwon Jang, Jaehyeong Jo, et al.
NeoVerse:リアルワールドの単眼動画を活用した4Dワールドモデルの強化
動画生成
3Dモデル
Yuxue Yang, Lue Fan, Ziqi Shi, et al.
Youtu-Agent:自動生成とハイブリッドポリシー最適化によるエージェント生産性のスケーリング
エージェント
LLM
Yuchen Shi, Yuzheng Cai, Siqi Cai, et al.
IQuest-Coder-V1 技術報告
コード生成
エージェント
Jian Yang, Wei Zhang, Shawn Guo, et al.
再帰型言語モデル
LLM
エージェント
Alex L. Zhang, Tim Kraska, Omar Khattab
1
2
3
4
5
6
7
8
47
動的オブジェクトの世界を巧みに編み込む
動画生成
3D生成
Yanzhe Lyu, Chen Geng, Karthik Dharmarajan, et al.
Klear:統合型マルチタスク音声・映像共同生成
テキストから動画
Any-to-Any
Jun Wang, Chunyu Qiang, Yuxin Guo, et al.
Atlas:マルチドメイン複雑推論のための異種モデルおよびツールのオーケストレーション
エージェント
Reasoning
Jinyang Wu, Guocheng Zhai, Ruihan Jin, et al.
Benchmark^2:LLMベンチマークの体系的評価
LLM
データセット
Qi Qian, Chengsong Huang, Jingwen Xu, et al.
MindWatcher:よりスマートなマルチモーダルツール統合推論への道
エージェント
Reasoning
Jiawei Chen, Xintian Shen, Lihao Zheng, et al.
エントロピー適応型ファインチューニング:確信した矛盾の解消による忘却の軽減
監視付き微調整
LLM
Muxi Diao, Lele Yang, Wuxuan Gong, et al.
多様性か精度か?次トークン予測の深い考察
強化学習
監視付き微調整
Haoyuan Wu, Hai Wang, Jiajia Wu, et al.
孔子コードエージェント:現実世界のコードベースにおけるスケーラブルなエージェント構造
エージェント
コード生成
Sherman Wong, Zhenting Qi, Zhaodong Wang, et al.
DreamStyle:ビデオスタイル化のための統合枠組み
画像から動画生成
ビデオ処理
Mengtian Li, Jinshu Chen, Songtao Zhao, et al.
UniCorn:自己生成された教師信号を用いた自己改善型統合型マルチモーダルモデルへの道
テキストから画像生成
画像生成
Ruiyan Han, Zhen Fang, XinYu Sun, et al.
LTX-2:効率的な共同音声視覚基盤モデル
テキストから動画
拡散モデル
Yoav HaCohen, Benny Brazowski, Nisan Chiprut, et al.
SciEvalKit:科学一般知能向けオープンソース評価ツールキット
ベンチマーク
オープンソース
Yiheng Wang, Yixin Chen, Shuo Li, et al.
MOSS Transcribe Diarize:発話者分離を伴う高精度な音声認識
音声および音声処理
LLM
Donghua Yu, Zhengyuan Lin, Chen Yang, et al.
InfiniDepth:ニューラルインプリシットフィールドを用いた任意解像度・細粒度深度推定
深度推定
3D マシンビジョン
Hao Yu, Haotong Lin, Jiawei Wang, et al.
エージェント型AIの適応
エージェント
Reasoning
Pengcheng Jiang, Jiacheng Lin, Zhiyi Shi, et al.
大規模なビデオ計画が汎用的なロボット制御を可能にする
ロボティクス
エムボディドインテリジェンス
Boyuan Chen, Tianyuan Zhang, Haoran Geng, et al.
InfiniteVGGT:無限ストリーム向け視覚幾何学に基づくトランスフォーマー
アーキテクチャ
3D マシンビジョン
Shuai Yuan, Yantai Yang, Xiaotian Yang, et al.
GARDO:報酬ハッキングを伴わずに拡散モデルを強化する
強化学習
拡散モデル
Haoran He, Yuxiao Ye, Jie Liu, et al.
VAR RLの正しさ:視覚的自己回帰生成における非同期な方策の衝突への対処
強化学習
拡散モデル
Shikun Sun, Liao Qu, Huichao Zhang, et al.
DreamID-V:拡散トランスフォーマーを活用した高忠実度顔交換における画像から動画へのギャップの橋渡し
画像から動画生成
拡散モデル
Xu Guo, Fulong Ye, Xinghui Li, et al.
NextFlow:統一された順序モデリングがマルチモーダル理解および生成を活性化する
テキストから画像生成
画像生成
Huichao Zhang, Liao Qu, Yiheng Liu, et al.
K-EXAONE 技術報告
LLM
テキスト生成
Eunbi Choi, Kibong Choi, Seokhee Hong, et al.
ハンガーゲーム論争:マルチエージェントシステムにおける過度な競争の台頭について
エージェント
LLM
Xinbei Ma, Ruotian Ma, Xingyu Chen, et al.
ルーブリック報酬を用いたAI共同研究者の訓練
エージェント
Reasoning
Shashwat Goel, Rishi Hazra, Dulhan Jayalath, et al.
AdaGaR:動的シーン再構成のための適応型ガボール表現
3D マシンビジョン
深度推定
Jiewen Chan, Zhenjun Zhao, Yu-Lun Liu
幻覚の制御:反事実動画生成によるMLLMの動画理解能力の向上
拡散モデル
ビデオ理解
Zhe Huang, Hao Wen, Aiming Hao, et al.
SenseNova-MARS:強化学習を活用したマルチモーダルエージェント型推論と検索の実現
エージェント
マルチモーダル表現
Yong Xien Chng, Tao Hu, Wenwen Tong, et al.
アバター・フォースイング:自然な会話を実現するリアルタイム対話型ヘッドアバター生成
人間-コンピュータインタラクション
エムボディドインテリジェンス
Taekyung Ki, Sangwon Jang, Jaehyeong Jo, et al.
NeoVerse:リアルワールドの単眼動画を活用した4Dワールドモデルの強化
動画生成
3Dモデル
Yuxue Yang, Lue Fan, Ziqi Shi, et al.
Youtu-Agent:自動生成とハイブリッドポリシー最適化によるエージェント生産性のスケーリング
エージェント
LLM
Yuchen Shi, Yuzheng Cai, Siqi Cai, et al.
IQuest-Coder-V1 技術報告
コード生成
エージェント
Jian Yang, Wei Zhang, Shawn Guo, et al.
再帰型言語モデル
LLM
エージェント
Alex L. Zhang, Tim Kraska, Omar Khattab
1
2
3
4
5
6
7
8
47