HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
DreamStyle:ビデオスタイル化のための統合枠組み
画像から動画生成
ビデオ処理
Mengtian Li, Jinshu Chen, Songtao Zhao, et al.
UniCorn:自己生成された教師信号を用いた自己改善型統合型マルチモーダルモデルへの道
テキストから画像生成
画像生成
Ruiyan Han, Zhen Fang, XinYu Sun, et al.
LTX-2:効率的な共同音声視覚基盤モデル
テキストから動画
拡散モデル
Yoav HaCohen, Benny Brazowski, Nisan Chiprut, et al.
SciEvalKit:科学一般知能向けオープンソース評価ツールキット
ベンチマーク
オープンソース
Yiheng Wang, Yixin Chen, Shuo Li, et al.
MOSS Transcribe Diarize:発話者分離を伴う高精度な音声認識
音声および音声処理
LLM
Donghua Yu, Zhengyuan Lin, Chen Yang, et al.
InfiniDepth:ニューラルインプリシットフィールドを用いた任意解像度・細粒度深度推定
深度推定
3D マシンビジョン
Hao Yu, Haotong Lin, Jiawei Wang, et al.
エージェント型AIの適応
エージェント
Reasoning
Pengcheng Jiang, Jiacheng Lin, Zhiyi Shi, et al.
大規模なビデオ計画が汎用的なロボット制御を可能にする
ロボティクス
エムボディドインテリジェンス
Boyuan Chen, Tianyuan Zhang, Haoran Geng, et al.
InfiniteVGGT:無限ストリーム向け視覚幾何学に基づくトランスフォーマー
アーキテクチャ
3D マシンビジョン
Shuai Yuan, Yantai Yang, Xiaotian Yang, et al.
GARDO:報酬ハッキングを伴わずに拡散モデルを強化する
強化学習
拡散モデル
Haoran He, Yuxiao Ye, Jie Liu, et al.
VAR RLの正しさ:視覚的自己回帰生成における非同期な方策の衝突への対処
強化学習
拡散モデル
Shikun Sun, Liao Qu, Huichao Zhang, et al.
DreamID-V:拡散トランスフォーマーを活用した高忠実度顔交換における画像から動画へのギャップの橋渡し
画像から動画生成
拡散モデル
Xu Guo, Fulong Ye, Xinghui Li, et al.
NextFlow:統一された順序モデリングがマルチモーダル理解および生成を活性化する
テキストから画像生成
画像生成
Huichao Zhang, Liao Qu, Yiheng Liu, et al.
K-EXAONE 技術報告
LLM
テキスト生成
Eunbi Choi, Kibong Choi, Seokhee Hong, et al.
ハンガーゲーム論争:マルチエージェントシステムにおける過度な競争の台頭について
エージェント
LLM
Xinbei Ma, Ruotian Ma, Xingyu Chen, et al.
ルーブリック報酬を用いたAI共同研究者の訓練
エージェント
Reasoning
Shashwat Goel, Rishi Hazra, Dulhan Jayalath, et al.
AdaGaR:動的シーン再構成のための適応型ガボール表現
3D マシンビジョン
深度推定
Jiewen Chan, Zhenjun Zhao, Yu-Lun Liu
幻覚の制御:反事実動画生成によるMLLMの動画理解能力の向上
拡散モデル
ビデオ理解
Zhe Huang, Hao Wen, Aiming Hao, et al.
SenseNova-MARS:強化学習を活用したマルチモーダルエージェント型推論と検索の実現
エージェント
マルチモーダル表現
Yong Xien Chng, Tao Hu, Wenwen Tong, et al.
アバター・フォースイング:自然な会話を実現するリアルタイム対話型ヘッドアバター生成
人間-コンピュータインタラクション
エムボディドインテリジェンス
Taekyung Ki, Sangwon Jang, Jaehyeong Jo, et al.
NeoVerse:リアルワールドの単眼動画を活用した4Dワールドモデルの強化
動画生成
3Dモデル
Yuxue Yang, Lue Fan, Ziqi Shi, et al.
Youtu-Agent:自動生成とハイブリッドポリシー最適化によるエージェント生産性のスケーリング
エージェント
LLM
Yuchen Shi, Yuzheng Cai, Siqi Cai, et al.
IQuest-Coder-V1 技術報告
コード生成
エージェント
Jian Yang, Wei Zhang, Shawn Guo, et al.
再帰型言語モデル
LLM
エージェント
Alex L. Zhang, Tim Kraska, Omar Khattab
FlowBlending:段階認識型マルチモデルサンプリングによる高速かつ高忠実度の動画生成
動画生成
拡散モデル
Jibin Song, Mingi Kwon, Jaeseok Jeong, et al.
Dream2Flow:3Dオブジェクトフローを用いたビデオ生成とオープンワールド操作の橋渡し
動画生成
ロボティクス
Karthik Dharmarajan, Wenlong Huang, Jiajun Wu, et al.
拡散LLMにおける離散性の役割
拡散モデル
LLM
Ziqi Jin, Bin Wang, Xiang Lin, et al.
DiffThinker:拡散モデルを用いた生成型マルチモーダル推論へ向けて
拡散モデル
Reasoning
Zefeng He, Xiaoye Qu, Yafu Li, et al.
動的大型概念モデル:適応型意味空間における潜在的推論
LLM
自然言語処理
Xingwei Qu, Shaowen Wang, Zihao Huang, et al.
長文脈複雑関係モデリングにおけるハイパーグラフベースメモリを用いたマルチステップRAGの改善
検索拡張生成
Reasoning
Chulun Zhou, Chunkang Zhang, Guoxin Yu, et al.
AIが脳に出会う:認知神経科学から自律エージェントへ至る記憶システム
エージェント
LLM
Jiafeng Liang, Hao Li, Chang Li, et al.
スケーラビリティの向上による開かれたエンドリーディング推論による未来予測
Reasoning
検索拡張生成
Nikhil Chandak, Shashwat Goel, Ameya Prabhu, et al.
1
4
5
6
7
8
9
10
49
DreamStyle:ビデオスタイル化のための統合枠組み
画像から動画生成
ビデオ処理
Mengtian Li, Jinshu Chen, Songtao Zhao, et al.
UniCorn:自己生成された教師信号を用いた自己改善型統合型マルチモーダルモデルへの道
テキストから画像生成
画像生成
Ruiyan Han, Zhen Fang, XinYu Sun, et al.
LTX-2:効率的な共同音声視覚基盤モデル
テキストから動画
拡散モデル
Yoav HaCohen, Benny Brazowski, Nisan Chiprut, et al.
SciEvalKit:科学一般知能向けオープンソース評価ツールキット
ベンチマーク
オープンソース
Yiheng Wang, Yixin Chen, Shuo Li, et al.
MOSS Transcribe Diarize:発話者分離を伴う高精度な音声認識
音声および音声処理
LLM
Donghua Yu, Zhengyuan Lin, Chen Yang, et al.
InfiniDepth:ニューラルインプリシットフィールドを用いた任意解像度・細粒度深度推定
深度推定
3D マシンビジョン
Hao Yu, Haotong Lin, Jiawei Wang, et al.
エージェント型AIの適応
エージェント
Reasoning
Pengcheng Jiang, Jiacheng Lin, Zhiyi Shi, et al.
大規模なビデオ計画が汎用的なロボット制御を可能にする
ロボティクス
エムボディドインテリジェンス
Boyuan Chen, Tianyuan Zhang, Haoran Geng, et al.
InfiniteVGGT:無限ストリーム向け視覚幾何学に基づくトランスフォーマー
アーキテクチャ
3D マシンビジョン
Shuai Yuan, Yantai Yang, Xiaotian Yang, et al.
GARDO:報酬ハッキングを伴わずに拡散モデルを強化する
強化学習
拡散モデル
Haoran He, Yuxiao Ye, Jie Liu, et al.
VAR RLの正しさ:視覚的自己回帰生成における非同期な方策の衝突への対処
強化学習
拡散モデル
Shikun Sun, Liao Qu, Huichao Zhang, et al.
DreamID-V:拡散トランスフォーマーを活用した高忠実度顔交換における画像から動画へのギャップの橋渡し
画像から動画生成
拡散モデル
Xu Guo, Fulong Ye, Xinghui Li, et al.
NextFlow:統一された順序モデリングがマルチモーダル理解および生成を活性化する
テキストから画像生成
画像生成
Huichao Zhang, Liao Qu, Yiheng Liu, et al.
K-EXAONE 技術報告
LLM
テキスト生成
Eunbi Choi, Kibong Choi, Seokhee Hong, et al.
ハンガーゲーム論争:マルチエージェントシステムにおける過度な競争の台頭について
エージェント
LLM
Xinbei Ma, Ruotian Ma, Xingyu Chen, et al.
ルーブリック報酬を用いたAI共同研究者の訓練
エージェント
Reasoning
Shashwat Goel, Rishi Hazra, Dulhan Jayalath, et al.
AdaGaR:動的シーン再構成のための適応型ガボール表現
3D マシンビジョン
深度推定
Jiewen Chan, Zhenjun Zhao, Yu-Lun Liu
幻覚の制御:反事実動画生成によるMLLMの動画理解能力の向上
拡散モデル
ビデオ理解
Zhe Huang, Hao Wen, Aiming Hao, et al.
SenseNova-MARS:強化学習を活用したマルチモーダルエージェント型推論と検索の実現
エージェント
マルチモーダル表現
Yong Xien Chng, Tao Hu, Wenwen Tong, et al.
アバター・フォースイング:自然な会話を実現するリアルタイム対話型ヘッドアバター生成
人間-コンピュータインタラクション
エムボディドインテリジェンス
Taekyung Ki, Sangwon Jang, Jaehyeong Jo, et al.
NeoVerse:リアルワールドの単眼動画を活用した4Dワールドモデルの強化
動画生成
3Dモデル
Yuxue Yang, Lue Fan, Ziqi Shi, et al.
Youtu-Agent:自動生成とハイブリッドポリシー最適化によるエージェント生産性のスケーリング
エージェント
LLM
Yuchen Shi, Yuzheng Cai, Siqi Cai, et al.
IQuest-Coder-V1 技術報告
コード生成
エージェント
Jian Yang, Wei Zhang, Shawn Guo, et al.
再帰型言語モデル
LLM
エージェント
Alex L. Zhang, Tim Kraska, Omar Khattab
FlowBlending:段階認識型マルチモデルサンプリングによる高速かつ高忠実度の動画生成
動画生成
拡散モデル
Jibin Song, Mingi Kwon, Jaeseok Jeong, et al.
Dream2Flow:3Dオブジェクトフローを用いたビデオ生成とオープンワールド操作の橋渡し
動画生成
ロボティクス
Karthik Dharmarajan, Wenlong Huang, Jiajun Wu, et al.
拡散LLMにおける離散性の役割
拡散モデル
LLM
Ziqi Jin, Bin Wang, Xiang Lin, et al.
DiffThinker:拡散モデルを用いた生成型マルチモーダル推論へ向けて
拡散モデル
Reasoning
Zefeng He, Xiaoye Qu, Yafu Li, et al.
動的大型概念モデル:適応型意味空間における潜在的推論
LLM
自然言語処理
Xingwei Qu, Shaowen Wang, Zihao Huang, et al.
長文脈複雑関係モデリングにおけるハイパーグラフベースメモリを用いたマルチステップRAGの改善
検索拡張生成
Reasoning
Chulun Zhou, Chunkang Zhang, Guoxin Yu, et al.
AIが脳に出会う:認知神経科学から自律エージェントへ至る記憶システム
エージェント
LLM
Jiafeng Liang, Hao Li, Chang Li, et al.
スケーラビリティの向上による開かれたエンドリーディング推論による未来予測
Reasoning
検索拡張生成
Nikhil Chandak, Shashwat Goel, Ameya Prabhu, et al.
1
4
5
6
7
8
9
10
49