HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
RecGPT-V2 技ical Report
LLM
Reasoning
Chao Yi, Dian Chen, Gaoyang Guo, et al.
ベクトルプリズム:意味構造の階層化によるベクトルグラフィックスのアニメーション化
画像分割
テキストから動画
Jooyeol Yun, Jaegul Choo
OpenDataArena:ポストトレーニングデータセット価値のベンチマーク評価のための公正でオープンなアリーナ
LLM
オープンソース
Mengzhang Cai, Xin Gao, Yu Li, et al.
ビデオリアリティテスト:AI生成ASMR動画はVLMおよび人間を欺くことができるか?
マルチモーダル
ビデオ処理
Jiaqi Wang, Weijia Wu, Yi Zhan, et al.
WorldPlay:リアルタイムインタラクティブなワールドモデリングにおける長期的幾何学的一貫性の実現へ
動画生成
3D生成
Wenqiang Sun, Haiyu Zhang, Haoyuan Wang, et al.
MMGR:マルチモーダル・ジェネレーティブ・リーズニング
動画生成
Reasoning
Zefan Cai, Haoyi Qiu, Tianyi Ma, et al.
フロンティアサイエンス:AIが専門家レベルの科学的タスクを実行する能力の評価
ベンチマーク
Reasoning
Miles Wang, Joy Jiao, Neil Chowdhury, et al.
FACTS Leaderboard:大規模言語モデルの事実性を評価する包括的なベンチマーク
ベンチマーク
検索拡張生成
Aileen Cheng, Alon Jacovi, Amir Globerson, et al.
Nemotron-Cascade:汎用推論モデル向けカスケード強化学習のスケーリング
強化学習
Reasoning
Boxin Wang, Chankyu Lee, Nayeon Lee, et al.
KlingAvatar 2.0 技術報告
テキストから動画
動画生成
Kling Team, Jialu Chen, Yikang Ding, et al.
QwenLong-L1.5:長文脈推論およびメモリ管理のためのポストトレーニングレシピ
Reasoning
監視付き微調整
Weizhou Shen, Ziyi Yang, Chenliang Li, et al.
ReFusion:並列自己回帰デコーディングを備えた拡散大規模言語モデル
拡散モデル
LLM
Jia-Nan Li, Jian Guan, Wei Wu, et al.
エラーフリーな線形アテンションはフリーランチである:連続時間ダイナミクスからの正確な解
Transformer
LLM
Jingdi Lei, Di Zhang, Soujanya Poria
AIエージェントの時代における記憶
エージェント
検索拡張生成
Yuyang Hu, Shichun Liu, Yanwei Yue, et al.
LongVie 2:マルチモーダル制御可能 Ultra-Long Video World Model
動画生成
マルチモーダル
Jianxiong Gao, Zhaoxi Chen, Xian Liu, et al.
FirstAidQA:低接続環境における救急対応向けの合成データセット
データセット
監視付き微調整
Saiyma Sittul Muna, Rezwan Islam Salvi, Mushfiqur Rahman Mushfique, et al.
CUDA-L2:強化学習を活用した行列積演算におけるcuBLASを凌駕する性能
LLM
高性能計算
Songqiao Su, Xiaofei Sun, Xiaoya Li, et al.
X-VLA:スケーラブルなクロスエン bodiment 視覚言語行動モデルとしてのソフトプロンプト付きトランスフォーマー
Transformer
ロボティクス
Jinliang Zheng, Jianxiong Li, Zhihao Wang, et al.
Nemotron 3 Nano:エージェンティックな推論向けに最適化されたオープンで効率的なMixture-of-Experts型ハイブリッドMamba-Transformerモデル
Transformer
監視付き微調整
NVIDIA
トラッキングからの構造:動画生成のための構造保存型運動の蒸留
動画生成
拡散モデル
Yang Fei, George Stoica, Jingyuan Liu, et al.
MetaCanvasを用いたMLLM-Diffusion間情報伝達の探求
拡散モデル
画像生成
Han Lin, Xichen Pan, Ziqi Huang, et al.
PersonaLive! ライブストリーミング向け表現力豊かなポートレート画像アニメーション
拡散モデル
画像から動画生成
Zhiyuan Li, Chi-Man Pun, Chen Fang, et al.
V-RGBX:内在特性に対する正確な制御を備えた動画編集
動画生成
ビデオ処理
Ye Fang, Tong Wu, Valentin Deschaintre, et al.
SVG-T2I:変分自己符号化器を用いずにテキストから画像への潜在拡散モデルのスケーリングアップ
テキストから画像生成
拡散モデル
Minglei Shi, Haolin Wang, Borui Zhang, et al.
DentalGPT:歯科におけるマルチモーダルな複雑な推論を促進するためのアプローチ
視覚質問応答
マルチモーダル表現
Zhenyang Cai, Jiaming Zhang, Junjie Zhao, et al.
SSRB:大規模な異種の準構造化データに対する直接的な自然言語クエリ
検索拡張生成
自然言語処理
Xin Zhang, Mingxin Li, Yanzhao Zhang, et al.
MUVR:マルチモーダルな未加工動画のリトリーバルを評価するベンチマークと、マルチレベルの視覚的対応関係
視覚質問応答
マルチモーダル表現
Yue Feng, Jinwei Hu, Qijia Lu, et al.
Geminiロボティクス政策のVeoワールドシミュレータにおける評価
ビデオ理解
ロボティクス
Coline Devin, Yilun Du, Debidatta Dwibedi, et al.
MotionEdit:モーション中心型画像編集のベンチマークと学習
画像間変換
動画生成
Yixin Wan, Lei Ke, Wenhao Yu, et al.
オリンピックレベルの幾何学大規模言語モデルエージェントの実現を目的とした、複雑性ブースティング強化学習によるアプローチ
視覚質問応答
エージェント
Haiteng Zhao, Junhao Shen, Yiming Zhang, et al.
OPV:効率的な長文の思考過程検証を目的とした成果に基づくプロセス検証器
LLM
Reasoning
Zijian Wu, Lingkai Kong, Wenwei Zhang, et al.
テキストから3D生成へのRL導入は、本当に準備ができているか? プログレッシブな検証
強化学習
3D生成
Yiwen Tang, Zoey Guo, Kaixin Zhu, et al.
1
6
7
8
9
10
11
12
47
RecGPT-V2 技ical Report
LLM
Reasoning
Chao Yi, Dian Chen, Gaoyang Guo, et al.
ベクトルプリズム:意味構造の階層化によるベクトルグラフィックスのアニメーション化
画像分割
テキストから動画
Jooyeol Yun, Jaegul Choo
OpenDataArena:ポストトレーニングデータセット価値のベンチマーク評価のための公正でオープンなアリーナ
LLM
オープンソース
Mengzhang Cai, Xin Gao, Yu Li, et al.
ビデオリアリティテスト:AI生成ASMR動画はVLMおよび人間を欺くことができるか?
マルチモーダル
ビデオ処理
Jiaqi Wang, Weijia Wu, Yi Zhan, et al.
WorldPlay:リアルタイムインタラクティブなワールドモデリングにおける長期的幾何学的一貫性の実現へ
動画生成
3D生成
Wenqiang Sun, Haiyu Zhang, Haoyuan Wang, et al.
MMGR:マルチモーダル・ジェネレーティブ・リーズニング
動画生成
Reasoning
Zefan Cai, Haoyi Qiu, Tianyi Ma, et al.
フロンティアサイエンス:AIが専門家レベルの科学的タスクを実行する能力の評価
ベンチマーク
Reasoning
Miles Wang, Joy Jiao, Neil Chowdhury, et al.
FACTS Leaderboard:大規模言語モデルの事実性を評価する包括的なベンチマーク
ベンチマーク
検索拡張生成
Aileen Cheng, Alon Jacovi, Amir Globerson, et al.
Nemotron-Cascade:汎用推論モデル向けカスケード強化学習のスケーリング
強化学習
Reasoning
Boxin Wang, Chankyu Lee, Nayeon Lee, et al.
KlingAvatar 2.0 技術報告
テキストから動画
動画生成
Kling Team, Jialu Chen, Yikang Ding, et al.
QwenLong-L1.5:長文脈推論およびメモリ管理のためのポストトレーニングレシピ
Reasoning
監視付き微調整
Weizhou Shen, Ziyi Yang, Chenliang Li, et al.
ReFusion:並列自己回帰デコーディングを備えた拡散大規模言語モデル
拡散モデル
LLM
Jia-Nan Li, Jian Guan, Wei Wu, et al.
エラーフリーな線形アテンションはフリーランチである:連続時間ダイナミクスからの正確な解
Transformer
LLM
Jingdi Lei, Di Zhang, Soujanya Poria
AIエージェントの時代における記憶
エージェント
検索拡張生成
Yuyang Hu, Shichun Liu, Yanwei Yue, et al.
LongVie 2:マルチモーダル制御可能 Ultra-Long Video World Model
動画生成
マルチモーダル
Jianxiong Gao, Zhaoxi Chen, Xian Liu, et al.
FirstAidQA:低接続環境における救急対応向けの合成データセット
データセット
監視付き微調整
Saiyma Sittul Muna, Rezwan Islam Salvi, Mushfiqur Rahman Mushfique, et al.
CUDA-L2:強化学習を活用した行列積演算におけるcuBLASを凌駕する性能
LLM
高性能計算
Songqiao Su, Xiaofei Sun, Xiaoya Li, et al.
X-VLA:スケーラブルなクロスエン bodiment 視覚言語行動モデルとしてのソフトプロンプト付きトランスフォーマー
Transformer
ロボティクス
Jinliang Zheng, Jianxiong Li, Zhihao Wang, et al.
Nemotron 3 Nano:エージェンティックな推論向けに最適化されたオープンで効率的なMixture-of-Experts型ハイブリッドMamba-Transformerモデル
Transformer
監視付き微調整
NVIDIA
トラッキングからの構造:動画生成のための構造保存型運動の蒸留
動画生成
拡散モデル
Yang Fei, George Stoica, Jingyuan Liu, et al.
MetaCanvasを用いたMLLM-Diffusion間情報伝達の探求
拡散モデル
画像生成
Han Lin, Xichen Pan, Ziqi Huang, et al.
PersonaLive! ライブストリーミング向け表現力豊かなポートレート画像アニメーション
拡散モデル
画像から動画生成
Zhiyuan Li, Chi-Man Pun, Chen Fang, et al.
V-RGBX:内在特性に対する正確な制御を備えた動画編集
動画生成
ビデオ処理
Ye Fang, Tong Wu, Valentin Deschaintre, et al.
SVG-T2I:変分自己符号化器を用いずにテキストから画像への潜在拡散モデルのスケーリングアップ
テキストから画像生成
拡散モデル
Minglei Shi, Haolin Wang, Borui Zhang, et al.
DentalGPT:歯科におけるマルチモーダルな複雑な推論を促進するためのアプローチ
視覚質問応答
マルチモーダル表現
Zhenyang Cai, Jiaming Zhang, Junjie Zhao, et al.
SSRB:大規模な異種の準構造化データに対する直接的な自然言語クエリ
検索拡張生成
自然言語処理
Xin Zhang, Mingxin Li, Yanzhao Zhang, et al.
MUVR:マルチモーダルな未加工動画のリトリーバルを評価するベンチマークと、マルチレベルの視覚的対応関係
視覚質問応答
マルチモーダル表現
Yue Feng, Jinwei Hu, Qijia Lu, et al.
Geminiロボティクス政策のVeoワールドシミュレータにおける評価
ビデオ理解
ロボティクス
Coline Devin, Yilun Du, Debidatta Dwibedi, et al.
MotionEdit:モーション中心型画像編集のベンチマークと学習
画像間変換
動画生成
Yixin Wan, Lei Ke, Wenhao Yu, et al.
オリンピックレベルの幾何学大規模言語モデルエージェントの実現を目的とした、複雑性ブースティング強化学習によるアプローチ
視覚質問応答
エージェント
Haiteng Zhao, Junhao Shen, Yiming Zhang, et al.
OPV:効率的な長文の思考過程検証を目的とした成果に基づくプロセス検証器
LLM
Reasoning
Zijian Wu, Lingkai Kong, Wenwei Zhang, et al.
テキストから3D生成へのRL導入は、本当に準備ができているか? プログレッシブな検証
強化学習
3D生成
Yiwen Tang, Zoey Guo, Kaixin Zhu, et al.
1
6
7
8
9
10
11
12
47