HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
次Embedding予測が強力な視覚学習者を実現する
Transformer
コンピュータビジョン
Sihan Xu, Ziqiao Ma, Wenhao Chai, et al.
エージェントAI:マルチモーダルインタラクションの地平を探索する
エムボディドインテリジェンス
マルチモーダル
Zane Durante, Qiuyuan Huang, Naoki Wake, et al.
AI数学者を数学的発見の先導者として――均質化理論における事例研究
Reasoning
人工知能
Yuanhang Liu, Beichen Wang, Peng Li, et al.
GenEval 2:テキストから画像評価におけるベンチマークのずれに対処する
テキストから画像生成
ベンチマーク
Amita Kamath, Kai-Wei Chang, Ranjay Krishna, et al.
PrivateXR:説明可能なAIガイド付き微分プライバシーを用いた拡張現実におけるプライバシー攻撃防御
感情認識
マルチモーダル
Ripan Kumar Kundu, Istiak Ahmed, Khaza Anuarul Hoque
時間的な摩擦と裁判所の結果:2020–2024年におけるクック郡の刑事判決における時間遅延の影響分析
データセット
モデリング
Yifei Tong
メタRLは言語エージェントにおける探索を誘発する
強化学習
LLM
Yulun Jiang, Liangze Jiang, Damien Teney, et al.
LLMCache:Transformer推論における高速再利用のための階層的キャッシュ戦略
LLM
Transformer
Harsh Vardhan Bansal
OPENTOUCH:現実世界のインタラクションにフルハンドタッチをもたらす
マルチモーダル
ビデオ理解
Yuxin Ray Song, Jinzhou Li, Rao Fu, et al.
VideoRewardBench:動画理解におけるマルチモーダル報酬モデルの包括的評価
ビデオ理解
視覚質問応答
Zhihong Zhang, Xiaojian Huang, Jin Xu, et al.
ソウル:高精度な長期マルチモーダルアニメーションのためのデジタル人間への生命の息吹き
Any-to-Any
画像から動画生成
Jiangning Zhang, Junwei Zhu, Zhenye Gan, et al.
IF-Bench:生成視覚を用いた赤外線画像におけるMLLMのベンチマーク評価と性能向上
視覚質問応答
ベンチマーク
Tao Zhang, Yuyang Hong, Yang Xia, et al.
RecGPT-V2 技ical Report
LLM
Reasoning
Chao Yi, Dian Chen, Gaoyang Guo, et al.
ベクトルプリズム:意味構造の階層化によるベクトルグラフィックスのアニメーション化
画像分割
テキストから動画
Jooyeol Yun, Jaegul Choo
OpenDataArena:ポストトレーニングデータセット価値のベンチマーク評価のための公正でオープンなアリーナ
LLM
オープンソース
Mengzhang Cai, Xin Gao, Yu Li, et al.
ビデオリアリティテスト:AI生成ASMR動画はVLMおよび人間を欺くことができるか?
マルチモーダル
ビデオ処理
Jiaqi Wang, Weijia Wu, Yi Zhan, et al.
WorldPlay:リアルタイムインタラクティブなワールドモデリングにおける長期的幾何学的一貫性の実現へ
動画生成
3D生成
Wenqiang Sun, Haiyu Zhang, Haoyuan Wang, et al.
MMGR:マルチモーダル・ジェネレーティブ・リーズニング
動画生成
Reasoning
Zefan Cai, Haoyi Qiu, Tianyi Ma, et al.
フロンティアサイエンス:AIが専門家レベルの科学的タスクを実行する能力の評価
ベンチマーク
Reasoning
Miles Wang, Joy Jiao, Neil Chowdhury, et al.
FACTS Leaderboard:大規模言語モデルの事実性を評価する包括的なベンチマーク
ベンチマーク
検索拡張生成
Aileen Cheng, Alon Jacovi, Amir Globerson, et al.
Nemotron-Cascade:汎用推論モデル向けカスケード強化学習のスケーリング
強化学習
Reasoning
Boxin Wang, Chankyu Lee, Nayeon Lee, et al.
KlingAvatar 2.0 技術報告
テキストから動画
動画生成
Kling Team, Jialu Chen, Yikang Ding, et al.
QwenLong-L1.5:長文脈推論およびメモリ管理のためのポストトレーニングレシピ
Reasoning
監視付き微調整
Weizhou Shen, Ziyi Yang, Chenliang Li, et al.
ReFusion:並列自己回帰デコーディングを備えた拡散大規模言語モデル
拡散モデル
LLM
Jia-Nan Li, Jian Guan, Wei Wu, et al.
エラーフリーな線形アテンションはフリーランチである:連続時間ダイナミクスからの正確な解
Transformer
LLM
Jingdi Lei, Di Zhang, Soujanya Poria
AIエージェントの時代における記憶
エージェント
検索拡張生成
Yuyang Hu, Shichun Liu, Yanwei Yue, et al.
LongVie 2:マルチモーダル制御可能 Ultra-Long Video World Model
動画生成
マルチモーダル
Jianxiong Gao, Zhaoxi Chen, Xian Liu, et al.
FirstAidQA:低接続環境における救急対応向けの合成データセット
データセット
監視付き微調整
Saiyma Sittul Muna, Rezwan Islam Salvi, Mushfiqur Rahman Mushfique, et al.
CUDA-L2:強化学習を活用した行列積演算におけるcuBLASを凌駕する性能
LLM
高性能計算
Songqiao Su, Xiaofei Sun, Xiaoya Li, et al.
X-VLA:スケーラブルなクロスエン bodiment 視覚言語行動モデルとしてのソフトプロンプト付きトランスフォーマー
Transformer
ロボティクス
Jinliang Zheng, Jianxiong Li, Zhihao Wang, et al.
Nemotron 3 Nano:エージェンティックな推論向けに最適化されたオープンで効率的なMixture-of-Experts型ハイブリッドMamba-Transformerモデル
Transformer
監視付き微調整
NVIDIA
トラッキングからの構造:動画生成のための構造保存型運動の蒸留
動画生成
拡散モデル
Yang Fei, George Stoica, Jingyuan Liu, et al.
1
10
11
12
13
14
15
16
51
次Embedding予測が強力な視覚学習者を実現する
Transformer
コンピュータビジョン
Sihan Xu, Ziqiao Ma, Wenhao Chai, et al.
エージェントAI:マルチモーダルインタラクションの地平を探索する
エムボディドインテリジェンス
マルチモーダル
Zane Durante, Qiuyuan Huang, Naoki Wake, et al.
AI数学者を数学的発見の先導者として――均質化理論における事例研究
Reasoning
人工知能
Yuanhang Liu, Beichen Wang, Peng Li, et al.
GenEval 2:テキストから画像評価におけるベンチマークのずれに対処する
テキストから画像生成
ベンチマーク
Amita Kamath, Kai-Wei Chang, Ranjay Krishna, et al.
PrivateXR:説明可能なAIガイド付き微分プライバシーを用いた拡張現実におけるプライバシー攻撃防御
感情認識
マルチモーダル
Ripan Kumar Kundu, Istiak Ahmed, Khaza Anuarul Hoque
時間的な摩擦と裁判所の結果:2020–2024年におけるクック郡の刑事判決における時間遅延の影響分析
データセット
モデリング
Yifei Tong
メタRLは言語エージェントにおける探索を誘発する
強化学習
LLM
Yulun Jiang, Liangze Jiang, Damien Teney, et al.
LLMCache:Transformer推論における高速再利用のための階層的キャッシュ戦略
LLM
Transformer
Harsh Vardhan Bansal
OPENTOUCH:現実世界のインタラクションにフルハンドタッチをもたらす
マルチモーダル
ビデオ理解
Yuxin Ray Song, Jinzhou Li, Rao Fu, et al.
VideoRewardBench:動画理解におけるマルチモーダル報酬モデルの包括的評価
ビデオ理解
視覚質問応答
Zhihong Zhang, Xiaojian Huang, Jin Xu, et al.
ソウル:高精度な長期マルチモーダルアニメーションのためのデジタル人間への生命の息吹き
Any-to-Any
画像から動画生成
Jiangning Zhang, Junwei Zhu, Zhenye Gan, et al.
IF-Bench:生成視覚を用いた赤外線画像におけるMLLMのベンチマーク評価と性能向上
視覚質問応答
ベンチマーク
Tao Zhang, Yuyang Hong, Yang Xia, et al.
RecGPT-V2 技ical Report
LLM
Reasoning
Chao Yi, Dian Chen, Gaoyang Guo, et al.
ベクトルプリズム:意味構造の階層化によるベクトルグラフィックスのアニメーション化
画像分割
テキストから動画
Jooyeol Yun, Jaegul Choo
OpenDataArena:ポストトレーニングデータセット価値のベンチマーク評価のための公正でオープンなアリーナ
LLM
オープンソース
Mengzhang Cai, Xin Gao, Yu Li, et al.
ビデオリアリティテスト:AI生成ASMR動画はVLMおよび人間を欺くことができるか?
マルチモーダル
ビデオ処理
Jiaqi Wang, Weijia Wu, Yi Zhan, et al.
WorldPlay:リアルタイムインタラクティブなワールドモデリングにおける長期的幾何学的一貫性の実現へ
動画生成
3D生成
Wenqiang Sun, Haiyu Zhang, Haoyuan Wang, et al.
MMGR:マルチモーダル・ジェネレーティブ・リーズニング
動画生成
Reasoning
Zefan Cai, Haoyi Qiu, Tianyi Ma, et al.
フロンティアサイエンス:AIが専門家レベルの科学的タスクを実行する能力の評価
ベンチマーク
Reasoning
Miles Wang, Joy Jiao, Neil Chowdhury, et al.
FACTS Leaderboard:大規模言語モデルの事実性を評価する包括的なベンチマーク
ベンチマーク
検索拡張生成
Aileen Cheng, Alon Jacovi, Amir Globerson, et al.
Nemotron-Cascade:汎用推論モデル向けカスケード強化学習のスケーリング
強化学習
Reasoning
Boxin Wang, Chankyu Lee, Nayeon Lee, et al.
KlingAvatar 2.0 技術報告
テキストから動画
動画生成
Kling Team, Jialu Chen, Yikang Ding, et al.
QwenLong-L1.5:長文脈推論およびメモリ管理のためのポストトレーニングレシピ
Reasoning
監視付き微調整
Weizhou Shen, Ziyi Yang, Chenliang Li, et al.
ReFusion:並列自己回帰デコーディングを備えた拡散大規模言語モデル
拡散モデル
LLM
Jia-Nan Li, Jian Guan, Wei Wu, et al.
エラーフリーな線形アテンションはフリーランチである:連続時間ダイナミクスからの正確な解
Transformer
LLM
Jingdi Lei, Di Zhang, Soujanya Poria
AIエージェントの時代における記憶
エージェント
検索拡張生成
Yuyang Hu, Shichun Liu, Yanwei Yue, et al.
LongVie 2:マルチモーダル制御可能 Ultra-Long Video World Model
動画生成
マルチモーダル
Jianxiong Gao, Zhaoxi Chen, Xian Liu, et al.
FirstAidQA:低接続環境における救急対応向けの合成データセット
データセット
監視付き微調整
Saiyma Sittul Muna, Rezwan Islam Salvi, Mushfiqur Rahman Mushfique, et al.
CUDA-L2:強化学習を活用した行列積演算におけるcuBLASを凌駕する性能
LLM
高性能計算
Songqiao Su, Xiaofei Sun, Xiaoya Li, et al.
X-VLA:スケーラブルなクロスエン bodiment 視覚言語行動モデルとしてのソフトプロンプト付きトランスフォーマー
Transformer
ロボティクス
Jinliang Zheng, Jianxiong Li, Zhihao Wang, et al.
Nemotron 3 Nano:エージェンティックな推論向けに最適化されたオープンで効率的なMixture-of-Experts型ハイブリッドMamba-Transformerモデル
Transformer
監視付き微調整
NVIDIA
トラッキングからの構造:動画生成のための構造保存型運動の蒸留
動画生成
拡散モデル
Yang Fei, George Stoica, Jingyuan Liu, et al.
1
10
11
12
13
14
15
16
51