HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
マインドスケープ認識型リtrieval-Augmented Generationによる長文脈理解の向上
検索拡張生成
LLM
Yuqing Li, Jiangnan Li, Zheng Lin, et al.
大規模言語モデルにおける短文の事実性の測定
インテリジェントな質問応答
ベンチマーク
Jason Wei, Nguyen Karina, Hyung Won Chung, et al.
DeepSearchQA:深い研究エージェントにおける包括性のギャップを埋める
エージェント
ベンチマーク
Nikita Gupta, Riju Chatterjee, Lukas Haas, et al.
MEM1:長期間エージェントの効率化のための記憶と推論の連携学習
強化学習
Reasoning
Zijian Zhou, Ao Qu, Zhaoxuan Wu, et al.
AI-Trader:リアルタイム金融市場における自律型エージェントのベンチマーク評価
エージェント
LLM
Tianyu Fan, Yuhao Yang, Yangqin Jiang, et al.
潜在的陰在視覚的推論
マルチモーダル表現
LLM
Kelvin Li, Chuyi Shang, Leonid Karlinsky, et al.
LLMのペルソナが手法のベンチマーキングにおけるフィールド実験の代替としての役割を果たす可能性
ベンチマーク
機械学習
Enoch Hyunwook Kang
DataFlow:データ中心型AI時代における統一されたデータ準備およびワークフロー自動化を実現するLLM駆動型フレームワーク
LLM
検索拡張生成
Hao Liang, Xiaochen Ma, Zhou Liu, et al.
HiStream:冗長性除去ストリーミングを用いた効率的な高解像度ビデオ生成
動画生成
拡散モデル
Haonan Qiu, Shikun Liu, Zijian Zhou, et al.
TokSuite:トークナイザーの選択が言語モデルの行動に与える影響を測定する
Transformer
ベンチマーク
Gül Sena Altıntaş, Malikeh Ehghaghi, Brian Lester, et al.
Nemotron 3 Nano:エージェンティック推論向けに最適化されたオープンで効率的なMixture-of-ExpertsハイブリッドMamba-Transformerモデル
Transformer
監視付き微調整
NVIDIA, Aaron Blakeman, Aaron Grattafiori, et al.
記憶を超えて:視覚言語モデルにおける人気バイアスを露呈するマルチモーダル順序回帰ベンチマーク
マルチモーダル
ベンチマーク
Li-Zhong Szu-Tu, Ting-Lin Wu, Chia-Jui Chang, et al.
DreaMontage:任意フレームガイド付きワンショット動画生成
動画生成
画像から動画生成
Jiawei Liu, Junqiao Li, Jiangfan Deng, et al.
T2AV-Compass:テキストから音声・映像生成への統合的評価へ向けて
Any-to-Any
テキストから動画
Zhe Cao, Tao Wang, Jiaming Wang, et al.
TongSIM:知能機械のシミュレーションを目的とした汎用プラットフォーム
エムボディドインテリジェンス
エージェント
Zhe Sun, Kunlun Wu, Chuanjian Fu, et al.
Qwen-Image-Layered:レイヤー分解による本質的な編集可能性の実現へ
拡散モデル
画像生成
Shengming Yin, Zekai Zhang, Zecheng Tang, et al.
RoboSafe:実行可能安全論理を用いた身体化エージェントの保護
ロボティクス
Reasoning
Le Wang, Zonghao Ying, Xiao Yang, et al.
NHSにおけるプライマリケアにおけるLLM薬物療法安全レビューの実世界評価
自然言語処理
データセット
Oliver Normand, Esther Borsi, Mitch Fruin, et al.
複数LLMを用いた主題分析:二重信頼性指標を用いた定性的研究の検証—CohenのKappaと意味的類似度の統合
LLM
自然言語処理
Nilesh Jain, Seyi Adeyinka, Leor Roseman, et al.
閉ループ・ワールドモデリングを用いたビデオアバターにおけるアクティブインテリジェンス
エムボディドインテリジェンス
強化学習
Xuanhua He, Tianyu Yang, Ke Cao, et al.
FaithLens:忠実性ホワリュネーションの検出と解釈
検索拡張生成
監視付き微調整
Shuzheng Si, Qingyi Wang, Haozhe Zhao, et al.
SAM Audio:音声におけるアノテーションのための「Anything」モデル
Any-to-Any
マルチモーダル
Bowen Shi, Andros Tjandra, John Hoffman, et al.
ステップ・ディープリサーチ 技術報告書
エージェント
監視付き微調整
Chen Hu, Haikuo Du, Heng Wang, et al.
SpatialTree:MLLMにおける空間能力の分岐構造
マルチモーダル
Reasoning
Yuxi Xiao, Longfei Li, Shen Yan, et al.
セマンティックジェン:セマンティック空間における動画生成
動画生成
画像から動画生成
Jianhong Bai, Xiaoshi Wu, Xintao Wang, et al.
人間がループ内に参加する推論型大規模言語モデルエージェントを用いた自動ステレオタクティック放射線外科学計画
Reasoning
エージェント
Humza Nusrat, Luke Francisco, Bing Luo, et al.
LongVideoAgent:長時間動画を用いたマルチエージェント推論
エージェント
視覚質問応答
Runtao Liu, Ziyi Liu, Jiaqi Tang, et al.
GenEnv:LLMエージェントと環境シミュレータ間の難易度整合型共進化
エージェント
LLM
Jiacheng Guo, Ling Yang, Peter Chen, et al.
WorldWarp:非同期ビデオディフュージョンを用いた3Dジオメトリの伝播
拡散モデル
3Dモデル
Hanyang Kong, Xingyi Yang, Xiaoxu Zheng, et al.
LoGoPlanner:メトリック感知視覚幾何を備えた局所化基盤型ナビゲーション方策
エムボディドインテリジェンス
深度推定
Jiaqi Peng, Wenzhe Cai, Yuqiang Yang, et al.
LLMは学生の困難を推定できるか?プロフィシエンシー・シミュレーションを用いた人間-AI難易度整合による項目難易度予測
LLM
Reasoning
Ming Li, Han Chen, Yunze Xiao, et al.
QuCo-RAG:事前学習コーパスからの不確実性の定量化による動的リトリーブ増強生成
検索拡張生成
インテリジェントな質問応答
Dehai Min, Kailin Zhang, Tongtong Wu, et al.
1
4
5
6
7
8
9
10
47
マインドスケープ認識型リtrieval-Augmented Generationによる長文脈理解の向上
検索拡張生成
LLM
Yuqing Li, Jiangnan Li, Zheng Lin, et al.
大規模言語モデルにおける短文の事実性の測定
インテリジェントな質問応答
ベンチマーク
Jason Wei, Nguyen Karina, Hyung Won Chung, et al.
DeepSearchQA:深い研究エージェントにおける包括性のギャップを埋める
エージェント
ベンチマーク
Nikita Gupta, Riju Chatterjee, Lukas Haas, et al.
MEM1:長期間エージェントの効率化のための記憶と推論の連携学習
強化学習
Reasoning
Zijian Zhou, Ao Qu, Zhaoxuan Wu, et al.
AI-Trader:リアルタイム金融市場における自律型エージェントのベンチマーク評価
エージェント
LLM
Tianyu Fan, Yuhao Yang, Yangqin Jiang, et al.
潜在的陰在視覚的推論
マルチモーダル表現
LLM
Kelvin Li, Chuyi Shang, Leonid Karlinsky, et al.
LLMのペルソナが手法のベンチマーキングにおけるフィールド実験の代替としての役割を果たす可能性
ベンチマーク
機械学習
Enoch Hyunwook Kang
DataFlow:データ中心型AI時代における統一されたデータ準備およびワークフロー自動化を実現するLLM駆動型フレームワーク
LLM
検索拡張生成
Hao Liang, Xiaochen Ma, Zhou Liu, et al.
HiStream:冗長性除去ストリーミングを用いた効率的な高解像度ビデオ生成
動画生成
拡散モデル
Haonan Qiu, Shikun Liu, Zijian Zhou, et al.
TokSuite:トークナイザーの選択が言語モデルの行動に与える影響を測定する
Transformer
ベンチマーク
Gül Sena Altıntaş, Malikeh Ehghaghi, Brian Lester, et al.
Nemotron 3 Nano:エージェンティック推論向けに最適化されたオープンで効率的なMixture-of-ExpertsハイブリッドMamba-Transformerモデル
Transformer
監視付き微調整
NVIDIA, Aaron Blakeman, Aaron Grattafiori, et al.
記憶を超えて:視覚言語モデルにおける人気バイアスを露呈するマルチモーダル順序回帰ベンチマーク
マルチモーダル
ベンチマーク
Li-Zhong Szu-Tu, Ting-Lin Wu, Chia-Jui Chang, et al.
DreaMontage:任意フレームガイド付きワンショット動画生成
動画生成
画像から動画生成
Jiawei Liu, Junqiao Li, Jiangfan Deng, et al.
T2AV-Compass:テキストから音声・映像生成への統合的評価へ向けて
Any-to-Any
テキストから動画
Zhe Cao, Tao Wang, Jiaming Wang, et al.
TongSIM:知能機械のシミュレーションを目的とした汎用プラットフォーム
エムボディドインテリジェンス
エージェント
Zhe Sun, Kunlun Wu, Chuanjian Fu, et al.
Qwen-Image-Layered:レイヤー分解による本質的な編集可能性の実現へ
拡散モデル
画像生成
Shengming Yin, Zekai Zhang, Zecheng Tang, et al.
RoboSafe:実行可能安全論理を用いた身体化エージェントの保護
ロボティクス
Reasoning
Le Wang, Zonghao Ying, Xiao Yang, et al.
NHSにおけるプライマリケアにおけるLLM薬物療法安全レビューの実世界評価
自然言語処理
データセット
Oliver Normand, Esther Borsi, Mitch Fruin, et al.
複数LLMを用いた主題分析:二重信頼性指標を用いた定性的研究の検証—CohenのKappaと意味的類似度の統合
LLM
自然言語処理
Nilesh Jain, Seyi Adeyinka, Leor Roseman, et al.
閉ループ・ワールドモデリングを用いたビデオアバターにおけるアクティブインテリジェンス
エムボディドインテリジェンス
強化学習
Xuanhua He, Tianyu Yang, Ke Cao, et al.
FaithLens:忠実性ホワリュネーションの検出と解釈
検索拡張生成
監視付き微調整
Shuzheng Si, Qingyi Wang, Haozhe Zhao, et al.
SAM Audio:音声におけるアノテーションのための「Anything」モデル
Any-to-Any
マルチモーダル
Bowen Shi, Andros Tjandra, John Hoffman, et al.
ステップ・ディープリサーチ 技術報告書
エージェント
監視付き微調整
Chen Hu, Haikuo Du, Heng Wang, et al.
SpatialTree:MLLMにおける空間能力の分岐構造
マルチモーダル
Reasoning
Yuxi Xiao, Longfei Li, Shen Yan, et al.
セマンティックジェン:セマンティック空間における動画生成
動画生成
画像から動画生成
Jianhong Bai, Xiaoshi Wu, Xintao Wang, et al.
人間がループ内に参加する推論型大規模言語モデルエージェントを用いた自動ステレオタクティック放射線外科学計画
Reasoning
エージェント
Humza Nusrat, Luke Francisco, Bing Luo, et al.
LongVideoAgent:長時間動画を用いたマルチエージェント推論
エージェント
視覚質問応答
Runtao Liu, Ziyi Liu, Jiaqi Tang, et al.
GenEnv:LLMエージェントと環境シミュレータ間の難易度整合型共進化
エージェント
LLM
Jiacheng Guo, Ling Yang, Peter Chen, et al.
WorldWarp:非同期ビデオディフュージョンを用いた3Dジオメトリの伝播
拡散モデル
3Dモデル
Hanyang Kong, Xingyi Yang, Xiaoxu Zheng, et al.
LoGoPlanner:メトリック感知視覚幾何を備えた局所化基盤型ナビゲーション方策
エムボディドインテリジェンス
深度推定
Jiaqi Peng, Wenzhe Cai, Yuqiang Yang, et al.
LLMは学生の困難を推定できるか?プロフィシエンシー・シミュレーションを用いた人間-AI難易度整合による項目難易度予測
LLM
Reasoning
Ming Li, Han Chen, Yunze Xiao, et al.
QuCo-RAG:事前学習コーパスからの不確実性の定量化による動的リトリーブ増強生成
検索拡張生成
インテリジェントな質問応答
Dehai Min, Kailin Zhang, Tongtong Wu, et al.
1
4
5
6
7
8
9
10
47