HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
ヘルメス4 技術報告
Reasoning
LLM
Ryan Teknium, Roger Jin, Jai Suphavadeeprasit, et al.
OmniHuman-1.5:認知シミュレーションによるアバターへの能動的思考の植え込み
マルチモーダル表現
Text-to-Speech
Jianwen Jiang, Weihong Zeng, Zerong Zheng, et al.
VoxHammer:ネイティブ3D空間における訓練不要な高精度・一貫性のある3D編集
3D生成
拡散モデル
Lin Li, Zehuan Huang, Haoran Feng, et al.
CMPhysBench:凝縮系物理学における大規模言語モデルの評価のためのベンチマーク
ベンチマーク
LLM
Weida Wang, Dongchen Huang, Jiatong Li, et al.
TreePO:ヒューリスティック木ベースモデリングによる方策最適化と効果性、推論効率のギャップ解消
強化学習
Reasoning
Yizhi Li, Qingshui Gu, Zhoufutu Wen, et al.
Nemotron-CC-Math:1330億トークン規模の高品質な数学向け事前学習データセット
LLM
数学
Rabeeh Karimi Mahabadi, Sanjeev Satheesh, Shrimai Prabhumoye, et al.
ツール統合型推論の理解
Reasoning
LLM
Heng Lin, Zhongwen Xu
スペーサー:設計された科学的インスピレーションへ向けて
LLM
テキスト生成
Minhyeong Lee, Suyoung Hwang, Seunghyun Moon, et al.
記憶を超えて:再帰性、記憶、およびテスト時計算スケーリングを活用した推論深度の拡張
LLM
Transformer
Ivan Rodkin, Daniil Orel, Konstantin Smirnov, et al.
バイブボイス技術報告書
Text-to-Speech
合成
Zhiliang Peng, Jianwei Yu, Wenhui Wang, et al.
MMTok:VLMの効率的推論のためのマルチモーダルカバレッジ最大化
マルチモーダル
マルチモーダル表現
Sixun Dong, Juhua Hu, Mian Zhang, et al.
MV-RAG:リトリーブ拡張マルチビュー拡散
3D生成
拡散モデル
Yosef Dayani, Omer Benishu, Sagie Benaim
マルチモーダル機械学習を用いた金属有機フレームワークの合成と応用の接続
マルチモーダル
ディープラーニング
Sartaaj Takrim Khan, Seyed Mohamad Moosavi
適応型輸送システムにおけるモデルコンテキストプロトコル:サーベイ
交通
モデリング
Gaurab Chhetri, Shriyank Somvanshi, Md Monzurul Islam, et al.
複数の集団を伴うアルゴリズム的集団行動
モデリング
感情分類
Claudio Battiloro, Pietro Greiner, Bret Nestor, Oumaima Amezgar, Francesca Dominici
OpenCUA:コンピュータ利用エージェントのためのオープン基盤
エージェント
データセット
Xinyuan Wang, Bowen Wang, Dunjie Lu, et al.
空間政策:空間認識モデリングおよび推論を用いた視覚運動ロボット操作のガイドライン
エージェント
エムボディドインテリジェンス
Yijun Liu, Yuwei Liu, Yuan Meng, et al.
Jet-Nemotron:後段ニューラルアーキテクチャ探索を用いた効率的な言語モデル
LLM
Transformer
Yuxian Gu, Qinghao Hu, Shang Yang, et al.
CRISP:スパース自己符号化器を用いた恒常的コンセプトの忘却
LLM
ベンチマーク
Tomer Ashuach, Dana Arad, Aaron Mueller, et al.
弱教師付きアフォーダンスのグランドイングにおける選択的コントラスト学習
コンピュータビジョン
画像認識
WonJun Moon, Hyun Seok Seong, Jae-Pil Heo
エゴツイン:第一人称視点における身体と視界の夢
動画生成
テキストから動画
Jingqiao Xiu, Fangzhou Hong, Yicong Li, et al.
Pass@1を越えて:変分問題生成を用いた自己対戦がRLVRの持続性を支える
強化学習
Reasoning
Xiao Liang, Zhongzhi Li, Yeyun Gong, et al.
ODYSSEY:長時間枠タスクにおけるオープンワールド四足歩行ロボットの探索と操作
エムボディドインテリジェンス
Any-to-Any
Kaijun Wang, Liqin Lu, Mingyu Liu, et al.
AgentFly: LLMエージェントのファインチューニングによるLLMのファインチューニングなし
強化学習
LLM
Huichi Zhou, Yihang Chen, Siyuan Guo, et al.
制約誘導型拡散推論機構による神経記号学習
Reasoning
ディープラーニング
Xuan Zhang, Zhijian Zhou, Weidi Xu, et al.
LLMを活用したエージェントによるドラッグ資産デューデリジェンスにおける競合状況マッピング
ドキュメント理解
マルチモーダル
Alisa Vinogradova, Vlad Vinogradov, Dmitrii Radkevich, et al.
SceneGen:1回のフォワードパスによる単一画像からの3Dシーン生成
3D生成
3Dモデル
Yanxu Meng, Haoning Wu, Ya Zhang, et al.
大規模言語モデルベンチマークに関する調査
LLM
データセット
Shiwen Ni, Guhong Chen, Shuaimin Li, et al.
Waver:リアルな動画生成へ向かう波を操る
画像から動画生成
テキストから動画
Yifu Zhang, Hao Yang, Yuqi Zhang, et al.
LiveMCP-101:挑戦的なクエリにおけるMCP対応エージェントのストレステストと診断
ベンチマーク
エージェント
Ming Yin, Dinghan Shen, Silei Xu, et al.
自信を持って深く考える
Reasoning
LLM
Yichao Fu, Xuewei Wang, Yuandong Tian, et al.
Mobile-Agent-v3:GUI自動化のための基盤エージェント
エージェント
LLM
Jiabo Ye, Xi Zhang, Haiyang Xu, et al.
1
32
33
34
35
36
37
38
49
ヘルメス4 技術報告
Reasoning
LLM
Ryan Teknium, Roger Jin, Jai Suphavadeeprasit, et al.
OmniHuman-1.5:認知シミュレーションによるアバターへの能動的思考の植え込み
マルチモーダル表現
Text-to-Speech
Jianwen Jiang, Weihong Zeng, Zerong Zheng, et al.
VoxHammer:ネイティブ3D空間における訓練不要な高精度・一貫性のある3D編集
3D生成
拡散モデル
Lin Li, Zehuan Huang, Haoran Feng, et al.
CMPhysBench:凝縮系物理学における大規模言語モデルの評価のためのベンチマーク
ベンチマーク
LLM
Weida Wang, Dongchen Huang, Jiatong Li, et al.
TreePO:ヒューリスティック木ベースモデリングによる方策最適化と効果性、推論効率のギャップ解消
強化学習
Reasoning
Yizhi Li, Qingshui Gu, Zhoufutu Wen, et al.
Nemotron-CC-Math:1330億トークン規模の高品質な数学向け事前学習データセット
LLM
数学
Rabeeh Karimi Mahabadi, Sanjeev Satheesh, Shrimai Prabhumoye, et al.
ツール統合型推論の理解
Reasoning
LLM
Heng Lin, Zhongwen Xu
スペーサー:設計された科学的インスピレーションへ向けて
LLM
テキスト生成
Minhyeong Lee, Suyoung Hwang, Seunghyun Moon, et al.
記憶を超えて:再帰性、記憶、およびテスト時計算スケーリングを活用した推論深度の拡張
LLM
Transformer
Ivan Rodkin, Daniil Orel, Konstantin Smirnov, et al.
バイブボイス技術報告書
Text-to-Speech
合成
Zhiliang Peng, Jianwei Yu, Wenhui Wang, et al.
MMTok:VLMの効率的推論のためのマルチモーダルカバレッジ最大化
マルチモーダル
マルチモーダル表現
Sixun Dong, Juhua Hu, Mian Zhang, et al.
MV-RAG:リトリーブ拡張マルチビュー拡散
3D生成
拡散モデル
Yosef Dayani, Omer Benishu, Sagie Benaim
マルチモーダル機械学習を用いた金属有機フレームワークの合成と応用の接続
マルチモーダル
ディープラーニング
Sartaaj Takrim Khan, Seyed Mohamad Moosavi
適応型輸送システムにおけるモデルコンテキストプロトコル:サーベイ
交通
モデリング
Gaurab Chhetri, Shriyank Somvanshi, Md Monzurul Islam, et al.
複数の集団を伴うアルゴリズム的集団行動
モデリング
感情分類
Claudio Battiloro, Pietro Greiner, Bret Nestor, Oumaima Amezgar, Francesca Dominici
OpenCUA:コンピュータ利用エージェントのためのオープン基盤
エージェント
データセット
Xinyuan Wang, Bowen Wang, Dunjie Lu, et al.
空間政策:空間認識モデリングおよび推論を用いた視覚運動ロボット操作のガイドライン
エージェント
エムボディドインテリジェンス
Yijun Liu, Yuwei Liu, Yuan Meng, et al.
Jet-Nemotron:後段ニューラルアーキテクチャ探索を用いた効率的な言語モデル
LLM
Transformer
Yuxian Gu, Qinghao Hu, Shang Yang, et al.
CRISP:スパース自己符号化器を用いた恒常的コンセプトの忘却
LLM
ベンチマーク
Tomer Ashuach, Dana Arad, Aaron Mueller, et al.
弱教師付きアフォーダンスのグランドイングにおける選択的コントラスト学習
コンピュータビジョン
画像認識
WonJun Moon, Hyun Seok Seong, Jae-Pil Heo
エゴツイン:第一人称視点における身体と視界の夢
動画生成
テキストから動画
Jingqiao Xiu, Fangzhou Hong, Yicong Li, et al.
Pass@1を越えて:変分問題生成を用いた自己対戦がRLVRの持続性を支える
強化学習
Reasoning
Xiao Liang, Zhongzhi Li, Yeyun Gong, et al.
ODYSSEY:長時間枠タスクにおけるオープンワールド四足歩行ロボットの探索と操作
エムボディドインテリジェンス
Any-to-Any
Kaijun Wang, Liqin Lu, Mingyu Liu, et al.
AgentFly: LLMエージェントのファインチューニングによるLLMのファインチューニングなし
強化学習
LLM
Huichi Zhou, Yihang Chen, Siyuan Guo, et al.
制約誘導型拡散推論機構による神経記号学習
Reasoning
ディープラーニング
Xuan Zhang, Zhijian Zhou, Weidi Xu, et al.
LLMを活用したエージェントによるドラッグ資産デューデリジェンスにおける競合状況マッピング
ドキュメント理解
マルチモーダル
Alisa Vinogradova, Vlad Vinogradov, Dmitrii Radkevich, et al.
SceneGen:1回のフォワードパスによる単一画像からの3Dシーン生成
3D生成
3Dモデル
Yanxu Meng, Haoning Wu, Ya Zhang, et al.
大規模言語モデルベンチマークに関する調査
LLM
データセット
Shiwen Ni, Guhong Chen, Shuaimin Li, et al.
Waver:リアルな動画生成へ向かう波を操る
画像から動画生成
テキストから動画
Yifu Zhang, Hao Yang, Yuqi Zhang, et al.
LiveMCP-101:挑戦的なクエリにおけるMCP対応エージェントのストレステストと診断
ベンチマーク
エージェント
Ming Yin, Dinghan Shen, Silei Xu, et al.
自信を持って深く考える
Reasoning
LLM
Yichao Fu, Xuewei Wang, Yuandong Tian, et al.
Mobile-Agent-v3:GUI自動化のための基盤エージェント
エージェント
LLM
Jiabo Ye, Xi Zhang, Haiyang Xu, et al.
1
32
33
34
35
36
37
38
49