HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
MMTok:VLMの効率的推論のためのマルチモーダルカバレッジ最大化
マルチモーダル
マルチモーダル表現
Sixun Dong, Juhua Hu, Mian Zhang, et al.
MV-RAG:リトリーブ拡張マルチビュー拡散
3D生成
拡散モデル
Yosef Dayani, Omer Benishu, Sagie Benaim
マルチモーダル機械学習を用いた金属有機フレームワークの合成と応用の接続
マルチモーダル
ディープラーニング
Sartaaj Takrim Khan, Seyed Mohamad Moosavi
適応型輸送システムにおけるモデルコンテキストプロトコル:サーベイ
交通
モデリング
Gaurab Chhetri, Shriyank Somvanshi, Md Monzurul Islam, et al.
複数の集団を伴うアルゴリズム的集団行動
モデリング
感情分類
Claudio Battiloro, Pietro Greiner, Bret Nestor, Oumaima Amezgar, Francesca Dominici
OpenCUA:コンピュータ利用エージェントのためのオープン基盤
エージェント
データセット
Xinyuan Wang, Bowen Wang, Dunjie Lu, et al.
空間政策:空間認識モデリングおよび推論を用いた視覚運動ロボット操作のガイドライン
エージェント
エムボディドインテリジェンス
Yijun Liu, Yuwei Liu, Yuan Meng, et al.
Jet-Nemotron:後段ニューラルアーキテクチャ探索を用いた効率的な言語モデル
LLM
Transformer
Yuxian Gu, Qinghao Hu, Shang Yang, et al.
CRISP:スパース自己符号化器を用いた恒常的コンセプトの忘却
LLM
ベンチマーク
Tomer Ashuach, Dana Arad, Aaron Mueller, et al.
弱教師付きアフォーダンスのグランドイングにおける選択的コントラスト学習
コンピュータビジョン
画像認識
WonJun Moon, Hyun Seok Seong, Jae-Pil Heo
エゴツイン:第一人称視点における身体と視界の夢
動画生成
テキストから動画
Jingqiao Xiu, Fangzhou Hong, Yicong Li, et al.
Pass@1を越えて:変分問題生成を用いた自己対戦がRLVRの持続性を支える
強化学習
Reasoning
Xiao Liang, Zhongzhi Li, Yeyun Gong, et al.
ODYSSEY:長時間枠タスクにおけるオープンワールド四足歩行ロボットの探索と操作
エムボディドインテリジェンス
Any-to-Any
Kaijun Wang, Liqin Lu, Mingyu Liu, et al.
AgentFly: LLMエージェントのファインチューニングによるLLMのファインチューニングなし
強化学習
LLM
Huichi Zhou, Yihang Chen, Siyuan Guo, et al.
制約誘導型拡散推論機構による神経記号学習
Reasoning
ディープラーニング
Xuan Zhang, Zhijian Zhou, Weidi Xu, et al.
LLMを活用したエージェントによるドラッグ資産デューデリジェンスにおける競合状況マッピング
ドキュメント理解
マルチモーダル
Alisa Vinogradova, Vlad Vinogradov, Dmitrii Radkevich, et al.
SceneGen:1回のフォワードパスによる単一画像からの3Dシーン生成
3D生成
3Dモデル
Yanxu Meng, Haoning Wu, Ya Zhang, et al.
大規模言語モデルベンチマークに関する調査
LLM
データセット
Shiwen Ni, Guhong Chen, Shuaimin Li, et al.
Waver:リアルな動画生成へ向かう波を操る
画像から動画生成
テキストから動画
Yifu Zhang, Hao Yang, Yuqi Zhang, et al.
LiveMCP-101:挑戦的なクエリにおけるMCP対応エージェントのストレステストと診断
ベンチマーク
エージェント
Ming Yin, Dinghan Shen, Silei Xu, et al.
自信を持って深く考える
Reasoning
LLM
Yichao Fu, Xuewei Wang, Yuandong Tian, et al.
Mobile-Agent-v3:GUI自動化のための基盤エージェント
エージェント
LLM
Jiabo Ye, Xi Zhang, Haiyang Xu, et al.
Intern-S1:科学用マルチモーダル基盤モデル
マルチモーダル
Any-to-Any
Lei Bai, Zhongrui Cai, Maosong Cao, et al.
言語誘導型チューニング:テキストフィードバックを活用した数値最適化の向上
Any-to-Any
LLM
Yuxing Lu, Yucheng Hu, Nan Sun, et al.
NiceWebRL:強化学習環境を用いた被験者実験用Pythonライブラリ
強化学習
人間-コンピュータインタラクション
Wilka Carvalho, Vikram Goddla, Ishaan Sinha, et al.
サイエンスのためのAIからエージェント型サイエンスへ:自律的科学発見に関するサーベイ
サイエンスのためのAI
エージェント
Jiaqi Wei, Yuejin Yang, Xiang Zhang, et al.
MeshCoder:点群からの構造化メッシュコード生成を実現するLLM駆動型手法
コード生成
3Dモデル
Bingquan Dai, Li Ray Luo, Qihong Tang, et al.
Tinker:拡散モデルが3Dにもたらす贈り物——シーン最適化を必要としないスパース入力からの多視点一貫性のある編集
拡散モデル
アプローチ/フレームワーク
Canyu Zhao, Xiaoman Li, Tianjian Feng, et al.
FutureX:未来予測におけるLLMエージェント向け高度なライブベンチマーク
ベンチマーク
LLM
Zhiyuan Zeng, Jiashuo Liu, Siyuan Chen, et al.
DuPO:二重選好に基づく信頼性のあるLLM自己検証の実現
監視付き微調整
Preference Modeling
Shuaijie She, Yu Bao, Yu Lu, et al.
スコアからスキルへ:金融分野向け大規模言語モデルの評価を目的とした認知診断枠組み
ベンチマーク
データセット
Ziyan Kuang, Feiyu Zhu, Maowei Jiang, et al.
グランアリー:25ヶ国語における音声認識および翻訳データセット
データセット
マルチタスク学習
Nithin Rao Koluguri, Monica Sekoyan, George Zelenfroynd, et al.
1
30
31
32
33
34
35
36
47
MMTok:VLMの効率的推論のためのマルチモーダルカバレッジ最大化
マルチモーダル
マルチモーダル表現
Sixun Dong, Juhua Hu, Mian Zhang, et al.
MV-RAG:リトリーブ拡張マルチビュー拡散
3D生成
拡散モデル
Yosef Dayani, Omer Benishu, Sagie Benaim
マルチモーダル機械学習を用いた金属有機フレームワークの合成と応用の接続
マルチモーダル
ディープラーニング
Sartaaj Takrim Khan, Seyed Mohamad Moosavi
適応型輸送システムにおけるモデルコンテキストプロトコル:サーベイ
交通
モデリング
Gaurab Chhetri, Shriyank Somvanshi, Md Monzurul Islam, et al.
複数の集団を伴うアルゴリズム的集団行動
モデリング
感情分類
Claudio Battiloro, Pietro Greiner, Bret Nestor, Oumaima Amezgar, Francesca Dominici
OpenCUA:コンピュータ利用エージェントのためのオープン基盤
エージェント
データセット
Xinyuan Wang, Bowen Wang, Dunjie Lu, et al.
空間政策:空間認識モデリングおよび推論を用いた視覚運動ロボット操作のガイドライン
エージェント
エムボディドインテリジェンス
Yijun Liu, Yuwei Liu, Yuan Meng, et al.
Jet-Nemotron:後段ニューラルアーキテクチャ探索を用いた効率的な言語モデル
LLM
Transformer
Yuxian Gu, Qinghao Hu, Shang Yang, et al.
CRISP:スパース自己符号化器を用いた恒常的コンセプトの忘却
LLM
ベンチマーク
Tomer Ashuach, Dana Arad, Aaron Mueller, et al.
弱教師付きアフォーダンスのグランドイングにおける選択的コントラスト学習
コンピュータビジョン
画像認識
WonJun Moon, Hyun Seok Seong, Jae-Pil Heo
エゴツイン:第一人称視点における身体と視界の夢
動画生成
テキストから動画
Jingqiao Xiu, Fangzhou Hong, Yicong Li, et al.
Pass@1を越えて:変分問題生成を用いた自己対戦がRLVRの持続性を支える
強化学習
Reasoning
Xiao Liang, Zhongzhi Li, Yeyun Gong, et al.
ODYSSEY:長時間枠タスクにおけるオープンワールド四足歩行ロボットの探索と操作
エムボディドインテリジェンス
Any-to-Any
Kaijun Wang, Liqin Lu, Mingyu Liu, et al.
AgentFly: LLMエージェントのファインチューニングによるLLMのファインチューニングなし
強化学習
LLM
Huichi Zhou, Yihang Chen, Siyuan Guo, et al.
制約誘導型拡散推論機構による神経記号学習
Reasoning
ディープラーニング
Xuan Zhang, Zhijian Zhou, Weidi Xu, et al.
LLMを活用したエージェントによるドラッグ資産デューデリジェンスにおける競合状況マッピング
ドキュメント理解
マルチモーダル
Alisa Vinogradova, Vlad Vinogradov, Dmitrii Radkevich, et al.
SceneGen:1回のフォワードパスによる単一画像からの3Dシーン生成
3D生成
3Dモデル
Yanxu Meng, Haoning Wu, Ya Zhang, et al.
大規模言語モデルベンチマークに関する調査
LLM
データセット
Shiwen Ni, Guhong Chen, Shuaimin Li, et al.
Waver:リアルな動画生成へ向かう波を操る
画像から動画生成
テキストから動画
Yifu Zhang, Hao Yang, Yuqi Zhang, et al.
LiveMCP-101:挑戦的なクエリにおけるMCP対応エージェントのストレステストと診断
ベンチマーク
エージェント
Ming Yin, Dinghan Shen, Silei Xu, et al.
自信を持って深く考える
Reasoning
LLM
Yichao Fu, Xuewei Wang, Yuandong Tian, et al.
Mobile-Agent-v3:GUI自動化のための基盤エージェント
エージェント
LLM
Jiabo Ye, Xi Zhang, Haiyang Xu, et al.
Intern-S1:科学用マルチモーダル基盤モデル
マルチモーダル
Any-to-Any
Lei Bai, Zhongrui Cai, Maosong Cao, et al.
言語誘導型チューニング:テキストフィードバックを活用した数値最適化の向上
Any-to-Any
LLM
Yuxing Lu, Yucheng Hu, Nan Sun, et al.
NiceWebRL:強化学習環境を用いた被験者実験用Pythonライブラリ
強化学習
人間-コンピュータインタラクション
Wilka Carvalho, Vikram Goddla, Ishaan Sinha, et al.
サイエンスのためのAIからエージェント型サイエンスへ:自律的科学発見に関するサーベイ
サイエンスのためのAI
エージェント
Jiaqi Wei, Yuejin Yang, Xiang Zhang, et al.
MeshCoder:点群からの構造化メッシュコード生成を実現するLLM駆動型手法
コード生成
3Dモデル
Bingquan Dai, Li Ray Luo, Qihong Tang, et al.
Tinker:拡散モデルが3Dにもたらす贈り物——シーン最適化を必要としないスパース入力からの多視点一貫性のある編集
拡散モデル
アプローチ/フレームワーク
Canyu Zhao, Xiaoman Li, Tianjian Feng, et al.
FutureX:未来予測におけるLLMエージェント向け高度なライブベンチマーク
ベンチマーク
LLM
Zhiyuan Zeng, Jiashuo Liu, Siyuan Chen, et al.
DuPO:二重選好に基づく信頼性のあるLLM自己検証の実現
監視付き微調整
Preference Modeling
Shuaijie She, Yu Bao, Yu Lu, et al.
スコアからスキルへ:金融分野向け大規模言語モデルの評価を目的とした認知診断枠組み
ベンチマーク
データセット
Ziyan Kuang, Feiyu Zhu, Maowei Jiang, et al.
グランアリー:25ヶ国語における音声認識および翻訳データセット
データセット
マルチタスク学習
Nithin Rao Koluguri, Monica Sekoyan, George Zelenfroynd, et al.
1
30
31
32
33
34
35
36
47