HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
AdaptFlow:メタラーニングを活用した適応型ワークフロー最適化
LLM
エージェント
Runchuan Zhu, Bowen Jiang, Lingrui Mei, et al.
オープンソースモデル間におけるメディエータ誘導型マルチエージェント協働による医療意思決定
視覚質問応答
エージェント
Kaitao Chen, Mianxin Liu, Daoming Zong, et al.
ラベルなしにおけるビジョン・ランゲージモデルの適応:包括的なサーベイ
マルチモーダル表現
Any-to-Any
Hao Dong, Lijun Sheng, Jian Liang, et al.
GENIE:ニューラルレンディアンスフィールドのインタラクティブ編集のためのガウス符号化
3Dモデル
3D マシンビジョン
Mikołaj Zieliński, Krzysztof Byrski, Tomasz Szczepanik, et al.
予想されるものを pruning する:最初のトークンの驚異性を活用した効率的なコード推論
コード生成
Reasoning
Wenhao Zeng, Yaoning Wang, Chao Hu, et al.
Voost:双方向バーチャル試着・試着外しのための統合的かつスケーラブルな拡散トランスフォーマー
拡散モデル
画像修復
Seungyong Lee, Jeong-gi Kwak
InfiGUI-G1:適応的探索方策最適化によるGUIインデキシングの進展
エージェント
視覚質問応答
Yuhang Liu, Zeyu Liu, Shuanghe Zhu, et al.
Memp:エージェントの手続き記憶の探求
エージェント
LLM
Runnan Fang, Yuan Liang, Xiaobin Wang, et al.
Perch 2.0:バイオ音響学におけるビタキの教訓
音声分類
マルチタスク学習
Bart van Merriënboer, Vincent Dumoulin, Jenny Hamer, et al.
ドキュメント検索増強生成の評価において、我々は正しい道を歩んでいるか?
検索拡張生成
ベンチマーク
Wenxuan Shen, Mingjia Wang, Yaochen Wang, et al.
Hi3DEval:階層的妥当性を活用した3D生成評価の進展
3D生成
ベンチマーク
Yuhan Zhang, Long Zhuo, Ziyang Chu, et al.
DeepPHY:物理推論におけるエージェント型VLMのベンチマーク
エージェント
ベンチマーク
Xinrun Xu, Pi Bu, Ye Wang, et al.
ジーニー・エンヴィジョンャー:ロボット操作のための統合型ワールド基礎プラットフォーム
Any-to-Any
動画生成
Yue Liao, Pengfei Zhou, Siyuan Huang, et al.
R-Zero:ゼロデータから自己進化する推論型LLM
LLM
Reasoning
Chengsong Huang, Wenhao Yu, Xiaoyang Wang, et al.
SFTの一般化について:報酬補正を用いた強化学習的視点
監視付き微調整
強化学習
Yongliang Wu, Yizhou Zhou, Zhou Ziheng, et al.
LLMを活用したエージェントによる人間らしい学習ダイナミクスのシミュレーション
エージェント
モデリング
Yu Yuan, Lili Zhao, Wei Chen, et al.
GRAIL:検索拡張推論のための大規模知識グラフとの相互作用を学ぶ
検索拡張生成
Reasoning
Ge Chang, Jinbo Su, Jiacheng Liu, et al.
CoTox:思考過程に基づく分子毒性推論と予測
LLM
Reasoning
Jueon Park, Yein Park, Minju Song, et al.
効率的なエージェント:コストを削減しながら効果的なエージェントを構築する
エージェント
LLM
Ningning Wang, Xavier Hu, Pai Liu, et al.
大規模言語モデルのチェーン・オブ・シンキング推論は幻か?データ分布の視点から
LLM
Reasoning
Chengshuai Zhao, Zhen Tan, Pingchuan Ma, et al.
VeriGUI:検証可能な長鎖GUIデータセット
エージェント
ベンチマーク
Shunyu Liu, Minghao Liu, Huichi Zhou, et al.
Qwen2.5-VL 技術報告
ドキュメント理解
ビデオ理解
Shuai Bai, Keqin Chen, Xuejing Liu, et al.
GANは死んだ。GAN万歳!モダンなGANベースライン
ディープラーニング
コンピュータビジョン
Yiwen Huang, Aaron Gokaslan, Volodymyr Kuleshov, et al.
MegaPairs:ユニバーサルなマルチモーダル検索のための大規模データ合成
マルチモーダル
データセット
Junjie Zhou, Zheng Liu, Ze Liu, et al.
ライラ:包括認知を統合的に扱うための効率的でスピーチ中心のフレームワーク
Any-to-Any
LLM
Zhisheng Zhong, Chengyao Wang, Yuqi Liu, et al.
オープンソース多モーダルモデルの性能境界をモデル、データ、テスト時スケーリングによって拡張する
マルチモーダル
LLM
Zhe Chen, Weiyun Wang, Yue Cao, et al.
NVILA:効率的フロンティア視覚言語モデル
マルチモーダル
ビデオ理解
Zhijian Liu, Ligeng Zhu, Baifeng Shi, et al.
VisionZip:視覚言語モデルにおいて、長ければ長いほど良いが、必ずしも必要ではない
マルチモーダル
マルチモーダル表現
Senqiao Yang, Yukang Chen, Zhuotao Tian, et al.
百川オムニ技術報告書
マルチモーダル
Any-to-Any
Yadong Li, Haoze Sun, Mingan Lin, et al.
MM1.5:多モーダルLLMのファインチューニングからの手法、分析および知見
マルチモーダル
LLM
Haotian Zhang, Mingfei Gao, Zhe Gan, et al.
Emu3:次トークン予測こそがすべてである
Transformer
Any-to-Any
Xinlong Wang, Xiaosong Zhang, Zhengxiong Luo, et al.
CogVLM2:画像および動画理解のための視覚言語モデル
画像理解
ビデオ理解
Wenyi Hong, Weihan Wang, Ming Ding, et al.
1
33
34
35
36
37
38
39
47
AdaptFlow:メタラーニングを活用した適応型ワークフロー最適化
LLM
エージェント
Runchuan Zhu, Bowen Jiang, Lingrui Mei, et al.
オープンソースモデル間におけるメディエータ誘導型マルチエージェント協働による医療意思決定
視覚質問応答
エージェント
Kaitao Chen, Mianxin Liu, Daoming Zong, et al.
ラベルなしにおけるビジョン・ランゲージモデルの適応:包括的なサーベイ
マルチモーダル表現
Any-to-Any
Hao Dong, Lijun Sheng, Jian Liang, et al.
GENIE:ニューラルレンディアンスフィールドのインタラクティブ編集のためのガウス符号化
3Dモデル
3D マシンビジョン
Mikołaj Zieliński, Krzysztof Byrski, Tomasz Szczepanik, et al.
予想されるものを pruning する:最初のトークンの驚異性を活用した効率的なコード推論
コード生成
Reasoning
Wenhao Zeng, Yaoning Wang, Chao Hu, et al.
Voost:双方向バーチャル試着・試着外しのための統合的かつスケーラブルな拡散トランスフォーマー
拡散モデル
画像修復
Seungyong Lee, Jeong-gi Kwak
InfiGUI-G1:適応的探索方策最適化によるGUIインデキシングの進展
エージェント
視覚質問応答
Yuhang Liu, Zeyu Liu, Shuanghe Zhu, et al.
Memp:エージェントの手続き記憶の探求
エージェント
LLM
Runnan Fang, Yuan Liang, Xiaobin Wang, et al.
Perch 2.0:バイオ音響学におけるビタキの教訓
音声分類
マルチタスク学習
Bart van Merriënboer, Vincent Dumoulin, Jenny Hamer, et al.
ドキュメント検索増強生成の評価において、我々は正しい道を歩んでいるか?
検索拡張生成
ベンチマーク
Wenxuan Shen, Mingjia Wang, Yaochen Wang, et al.
Hi3DEval:階層的妥当性を活用した3D生成評価の進展
3D生成
ベンチマーク
Yuhan Zhang, Long Zhuo, Ziyang Chu, et al.
DeepPHY:物理推論におけるエージェント型VLMのベンチマーク
エージェント
ベンチマーク
Xinrun Xu, Pi Bu, Ye Wang, et al.
ジーニー・エンヴィジョンャー:ロボット操作のための統合型ワールド基礎プラットフォーム
Any-to-Any
動画生成
Yue Liao, Pengfei Zhou, Siyuan Huang, et al.
R-Zero:ゼロデータから自己進化する推論型LLM
LLM
Reasoning
Chengsong Huang, Wenhao Yu, Xiaoyang Wang, et al.
SFTの一般化について:報酬補正を用いた強化学習的視点
監視付き微調整
強化学習
Yongliang Wu, Yizhou Zhou, Zhou Ziheng, et al.
LLMを活用したエージェントによる人間らしい学習ダイナミクスのシミュレーション
エージェント
モデリング
Yu Yuan, Lili Zhao, Wei Chen, et al.
GRAIL:検索拡張推論のための大規模知識グラフとの相互作用を学ぶ
検索拡張生成
Reasoning
Ge Chang, Jinbo Su, Jiacheng Liu, et al.
CoTox:思考過程に基づく分子毒性推論と予測
LLM
Reasoning
Jueon Park, Yein Park, Minju Song, et al.
効率的なエージェント:コストを削減しながら効果的なエージェントを構築する
エージェント
LLM
Ningning Wang, Xavier Hu, Pai Liu, et al.
大規模言語モデルのチェーン・オブ・シンキング推論は幻か?データ分布の視点から
LLM
Reasoning
Chengshuai Zhao, Zhen Tan, Pingchuan Ma, et al.
VeriGUI:検証可能な長鎖GUIデータセット
エージェント
ベンチマーク
Shunyu Liu, Minghao Liu, Huichi Zhou, et al.
Qwen2.5-VL 技術報告
ドキュメント理解
ビデオ理解
Shuai Bai, Keqin Chen, Xuejing Liu, et al.
GANは死んだ。GAN万歳!モダンなGANベースライン
ディープラーニング
コンピュータビジョン
Yiwen Huang, Aaron Gokaslan, Volodymyr Kuleshov, et al.
MegaPairs:ユニバーサルなマルチモーダル検索のための大規模データ合成
マルチモーダル
データセット
Junjie Zhou, Zheng Liu, Ze Liu, et al.
ライラ:包括認知を統合的に扱うための効率的でスピーチ中心のフレームワーク
Any-to-Any
LLM
Zhisheng Zhong, Chengyao Wang, Yuqi Liu, et al.
オープンソース多モーダルモデルの性能境界をモデル、データ、テスト時スケーリングによって拡張する
マルチモーダル
LLM
Zhe Chen, Weiyun Wang, Yue Cao, et al.
NVILA:効率的フロンティア視覚言語モデル
マルチモーダル
ビデオ理解
Zhijian Liu, Ligeng Zhu, Baifeng Shi, et al.
VisionZip:視覚言語モデルにおいて、長ければ長いほど良いが、必ずしも必要ではない
マルチモーダル
マルチモーダル表現
Senqiao Yang, Yukang Chen, Zhuotao Tian, et al.
百川オムニ技術報告書
マルチモーダル
Any-to-Any
Yadong Li, Haoze Sun, Mingan Lin, et al.
MM1.5:多モーダルLLMのファインチューニングからの手法、分析および知見
マルチモーダル
LLM
Haotian Zhang, Mingfei Gao, Zhe Gan, et al.
Emu3:次トークン予測こそがすべてである
Transformer
Any-to-Any
Xinlong Wang, Xiaosong Zhang, Zhengxiong Luo, et al.
CogVLM2:画像および動画理解のための視覚言語モデル
画像理解
ビデオ理解
Wenyi Hong, Weihan Wang, Ming Ding, et al.
1
33
34
35
36
37
38
39
47