HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
空間的超感応を用いずに空間的超感応を解く
ビデオ理解
コンピュータビジョン
Vishaal Udandarao, Shyamgopal Karthik, Surabhi S. Nath, et al.
Parrot:出力の真実性に対する説得および同意への頑健性評価——LLMsのための迎合性頑健性ベンチマーク
LLM
ベンチマーク
Yusuf Çelebi, Mahmoud El Hussieni, Özay Ezerceli
O-Mem:パーソナライズされた長期ホライゾンの自己進化型Agentのためのオムニメモリシステム
LLM
ベンチマーク
Piaohong Wang, Motong Tian, Jiaxian Li, et al.
テキストの内在的次元の解明:学術要旨から創作物語まで
LLM
自然言語処理
Vladislav Pedashenko, Laida Kushnareva, Yana Khassan Nibal, et al.
SAM 3:概念を用いたSegment Anything
コンピュータビジョン
セマンティックセグメンテーション
Nicolas Carion, Laura Gustafson, Yuan-Ting Hu, et al.
GeoVista:地理的位置特定のためのWeb拡張型Agent視覚的推論
エージェント
検索拡張生成
Yikun Wang, Zuyan Liu, Ziyi Wang, et al.
OpenMMReasoner:オープンかつ汎用的なレシピによるマルチモーダル推論のフロンティアの開拓
監視付き微調整
Reasoning
Kaichen Zhang, Keming Wu, Zuhao Yang, et al.
HiPO:大規模言語モデルにおける動的推論向けハイブリッド方策最適化
Reasoning
強化学習
Ken Deng, Zizheng Zhan, Wen Xiang, et al.
SERES:スパースな視点からの意味認識型ニューラル再構成
3D生成
コンピュータビジョン
Bo Xu, Yuhu Guo, Yuchao Wang, et al.
SDAR:スケーラブルなシーケンス生成のための相乗効果を持つ拡散-自己回帰パラダイム
拡散モデル
モデル学習
Shuang Cheng, Yihan Bian, Dawei Liu, et al.
MultiPL-MoE:ハイブリッドMixture-of-Expertsによる大規模言語モデルの多プログラミング・多言語拡張
LLM
コード生成
Qing Wang, Xue Han, Jiahui Wang, et al.
CapRL:強化学習を用いた密集画像記述能力の促進
画像説明
視覚質問応答
Long Xing, Xiaoyi Dong, Yuhang Zang, et al.
離散拡散発散指令による超高速言語生成
拡散モデル
テキスト生成
Haoyang Zheng, Xinyang Liu, Cindy Xiangrui Kong, et al.
DisCO:識別的制約最適化を用いた大規模推論モデルの強化
強化学習
Reasoning
Gang Li, Ming Lin, Tomer Galanti, et al.
QSVD:低精度視覚言語モデルにおける統合的クエリ・キー・バリュー重み圧縮のための効率的低ランク近似
Transformer
視覚質問応答
Yutong Wang, Haiyu Wang, Sai Qian Zhang
ネストド・ラーニング:ディープラーニングアーキテクチャの錯覚
ディープラーニング
自然言語処理
Ali Behrouz, Meisam Razaviyayn, Peiling Zhong, et al.
SAM 3D:画像内の何でも3D化
3D生成
3Dモデル
SAM 3D Team, Xingyu Chen, Fu-Jen Chu, et al.
Video-as-Answer:Joint-GRPOを用いた次に発生する動画イベントの予測と生成
動画生成
テキストから動画
Junhao Cheng, Liang Hou, Xin Tao, et al.
最初のフレームがビデオコンテンツカスタマイズの最適な場所である
動画生成
画像から動画生成
Jingxi Chen, Zongxia Li, Zhichao Liu, et al.
マルチモーダル基礎モデルによる空間知能のスケーリング
マルチモーダル
マルチモーダル表現
Zhongang Cai, Ruisi Wang, Chenyang Gu, et al.
Step-Audio-R1 技術報告
Reasoning
マルチモーダル
Fei Tian, Xiangyu Tony Zhang, Yuxin Zhang, et al.
V-ReasonBench:動画生成モデル向け統合推論ベンチマークセットへの道
ベンチマーク
視覚質問応答
Yang Luo, Xuanlei Zhao, Baijiong Lin, et al.
オルモ3
LLM
コード生成
Allyson Ettinger, Amanda Bertsch, Bailey Kuehl, et al.
GPT-5を用いた初期の科学加速実験
サイエンスのためのAI
Reasoning
Sébastien Bubeck, Christian Coester, Ronen Eldan, et al.
優れたAI研究エージェントとなるために必要なものとは何か?アイデーション多様性の役割を検討する
エージェント
ベンチマーク
Alexis Audran-Reiss, Jordi Armengol Estapé, Karen Hambardzumyan, et al.
LLMを用いた自動生成大規模データセットを活用した、指示に従う胸部X線画像における病変セグメンテーション
セマンティックセグメンテーション
マルチモーダル
Geon Choi, Hangyul Yoon, Hyunju Shin, et al.
VisPlay:画像から自己進化する視覚言語モデル
強化学習
マルチモーダル
Yicheng He, Chengsong Huang, Zongxia Li, et al.
ビデオを用いた推論:迷路解法タスクを用いたビデオモデルの推論能力の初めての評価
マルチモーダル表現
Reasoning
Cheng Yang, Haiyuan Wan, Yiran Peng, et al.
VIDEOP2R:認知から推論への動画理解
ビデオ理解
マルチモーダル表現
Yifan Jiang, Yueying Wang, Rui Zhao, et al.
Kandinsky 5.0:画像および動画生成のためのファミリーファウンデーションモデル
テキストから画像生成
画像から動画生成
Vladimir Arkhipkin, Vladimir Korviakov, Nikolai Gerasimenko, et al.
JAM-2:高い成功率を示す薬物様抗体の完全計算設計
サイエンスのためのAI
ディープラーニング
Nabla Bio
PathMind:大規模言語モデルを用いた知識グラフ推論のためのRetrieve-Prioritize-Reasonフレームワーク
検索拡張生成
LLM
Yu Liu, Xixun Lin, Yanmin Shang, et al.
1
13
14
15
16
17
18
19
48
空間的超感応を用いずに空間的超感応を解く
ビデオ理解
コンピュータビジョン
Vishaal Udandarao, Shyamgopal Karthik, Surabhi S. Nath, et al.
Parrot:出力の真実性に対する説得および同意への頑健性評価——LLMsのための迎合性頑健性ベンチマーク
LLM
ベンチマーク
Yusuf Çelebi, Mahmoud El Hussieni, Özay Ezerceli
O-Mem:パーソナライズされた長期ホライゾンの自己進化型Agentのためのオムニメモリシステム
LLM
ベンチマーク
Piaohong Wang, Motong Tian, Jiaxian Li, et al.
テキストの内在的次元の解明:学術要旨から創作物語まで
LLM
自然言語処理
Vladislav Pedashenko, Laida Kushnareva, Yana Khassan Nibal, et al.
SAM 3:概念を用いたSegment Anything
コンピュータビジョン
セマンティックセグメンテーション
Nicolas Carion, Laura Gustafson, Yuan-Ting Hu, et al.
GeoVista:地理的位置特定のためのWeb拡張型Agent視覚的推論
エージェント
検索拡張生成
Yikun Wang, Zuyan Liu, Ziyi Wang, et al.
OpenMMReasoner:オープンかつ汎用的なレシピによるマルチモーダル推論のフロンティアの開拓
監視付き微調整
Reasoning
Kaichen Zhang, Keming Wu, Zuhao Yang, et al.
HiPO:大規模言語モデルにおける動的推論向けハイブリッド方策最適化
Reasoning
強化学習
Ken Deng, Zizheng Zhan, Wen Xiang, et al.
SERES:スパースな視点からの意味認識型ニューラル再構成
3D生成
コンピュータビジョン
Bo Xu, Yuhu Guo, Yuchao Wang, et al.
SDAR:スケーラブルなシーケンス生成のための相乗効果を持つ拡散-自己回帰パラダイム
拡散モデル
モデル学習
Shuang Cheng, Yihan Bian, Dawei Liu, et al.
MultiPL-MoE:ハイブリッドMixture-of-Expertsによる大規模言語モデルの多プログラミング・多言語拡張
LLM
コード生成
Qing Wang, Xue Han, Jiahui Wang, et al.
CapRL:強化学習を用いた密集画像記述能力の促進
画像説明
視覚質問応答
Long Xing, Xiaoyi Dong, Yuhang Zang, et al.
離散拡散発散指令による超高速言語生成
拡散モデル
テキスト生成
Haoyang Zheng, Xinyang Liu, Cindy Xiangrui Kong, et al.
DisCO:識別的制約最適化を用いた大規模推論モデルの強化
強化学習
Reasoning
Gang Li, Ming Lin, Tomer Galanti, et al.
QSVD:低精度視覚言語モデルにおける統合的クエリ・キー・バリュー重み圧縮のための効率的低ランク近似
Transformer
視覚質問応答
Yutong Wang, Haiyu Wang, Sai Qian Zhang
ネストド・ラーニング:ディープラーニングアーキテクチャの錯覚
ディープラーニング
自然言語処理
Ali Behrouz, Meisam Razaviyayn, Peiling Zhong, et al.
SAM 3D:画像内の何でも3D化
3D生成
3Dモデル
SAM 3D Team, Xingyu Chen, Fu-Jen Chu, et al.
Video-as-Answer:Joint-GRPOを用いた次に発生する動画イベントの予測と生成
動画生成
テキストから動画
Junhao Cheng, Liang Hou, Xin Tao, et al.
最初のフレームがビデオコンテンツカスタマイズの最適な場所である
動画生成
画像から動画生成
Jingxi Chen, Zongxia Li, Zhichao Liu, et al.
マルチモーダル基礎モデルによる空間知能のスケーリング
マルチモーダル
マルチモーダル表現
Zhongang Cai, Ruisi Wang, Chenyang Gu, et al.
Step-Audio-R1 技術報告
Reasoning
マルチモーダル
Fei Tian, Xiangyu Tony Zhang, Yuxin Zhang, et al.
V-ReasonBench:動画生成モデル向け統合推論ベンチマークセットへの道
ベンチマーク
視覚質問応答
Yang Luo, Xuanlei Zhao, Baijiong Lin, et al.
オルモ3
LLM
コード生成
Allyson Ettinger, Amanda Bertsch, Bailey Kuehl, et al.
GPT-5を用いた初期の科学加速実験
サイエンスのためのAI
Reasoning
Sébastien Bubeck, Christian Coester, Ronen Eldan, et al.
優れたAI研究エージェントとなるために必要なものとは何か?アイデーション多様性の役割を検討する
エージェント
ベンチマーク
Alexis Audran-Reiss, Jordi Armengol Estapé, Karen Hambardzumyan, et al.
LLMを用いた自動生成大規模データセットを活用した、指示に従う胸部X線画像における病変セグメンテーション
セマンティックセグメンテーション
マルチモーダル
Geon Choi, Hangyul Yoon, Hyunju Shin, et al.
VisPlay:画像から自己進化する視覚言語モデル
強化学習
マルチモーダル
Yicheng He, Chengsong Huang, Zongxia Li, et al.
ビデオを用いた推論:迷路解法タスクを用いたビデオモデルの推論能力の初めての評価
マルチモーダル表現
Reasoning
Cheng Yang, Haiyuan Wan, Yiran Peng, et al.
VIDEOP2R:認知から推論への動画理解
ビデオ理解
マルチモーダル表現
Yifan Jiang, Yueying Wang, Rui Zhao, et al.
Kandinsky 5.0:画像および動画生成のためのファミリーファウンデーションモデル
テキストから画像生成
画像から動画生成
Vladimir Arkhipkin, Vladimir Korviakov, Nikolai Gerasimenko, et al.
JAM-2:高い成功率を示す薬物様抗体の完全計算設計
サイエンスのためのAI
ディープラーニング
Nabla Bio
PathMind:大規模言語モデルを用いた知識グラフ推論のためのRetrieve-Prioritize-Reasonフレームワーク
検索拡張生成
LLM
Yu Liu, Xixun Lin, Yanmin Shang, et al.
1
13
14
15
16
17
18
19
48