HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
ネストド・ラーニング:ディープラーニングアーキテクチャの錯覚
ディープラーニング
自然言語処理
Ali Behrouz, Meisam Razaviyayn, Peiling Zhong, et al.
SAM 3D:画像内の何でも3D化
3D生成
3Dモデル
SAM 3D Team, Xingyu Chen, Fu-Jen Chu, et al.
Video-as-Answer:Joint-GRPOを用いた次に発生する動画イベントの予測と生成
動画生成
テキストから動画
Junhao Cheng, Liang Hou, Xin Tao, et al.
最初のフレームがビデオコンテンツカスタマイズの最適な場所である
動画生成
画像から動画生成
Jingxi Chen, Zongxia Li, Zhichao Liu, et al.
マルチモーダル基礎モデルによる空間知能のスケーリング
マルチモーダル
マルチモーダル表現
Zhongang Cai, Ruisi Wang, Chenyang Gu, et al.
Step-Audio-R1 技術報告
Reasoning
マルチモーダル
Fei Tian, Xiangyu Tony Zhang, Yuxin Zhang, et al.
V-ReasonBench:動画生成モデル向け統合推論ベンチマークセットへの道
ベンチマーク
視覚質問応答
Yang Luo, Xuanlei Zhao, Baijiong Lin, et al.
オルモ3
LLM
コード生成
Allyson Ettinger, Amanda Bertsch, Bailey Kuehl, et al.
GPT-5を用いた初期の科学加速実験
サイエンスのためのAI
Reasoning
Sébastien Bubeck, Christian Coester, Ronen Eldan, et al.
優れたAI研究エージェントとなるために必要なものとは何か?アイデーション多様性の役割を検討する
エージェント
ベンチマーク
Alexis Audran-Reiss, Jordi Armengol Estapé, Karen Hambardzumyan, et al.
LLMを用いた自動生成大規模データセットを活用した、指示に従う胸部X線画像における病変セグメンテーション
セマンティックセグメンテーション
マルチモーダル
Geon Choi, Hangyul Yoon, Hyunju Shin, et al.
VisPlay:画像から自己進化する視覚言語モデル
強化学習
マルチモーダル
Yicheng He, Chengsong Huang, Zongxia Li, et al.
ビデオを用いた推論:迷路解法タスクを用いたビデオモデルの推論能力の初めての評価
マルチモーダル表現
Reasoning
Cheng Yang, Haiyuan Wan, Yiran Peng, et al.
VIDEOP2R:認知から推論への動画理解
ビデオ理解
マルチモーダル表現
Yifan Jiang, Yueying Wang, Rui Zhao, et al.
Kandinsky 5.0:画像および動画生成のためのファミリーファウンデーションモデル
テキストから画像生成
画像から動画生成
Vladimir Arkhipkin, Vladimir Korviakov, Nikolai Gerasimenko, et al.
JAM-2:高い成功率を示す薬物様抗体の完全計算設計
サイエンスのためのAI
ディープラーニング
Nabla Bio
PathMind:大規模言語モデルを用いた知識グラフ推論のためのRetrieve-Prioritize-Reasonフレームワーク
検索拡張生成
LLM
Yu Liu, Xixun Lin, Yanmin Shang, et al.
レビューア:テキスト的内省を越えて、長編動画理解におけるマルチモーダル内省的推論へ
ビデオ理解
Reasoning
Jiaze Li, Hao Yin, Wenhui Tan, et al.
MVI-Bench:LVLMにおける誤った視覚入力に対するロバスト性評価のための包括的ベンチマーク
視覚質問応答
マルチモーダル
Huiyi Chen, Jiawei Peng, Dehai Min, et al.
世界シミュレータは推論できるか?Gen-ViRe:生成型視覚推論ベンチマーク
ベンチマーク
動画生成
Xinxin Liu, Zhaopan Xu, Kai Wang, et al.
スタイル1つでコード1つに相当する:離散的スタイル空間を活用したコードからスタイル画像への生成
テキストから画像生成
拡散モデル
Huijie Liu, Shuhao Cui, Haoxiang Cao, et al.
AraLingBench:大規模言語モデルのアラビア語言語能力を評価するためのヒューマンアノテートベンチマーク
ベンチマーク
LLM
Mohammad Zbib, Hasan Abed Al Kader Hammoud, Sina Mukalled, et al.
Think-at-Hard:推論言語モデルの性能向上のための選択的ラテン反復手法
LLM
Reasoning
Tianyu Fu, Yichen You, Zekai Chen, et al.
HumanSense:推論型MLLMを活用したマルチモーダル知覚から共感的で文脈に配慮した応答へ
LLM
マルチモーダル
Zheng Qin, Ruobing Zheng, Yabing Wang, et al.
CamCloneMaster:ビデオ生成におけるリファレンスベースカメラ制御を可能にする
動画生成
画像から動画生成
Yawen Luo, Jianhong Bai, Xiaoyu Shi, et al.
EditScore:高忠実度報酬モデリングによる画像編集向けオンライン強化学習の解禁
強化学習
Preference Modeling
Xin Luo, Jiahao Wang, Chenyuan Wu, et al.
InteractMove:可動物体を有する3Dシーンにおけるテキスト制御型人間-物体インタラクション生成
ロボティクス
エムボディドインテリジェンス
Xinhao Cai, Minghang Zheng, Xin Jin, et al.
WebCoach:セッション間メモリガイダンスを備えた自己進化型Webエージェント
エージェント
LLM
Genglin Liu, Shijie Geng, Sha Li, et al.
信頼する力を学ぶ:順次的意思決定における提示者の信頼性の変動へのベイズ的適応
強化学習
エージェント
Dylan M. Asmar, Mykel J. Kochenderfer
GroupRank:強化学習によって駆動されるグループワイドな再ランク付け枠組み
検索拡張生成
LLM
Duolin Sun, Meixiu Long, Dan Yang, et al.
MMaDA-Parallel:思考認識型編集・生成のためのマルチモーダル大規模拡散言語モデル
拡散モデル
LLM
Ye Tian, Ling Yang, Jiongfan Yang, et al.
TiViBench:Video生成モデルにおけるThink-in-Video推論のベンチマーク
動画生成
Reasoning
Harold Haodong Chen, Disen Lan, Wen-Jie Shu, et al.
1
12
13
14
15
16
17
18
47
ネストド・ラーニング:ディープラーニングアーキテクチャの錯覚
ディープラーニング
自然言語処理
Ali Behrouz, Meisam Razaviyayn, Peiling Zhong, et al.
SAM 3D:画像内の何でも3D化
3D生成
3Dモデル
SAM 3D Team, Xingyu Chen, Fu-Jen Chu, et al.
Video-as-Answer:Joint-GRPOを用いた次に発生する動画イベントの予測と生成
動画生成
テキストから動画
Junhao Cheng, Liang Hou, Xin Tao, et al.
最初のフレームがビデオコンテンツカスタマイズの最適な場所である
動画生成
画像から動画生成
Jingxi Chen, Zongxia Li, Zhichao Liu, et al.
マルチモーダル基礎モデルによる空間知能のスケーリング
マルチモーダル
マルチモーダル表現
Zhongang Cai, Ruisi Wang, Chenyang Gu, et al.
Step-Audio-R1 技術報告
Reasoning
マルチモーダル
Fei Tian, Xiangyu Tony Zhang, Yuxin Zhang, et al.
V-ReasonBench:動画生成モデル向け統合推論ベンチマークセットへの道
ベンチマーク
視覚質問応答
Yang Luo, Xuanlei Zhao, Baijiong Lin, et al.
オルモ3
LLM
コード生成
Allyson Ettinger, Amanda Bertsch, Bailey Kuehl, et al.
GPT-5を用いた初期の科学加速実験
サイエンスのためのAI
Reasoning
Sébastien Bubeck, Christian Coester, Ronen Eldan, et al.
優れたAI研究エージェントとなるために必要なものとは何か?アイデーション多様性の役割を検討する
エージェント
ベンチマーク
Alexis Audran-Reiss, Jordi Armengol Estapé, Karen Hambardzumyan, et al.
LLMを用いた自動生成大規模データセットを活用した、指示に従う胸部X線画像における病変セグメンテーション
セマンティックセグメンテーション
マルチモーダル
Geon Choi, Hangyul Yoon, Hyunju Shin, et al.
VisPlay:画像から自己進化する視覚言語モデル
強化学習
マルチモーダル
Yicheng He, Chengsong Huang, Zongxia Li, et al.
ビデオを用いた推論:迷路解法タスクを用いたビデオモデルの推論能力の初めての評価
マルチモーダル表現
Reasoning
Cheng Yang, Haiyuan Wan, Yiran Peng, et al.
VIDEOP2R:認知から推論への動画理解
ビデオ理解
マルチモーダル表現
Yifan Jiang, Yueying Wang, Rui Zhao, et al.
Kandinsky 5.0:画像および動画生成のためのファミリーファウンデーションモデル
テキストから画像生成
画像から動画生成
Vladimir Arkhipkin, Vladimir Korviakov, Nikolai Gerasimenko, et al.
JAM-2:高い成功率を示す薬物様抗体の完全計算設計
サイエンスのためのAI
ディープラーニング
Nabla Bio
PathMind:大規模言語モデルを用いた知識グラフ推論のためのRetrieve-Prioritize-Reasonフレームワーク
検索拡張生成
LLM
Yu Liu, Xixun Lin, Yanmin Shang, et al.
レビューア:テキスト的内省を越えて、長編動画理解におけるマルチモーダル内省的推論へ
ビデオ理解
Reasoning
Jiaze Li, Hao Yin, Wenhui Tan, et al.
MVI-Bench:LVLMにおける誤った視覚入力に対するロバスト性評価のための包括的ベンチマーク
視覚質問応答
マルチモーダル
Huiyi Chen, Jiawei Peng, Dehai Min, et al.
世界シミュレータは推論できるか?Gen-ViRe:生成型視覚推論ベンチマーク
ベンチマーク
動画生成
Xinxin Liu, Zhaopan Xu, Kai Wang, et al.
スタイル1つでコード1つに相当する:離散的スタイル空間を活用したコードからスタイル画像への生成
テキストから画像生成
拡散モデル
Huijie Liu, Shuhao Cui, Haoxiang Cao, et al.
AraLingBench:大規模言語モデルのアラビア語言語能力を評価するためのヒューマンアノテートベンチマーク
ベンチマーク
LLM
Mohammad Zbib, Hasan Abed Al Kader Hammoud, Sina Mukalled, et al.
Think-at-Hard:推論言語モデルの性能向上のための選択的ラテン反復手法
LLM
Reasoning
Tianyu Fu, Yichen You, Zekai Chen, et al.
HumanSense:推論型MLLMを活用したマルチモーダル知覚から共感的で文脈に配慮した応答へ
LLM
マルチモーダル
Zheng Qin, Ruobing Zheng, Yabing Wang, et al.
CamCloneMaster:ビデオ生成におけるリファレンスベースカメラ制御を可能にする
動画生成
画像から動画生成
Yawen Luo, Jianhong Bai, Xiaoyu Shi, et al.
EditScore:高忠実度報酬モデリングによる画像編集向けオンライン強化学習の解禁
強化学習
Preference Modeling
Xin Luo, Jiahao Wang, Chenyuan Wu, et al.
InteractMove:可動物体を有する3Dシーンにおけるテキスト制御型人間-物体インタラクション生成
ロボティクス
エムボディドインテリジェンス
Xinhao Cai, Minghang Zheng, Xin Jin, et al.
WebCoach:セッション間メモリガイダンスを備えた自己進化型Webエージェント
エージェント
LLM
Genglin Liu, Shijie Geng, Sha Li, et al.
信頼する力を学ぶ:順次的意思決定における提示者の信頼性の変動へのベイズ的適応
強化学習
エージェント
Dylan M. Asmar, Mykel J. Kochenderfer
GroupRank:強化学習によって駆動されるグループワイドな再ランク付け枠組み
検索拡張生成
LLM
Duolin Sun, Meixiu Long, Dan Yang, et al.
MMaDA-Parallel:思考認識型編集・生成のためのマルチモーダル大規模拡散言語モデル
拡散モデル
LLM
Ye Tian, Ling Yang, Jiongfan Yang, et al.
TiViBench:Video生成モデルにおけるThink-in-Video推論のベンチマーク
動画生成
Reasoning
Harold Haodong Chen, Disen Lan, Wen-Jie Shu, et al.
1
12
13
14
15
16
17
18
47