HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
Kandinsky 5.0:画像および動画生成のためのファミリーファウンデーションモデル
テキストから画像生成
画像から動画生成
Vladimir Arkhipkin, Vladimir Korviakov, Nikolai Gerasimenko, et al.
JAM-2:高い成功率を示す薬物様抗体の完全計算設計
サイエンスのためのAI
ディープラーニング
Nabla Bio
PathMind:大規模言語モデルを用いた知識グラフ推論のためのRetrieve-Prioritize-Reasonフレームワーク
検索拡張生成
LLM
Yu Liu, Xixun Lin, Yanmin Shang, et al.
レビューア:テキスト的内省を越えて、長編動画理解におけるマルチモーダル内省的推論へ
ビデオ理解
Reasoning
Jiaze Li, Hao Yin, Wenhui Tan, et al.
MVI-Bench:LVLMにおける誤った視覚入力に対するロバスト性評価のための包括的ベンチマーク
視覚質問応答
マルチモーダル
Huiyi Chen, Jiawei Peng, Dehai Min, et al.
世界シミュレータは推論できるか?Gen-ViRe:生成型視覚推論ベンチマーク
ベンチマーク
動画生成
Xinxin Liu, Zhaopan Xu, Kai Wang, et al.
スタイル1つでコード1つに相当する:離散的スタイル空間を活用したコードからスタイル画像への生成
テキストから画像生成
拡散モデル
Huijie Liu, Shuhao Cui, Haoxiang Cao, et al.
AraLingBench:大規模言語モデルのアラビア語言語能力を評価するためのヒューマンアノテートベンチマーク
ベンチマーク
LLM
Mohammad Zbib, Hasan Abed Al Kader Hammoud, Sina Mukalled, et al.
Think-at-Hard:推論言語モデルの性能向上のための選択的ラテン反復手法
LLM
Reasoning
Tianyu Fu, Yichen You, Zekai Chen, et al.
HumanSense:推論型MLLMを活用したマルチモーダル知覚から共感的で文脈に配慮した応答へ
LLM
マルチモーダル
Zheng Qin, Ruobing Zheng, Yabing Wang, et al.
CamCloneMaster:ビデオ生成におけるリファレンスベースカメラ制御を可能にする
動画生成
画像から動画生成
Yawen Luo, Jianhong Bai, Xiaoyu Shi, et al.
EditScore:高忠実度報酬モデリングによる画像編集向けオンライン強化学習の解禁
強化学習
Preference Modeling
Xin Luo, Jiahao Wang, Chenyuan Wu, et al.
InteractMove:可動物体を有する3Dシーンにおけるテキスト制御型人間-物体インタラクション生成
ロボティクス
エムボディドインテリジェンス
Xinhao Cai, Minghang Zheng, Xin Jin, et al.
WebCoach:セッション間メモリガイダンスを備えた自己進化型Webエージェント
エージェント
LLM
Genglin Liu, Shijie Geng, Sha Li, et al.
信頼する力を学ぶ:順次的意思決定における提示者の信頼性の変動へのベイズ的適応
強化学習
エージェント
Dylan M. Asmar, Mykel J. Kochenderfer
GroupRank:強化学習によって駆動されるグループワイドな再ランク付け枠組み
検索拡張生成
LLM
Duolin Sun, Meixiu Long, Dan Yang, et al.
MMaDA-Parallel:思考認識型編集・生成のためのマルチモーダル大規模拡散言語モデル
拡散モデル
LLM
Ye Tian, Ling Yang, Jiongfan Yang, et al.
TiViBench:Video生成モデルにおけるThink-in-Video推論のベンチマーク
動画生成
Reasoning
Harold Haodong Chen, Disen Lan, Wen-Jie Shu, et al.
Part-X-MLLM:部位認識型3Dマルチモーダル大規模言語モデル
Any-to-Any
3D生成
Chunshi Wang, Junliang Ye, Yunhan Yang, et al.
Uni-MoE-2.0-Omni:高度なMoE、トレーニングおよびデータを用いた言語中心型オムニモーダル大規模モデルのスケーリング
Any-to-Any
LLM
Yunxin Li, Xinyu Chen, Shenyuan Jiang, et al.
P1:強化学習を用いた物理学オリンピックの習得
Reasoning
LLM
Jiacheng Chen, Qianjia Cheng, Fangchen Yu, et al.
ランスロット:完全準同型暗号内における効率的かつプライバシー保護型のバシニンス耐性フェデレーテッドラーニングのためのアプローチ
コンピュータビジョン
ニューラルネットワーク
Siyang Jiang, Hao Yang, Qipeng Xie, et al.
変分自己符号化器を用いない潜在拡散モデル
拡散モデル
画像生成
Minglei Shi, Haolin Wang, Wenzhao Zheng, et al.
RewardMap:マルチステージ強化学習を活用した詳細視覚推論におけるスパース報酬の克服
視覚質問応答
強化学習
Sicheng Feng, Kaiwen Tuo, Song Wang, et al.
ReinFlow:オンライン強化学習を用いたフローマッチング方策のファインチューニング
強化学習
拡散モデル
Tonghe Zhang, Chao Yu, Sichang Su, et al.
推論能力の音声評価:モダリティに起因するパフォーマンス格差の診断
ベンチマーク
音声および音声処理
Yueqian Lin, Zhengmian Hu, Qinsi Wang, et al.
MarsRL:エージェントパイプライン並列化を用いた強化学習によるマルチエージェント推論システムの進展
強化学習
エージェント
Shulin Liu, Dong Du, Tao Yang, et al.
バーチャル幅ネットワーク
Transformer
モデル学習
Seed, Baisheng Li, Banggu Wu, et al.
AIonopedia:マルチモーダル学習を統合するLLMエージェントによるイオン液体の発見
LLM
マルチモーダル
Yuqi Yin, Yibo Fu, Siyuan Wang, et al.
UI2Code$^ ext{N}$:テスト時スケーラビリティを備えたインタラクティブなUIからCode生成のための視覚言語モデル
コード生成
LLM
Zhen Yang, Wenyi Hong, Mingde Xu, et al.
GGBench:統一型マルチモーダルモデル向けの幾何学的生成推論ベンチマーク
マルチモーダル
Any-to-Any
Jingxuan Wei, Caijun Jia, Xi Bai, et al.
WEAVE:文脈内インタリーブド理解および生成の解放とベンチマーク
Any-to-Any
画像生成
Wei Chow, Jiachun Pan, Yongyuan Liang, et al.
1
14
15
16
17
18
19
20
49
Kandinsky 5.0:画像および動画生成のためのファミリーファウンデーションモデル
テキストから画像生成
画像から動画生成
Vladimir Arkhipkin, Vladimir Korviakov, Nikolai Gerasimenko, et al.
JAM-2:高い成功率を示す薬物様抗体の完全計算設計
サイエンスのためのAI
ディープラーニング
Nabla Bio
PathMind:大規模言語モデルを用いた知識グラフ推論のためのRetrieve-Prioritize-Reasonフレームワーク
検索拡張生成
LLM
Yu Liu, Xixun Lin, Yanmin Shang, et al.
レビューア:テキスト的内省を越えて、長編動画理解におけるマルチモーダル内省的推論へ
ビデオ理解
Reasoning
Jiaze Li, Hao Yin, Wenhui Tan, et al.
MVI-Bench:LVLMにおける誤った視覚入力に対するロバスト性評価のための包括的ベンチマーク
視覚質問応答
マルチモーダル
Huiyi Chen, Jiawei Peng, Dehai Min, et al.
世界シミュレータは推論できるか?Gen-ViRe:生成型視覚推論ベンチマーク
ベンチマーク
動画生成
Xinxin Liu, Zhaopan Xu, Kai Wang, et al.
スタイル1つでコード1つに相当する:離散的スタイル空間を活用したコードからスタイル画像への生成
テキストから画像生成
拡散モデル
Huijie Liu, Shuhao Cui, Haoxiang Cao, et al.
AraLingBench:大規模言語モデルのアラビア語言語能力を評価するためのヒューマンアノテートベンチマーク
ベンチマーク
LLM
Mohammad Zbib, Hasan Abed Al Kader Hammoud, Sina Mukalled, et al.
Think-at-Hard:推論言語モデルの性能向上のための選択的ラテン反復手法
LLM
Reasoning
Tianyu Fu, Yichen You, Zekai Chen, et al.
HumanSense:推論型MLLMを活用したマルチモーダル知覚から共感的で文脈に配慮した応答へ
LLM
マルチモーダル
Zheng Qin, Ruobing Zheng, Yabing Wang, et al.
CamCloneMaster:ビデオ生成におけるリファレンスベースカメラ制御を可能にする
動画生成
画像から動画生成
Yawen Luo, Jianhong Bai, Xiaoyu Shi, et al.
EditScore:高忠実度報酬モデリングによる画像編集向けオンライン強化学習の解禁
強化学習
Preference Modeling
Xin Luo, Jiahao Wang, Chenyuan Wu, et al.
InteractMove:可動物体を有する3Dシーンにおけるテキスト制御型人間-物体インタラクション生成
ロボティクス
エムボディドインテリジェンス
Xinhao Cai, Minghang Zheng, Xin Jin, et al.
WebCoach:セッション間メモリガイダンスを備えた自己進化型Webエージェント
エージェント
LLM
Genglin Liu, Shijie Geng, Sha Li, et al.
信頼する力を学ぶ:順次的意思決定における提示者の信頼性の変動へのベイズ的適応
強化学習
エージェント
Dylan M. Asmar, Mykel J. Kochenderfer
GroupRank:強化学習によって駆動されるグループワイドな再ランク付け枠組み
検索拡張生成
LLM
Duolin Sun, Meixiu Long, Dan Yang, et al.
MMaDA-Parallel:思考認識型編集・生成のためのマルチモーダル大規模拡散言語モデル
拡散モデル
LLM
Ye Tian, Ling Yang, Jiongfan Yang, et al.
TiViBench:Video生成モデルにおけるThink-in-Video推論のベンチマーク
動画生成
Reasoning
Harold Haodong Chen, Disen Lan, Wen-Jie Shu, et al.
Part-X-MLLM:部位認識型3Dマルチモーダル大規模言語モデル
Any-to-Any
3D生成
Chunshi Wang, Junliang Ye, Yunhan Yang, et al.
Uni-MoE-2.0-Omni:高度なMoE、トレーニングおよびデータを用いた言語中心型オムニモーダル大規模モデルのスケーリング
Any-to-Any
LLM
Yunxin Li, Xinyu Chen, Shenyuan Jiang, et al.
P1:強化学習を用いた物理学オリンピックの習得
Reasoning
LLM
Jiacheng Chen, Qianjia Cheng, Fangchen Yu, et al.
ランスロット:完全準同型暗号内における効率的かつプライバシー保護型のバシニンス耐性フェデレーテッドラーニングのためのアプローチ
コンピュータビジョン
ニューラルネットワーク
Siyang Jiang, Hao Yang, Qipeng Xie, et al.
変分自己符号化器を用いない潜在拡散モデル
拡散モデル
画像生成
Minglei Shi, Haolin Wang, Wenzhao Zheng, et al.
RewardMap:マルチステージ強化学習を活用した詳細視覚推論におけるスパース報酬の克服
視覚質問応答
強化学習
Sicheng Feng, Kaiwen Tuo, Song Wang, et al.
ReinFlow:オンライン強化学習を用いたフローマッチング方策のファインチューニング
強化学習
拡散モデル
Tonghe Zhang, Chao Yu, Sichang Su, et al.
推論能力の音声評価:モダリティに起因するパフォーマンス格差の診断
ベンチマーク
音声および音声処理
Yueqian Lin, Zhengmian Hu, Qinsi Wang, et al.
MarsRL:エージェントパイプライン並列化を用いた強化学習によるマルチエージェント推論システムの進展
強化学習
エージェント
Shulin Liu, Dong Du, Tao Yang, et al.
バーチャル幅ネットワーク
Transformer
モデル学習
Seed, Baisheng Li, Banggu Wu, et al.
AIonopedia:マルチモーダル学習を統合するLLMエージェントによるイオン液体の発見
LLM
マルチモーダル
Yuqi Yin, Yibo Fu, Siyuan Wang, et al.
UI2Code$^ ext{N}$:テスト時スケーラビリティを備えたインタラクティブなUIからCode生成のための視覚言語モデル
コード生成
LLM
Zhen Yang, Wenyi Hong, Mingde Xu, et al.
GGBench:統一型マルチモーダルモデル向けの幾何学的生成推論ベンチマーク
マルチモーダル
Any-to-Any
Jingxuan Wei, Caijun Jia, Xi Bai, et al.
WEAVE:文脈内インタリーブド理解および生成の解放とベンチマーク
Any-to-Any
画像生成
Wei Chow, Jiachun Pan, Yongyuan Liang, et al.
1
14
15
16
17
18
19
20
49