HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
華佗GPT-Vision:大規模なマルチモーダルLLMに医療視覚知識を統合するための取り組み
視覚質問応答
マルチモーダル
Junying Chen, Ruyi Ouyang, Anningzhe Gao, et al.
複雑な動的環境におけるツール利用精度を入力再構成によってどのように向上できるか? τ-benchを用いた研究
エージェント
LLM
Venkatesh Mishra, Amir Saeidi, Satyam Raj, et al.
UIレベルでのALLaM 34Bの評価:HUMAIN Chatを用いたアラビア語中心のLLMの測定
LLM
自然言語処理
Omer Nacar
反応的から認知的へ:エージェントにインスパイアされた空間知能
エムボディドインテリジェンス
Reasoning
Shouwei Ruan, Liyuan Wang, Caixin Kang, et al.
ラベルを残さない:すべての教師信号設定に対応する統一された表面欠陥検出モデル
コンピュータビジョン
オブジェクト検出
Blaž Rolih, Matic Fučka, Danijel Skočaj
T2R-bench:現実の産業用テーブルから記事レベルのレポートを生成するためのベンチマーク
ベンチマーク
LLM
Jie Zhang, Changzai Pan, Kaiwen Wei, et al.
PVPO:エージェント型推論のための事前推定価値に基づく方策最適化
強化学習
モデル学習
Wenfeng Feng, Penghong Zhao, Guochao Jiang, et al.
人間からのフィードバックを用いた強化学習による、有用かつ無害なアシスタントの訓練
Preference Modeling
強化学習
Yuntao Bai, Andy Jones, Kamal Ndousse, et al.
UQ:未解決の問いに対する言語モデルの評価
データセット
Reasoning
Fan Nie, Ken Ziyu Liu, Zihao Wang, et al.
CARJAN:AJANを用いたエージェントベースの交通シナリオ生成とシミュレーション
自動運転
エージェント
Leonard Frank Neis, Andre Antakli, Matthias Klusch
TiKMiX:言語モデル事前学習における動的混合にデータインフルエンスを組み込む
LLM
モデル学習
Yifan Wang, Binbin Liu, Fengze Liu, et al.
TalkVid:音声駆動型トークヘッド合成のための大規模多様データセット
Any-to-Any
データセット
Shunian Chen, Hejin Huang, Yexin Liu, et al.
Droplet3D:動画から得られる常識的事前知識が3D生成を促進する
3D生成
ビデオ理解
Xiaochuan Li, Guoguang Du, Runze Zhang, et al.
A.S.E:AI生成コードにおけるセキュリティ評価を目的としたリポジトリレベルのベンチマーク
コード生成
ベンチマーク
Keke Lian, Bin Wang, Lei Zhang, et al.
EmbodiedOneVision:汎用ロボット制御のためのインタリーブド視覚-テキスト-アクション事前学習
エージェント
エムボディドインテリジェンス
Delin Qu, Haoming Song, Qizhi Chen, et al.
R-4B:バイモードアニーリングと強化学習を用いたMLLMsにおける汎用自己思考能力のインセンティブ化
マルチモーダル
Reasoning
Jie Jiang, Qi Yang, Bolin Ni, et al.
小さな言語モデルにおける創造的ライティングの喚起:LLM-as-a-Judge とマルチエージェントによる報酬の精緻化
監視付き微調整
Preference Modeling
Xiaolong Wei, Bo Lu, Xingyu Zhang, et al.
TMUAD:テキストメモリバンクを用いた統合異常検出モデルにおける論理機能の強化
コンピュータビジョン
画像理解
Jiawei Liu, Jiahe Hou, Wei Wang, et al.
思考過程のダイナミクスの分析:能動的誘導か、不誠実な後向きの合理化か?
LLM
監視付き微調整
Samuel Lewis-Lim, Xingwei Tan, Zhixue Zhao, et al.
AWorld:エージェント型AIのトレーニングレシピの調整
エージェント
ベンチマーク
Chengyue Yu, Siyuan Lu, Chenyi Zhuang, et al.
MCP-Bench:MCPサーバーを活用した複雑な現実世界タスクにおけるツール利用型LLMエージェントのベンチマーク手法
ベンチマーク
エージェント
Zhenting Wang, Qi Chang, Hemani Patel, et al.
rStar2エージェント:エージェンティックリーズニング技術報告書
エージェント
強化学習
Ning Shang, Yifei Liu, Yi Zhu, et al.
Pref-GRPO:安定したテキストto画像強化学習のためのペアワイズ・プレファレンス報酬ベースのGRPO
テキストから画像生成
Preference Modeling
Yibin Wang, Zhimin Li, Yuhang Zang, et al.
MobileCLIP2:マルチモーダル強化学習の向上
マルチモーダル
画像説明
Fartash Faghri, Pavan Kumar Anasosalu Vasu, Cem Koc, et al.
AI-AI美的協働:明示的な象徴意識と顕在する文法形成
人工知能
自然言語処理
Nicanor I. Moldovan
視線を心へ:rPPGおよび健康バイオマーカー推定のためのマルチビュー動画データセット
コンピュータビジョン
ビデオ理解
Konstantin Egorov, Stepan Botman, Pavel Blinov, et al.
次に出現するトークンの順序予測が言語モデルの性能向上に寄与する
Transformer
モデル学習
Zayd M. K. Zuhri, Erland Hilman Fuadi, Alham Fikri Aji
MIDAS:リアルタイム自己回帰型動画生成を活用したマルチモーダルインタラクティブなデジタル人間合成
テキストから動画
Any-to-Any
Ming Chen, Liyuan Cui, Wenyuan Zhang, et al.
離散拡散VLA:視覚言語行動方策における行動復元に離散拡散を導入する
拡散モデル
Transformer
Zhixuan Liang, Yizhuo Li, Tianshuo Yang, et al.
推論分解を用いた自己報酬付き視覚言語モデル
視覚質問応答
Reasoning
Zongxia Li, Wenhao Yu, Chengsong Huang, et al.
転写を越えて:音声認識におけるメカニズム解釈可能性
Transformer
ディープラーニング
Neta Glazer, Yael Segal-Feldman, Hilit Segev, et al.
CODA:分離型強化学習を用いた二大脳コンピュータ利用エージェントにおける大脳と小脳の連携
エージェント
強化学習
Zeyi Sun, Yuhang Cao, Jianze Liang, et al.
1
33
34
35
36
37
38
39
51
華佗GPT-Vision:大規模なマルチモーダルLLMに医療視覚知識を統合するための取り組み
視覚質問応答
マルチモーダル
Junying Chen, Ruyi Ouyang, Anningzhe Gao, et al.
複雑な動的環境におけるツール利用精度を入力再構成によってどのように向上できるか? τ-benchを用いた研究
エージェント
LLM
Venkatesh Mishra, Amir Saeidi, Satyam Raj, et al.
UIレベルでのALLaM 34Bの評価:HUMAIN Chatを用いたアラビア語中心のLLMの測定
LLM
自然言語処理
Omer Nacar
反応的から認知的へ:エージェントにインスパイアされた空間知能
エムボディドインテリジェンス
Reasoning
Shouwei Ruan, Liyuan Wang, Caixin Kang, et al.
ラベルを残さない:すべての教師信号設定に対応する統一された表面欠陥検出モデル
コンピュータビジョン
オブジェクト検出
Blaž Rolih, Matic Fučka, Danijel Skočaj
T2R-bench:現実の産業用テーブルから記事レベルのレポートを生成するためのベンチマーク
ベンチマーク
LLM
Jie Zhang, Changzai Pan, Kaiwen Wei, et al.
PVPO:エージェント型推論のための事前推定価値に基づく方策最適化
強化学習
モデル学習
Wenfeng Feng, Penghong Zhao, Guochao Jiang, et al.
人間からのフィードバックを用いた強化学習による、有用かつ無害なアシスタントの訓練
Preference Modeling
強化学習
Yuntao Bai, Andy Jones, Kamal Ndousse, et al.
UQ:未解決の問いに対する言語モデルの評価
データセット
Reasoning
Fan Nie, Ken Ziyu Liu, Zihao Wang, et al.
CARJAN:AJANを用いたエージェントベースの交通シナリオ生成とシミュレーション
自動運転
エージェント
Leonard Frank Neis, Andre Antakli, Matthias Klusch
TiKMiX:言語モデル事前学習における動的混合にデータインフルエンスを組み込む
LLM
モデル学習
Yifan Wang, Binbin Liu, Fengze Liu, et al.
TalkVid:音声駆動型トークヘッド合成のための大規模多様データセット
Any-to-Any
データセット
Shunian Chen, Hejin Huang, Yexin Liu, et al.
Droplet3D:動画から得られる常識的事前知識が3D生成を促進する
3D生成
ビデオ理解
Xiaochuan Li, Guoguang Du, Runze Zhang, et al.
A.S.E:AI生成コードにおけるセキュリティ評価を目的としたリポジトリレベルのベンチマーク
コード生成
ベンチマーク
Keke Lian, Bin Wang, Lei Zhang, et al.
EmbodiedOneVision:汎用ロボット制御のためのインタリーブド視覚-テキスト-アクション事前学習
エージェント
エムボディドインテリジェンス
Delin Qu, Haoming Song, Qizhi Chen, et al.
R-4B:バイモードアニーリングと強化学習を用いたMLLMsにおける汎用自己思考能力のインセンティブ化
マルチモーダル
Reasoning
Jie Jiang, Qi Yang, Bolin Ni, et al.
小さな言語モデルにおける創造的ライティングの喚起:LLM-as-a-Judge とマルチエージェントによる報酬の精緻化
監視付き微調整
Preference Modeling
Xiaolong Wei, Bo Lu, Xingyu Zhang, et al.
TMUAD:テキストメモリバンクを用いた統合異常検出モデルにおける論理機能の強化
コンピュータビジョン
画像理解
Jiawei Liu, Jiahe Hou, Wei Wang, et al.
思考過程のダイナミクスの分析:能動的誘導か、不誠実な後向きの合理化か?
LLM
監視付き微調整
Samuel Lewis-Lim, Xingwei Tan, Zhixue Zhao, et al.
AWorld:エージェント型AIのトレーニングレシピの調整
エージェント
ベンチマーク
Chengyue Yu, Siyuan Lu, Chenyi Zhuang, et al.
MCP-Bench:MCPサーバーを活用した複雑な現実世界タスクにおけるツール利用型LLMエージェントのベンチマーク手法
ベンチマーク
エージェント
Zhenting Wang, Qi Chang, Hemani Patel, et al.
rStar2エージェント:エージェンティックリーズニング技術報告書
エージェント
強化学習
Ning Shang, Yifei Liu, Yi Zhu, et al.
Pref-GRPO:安定したテキストto画像強化学習のためのペアワイズ・プレファレンス報酬ベースのGRPO
テキストから画像生成
Preference Modeling
Yibin Wang, Zhimin Li, Yuhang Zang, et al.
MobileCLIP2:マルチモーダル強化学習の向上
マルチモーダル
画像説明
Fartash Faghri, Pavan Kumar Anasosalu Vasu, Cem Koc, et al.
AI-AI美的協働:明示的な象徴意識と顕在する文法形成
人工知能
自然言語処理
Nicanor I. Moldovan
視線を心へ:rPPGおよび健康バイオマーカー推定のためのマルチビュー動画データセット
コンピュータビジョン
ビデオ理解
Konstantin Egorov, Stepan Botman, Pavel Blinov, et al.
次に出現するトークンの順序予測が言語モデルの性能向上に寄与する
Transformer
モデル学習
Zayd M. K. Zuhri, Erland Hilman Fuadi, Alham Fikri Aji
MIDAS:リアルタイム自己回帰型動画生成を活用したマルチモーダルインタラクティブなデジタル人間合成
テキストから動画
Any-to-Any
Ming Chen, Liyuan Cui, Wenyuan Zhang, et al.
離散拡散VLA:視覚言語行動方策における行動復元に離散拡散を導入する
拡散モデル
Transformer
Zhixuan Liang, Yizhuo Li, Tianshuo Yang, et al.
推論分解を用いた自己報酬付き視覚言語モデル
視覚質問応答
Reasoning
Zongxia Li, Wenhao Yu, Chengsong Huang, et al.
転写を越えて:音声認識におけるメカニズム解釈可能性
Transformer
ディープラーニング
Neta Glazer, Yael Segal-Feldman, Hilit Segev, et al.
CODA:分離型強化学習を用いた二大脳コンピュータ利用エージェントにおける大脳と小脳の連携
エージェント
強化学習
Zeyi Sun, Yuhang Cao, Jianze Liang, et al.
1
33
34
35
36
37
38
39
51