HyperAI

メイン

GPU

コンソール
Studio
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

人工知能の未来を築く

概要

当社についてサポートデータセットのヘルプ

製品

ニュース論文ノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

メイン

GPU

コンソール
Studio
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

人工知能の未来を築く

概要

当社についてサポートデータセットのヘルプ

製品

ニュース論文ノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)

反応的から認知的へ：エージェントにインスパイアされた空間知能

反応的から認知的へ：エージェントにインスパイアされた空間知能

エムボディドインテリジェンス

Shouwei Ruan, Liyuan Wang, Caixin Kang, et al.

ラベルを残さない：すべての教師信号設定に対応する統一された表面欠陥検出モデル

ラベルを残さない：すべての教師信号設定に対応する統一された表面欠陥検出モデル

コンピュータビジョン

オブジェクト検出

Blaž Rolih, Matic Fučka, Danijel Skočaj

T2R-bench：現実の産業用テーブルから記事レベルのレポートを生成するためのベンチマーク

ベンチマーク

Jie Zhang, Changzai Pan, Kaiwen Wei, et al.

PVPO：エージェント型推論のための事前推定価値に基づく方策最適化

モデル学習

Wenfeng Feng, Penghong Zhao, Guochao Jiang, et al.

人間からのフィードバックを用いた強化学習による、有用かつ無害なアシスタントの訓練

Preference Modeling

Yuntao Bai, Andy Jones, Kamal Ndousse, et al.

UQ：未解決の問いに対する言語モデルの評価

データセット

Fan Nie, Ken Ziyu Liu, Zihao Wang, et al.

CARJAN：AJANを用いたエージェントベースの交通シナリオ生成とシミュレーション

エージェント

Leonard Frank Neis, Andre Antakli, Matthias Klusch

TiKMiX：言語モデル事前学習における動的混合にデータインフルエンスを組み込む

モデル学習

Yifan Wang, Binbin Liu, Fengze Liu, et al.

TalkVid：音声駆動型トークヘッド合成のための大規模多様データセット

データセット

Shunian Chen, Hejin Huang, Yexin Liu, et al.

Droplet3D：動画から得られる常識的事前知識が3D生成を促進する

ビデオ理解

Xiaochuan Li, Guoguang Du, Runze Zhang, et al.

A.S.E：AI生成コードにおけるセキュリティ評価を目的としたリポジトリレベルのベンチマーク

コード生成

ベンチマーク

Keke Lian, Bin Wang, Lei Zhang, et al.

EmbodiedOneVision：汎用ロボット制御のためのインタリーブド視覚－テキスト－アクション事前学習

エージェント

エムボディドインテリジェンス

Delin Qu, Haoming Song, Qizhi Chen, et al.

R-4B：バイモードアニーリングと強化学習を用いたMLLMsにおける汎用自己思考能力のインセンティブ化

マルチモーダル

Jie Jiang, Qi Yang, Bolin Ni, et al.

小さな言語モデルにおける創造的ライティングの喚起：LLM-as-a-Judge とマルチエージェントによる報酬の精緻化

監視付き微調整

Preference Modeling

Xiaolong Wei, Bo Lu, Xingyu Zhang, et al.

TMUAD：テキストメモリバンクを用いた統合異常検出モデルにおける論理機能の強化

コンピュータビジョン

Jiawei Liu, Jiahe Hou, Wei Wang, et al.

思考過程のダイナミクスの分析：能動的誘導か、不誠実な後向きの合理化か？

監視付き微調整

Samuel Lewis-Lim, Xingwei Tan, Zhixue Zhao, et al.

AWorld：エージェント型AIのトレーニングレシピの調整

エージェント

ベンチマーク

Chengyue Yu, Siyuan Lu, Chenyi Zhuang, et al.

MCP-Bench：MCPサーバーを活用した複雑な現実世界タスクにおけるツール利用型LLMエージェントのベンチマーク手法

ベンチマーク

エージェント

Zhenting Wang, Qi Chang, Hemani Patel, et al.

rStar2エージェント：エージェンティックリーズニング技術報告書

エージェント

Ning Shang, Yifei Liu, Yi Zhu, et al.

Pref-GRPO：安定したテキストto画像強化学習のためのペアワイズ・プレファレンス報酬ベースのGRPO

テキストから画像生成

Preference Modeling

Yibin Wang, Zhimin Li, Yuhang Zang, et al.

MobileCLIP2：マルチモーダル強化学習の向上

マルチモーダル

Fartash Faghri, Pavan Kumar Anasosalu Vasu, Cem Koc, et al.

AI-AI美的協働：明示的な象徴意識と顕在する文法形成

自然言語処理

Nicanor I. Moldovan

視線を心へ：rPPGおよび健康バイオマーカー推定のためのマルチビュー動画データセット

コンピュータビジョン

ビデオ理解

Konstantin Egorov, Stepan Botman, Pavel Blinov, et al.

次に出現するトークンの順序予測が言語モデルの性能向上に寄与する

モデル学習

Zayd M. K. Zuhri, Erland Hilman Fuadi, Alham Fikri Aji

MIDAS：リアルタイム自己回帰型動画生成を活用したマルチモーダルインタラクティブなデジタル人間合成

テキストから動画

Ming Chen, Liyuan Cui, Wenyuan Zhang, et al.

離散拡散VLA：視覚言語行動方策における行動復元に離散拡散を導入する

拡散モデル

Zhixuan Liang, Yizhuo Li, Tianshuo Yang, et al.

推論分解を用いた自己報酬付き視覚言語モデル

視覚質問応答

Zongxia Li, Wenhao Yu, Chengsong Huang, et al.

転写を越えて：音声認識におけるメカニズム解釈可能性

ディープラーニング

Neta Glazer, Yael Segal-Feldman, Hilit Segev, et al.

CODA：分離型強化学習を用いた二大脳コンピュータ利用エージェントにおける大脳と小脳の連携

エージェント

Zeyi Sun, Yuhang Cao, Jianze Liang, et al.

WebSight：ロバストなWebエージェント向けのビジョンファーストアーキテクチャ

エージェント

Tanvir Bhathal, Asanshay Gupta

UltraMemV2：1200億パラメータにスケーリングするメモリネットワークと優れた長文脈学習

Zihao Huang, Yu Bao, Qiyang Min, et al.

ヘルメス4 技術報告

Ryan Teknium, Roger Jin, Jai Suphavadeeprasit, et al.

反応的から認知的へ：エージェントにインスパイアされた空間知能

反応的から認知的へ：エージェントにインスパイアされた空間知能

エムボディドインテリジェンス

Shouwei Ruan, Liyuan Wang, Caixin Kang, et al.

ラベルを残さない：すべての教師信号設定に対応する統一された表面欠陥検出モデル

ラベルを残さない：すべての教師信号設定に対応する統一された表面欠陥検出モデル

コンピュータビジョン

オブジェクト検出

Blaž Rolih, Matic Fučka, Danijel Skočaj

T2R-bench：現実の産業用テーブルから記事レベルのレポートを生成するためのベンチマーク

ベンチマーク

Jie Zhang, Changzai Pan, Kaiwen Wei, et al.

PVPO：エージェント型推論のための事前推定価値に基づく方策最適化

モデル学習

Wenfeng Feng, Penghong Zhao, Guochao Jiang, et al.

人間からのフィードバックを用いた強化学習による、有用かつ無害なアシスタントの訓練

Preference Modeling

Yuntao Bai, Andy Jones, Kamal Ndousse, et al.

UQ：未解決の問いに対する言語モデルの評価

データセット

Fan Nie, Ken Ziyu Liu, Zihao Wang, et al.

CARJAN：AJANを用いたエージェントベースの交通シナリオ生成とシミュレーション

エージェント

Leonard Frank Neis, Andre Antakli, Matthias Klusch

TiKMiX：言語モデル事前学習における動的混合にデータインフルエンスを組み込む

モデル学習

Yifan Wang, Binbin Liu, Fengze Liu, et al.

TalkVid：音声駆動型トークヘッド合成のための大規模多様データセット

データセット

Shunian Chen, Hejin Huang, Yexin Liu, et al.

Droplet3D：動画から得られる常識的事前知識が3D生成を促進する

ビデオ理解

Xiaochuan Li, Guoguang Du, Runze Zhang, et al.

A.S.E：AI生成コードにおけるセキュリティ評価を目的としたリポジトリレベルのベンチマーク

コード生成

ベンチマーク

Keke Lian, Bin Wang, Lei Zhang, et al.

EmbodiedOneVision：汎用ロボット制御のためのインタリーブド視覚－テキスト－アクション事前学習

エージェント

エムボディドインテリジェンス

Delin Qu, Haoming Song, Qizhi Chen, et al.

R-4B：バイモードアニーリングと強化学習を用いたMLLMsにおける汎用自己思考能力のインセンティブ化

マルチモーダル

Jie Jiang, Qi Yang, Bolin Ni, et al.

小さな言語モデルにおける創造的ライティングの喚起：LLM-as-a-Judge とマルチエージェントによる報酬の精緻化

監視付き微調整

Preference Modeling

Xiaolong Wei, Bo Lu, Xingyu Zhang, et al.

TMUAD：テキストメモリバンクを用いた統合異常検出モデルにおける論理機能の強化

コンピュータビジョン

Jiawei Liu, Jiahe Hou, Wei Wang, et al.

思考過程のダイナミクスの分析：能動的誘導か、不誠実な後向きの合理化か？

監視付き微調整

Samuel Lewis-Lim, Xingwei Tan, Zhixue Zhao, et al.

AWorld：エージェント型AIのトレーニングレシピの調整

エージェント

ベンチマーク

Chengyue Yu, Siyuan Lu, Chenyi Zhuang, et al.

MCP-Bench：MCPサーバーを活用した複雑な現実世界タスクにおけるツール利用型LLMエージェントのベンチマーク手法

ベンチマーク

エージェント

Zhenting Wang, Qi Chang, Hemani Patel, et al.

rStar2エージェント：エージェンティックリーズニング技術報告書

エージェント

Ning Shang, Yifei Liu, Yi Zhu, et al.

Pref-GRPO：安定したテキストto画像強化学習のためのペアワイズ・プレファレンス報酬ベースのGRPO

テキストから画像生成

Preference Modeling

Yibin Wang, Zhimin Li, Yuhang Zang, et al.

MobileCLIP2：マルチモーダル強化学習の向上

マルチモーダル

Fartash Faghri, Pavan Kumar Anasosalu Vasu, Cem Koc, et al.

AI-AI美的協働：明示的な象徴意識と顕在する文法形成

自然言語処理

Nicanor I. Moldovan

視線を心へ：rPPGおよび健康バイオマーカー推定のためのマルチビュー動画データセット

コンピュータビジョン

ビデオ理解

Konstantin Egorov, Stepan Botman, Pavel Blinov, et al.

次に出現するトークンの順序予測が言語モデルの性能向上に寄与する

モデル学習

Zayd M. K. Zuhri, Erland Hilman Fuadi, Alham Fikri Aji

MIDAS：リアルタイム自己回帰型動画生成を活用したマルチモーダルインタラクティブなデジタル人間合成

テキストから動画

Ming Chen, Liyuan Cui, Wenyuan Zhang, et al.

離散拡散VLA：視覚言語行動方策における行動復元に離散拡散を導入する

拡散モデル

Zhixuan Liang, Yizhuo Li, Tianshuo Yang, et al.

推論分解を用いた自己報酬付き視覚言語モデル

視覚質問応答

Zongxia Li, Wenhao Yu, Chengsong Huang, et al.

転写を越えて：音声認識におけるメカニズム解釈可能性

ディープラーニング

Neta Glazer, Yael Segal-Feldman, Hilit Segev, et al.

CODA：分離型強化学習を用いた二大脳コンピュータ利用エージェントにおける大脳と小脳の連携

エージェント

Zeyi Sun, Yuhang Cao, Jianze Liang, et al.

WebSight：ロバストなWebエージェント向けのビジョンファーストアーキテクチャ

エージェント

Tanvir Bhathal, Asanshay Gupta

UltraMemV2：1200億パラメータにスケーリングするメモリネットワークと優れた長文脈学習

Zihao Huang, Yu Bao, Qiyang Min, et al.

ヘルメス4 技術報告

Ryan Teknium, Roger Jin, Jai Suphavadeeprasit, et al.

T2R-bench：現実の産業用テーブルから記事レベルのレポートを生成するためのベンチマーク

PVPO：エージェント型推論のための事前推定価値に基づく方策最適化

人間からのフィードバックを用いた強化学習による、有用かつ無害なアシスタントの訓練

UQ：未解決の問いに対する言語モデルの評価

CARJAN：AJANを用いたエージェントベースの交通シナリオ生成とシミュレーション

TiKMiX：言語モデル事前学習における動的混合にデータインフルエンスを組み込む

TalkVid：音声駆動型トークヘッド合成のための大規模多様データセット

Droplet3D：動画から得られる常識的事前知識が3D生成を促進する

A.S.E：AI生成コードにおけるセキュリティ評価を目的としたリポジトリレベルのベンチマーク

EmbodiedOneVision：汎用ロボット制御のためのインタリーブド視覚－テキスト－アクション事前学習

R-4B：バイモードアニーリングと強化学習を用いたMLLMsにおける汎用自己思考能力のインセンティブ化

小さな言語モデルにおける創造的ライティングの喚起：LLM-as-a-Judge とマルチエージェントによる報酬の精緻化

TMUAD：テキストメモリバンクを用いた統合異常検出モデルにおける論理機能の強化

思考過程のダイナミクスの分析：能動的誘導か、不誠実な後向きの合理化か？

AWorld：エージェント型AIのトレーニングレシピの調整

MCP-Bench：MCPサーバーを活用した複雑な現実世界タスクにおけるツール利用型LLMエージェントのベンチマーク手法

rStar2エージェント：エージェンティックリーズニング技術報告書

Pref-GRPO：安定したテキストto画像強化学習のためのペアワイズ・プレファレンス報酬ベースのGRPO

MobileCLIP2：マルチモーダル強化学習の向上

AI-AI美的協働：明示的な象徴意識と顕在する文法形成

視線を心へ：rPPGおよび健康バイオマーカー推定のためのマルチビュー動画データセット

次に出現するトークンの順序予測が言語モデルの性能向上に寄与する

MIDAS：リアルタイム自己回帰型動画生成を活用したマルチモーダルインタラクティブなデジタル人間合成

離散拡散VLA：視覚言語行動方策における行動復元に離散拡散を導入する

推論分解を用いた自己報酬付き視覚言語モデル

転写を越えて：音声認識におけるメカニズム解釈可能性

CODA：分離型強化学習を用いた二大脳コンピュータ利用エージェントにおける大脳と小脳の連携

WebSight：ロバストなWebエージェント向けのビジョンファーストアーキテクチャ

UltraMemV2：1200億パラメータにスケーリングするメモリネットワークと優れた長文脈学習

ヘルメス4 技術報告

T2R-bench：現実の産業用テーブルから記事レベルのレポートを生成するためのベンチマーク

PVPO：エージェント型推論のための事前推定価値に基づく方策最適化

人間からのフィードバックを用いた強化学習による、有用かつ無害なアシスタントの訓練

UQ：未解決の問いに対する言語モデルの評価

CARJAN：AJANを用いたエージェントベースの交通シナリオ生成とシミュレーション

TiKMiX：言語モデル事前学習における動的混合にデータインフルエンスを組み込む

TalkVid：音声駆動型トークヘッド合成のための大規模多様データセット

Droplet3D：動画から得られる常識的事前知識が3D生成を促進する

A.S.E：AI生成コードにおけるセキュリティ評価を目的としたリポジトリレベルのベンチマーク

EmbodiedOneVision：汎用ロボット制御のためのインタリーブド視覚－テキスト－アクション事前学習

R-4B：バイモードアニーリングと強化学習を用いたMLLMsにおける汎用自己思考能力のインセンティブ化

小さな言語モデルにおける創造的ライティングの喚起：LLM-as-a-Judge とマルチエージェントによる報酬の精緻化

TMUAD：テキストメモリバンクを用いた統合異常検出モデルにおける論理機能の強化

思考過程のダイナミクスの分析：能動的誘導か、不誠実な後向きの合理化か？

AWorld：エージェント型AIのトレーニングレシピの調整

MCP-Bench：MCPサーバーを活用した複雑な現実世界タスクにおけるツール利用型LLMエージェントのベンチマーク手法

rStar2エージェント：エージェンティックリーズニング技術報告書

Pref-GRPO：安定したテキストto画像強化学習のためのペアワイズ・プレファレンス報酬ベースのGRPO

MobileCLIP2：マルチモーダル強化学習の向上

AI-AI美的協働：明示的な象徴意識と顕在する文法形成

視線を心へ：rPPGおよび健康バイオマーカー推定のためのマルチビュー動画データセット

次に出現するトークンの順序予測が言語モデルの性能向上に寄与する

MIDAS：リアルタイム自己回帰型動画生成を活用したマルチモーダルインタラクティブなデジタル人間合成

離散拡散VLA：視覚言語行動方策における行動復元に離散拡散を導入する

推論分解を用いた自己報酬付き視覚言語モデル

転写を越えて：音声認識におけるメカニズム解釈可能性

CODA：分離型強化学習を用いた二大脳コンピュータ利用エージェントにおける大脳と小脳の連携

WebSight：ロバストなWebエージェント向けのビジョンファーストアーキテクチャ

UltraMemV2：1200億パラメータにスケーリングするメモリネットワークと優れた長文脈学習

ヘルメス4 技術報告