HyperAI

メイン

GPU

コンソール
Studio
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

人工知能の未来を築く

概要

当社についてサポートデータセットのヘルプ

製品

ニュース論文ノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

メイン

GPU

コンソール
Studio
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

人工知能の未来を築く

概要

当社についてサポートデータセットのヘルプ

製品

ニュース論文ノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)

iMontage：統合的で多様性に富み、非常に動的な多対多画像生成

iMontage：統合的で多様性に富み、非常に動的な多対多画像生成

Zhoujie Fu, Xianfang Zeng, Jinghong Lan, et al.

Agent0-VL：ツール統合型視覚言語推論における自己進化型エージェントの探求

Agent0-VL：ツール統合型視覚言語推論における自己進化型エージェントの探求

エージェント

Jiaqi Liu, Kaiwen Xiong, Peng Xia, et al.

MedSAM3：医療概念を用いたSegment Anythingの探求

Anglin Liu, Rundong Xue, Xu R. Cao, et al.

SteadyDancer：最初フレーム保持を伴う調和的で一貫性のある人間画像アニメーション

画像から動画生成

画像間変換

Jiaming Zhang, Shengming Cao, Rui Li, et al.

GigaEvo：LLM および進化アルゴリズムによって駆動されるオープンソース最適化フレームワーク

アルゴリズム

Valentin Khrulkov, Andrey Galichin, Denis Bashkirov, et al.

確率的経路積分を用いた忠実度を考慮した推薦説明

Preference Modeling

ベンチマーク

Oren Barkan, Yahlly Schein, Yehonatan Elisha, et al.

推薦システムにおけるインタラクションを考慮した単義的概念の抽出

ディープラーニング

ニューラルネットワーク

Dor Arviv, Yehonatan Elisha, Oren Barkan, et al.

MSRNet：偽装物体検出のためのマルチスケール再帰的ネットワーク

オブジェクト検出

セマンティックセグメンテーション

Leena Alghamdi, Muhammad Usman, Hafeez Anwar, et al.

予算考慮型のツール利用は効果的なAgentスケーリングを可能にする

エージェント

Tengxiao Liu, Zifeng Wang, Jin Miao, et al.

動画内指示：生成制御としての視覚信号

画像から動画生成

Gongfan Fang, Xinyin Ma, Xinchao Wang

DR Tulu：深層リサーチのための進化的ルーブリックを用いた強化学習

インテリジェントな質問応答

Rulin Shao, Akari Asai, Shannon Zejiang Shen, et al.

AICC：HTML解析の精緻化とモデル性能の向上 —— モデルベースのHTMLパーサーにより構築された7.3TのAI-Readyコーパス

ドキュメント理解

Ren Ma, Jiantao Qiu, Chao Xu, et al.

UltraFlux：多様なアスペクト比に対応した高品質なネイティブ4Kテキスト画像生成のためのデータ・モデル協調設計

テキストから画像生成

拡散モデル

Tian Ye, Song Fei, Lei Zhu

DeCo：エンドツーエンド画像生成のための周波数分離ピクセル拡散

拡散モデル

Zehong Ma, Longhui Wei, Shuai Wang, et al.

生成的ユーザーインターフェースの判定者としてのComputer-Use Agent

エージェント

コード生成

Kevin Qinghong Lin, Siyuan Hu, Linjie Li, et al.

AutoEnv：環境横断的なAgent学習を測定するための自動化環境

エージェント

Jiayi Zhang, Yiran Peng, Fanqi Kong, et al.

ディープ・リサーチに基づく一般的なエージェント型メモリ

エージェント

検索拡張生成

B.Y. Yan, Chaofan Li, Hongjin Qian, et al.

VIRAL：人型ロボットの運動操作におけるスケールアップ型視覚シミュレーションから現実への展開

コンピュータビジョン

Tairan He, Zi Wang, Haoru Xue, et al.

MIST：教師あり学習による相互情報量

ニューラルネットワーク

ディープラーニング

German Gritsai, Megan Richards, Maxime Méloux, et al.

マルチエージェント深層調査：M-GRPOによるマルチエージェントシステムのトレーニング

エージェント

Haoyang Hong, Jiajun Yin, Yuan Wang, et al.

データなしのフローマップ蒸留

拡散モデル

Shangyuan Tong, Nanye Ma, Saining Xie, et al.

Docling: AI駆動のドキュメント変換のための効率的なオープンソースツールキット

Nikolaos Livathinos, Christoph Auer, Maksym Lysak, et al.

フニエンOCR 技術報告

視覚質問応答

Tencent Hunyuan Vision Team, Jie Jiang, Linus, et al.

PhysToolBench：MLLMsにおける物理ツール理解のベンチマーク

視覚質問応答

ベンチマーク

Zixin Zhang, Kanghao Chen, Xingwang Lin, et al.

ハクスリー・ゲーデル機械：最適自己改善機械の近似による人間レベルのコーディングエージェントの開発

エージェント

Wenyi Wang, Piotr Piękos, Li Nanbo, et al.

空間的超感応を用いずに空間的超感応を解く

ビデオ理解

コンピュータビジョン

Vishaal Udandarao, Shyamgopal Karthik, Surabhi S. Nath, et al.

Parrot：出力の真実性に対する説得および同意への頑健性評価——LLMsのための迎合性頑健性ベンチマーク

ベンチマーク

Yusuf Çelebi, Mahmoud El Hussieni, Özay Ezerceli

O-Mem: 個人化された長期自律進化するAgentのための包括的メモリシステム

エージェント

Wangchunshu Zhou

テキストの内在的次元の解明：学術要旨から創作物語まで

自然言語処理

Vladislav Pedashenko, Laida Kushnareva, Yana Khassan Nibal, et al.

SAM 3：概念を用いたSegment Anything

コンピュータビジョン

セマンティックセグメンテーション

Nicolas Carion, Laura Gustafson, Yuan-Ting Hu, et al.

GeoVista：地理的位置特定のためのWeb拡張型Agent視覚的推論

エージェント

検索拡張生成

Yikun Wang, Zuyan Liu, Ziyi Wang, et al.

OpenMMReasoner：オープンかつ汎用的なレシピによるマルチモーダル推論のフロンティアの開拓

監視付き微調整

Kaichen Zhang, Keming Wu, Zuhao Yang, et al.

iMontage：統合的で多様性に富み、非常に動的な多対多画像生成

iMontage：統合的で多様性に富み、非常に動的な多対多画像生成

Zhoujie Fu, Xianfang Zeng, Jinghong Lan, et al.

Agent0-VL：ツール統合型視覚言語推論における自己進化型エージェントの探求

Agent0-VL：ツール統合型視覚言語推論における自己進化型エージェントの探求

エージェント

Jiaqi Liu, Kaiwen Xiong, Peng Xia, et al.

MedSAM3：医療概念を用いたSegment Anythingの探求

Anglin Liu, Rundong Xue, Xu R. Cao, et al.

SteadyDancer：最初フレーム保持を伴う調和的で一貫性のある人間画像アニメーション

画像から動画生成

画像間変換

Jiaming Zhang, Shengming Cao, Rui Li, et al.

GigaEvo：LLM および進化アルゴリズムによって駆動されるオープンソース最適化フレームワーク

アルゴリズム

Valentin Khrulkov, Andrey Galichin, Denis Bashkirov, et al.

確率的経路積分を用いた忠実度を考慮した推薦説明

Preference Modeling

ベンチマーク

Oren Barkan, Yahlly Schein, Yehonatan Elisha, et al.

推薦システムにおけるインタラクションを考慮した単義的概念の抽出

ディープラーニング

ニューラルネットワーク

Dor Arviv, Yehonatan Elisha, Oren Barkan, et al.

MSRNet：偽装物体検出のためのマルチスケール再帰的ネットワーク

オブジェクト検出

セマンティックセグメンテーション

Leena Alghamdi, Muhammad Usman, Hafeez Anwar, et al.

予算考慮型のツール利用は効果的なAgentスケーリングを可能にする

エージェント

Tengxiao Liu, Zifeng Wang, Jin Miao, et al.

動画内指示：生成制御としての視覚信号

画像から動画生成

Gongfan Fang, Xinyin Ma, Xinchao Wang

DR Tulu：深層リサーチのための進化的ルーブリックを用いた強化学習

インテリジェントな質問応答

Rulin Shao, Akari Asai, Shannon Zejiang Shen, et al.

AICC：HTML解析の精緻化とモデル性能の向上 —— モデルベースのHTMLパーサーにより構築された7.3TのAI-Readyコーパス

ドキュメント理解

Ren Ma, Jiantao Qiu, Chao Xu, et al.

UltraFlux：多様なアスペクト比に対応した高品質なネイティブ4Kテキスト画像生成のためのデータ・モデル協調設計

テキストから画像生成

拡散モデル

Tian Ye, Song Fei, Lei Zhu

DeCo：エンドツーエンド画像生成のための周波数分離ピクセル拡散

拡散モデル

Zehong Ma, Longhui Wei, Shuai Wang, et al.

生成的ユーザーインターフェースの判定者としてのComputer-Use Agent

エージェント

コード生成

Kevin Qinghong Lin, Siyuan Hu, Linjie Li, et al.

AutoEnv：環境横断的なAgent学習を測定するための自動化環境

エージェント

Jiayi Zhang, Yiran Peng, Fanqi Kong, et al.

ディープ・リサーチに基づく一般的なエージェント型メモリ

エージェント

検索拡張生成

B.Y. Yan, Chaofan Li, Hongjin Qian, et al.

VIRAL：人型ロボットの運動操作におけるスケールアップ型視覚シミュレーションから現実への展開

コンピュータビジョン

Tairan He, Zi Wang, Haoru Xue, et al.

MIST：教師あり学習による相互情報量

ニューラルネットワーク

ディープラーニング

German Gritsai, Megan Richards, Maxime Méloux, et al.

マルチエージェント深層調査：M-GRPOによるマルチエージェントシステムのトレーニング

エージェント

Haoyang Hong, Jiajun Yin, Yuan Wang, et al.

データなしのフローマップ蒸留

拡散モデル

Shangyuan Tong, Nanye Ma, Saining Xie, et al.

Docling: AI駆動のドキュメント変換のための効率的なオープンソースツールキット

Nikolaos Livathinos, Christoph Auer, Maksym Lysak, et al.

フニエンOCR 技術報告

視覚質問応答

Tencent Hunyuan Vision Team, Jie Jiang, Linus, et al.

PhysToolBench：MLLMsにおける物理ツール理解のベンチマーク

視覚質問応答

ベンチマーク

Zixin Zhang, Kanghao Chen, Xingwang Lin, et al.

ハクスリー・ゲーデル機械：最適自己改善機械の近似による人間レベルのコーディングエージェントの開発

エージェント

Wenyi Wang, Piotr Piękos, Li Nanbo, et al.

空間的超感応を用いずに空間的超感応を解く

ビデオ理解

コンピュータビジョン

Vishaal Udandarao, Shyamgopal Karthik, Surabhi S. Nath, et al.

Parrot：出力の真実性に対する説得および同意への頑健性評価——LLMsのための迎合性頑健性ベンチマーク

ベンチマーク

Yusuf Çelebi, Mahmoud El Hussieni, Özay Ezerceli

O-Mem: 個人化された長期自律進化するAgentのための包括的メモリシステム

エージェント

Wangchunshu Zhou

テキストの内在的次元の解明：学術要旨から創作物語まで

自然言語処理

Vladislav Pedashenko, Laida Kushnareva, Yana Khassan Nibal, et al.

SAM 3：概念を用いたSegment Anything

コンピュータビジョン

セマンティックセグメンテーション

Nicolas Carion, Laura Gustafson, Yuan-Ting Hu, et al.

GeoVista：地理的位置特定のためのWeb拡張型Agent視覚的推論

エージェント

検索拡張生成

Yikun Wang, Zuyan Liu, Ziyi Wang, et al.

OpenMMReasoner：オープンかつ汎用的なレシピによるマルチモーダル推論のフロンティアの開拓

監視付き微調整

Kaichen Zhang, Keming Wu, Zuhao Yang, et al.

MedSAM3：医療概念を用いたSegment Anythingの探求

SteadyDancer：最初フレーム保持を伴う調和的で一貫性のある人間画像アニメーション

GigaEvo：LLM および進化アルゴリズムによって駆動されるオープンソース最適化フレームワーク

確率的経路積分を用いた忠実度を考慮した推薦説明

推薦システムにおけるインタラクションを考慮した単義的概念の抽出

MSRNet：偽装物体検出のためのマルチスケール再帰的ネットワーク

予算考慮型のツール利用は効果的なAgentスケーリングを可能にする

動画内指示：生成制御としての視覚信号

DR Tulu：深層リサーチのための進化的ルーブリックを用いた強化学習

AICC：HTML解析の精緻化とモデル性能の向上 —— モデルベースのHTMLパーサーにより構築された7.3TのAI-Readyコーパス

UltraFlux：多様なアスペクト比に対応した高品質なネイティブ4Kテキスト画像生成のためのデータ・モデル協調設計

DeCo：エンドツーエンド画像生成のための周波数分離ピクセル拡散

生成的ユーザーインターフェースの判定者としてのComputer-Use Agent

AutoEnv：環境横断的なAgent学習を測定するための自動化環境

ディープ・リサーチに基づく一般的なエージェント型メモリ

VIRAL：人型ロボットの運動操作におけるスケールアップ型視覚シミュレーションから現実への展開

MIST：教師あり学習による相互情報量

マルチエージェント深層調査：M-GRPOによるマルチエージェントシステムのトレーニング

データなしのフローマップ蒸留

Docling: AI駆動のドキュメント変換のための効率的なオープンソースツールキット

フニエンOCR 技術報告

PhysToolBench：MLLMsにおける物理ツール理解のベンチマーク

ハクスリー・ゲーデル機械：最適自己改善機械の近似による人間レベルのコーディングエージェントの開発

空間的超感応を用いずに空間的超感応を解く

Parrot：出力の真実性に対する説得および同意への頑健性評価——LLMsのための迎合性頑健性ベンチマーク

O-Mem: 個人化された長期自律進化するAgentのための包括的メモリシステム

テキストの内在的次元の解明：学術要旨から創作物語まで

SAM 3：概念を用いたSegment Anything

GeoVista：地理的位置特定のためのWeb拡張型Agent視覚的推論

OpenMMReasoner：オープンかつ汎用的なレシピによるマルチモーダル推論のフロンティアの開拓

MedSAM3：医療概念を用いたSegment Anythingの探求

SteadyDancer：最初フレーム保持を伴う調和的で一貫性のある人間画像アニメーション

GigaEvo：LLM および進化アルゴリズムによって駆動されるオープンソース最適化フレームワーク

確率的経路積分を用いた忠実度を考慮した推薦説明

推薦システムにおけるインタラクションを考慮した単義的概念の抽出

MSRNet：偽装物体検出のためのマルチスケール再帰的ネットワーク

予算考慮型のツール利用は効果的なAgentスケーリングを可能にする

動画内指示：生成制御としての視覚信号

DR Tulu：深層リサーチのための進化的ルーブリックを用いた強化学習

AICC：HTML解析の精緻化とモデル性能の向上 —— モデルベースのHTMLパーサーにより構築された7.3TのAI-Readyコーパス

UltraFlux：多様なアスペクト比に対応した高品質なネイティブ4Kテキスト画像生成のためのデータ・モデル協調設計

DeCo：エンドツーエンド画像生成のための周波数分離ピクセル拡散

生成的ユーザーインターフェースの判定者としてのComputer-Use Agent

AutoEnv：環境横断的なAgent学習を測定するための自動化環境

ディープ・リサーチに基づく一般的なエージェント型メモリ

VIRAL：人型ロボットの運動操作におけるスケールアップ型視覚シミュレーションから現実への展開

MIST：教師あり学習による相互情報量

マルチエージェント深層調査：M-GRPOによるマルチエージェントシステムのトレーニング

データなしのフローマップ蒸留

Docling: AI駆動のドキュメント変換のための効率的なオープンソースツールキット

フニエンOCR 技術報告

PhysToolBench：MLLMsにおける物理ツール理解のベンチマーク

ハクスリー・ゲーデル機械：最適自己改善機械の近似による人間レベルのコーディングエージェントの開発

空間的超感応を用いずに空間的超感応を解く

Parrot：出力の真実性に対する説得および同意への頑健性評価——LLMsのための迎合性頑健性ベンチマーク

O-Mem: 個人化された長期自律進化するAgentのための包括的メモリシステム

テキストの内在的次元の解明：学術要旨から創作物語まで

SAM 3：概念を用いたSegment Anything

GeoVista：地理的位置特定のためのWeb拡張型Agent視覚的推論

OpenMMReasoner：オープンかつ汎用的なレシピによるマルチモーダル推論のフロンティアの開拓