HyperAI

メイン

GPU

コンソール
Studio
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

人工知能の未来を築く

概要

当社についてサポートデータセットのヘルプ

製品

ニュース論文ノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

メイン

GPU

コンソール
Studio
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

人工知能の未来を築く

概要

当社についてサポートデータセットのヘルプ

製品

ニュース論文ノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)

Parrot：出力の真実性に対する説得および同意への頑健性評価——LLMsのための迎合性頑健性ベンチマーク

Parrot：出力の真実性に対する説得および同意への頑健性評価——LLMsのための迎合性頑健性ベンチマーク

ベンチマーク

Yusuf Çelebi, Mahmoud El Hussieni, Özay Ezerceli

O-Mem: 個人化された長期自律進化するAgentのための包括的メモリシステム

O-Mem: 個人化された長期自律進化するAgentのための包括的メモリシステム

エージェント

Wangchunshu Zhou

テキストの内在的次元の解明：学術要旨から創作物語まで

自然言語処理

Vladislav Pedashenko, Laida Kushnareva, Yana Khassan Nibal, et al.

SAM 3：概念を用いたSegment Anything

コンピュータビジョン

セマンティックセグメンテーション

Nicolas Carion, Laura Gustafson, Yuan-Ting Hu, et al.

GeoVista：地理的位置特定のためのWeb拡張型Agent視覚的推論

エージェント

検索拡張生成

Yikun Wang, Zuyan Liu, Ziyi Wang, et al.

OpenMMReasoner：オープンかつ汎用的なレシピによるマルチモーダル推論のフロンティアの開拓

監視付き微調整

Kaichen Zhang, Keming Wu, Zuhao Yang, et al.

HiPO：大規模言語モデルにおける動的推論向けハイブリッド方策最適化

Ken Deng, Zizheng Zhan, Wen Xiang, et al.

SERES：スパースな視点からの意味認識型ニューラル再構成

コンピュータビジョン

Bo Xu, Yuhu Guo, Yuchao Wang, et al.

SDAR：スケーラブルなシーケンス生成のための相乗効果を持つ拡散-自己回帰パラダイム

拡散モデル

モデル学習

Shuang Cheng, Yihan Bian, Dawei Liu, et al.

MultiPL-MoE：ハイブリッドMixture-of-Expertsによる大規模言語モデルの多プログラミング・多言語拡張

コード生成

Qing Wang, Xue Han, Jiahui Wang, et al.

CapRL：強化学習を用いた密集画像記述能力の促進

視覚質問応答

Long Xing, Xiaoyi Dong, Yuhang Zang, et al.

離散拡散発散指令による超高速言語生成

拡散モデル

テキスト生成

Haoyang Zheng, Xinyang Liu, Cindy Xiangrui Kong, et al.

DisCO：識別的制約最適化を用いた大規模推論モデルの強化

Gang Li, Ming Lin, Tomer Galanti, et al.

QSVD：低精度視覚言語モデルにおける統合的クエリ・キー・バリュー重み圧縮のための効率的低ランク近似

視覚質問応答

Yutong Wang, Haiyu Wang, Sai Qian Zhang

ネストド・ラーニング：ディープラーニングアーキテクチャの錯覚

ディープラーニング

自然言語処理

Ali Behrouz, Meisam Razaviyayn, Peiling Zhong, et al.

SAM 3D：画像内の何でも3D化

SAM 3D Team, Xingyu Chen, Fu-Jen Chu, et al.

Video-as-Answer：Joint-GRPOを用いた次に発生する動画イベントの予測と生成

テキストから動画

Junhao Cheng, Liang Hou, Xin Tao, et al.

最初のフレームがビデオコンテンツカスタマイズの最適な場所である

画像から動画生成

Jingxi Chen, Zongxia Li, Zhichao Liu, et al.

マルチモーダル基礎モデルによる空間知能のスケーリング

マルチモーダル

マルチモーダル表現

Zhongang Cai, Ruisi Wang, Chenyang Gu, et al.

Step-Audio-R1 技術報告

マルチモーダル

Fei Tian, Xiangyu Tony Zhang, Yuxin Zhang, et al.

V-ReasonBench：動画生成モデル向け統合推論ベンチマークセットへの道

ベンチマーク

視覚質問応答

Yang Luo, Xuanlei Zhao, Baijiong Lin, et al.

オルモ3

コード生成

Allyson Ettinger, Amanda Bertsch, Bailey Kuehl, et al.

GPT-5を用いた初期の科学加速実験

サイエンスのためのAI

Sébastien Bubeck, Christian Coester, Ronen Eldan, et al.

医療画像における人工知能のバイアスに対する客観的かつ体系的な評価に向けて

Emma A.M. Stanley, Raissa Souza, Anthony J. Winder, et al.

優れたAI研究エージェントとなるために必要なものとは何か？アイデーション多様性の役割を検討する

エージェント

ベンチマーク

Alexis Audran-Reiss, Jordi Armengol Estapé, Karen Hambardzumyan, et al.

LLMを用いた自動生成大規模データセットを活用した、指示に従う胸部X線画像における病変セグメンテーション

セマンティックセグメンテーション

マルチモーダル

Geon Choi, Hangyul Yoon, Hyunju Shin, et al.

VisPlay：画像から自己進化する視覚言語モデル

マルチモーダル

Yicheng He, Chengsong Huang, Zongxia Li, et al.

ビデオを用いた推論：迷路解法タスクを用いたビデオモデルの推論能力の初めての評価

マルチモーダル表現

Cheng Yang, Haiyuan Wan, Yiran Peng, et al.

VIDEOP2R：認知から推論への動画理解

ビデオ理解

マルチモーダル表現

Yifan Jiang, Yueying Wang, Rui Zhao, et al.

Kandinsky 5.0：画像および動画生成のためのファミリーファウンデーションモデル

テキストから画像生成

画像から動画生成

Vladimir Arkhipkin, Vladimir Korviakov, Nikolai Gerasimenko, et al.

JAM-2：高い成功率を示す薬物様抗体の完全計算設計

サイエンスのためのAI

ディープラーニング

PathMind：大規模言語モデルを用いた知識グラフ推論のためのRetrieve-Prioritize-Reasonフレームワーク

検索拡張生成

Yu Liu, Xixun Lin, Yanmin Shang, et al.

Parrot：出力の真実性に対する説得および同意への頑健性評価——LLMsのための迎合性頑健性ベンチマーク

Parrot：出力の真実性に対する説得および同意への頑健性評価——LLMsのための迎合性頑健性ベンチマーク

ベンチマーク

Yusuf Çelebi, Mahmoud El Hussieni, Özay Ezerceli

O-Mem: 個人化された長期自律進化するAgentのための包括的メモリシステム

O-Mem: 個人化された長期自律進化するAgentのための包括的メモリシステム

エージェント

Wangchunshu Zhou

テキストの内在的次元の解明：学術要旨から創作物語まで

自然言語処理

Vladislav Pedashenko, Laida Kushnareva, Yana Khassan Nibal, et al.

SAM 3：概念を用いたSegment Anything

コンピュータビジョン

セマンティックセグメンテーション

Nicolas Carion, Laura Gustafson, Yuan-Ting Hu, et al.

GeoVista：地理的位置特定のためのWeb拡張型Agent視覚的推論

エージェント

検索拡張生成

Yikun Wang, Zuyan Liu, Ziyi Wang, et al.

OpenMMReasoner：オープンかつ汎用的なレシピによるマルチモーダル推論のフロンティアの開拓

監視付き微調整

Kaichen Zhang, Keming Wu, Zuhao Yang, et al.

HiPO：大規模言語モデルにおける動的推論向けハイブリッド方策最適化

Ken Deng, Zizheng Zhan, Wen Xiang, et al.

SERES：スパースな視点からの意味認識型ニューラル再構成

コンピュータビジョン

Bo Xu, Yuhu Guo, Yuchao Wang, et al.

SDAR：スケーラブルなシーケンス生成のための相乗効果を持つ拡散-自己回帰パラダイム

拡散モデル

モデル学習

Shuang Cheng, Yihan Bian, Dawei Liu, et al.

MultiPL-MoE：ハイブリッドMixture-of-Expertsによる大規模言語モデルの多プログラミング・多言語拡張

コード生成

Qing Wang, Xue Han, Jiahui Wang, et al.

CapRL：強化学習を用いた密集画像記述能力の促進

視覚質問応答

Long Xing, Xiaoyi Dong, Yuhang Zang, et al.

離散拡散発散指令による超高速言語生成

拡散モデル

テキスト生成

Haoyang Zheng, Xinyang Liu, Cindy Xiangrui Kong, et al.

DisCO：識別的制約最適化を用いた大規模推論モデルの強化

Gang Li, Ming Lin, Tomer Galanti, et al.

QSVD：低精度視覚言語モデルにおける統合的クエリ・キー・バリュー重み圧縮のための効率的低ランク近似

視覚質問応答

Yutong Wang, Haiyu Wang, Sai Qian Zhang

ネストド・ラーニング：ディープラーニングアーキテクチャの錯覚

ディープラーニング

自然言語処理

Ali Behrouz, Meisam Razaviyayn, Peiling Zhong, et al.

SAM 3D：画像内の何でも3D化

SAM 3D Team, Xingyu Chen, Fu-Jen Chu, et al.

Video-as-Answer：Joint-GRPOを用いた次に発生する動画イベントの予測と生成

テキストから動画

Junhao Cheng, Liang Hou, Xin Tao, et al.

最初のフレームがビデオコンテンツカスタマイズの最適な場所である

画像から動画生成

Jingxi Chen, Zongxia Li, Zhichao Liu, et al.

マルチモーダル基礎モデルによる空間知能のスケーリング

マルチモーダル

マルチモーダル表現

Zhongang Cai, Ruisi Wang, Chenyang Gu, et al.

Step-Audio-R1 技術報告

マルチモーダル

Fei Tian, Xiangyu Tony Zhang, Yuxin Zhang, et al.

V-ReasonBench：動画生成モデル向け統合推論ベンチマークセットへの道

ベンチマーク

視覚質問応答

Yang Luo, Xuanlei Zhao, Baijiong Lin, et al.

オルモ3

コード生成

Allyson Ettinger, Amanda Bertsch, Bailey Kuehl, et al.

GPT-5を用いた初期の科学加速実験

サイエンスのためのAI

Sébastien Bubeck, Christian Coester, Ronen Eldan, et al.

医療画像における人工知能のバイアスに対する客観的かつ体系的な評価に向けて

Emma A.M. Stanley, Raissa Souza, Anthony J. Winder, et al.

優れたAI研究エージェントとなるために必要なものとは何か？アイデーション多様性の役割を検討する

エージェント

ベンチマーク

Alexis Audran-Reiss, Jordi Armengol Estapé, Karen Hambardzumyan, et al.

LLMを用いた自動生成大規模データセットを活用した、指示に従う胸部X線画像における病変セグメンテーション

セマンティックセグメンテーション

マルチモーダル

Geon Choi, Hangyul Yoon, Hyunju Shin, et al.

VisPlay：画像から自己進化する視覚言語モデル

マルチモーダル

Yicheng He, Chengsong Huang, Zongxia Li, et al.

ビデオを用いた推論：迷路解法タスクを用いたビデオモデルの推論能力の初めての評価

マルチモーダル表現

Cheng Yang, Haiyuan Wan, Yiran Peng, et al.

VIDEOP2R：認知から推論への動画理解

ビデオ理解

マルチモーダル表現

Yifan Jiang, Yueying Wang, Rui Zhao, et al.

Kandinsky 5.0：画像および動画生成のためのファミリーファウンデーションモデル

テキストから画像生成

画像から動画生成

Vladimir Arkhipkin, Vladimir Korviakov, Nikolai Gerasimenko, et al.

JAM-2：高い成功率を示す薬物様抗体の完全計算設計

サイエンスのためのAI

ディープラーニング

PathMind：大規模言語モデルを用いた知識グラフ推論のためのRetrieve-Prioritize-Reasonフレームワーク

検索拡張生成

Yu Liu, Xixun Lin, Yanmin Shang, et al.

テキストの内在的次元の解明：学術要旨から創作物語まで

SAM 3：概念を用いたSegment Anything

GeoVista：地理的位置特定のためのWeb拡張型Agent視覚的推論

OpenMMReasoner：オープンかつ汎用的なレシピによるマルチモーダル推論のフロンティアの開拓

HiPO：大規模言語モデルにおける動的推論向けハイブリッド方策最適化

SERES：スパースな視点からの意味認識型ニューラル再構成

SDAR：スケーラブルなシーケンス生成のための相乗効果を持つ拡散-自己回帰パラダイム

MultiPL-MoE：ハイブリッドMixture-of-Expertsによる大規模言語モデルの多プログラミング・多言語拡張

CapRL：強化学習を用いた密集画像記述能力の促進

離散拡散発散指令による超高速言語生成

DisCO：識別的制約最適化を用いた大規模推論モデルの強化

QSVD：低精度視覚言語モデルにおける統合的クエリ・キー・バリュー重み圧縮のための効率的低ランク近似

ネストド・ラーニング：ディープラーニングアーキテクチャの錯覚

SAM 3D：画像内の何でも3D化

Video-as-Answer：Joint-GRPOを用いた次に発生する動画イベントの予測と生成

最初のフレームがビデオコンテンツカスタマイズの最適な場所である

マルチモーダル基礎モデルによる空間知能のスケーリング

Step-Audio-R1 技術報告

V-ReasonBench：動画生成モデル向け統合推論ベンチマークセットへの道

オルモ3

GPT-5を用いた初期の科学加速実験

医療画像における人工知能のバイアスに対する客観的かつ体系的な評価に向けて

優れたAI研究エージェントとなるために必要なものとは何か？アイデーション多様性の役割を検討する

LLMを用いた自動生成大規模データセットを活用した、指示に従う胸部X線画像における病変セグメンテーション

VisPlay：画像から自己進化する視覚言語モデル

ビデオを用いた推論：迷路解法タスクを用いたビデオモデルの推論能力の初めての評価

VIDEOP2R：認知から推論への動画理解

Kandinsky 5.0：画像および動画生成のためのファミリーファウンデーションモデル

JAM-2：高い成功率を示す薬物様抗体の完全計算設計

PathMind：大規模言語モデルを用いた知識グラフ推論のためのRetrieve-Prioritize-Reasonフレームワーク

テキストの内在的次元の解明：学術要旨から創作物語まで

SAM 3：概念を用いたSegment Anything

GeoVista：地理的位置特定のためのWeb拡張型Agent視覚的推論

OpenMMReasoner：オープンかつ汎用的なレシピによるマルチモーダル推論のフロンティアの開拓

HiPO：大規模言語モデルにおける動的推論向けハイブリッド方策最適化

SERES：スパースな視点からの意味認識型ニューラル再構成

SDAR：スケーラブルなシーケンス生成のための相乗効果を持つ拡散-自己回帰パラダイム

MultiPL-MoE：ハイブリッドMixture-of-Expertsによる大規模言語モデルの多プログラミング・多言語拡張

CapRL：強化学習を用いた密集画像記述能力の促進

離散拡散発散指令による超高速言語生成

DisCO：識別的制約最適化を用いた大規模推論モデルの強化

QSVD：低精度視覚言語モデルにおける統合的クエリ・キー・バリュー重み圧縮のための効率的低ランク近似

ネストド・ラーニング：ディープラーニングアーキテクチャの錯覚

SAM 3D：画像内の何でも3D化

Video-as-Answer：Joint-GRPOを用いた次に発生する動画イベントの予測と生成

最初のフレームがビデオコンテンツカスタマイズの最適な場所である

マルチモーダル基礎モデルによる空間知能のスケーリング

Step-Audio-R1 技術報告

V-ReasonBench：動画生成モデル向け統合推論ベンチマークセットへの道

オルモ3

GPT-5を用いた初期の科学加速実験

医療画像における人工知能のバイアスに対する客観的かつ体系的な評価に向けて

優れたAI研究エージェントとなるために必要なものとは何か？アイデーション多様性の役割を検討する

LLMを用いた自動生成大規模データセットを活用した、指示に従う胸部X線画像における病変セグメンテーション

VisPlay：画像から自己進化する視覚言語モデル

ビデオを用いた推論：迷路解法タスクを用いたビデオモデルの推論能力の初めての評価

VIDEOP2R：認知から推論への動画理解

Kandinsky 5.0：画像および動画生成のためのファミリーファウンデーションモデル

JAM-2：高い成功率を示す薬物様抗体の完全計算設計

PathMind：大規模言語モデルを用いた知識グラフ推論のためのRetrieve-Prioritize-Reasonフレームワーク