HyperAI

メイン

GPU

コンソール
Studio
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

人工知能の未来を築く

概要

当社についてサポートデータセットのヘルプ

製品

ニュース論文ノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

メイン

GPU

コンソール
Studio
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

人工知能の未来を築く

概要

当社についてサポートデータセットのヘルプ

製品

ニュース論文ノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)

Brain-IT：脳相互作用トランスフォーマーを用いたfMRIからの画像再構成

Brain-IT：脳相互作用トランスフォーマーを用いたfMRIからの画像再構成

マルチモーダル

コンピュータビジョン

Roman Beliy, Amit Zalcher, Jonathan Kogman, et al.

モダリティの衝突時：単モダリティ推論の不確実性がMLLMsにおける好ましさの動態を支配するメカニズム

モダリティの衝突時：単モダリティ推論の不確実性がMLLMsにおける好ましさの動態を支配するメカニズム

視覚質問応答

Zhuoran Zhang, Tengyue Wang, Xilin Gong, et al.

VLAを盲目にしない：OOD一般化のための視覚表現の整合

マルチモーダル

マルチモーダル表現

Nikita Kachaev, Mikhail Kolosov, Daniil Zelezetsky, et al.

視覚化が推論の第一歩であるとき：視覚的連鎖思考のためのベンチマークMIRA

マルチモーダル

Yiyang Zhou, Haoqin Tu, Zijun Wang, et al.

VCode：記号的視覚表現としてのSVGを用いたマルチモーダルコーディングベンチマーク

コード生成

マルチモーダル

Kevin Qinghong Lin, Yuhao Zheng, Hangyu Ran, et al.

AI生産性指数（APEX）

ベンチマーク

Bertie Vidgen, Abby Fennelly, Evan Pinnix, et al.

フレーム連鎖：フレーム認識型推論による多モーダルLLMにおける動画理解の進展

ビデオ理解

視覚質問応答

Sara Ghazanfari, Francesco Croce, Nicolas Flammarion, et al.

ロバストな数学的推論への道

ベンチマーク

Thang Luong, Dawsen Hwang, Hoang H. Nguyen, et al.

将来の宇宙基盤型で高スケーラビリティを備えたAIインフラシステム設計へ

高性能計算

サイエンスのためのAI

Blaise Agüera y Arcas, Travis Beals, Maria Biggs, et al.

PHUMA：物理的基盤を有する人型歩行データセット

データセット

ロボティクス

Kyungmin Lee, Sibeen Kim, Minho Park, et al.

UniREditBench：統合的推論ベース画像編集ベンチマーク

ベンチマーク

画像間変換

Feng Han, Yibin Wang, Chenglin Li, et al.

テスト時計算最適スケーリングの一般化：最適化可能なグラフとして

アルゴリズム

Fali Wang, Jihai Chen, Shuhua Yang, et al.

UniLumos：物理的に妥当なフィードバックを用いた高速かつ統一的な画像・動画の再照明

拡散モデル

Ropeway Liu, Hangjie Yuan, Bo Dong, et al.

視覚モデルがグラフ構造理解に持つ見過ごされている力

コンピュータビジョン

Xinjian Zhao, Wei Pang, Zhongkai Xue, et al.

すべての活性化を強化：1兆規模のオープン言語基盤への汎用推論モデルのスケーリング

Ling-Team, Ang Li, Ben Liu, et al.

NOBLE - 生物学的洞察を埋め込んだ潜在埋め込みを有するニューラルオペレーターによる生物学的ニューロンモデルにおける実験変動の捉え方

ディープラーニング

モデリング

Luca Ghafourpour, Valentin Duruisseaux, Bahareh Tolooshams, et al.

グリア：人間の知性を模倣した自動システム設計・最適化向けAI

Pouya Hamadanian, Pantea Karimi, Arash Nasr-Esfahany, et al.

コンテキスト工学2.0：コンテキスト工学のコンテキスト

エージェント

Qishuo Hua, Lyumanshan Ye, Dayuan Fu, et al.

空間的SSRL：自己教師付き強化学習を活用した空間理解の向上

コンピュータビジョン

Yuhong Liu, Beichen Zhang, Yuhang Zang, et al.

連続型自己回帰言語モデル

テキスト生成

Chenze Shao, Darren Li, Fandong Meng, et al.

$π_ exttt{RL}$：フローに基づく視覚言語行動モデルに対するオンラインRLファインチューニング

監視付き微調整

Kang Chen, Zhihao Liu, Tonghe Zhang, et al.

INTとFPの比較：微細な低ビット量子化フォーマットに関する包括的研究

Mengzhao Chen, Meng Wu, Hui Jin, et al.

ThinkMorph：マルチモーダル交差連鎖推論における出現的性質

マルチモーダル

Jiawei Gu, Yunzhuo Hao, Huichen Will Wang, et al.

OS-Sentinel：現実的なワークフローにおけるハイブリッド検証を活用した安全強化型モバイルGUIエージェントの実現

エージェント

Qiushi Sun, Mukai Li, Zhoumianze Liu, et al.

エージェント組織の時代：言語モデルによる組織化の学び

エージェント

Zewen Chi, Li Dong, Qingxiu Dong, et al.

SPICE：コーパス環境下における自己対戦が推論能力を向上させる

Bo Liu, Chuanyang Jin, Seungone Kim, et al.

Surfer 2：次世代のクロスプラットフォームコンピュータ利用エージェント

エージェント

人間-コンピュータインタラクション

Mathieu Andreux, Märt Bakler, Yanael Barbier, et al.

ロボット制御における拡散モデルの適用条件の探求

拡散モデル

ロボティクス

Heeseong Shin, Byeongho Heo, Dongyoon Han, et al.

エージェントはウェブを制覇できるか？ ChatGPT Atlasエージェントのウェブゲームにおけるフロンティアを探る

エージェント

Jingran Zhang, Ning Li, Justin Cui

Kimi Linear：表現力と効率性を兼ね備えたアテンションアーキテクチャ

Kimi Team, Yu Zhang, Zongyu Lin, et al.

Emu3.5：ネイティブなマルチモーダルモデルは世界の学習者である

Yufeng Cui, Honghao Chen, Haoge Deng, et al.

マニュアルデコードの終焉：本格的エンド・ツー・エンド言語モデルへ

Zhichao Wang, Dongyang Ma, Xinting Huang, et al.

Brain-IT：脳相互作用トランスフォーマーを用いたfMRIからの画像再構成

Brain-IT：脳相互作用トランスフォーマーを用いたfMRIからの画像再構成

マルチモーダル

コンピュータビジョン

Roman Beliy, Amit Zalcher, Jonathan Kogman, et al.

モダリティの衝突時：単モダリティ推論の不確実性がMLLMsにおける好ましさの動態を支配するメカニズム

モダリティの衝突時：単モダリティ推論の不確実性がMLLMsにおける好ましさの動態を支配するメカニズム

視覚質問応答

Zhuoran Zhang, Tengyue Wang, Xilin Gong, et al.

VLAを盲目にしない：OOD一般化のための視覚表現の整合

マルチモーダル

マルチモーダル表現

Nikita Kachaev, Mikhail Kolosov, Daniil Zelezetsky, et al.

視覚化が推論の第一歩であるとき：視覚的連鎖思考のためのベンチマークMIRA

マルチモーダル

Yiyang Zhou, Haoqin Tu, Zijun Wang, et al.

VCode：記号的視覚表現としてのSVGを用いたマルチモーダルコーディングベンチマーク

コード生成

マルチモーダル

Kevin Qinghong Lin, Yuhao Zheng, Hangyu Ran, et al.

AI生産性指数（APEX）

ベンチマーク

Bertie Vidgen, Abby Fennelly, Evan Pinnix, et al.

フレーム連鎖：フレーム認識型推論による多モーダルLLMにおける動画理解の進展

ビデオ理解

視覚質問応答

Sara Ghazanfari, Francesco Croce, Nicolas Flammarion, et al.

ロバストな数学的推論への道

ベンチマーク

Thang Luong, Dawsen Hwang, Hoang H. Nguyen, et al.

将来の宇宙基盤型で高スケーラビリティを備えたAIインフラシステム設計へ

高性能計算

サイエンスのためのAI

Blaise Agüera y Arcas, Travis Beals, Maria Biggs, et al.

PHUMA：物理的基盤を有する人型歩行データセット

データセット

ロボティクス

Kyungmin Lee, Sibeen Kim, Minho Park, et al.

UniREditBench：統合的推論ベース画像編集ベンチマーク

ベンチマーク

画像間変換

Feng Han, Yibin Wang, Chenglin Li, et al.

テスト時計算最適スケーリングの一般化：最適化可能なグラフとして

アルゴリズム

Fali Wang, Jihai Chen, Shuhua Yang, et al.

UniLumos：物理的に妥当なフィードバックを用いた高速かつ統一的な画像・動画の再照明

拡散モデル

Ropeway Liu, Hangjie Yuan, Bo Dong, et al.

視覚モデルがグラフ構造理解に持つ見過ごされている力

コンピュータビジョン

Xinjian Zhao, Wei Pang, Zhongkai Xue, et al.

すべての活性化を強化：1兆規模のオープン言語基盤への汎用推論モデルのスケーリング

Ling-Team, Ang Li, Ben Liu, et al.

NOBLE - 生物学的洞察を埋め込んだ潜在埋め込みを有するニューラルオペレーターによる生物学的ニューロンモデルにおける実験変動の捉え方

ディープラーニング

モデリング

Luca Ghafourpour, Valentin Duruisseaux, Bahareh Tolooshams, et al.

グリア：人間の知性を模倣した自動システム設計・最適化向けAI

Pouya Hamadanian, Pantea Karimi, Arash Nasr-Esfahany, et al.

コンテキスト工学2.0：コンテキスト工学のコンテキスト

エージェント

Qishuo Hua, Lyumanshan Ye, Dayuan Fu, et al.

空間的SSRL：自己教師付き強化学習を活用した空間理解の向上

コンピュータビジョン

Yuhong Liu, Beichen Zhang, Yuhang Zang, et al.

連続型自己回帰言語モデル

テキスト生成

Chenze Shao, Darren Li, Fandong Meng, et al.

$π_ exttt{RL}$：フローに基づく視覚言語行動モデルに対するオンラインRLファインチューニング

監視付き微調整

Kang Chen, Zhihao Liu, Tonghe Zhang, et al.

INTとFPの比較：微細な低ビット量子化フォーマットに関する包括的研究

Mengzhao Chen, Meng Wu, Hui Jin, et al.

ThinkMorph：マルチモーダル交差連鎖推論における出現的性質

マルチモーダル

Jiawei Gu, Yunzhuo Hao, Huichen Will Wang, et al.

OS-Sentinel：現実的なワークフローにおけるハイブリッド検証を活用した安全強化型モバイルGUIエージェントの実現

エージェント

Qiushi Sun, Mukai Li, Zhoumianze Liu, et al.

エージェント組織の時代：言語モデルによる組織化の学び

エージェント

Zewen Chi, Li Dong, Qingxiu Dong, et al.

SPICE：コーパス環境下における自己対戦が推論能力を向上させる

Bo Liu, Chuanyang Jin, Seungone Kim, et al.

Surfer 2：次世代のクロスプラットフォームコンピュータ利用エージェント

エージェント

人間-コンピュータインタラクション

Mathieu Andreux, Märt Bakler, Yanael Barbier, et al.

ロボット制御における拡散モデルの適用条件の探求

拡散モデル

ロボティクス

Heeseong Shin, Byeongho Heo, Dongyoon Han, et al.

エージェントはウェブを制覇できるか？ ChatGPT Atlasエージェントのウェブゲームにおけるフロンティアを探る

エージェント

Jingran Zhang, Ning Li, Justin Cui

Kimi Linear：表現力と効率性を兼ね備えたアテンションアーキテクチャ

Kimi Team, Yu Zhang, Zongyu Lin, et al.

Emu3.5：ネイティブなマルチモーダルモデルは世界の学習者である

Yufeng Cui, Honghao Chen, Haoge Deng, et al.

マニュアルデコードの終焉：本格的エンド・ツー・エンド言語モデルへ

Zhichao Wang, Dongyang Ma, Xinting Huang, et al.

VLAを盲目にしない：OOD一般化のための視覚表現の整合

視覚化が推論の第一歩であるとき：視覚的連鎖思考のためのベンチマークMIRA

VCode：記号的視覚表現としてのSVGを用いたマルチモーダルコーディングベンチマーク

AI生産性指数（APEX）

フレーム連鎖：フレーム認識型推論による多モーダルLLMにおける動画理解の進展

ロバストな数学的推論への道

将来の宇宙基盤型で高スケーラビリティを備えたAIインフラシステム設計へ

PHUMA：物理的基盤を有する人型歩行データセット

UniREditBench：統合的推論ベース画像編集ベンチマーク

テスト時計算最適スケーリングの一般化：最適化可能なグラフとして

UniLumos：物理的に妥当なフィードバックを用いた高速かつ統一的な画像・動画の再照明

視覚モデルがグラフ構造理解に持つ見過ごされている力

すべての活性化を強化：1兆規模のオープン言語基盤への汎用推論モデルのスケーリング

NOBLE - 生物学的洞察を埋め込んだ潜在埋め込みを有するニューラルオペレーターによる生物学的ニューロンモデルにおける実験変動の捉え方

グリア：人間の知性を模倣した自動システム設計・最適化向けAI

コンテキスト工学2.0：コンテキスト工学のコンテキスト

空間的SSRL：自己教師付き強化学習を活用した空間理解の向上

連続型自己回帰言語モデル

$π_ exttt{RL}$ ：フローに基づく視覚言語行動モデルに対するオンラインRLファインチューニング

INTとFPの比較：微細な低ビット量子化フォーマットに関する包括的研究

ThinkMorph：マルチモーダル交差連鎖推論における出現的性質

OS-Sentinel：現実的なワークフローにおけるハイブリッド検証を活用した安全強化型モバイルGUIエージェントの実現

エージェント組織の時代：言語モデルによる組織化の学び

SPICE：コーパス環境下における自己対戦が推論能力を向上させる

Surfer 2：次世代のクロスプラットフォームコンピュータ利用エージェント

ロボット制御における拡散モデルの適用条件の探求

エージェントはウェブを制覇できるか？ ChatGPT Atlasエージェントのウェブゲームにおけるフロンティアを探る

Kimi Linear：表現力と効率性を兼ね備えたアテンションアーキテクチャ

Emu3.5：ネイティブなマルチモーダルモデルは世界の学習者である

マニュアルデコードの終焉：本格的エンド・ツー・エンド言語モデルへ

VLAを盲目にしない：OOD一般化のための視覚表現の整合

視覚化が推論の第一歩であるとき：視覚的連鎖思考のためのベンチマークMIRA

VCode：記号的視覚表現としてのSVGを用いたマルチモーダルコーディングベンチマーク

AI生産性指数（APEX）

フレーム連鎖：フレーム認識型推論による多モーダルLLMにおける動画理解の進展

ロバストな数学的推論への道

将来の宇宙基盤型で高スケーラビリティを備えたAIインフラシステム設計へ

PHUMA：物理的基盤を有する人型歩行データセット

UniREditBench：統合的推論ベース画像編集ベンチマーク

テスト時計算最適スケーリングの一般化：最適化可能なグラフとして

UniLumos：物理的に妥当なフィードバックを用いた高速かつ統一的な画像・動画の再照明

視覚モデルがグラフ構造理解に持つ見過ごされている力

すべての活性化を強化：1兆規模のオープン言語基盤への汎用推論モデルのスケーリング

NOBLE - 生物学的洞察を埋め込んだ潜在埋め込みを有するニューラルオペレーターによる生物学的ニューロンモデルにおける実験変動の捉え方

グリア：人間の知性を模倣した自動システム設計・最適化向けAI

コンテキスト工学2.0：コンテキスト工学のコンテキスト

空間的SSRL：自己教師付き強化学習を活用した空間理解の向上

連続型自己回帰言語モデル

$π_ exttt{RL}$ ：フローに基づく視覚言語行動モデルに対するオンラインRLファインチューニング

INTとFPの比較：微細な低ビット量子化フォーマットに関する包括的研究

ThinkMorph：マルチモーダル交差連鎖推論における出現的性質

OS-Sentinel：現実的なワークフローにおけるハイブリッド検証を活用した安全強化型モバイルGUIエージェントの実現

エージェント組織の時代：言語モデルによる組織化の学び

SPICE：コーパス環境下における自己対戦が推論能力を向上させる

Surfer 2：次世代のクロスプラットフォームコンピュータ利用エージェント

ロボット制御における拡散モデルの適用条件の探求

エージェントはウェブを制覇できるか？ ChatGPT Atlasエージェントのウェブゲームにおけるフロンティアを探る

Kimi Linear：表現力と効率性を兼ね備えたアテンションアーキテクチャ

Emu3.5：ネイティブなマルチモーダルモデルは世界の学習者である

マニュアルデコードの終焉：本格的エンド・ツー・エンド言語モデルへ