HyperAI
HyperAI超神経
ホーム
プラットフォーム
ドキュメント
ニュース
論文
Notebooks
データセット
百科事典
SOTA
LLMモデル
GPU ランキング
学会
検索
サイトについて
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
サイトを検索…
⌘
K
Command Palette
Search for a command to run...
Console
サインイン
ホーム
論文
論文
日々更新される最先端AI研究論文、人工知能の最新動向を把握
HyperAI
HyperAI超神経
ホーム
プラットフォーム
ドキュメント
ニュース
論文
Notebooks
データセット
百科事典
SOTA
LLMモデル
GPU ランキング
学会
検索
サイトについて
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
サイトを検索…
⌘
K
Command Palette
Search for a command to run...
Console
サインイン
ホーム
論文
論文
日々更新される最先端AI研究論文、人工知能の最新動向を把握
Console
Console
論文 | HyperAI超神経
データなしのフローマップ蒸留
Shangyuan Tong, Nanye Ma, Saining Xie, et al.
フニエンOCR 技術報告
Tencent Hunyuan Vision Team, Jie Jiang, Linus, et al.
PhysToolBench:MLLMsにおける物理ツール理解のベンチマーク
Zixin Zhang, Kanghao Chen, Xingwang Lin, et al.
ハクスリー・ゲーデル機械:最適自己改善機械の近似による人間レベルのコーディングエージェントの開発
Wenyi Wang, Piotr Piękos, Li Nanbo, et al.
空間的超感応を用いずに空間的超感応を解く
Vishaal Udandarao, Shyamgopal Karthik, Surabhi S. Nath, et al.
Parrot:出力の真実性に対する説得および同意への頑健性評価——LLMsのための迎合性頑健性ベンチマーク
Yusuf Çelebi, Mahmoud El Hussieni, Özay Ezerceli
O-Mem:パーソナライズされた長期ホライゾンの自己進化型Agentのためのオムニメモリシステム
Piaohong Wang, Motong Tian, Jiaxian Li, et al.
テキストの内在的次元の解明:学術要旨から創作物語まで
Vladislav Pedashenko, Laida Kushnareva, Yana Khassan Nibal, et al.
SAM 3:概念を用いたSegment Anything
Nicolas Carion, Laura Gustafson, Yuan-Ting Hu, et al.
GeoVista:地理的位置特定のためのWeb拡張型Agent視覚的推論
Yikun Wang, Zuyan Liu, Ziyi Wang, et al.
OpenMMReasoner:オープンかつ汎用的なレシピによるマルチモーダル推論のフロンティアの開拓
Kaichen Zhang, Keming Wu, Zuhao Yang, et al.
HiPO:大規模言語モデルにおける動的推論向けハイブリッド方策最適化
Ken Deng, Zizheng Zhan, Wen Xiang, et al.
SERES:スパースな視点からの意味認識型ニューラル再構成
Bo Xu, Yuhu Guo, Yuchao Wang, et al.
SDAR:スケーラブルなシーケンス生成のための相乗効果を持つ拡散-自己回帰パラダイム
Shuang Cheng, Yihan Bian, Dawei Liu, et al.
MultiPL-MoE:ハイブリッドMixture-of-Expertsによる大規模言語モデルの多プログラミング・多言語拡張
Qing Wang, Xue Han, Jiahui Wang, et al.
CapRL:強化学習を用いた密集画像記述能力の促進
Long Xing, Xiaoyi Dong, Yuhang Zang, et al.
離散拡散発散指令による超高速言語生成
Haoyang Zheng, Xinyang Liu, Cindy Xiangrui Kong, et al.
DisCO:識別的制約最適化を用いた大規模推論モデルの強化
Gang Li, Ming Lin, Tomer Galanti, et al.
QSVD:低精度視覚言語モデルにおける統合的クエリ・キー・バリュー重み圧縮のための効率的低ランク近似
Yutong Wang, Haiyu Wang, Sai Qian Zhang
ネストド・ラーニング:ディープラーニングアーキテクチャの錯覚
Ali Behrouz, Meisam Razaviyayn, Peiling Zhong, et al.
SAM 3D:画像内の何でも3D化
SAM 3D Team, Xingyu Chen, Fu-Jen Chu, et al.
Video-as-Answer:Joint-GRPOを用いた次に発生する動画イベントの予測と生成
Junhao Cheng, Liang Hou, Xin Tao, et al.
最初のフレームがビデオコンテンツカスタマイズの最適な場所である
Jingxi Chen, Zongxia Li, Zhichao Liu, et al.
マルチモーダル基礎モデルによる空間知能のスケーリング
Zhongang Cai, Ruisi Wang, Chenyang Gu, et al.
Step-Audio-R1 技術報告
Fei Tian, Xiangyu Tony Zhang, Yuxin Zhang, et al.
V-ReasonBench:動画生成モデル向け統合推論ベンチマークセットへの道
Yang Luo, Xuanlei Zhao, Baijiong Lin, et al.
オルモ3
Allyson Ettinger, Amanda Bertsch, Bailey Kuehl, et al.
GPT-5を用いた初期の科学加速実験
Sébastien Bubeck, Christian Coester, Ronen Eldan, et al.
優れたAI研究エージェントとなるために必要なものとは何か?アイデーション多様性の役割を検討する
Alexis Audran-Reiss, Jordi Armengol Estapé, Karen Hambardzumyan, et al.
LLMを用いた自動生成大規模データセットを活用した、指示に従う胸部X線画像における病変セグメンテーション
Geon Choi, Hangyul Yoon, Hyunju Shin, et al.
VisPlay:画像から自己進化する視覚言語モデル
Yicheng He, Chengsong Huang, Zongxia Li, et al.
ビデオを用いた推論:迷路解法タスクを用いたビデオモデルの推論能力の初めての評価
Cheng Yang, Haiyuan Wan, Yiran Peng, et al.
1
3
4
5
6
7
8
9
39
データなしのフローマップ蒸留
Shangyuan Tong, Nanye Ma, Saining Xie, et al.
フニエンOCR 技術報告
Tencent Hunyuan Vision Team, Jie Jiang, Linus, et al.
PhysToolBench:MLLMsにおける物理ツール理解のベンチマーク
Zixin Zhang, Kanghao Chen, Xingwang Lin, et al.
ハクスリー・ゲーデル機械:最適自己改善機械の近似による人間レベルのコーディングエージェントの開発
Wenyi Wang, Piotr Piękos, Li Nanbo, et al.
空間的超感応を用いずに空間的超感応を解く
Vishaal Udandarao, Shyamgopal Karthik, Surabhi S. Nath, et al.
Parrot:出力の真実性に対する説得および同意への頑健性評価——LLMsのための迎合性頑健性ベンチマーク
Yusuf Çelebi, Mahmoud El Hussieni, Özay Ezerceli
O-Mem:パーソナライズされた長期ホライゾンの自己進化型Agentのためのオムニメモリシステム
Piaohong Wang, Motong Tian, Jiaxian Li, et al.
テキストの内在的次元の解明:学術要旨から創作物語まで
Vladislav Pedashenko, Laida Kushnareva, Yana Khassan Nibal, et al.
SAM 3:概念を用いたSegment Anything
Nicolas Carion, Laura Gustafson, Yuan-Ting Hu, et al.
GeoVista:地理的位置特定のためのWeb拡張型Agent視覚的推論
Yikun Wang, Zuyan Liu, Ziyi Wang, et al.
OpenMMReasoner:オープンかつ汎用的なレシピによるマルチモーダル推論のフロンティアの開拓
Kaichen Zhang, Keming Wu, Zuhao Yang, et al.
HiPO:大規模言語モデルにおける動的推論向けハイブリッド方策最適化
Ken Deng, Zizheng Zhan, Wen Xiang, et al.
SERES:スパースな視点からの意味認識型ニューラル再構成
Bo Xu, Yuhu Guo, Yuchao Wang, et al.
SDAR:スケーラブルなシーケンス生成のための相乗効果を持つ拡散-自己回帰パラダイム
Shuang Cheng, Yihan Bian, Dawei Liu, et al.
MultiPL-MoE:ハイブリッドMixture-of-Expertsによる大規模言語モデルの多プログラミング・多言語拡張
Qing Wang, Xue Han, Jiahui Wang, et al.
CapRL:強化学習を用いた密集画像記述能力の促進
Long Xing, Xiaoyi Dong, Yuhang Zang, et al.
離散拡散発散指令による超高速言語生成
Haoyang Zheng, Xinyang Liu, Cindy Xiangrui Kong, et al.
DisCO:識別的制約最適化を用いた大規模推論モデルの強化
Gang Li, Ming Lin, Tomer Galanti, et al.
QSVD:低精度視覚言語モデルにおける統合的クエリ・キー・バリュー重み圧縮のための効率的低ランク近似
Yutong Wang, Haiyu Wang, Sai Qian Zhang
ネストド・ラーニング:ディープラーニングアーキテクチャの錯覚
Ali Behrouz, Meisam Razaviyayn, Peiling Zhong, et al.
SAM 3D:画像内の何でも3D化
SAM 3D Team, Xingyu Chen, Fu-Jen Chu, et al.
Video-as-Answer:Joint-GRPOを用いた次に発生する動画イベントの予測と生成
Junhao Cheng, Liang Hou, Xin Tao, et al.
最初のフレームがビデオコンテンツカスタマイズの最適な場所である
Jingxi Chen, Zongxia Li, Zhichao Liu, et al.
マルチモーダル基礎モデルによる空間知能のスケーリング
Zhongang Cai, Ruisi Wang, Chenyang Gu, et al.
Step-Audio-R1 技術報告
Fei Tian, Xiangyu Tony Zhang, Yuxin Zhang, et al.
V-ReasonBench:動画生成モデル向け統合推論ベンチマークセットへの道
Yang Luo, Xuanlei Zhao, Baijiong Lin, et al.
オルモ3
Allyson Ettinger, Amanda Bertsch, Bailey Kuehl, et al.
GPT-5を用いた初期の科学加速実験
Sébastien Bubeck, Christian Coester, Ronen Eldan, et al.
優れたAI研究エージェントとなるために必要なものとは何か?アイデーション多様性の役割を検討する
Alexis Audran-Reiss, Jordi Armengol Estapé, Karen Hambardzumyan, et al.
LLMを用いた自動生成大規模データセットを活用した、指示に従う胸部X線画像における病変セグメンテーション
Geon Choi, Hangyul Yoon, Hyunju Shin, et al.
VisPlay:画像から自己進化する視覚言語モデル
Yicheng He, Chengsong Huang, Zongxia Li, et al.
ビデオを用いた推論:迷路解法タスクを用いたビデオモデルの推論能力の初めての評価
Cheng Yang, Haiyuan Wan, Yiran Peng, et al.
1
3
4
5
6
7
8
9
39