HyperAI
HyperAI超神経
ホーム
プラットフォーム
ドキュメント
ニュース
論文
Notebooks
データセット
百科事典
SOTA
LLMモデル
GPU ランキング
学会
検索
サイトについて
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
サイトを検索…
⌘
K
Command Palette
Search for a command to run...
Console
サインイン
ホーム
論文
論文
日々更新される最先端AI研究論文、人工知能の最新動向を把握
HyperAI
HyperAI超神経
ホーム
プラットフォーム
ドキュメント
ニュース
論文
Notebooks
データセット
百科事典
SOTA
LLMモデル
GPU ランキング
学会
検索
サイトについて
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
サイトを検索…
⌘
K
Command Palette
Search for a command to run...
Console
サインイン
ホーム
論文
論文
日々更新される最先端AI研究論文、人工知能の最新動向を把握
Console
Console
論文 | HyperAI超神経
R-Horizon:大規模な推論モデルの広がりと深さにおける到達可能範囲はどこまでか?
Yi Lu, Jianing Wang, Linsen Guo, et al.
AutoPR:学術昇進を自動化しましょう!
Qiguang Chen, Zheng Yan, Mingda Yang, et al.
マルチモーダル・プロンプト最適化:MLLMsにおいて複数のモダリティを活用しない理由は何か
Yumin Choi, Dongki Kim, Jinheon Baek, et al.
補正方向誘導による妄想耐性のある拡散サンプリング
Hyunmin Cho, Donghoon Ahn, Susung Hong, et al.
カメラで考える:カメラ中心の理解と生成のための統合型マルチモーダルモデル
Kang Liao, Size Wu, Zhonghua Wu, et al.
D2E:エムボディドAIへの転移を目的としたデスクトップデータ上の視覚-行動事前学習のスケーリング
Suwhan Choi, Jaeyoon Jung, Haebin Seong, et al.
Code2Video:教育用動画生成のためのコード中心型パラダイム
Yanzhe Chen, Kevin Qinghong Lin, Mike Zheng Shou
バイアス博士:AIを活用した医療支援における社会的格差
Emma Kondrup, Anne Imouza
大規模言語モデルにおける2次最適化の可能性:フル・ガウス・ニュートン法を用いた研究
Natalie Abreu, Nikhil Vyas, Sham Kakade, et al.
メタ認識が推論モデルを向上させる:自己整合強化学習
Yoonjeon Kim, Doohyuk Jang, Eunho Yang
何が起こったかからなぜ起こったかへ:根拠に基づく化学反応条件の推論のためのマルチエージェントシステム
Cheng Yang, Jiaxuan Lu, Haiyuan Wan, et al.
DreamOmni2:マルチモーダルな指示ベースの編集と生成
Bin Xia, Bohao Peng, Yuechen Zhang, et al.
VideoCanvas:文脈条件付きによる任意の時空間パッチからの統一的動画補完
Minghong Cai, Qiulin Wang, Zongli Ye, et al.
UniVideo:動画の統合的理解・生成・編集
Cong Wei, Quande Liu, Zixuan Ye, et al.
MemMamba:状態空間モデルにおけるメモリパターンの再考
Youjin Wang, Yangjingyi Chen, Jiahao Yan, et al.
PromptCoT 2.0:大規模言語モデル推論のためのプロンプト生成のスケーリング
Xueliang Zhao, Wei Wu, Jian Guan, et al.
抽出-0:ドキュメント情報抽出のための専門化された言語モデル
Henrique Godoy
オムニリターゲット:ヒューマノイド全身運動と操作およびシーンインタラクションのためのインタラクション保持型データ生成
Lujie Yang, Xiaoyu Huang, Zhen Wu, et al.
WildSpeech-Bench:野生環境におけるエンドツーエンド音声LLMのベンチマーク
Linhao Zhang, Jian Zhang, Bokai Lei, et al.
大規模言語モデルの整合性向上のためのトークン認識型内部活性の編集
Tianbo Wang, Yuqing Ma, Kewei Liao, et al.
学びを追求する:リソースが限られた視覚言語モデリングのためのトークン別ダイナミックゲーティング
Bianca-Mihaela Ganescu, Suchir Salhan, Andrew Caines, et al.
エージェントの早期経験を用いた学習
Kai Zhang, Xiangchao Chen, Bo Liu, et al.
MATRIX:インタラクション認識型動画生成のためのマスクトラックアライメント
Siyoon Jin, Seongchan Kim, Dahyun Chung, et al.
RLinf-VLA:VLA+RL学習を統合的かつ効率的に実現するフレームワーク
Hongzhi Zang, Mingjie Wei, Si Xu, et al.
SHANKS:音声言語モデルにおける同時聴取と思考
Cheng-Han Chiang, Xiaofei Wang, Linjie Li, et al.
Lumina-DiMOO:マルチモーダル生成および理解を目的としたオムニ拡散大規模言語モデル
Yi Xin, Qi Qin, Siqi Luo, et al.
キャッシュ間通信:大規模言語モデル間の直接的な意味通信
Tianyu Fu, Zihan Min, Hanling Zhang, et al.
Ming-UniVision:統一連続トークナイザーを用いた画像理解と生成の統合
Ziyuan Huang, DanDan Zheng, Cheng Zou, et al.
DeepSeek-R1:強化学習を用いた大規模言語モデルにおける推論能力の促進
DeepSeek-AI, Daya Guo, Dejian Yang, et al.
Phi-3 技術レポート:あなたのスマートフォン上でローカルに実行可能な高機能な言語モデル
Marah Abdin, Sam Ade Jacobs, Ammar Ahmad Awan, et al.
Qwen2.5 技術報告
Qwen, An Yang, Baosong Yang, et al.
ディープリサーチを組み込んだAlphaEvolveによる科学的アルゴリズムの発見
Gang Liu, Yihan Zhu, Jie Chen, et al.
1
12
13
14
15
16
17
18
39
R-Horizon:大規模な推論モデルの広がりと深さにおける到達可能範囲はどこまでか?
Yi Lu, Jianing Wang, Linsen Guo, et al.
AutoPR:学術昇進を自動化しましょう!
Qiguang Chen, Zheng Yan, Mingda Yang, et al.
マルチモーダル・プロンプト最適化:MLLMsにおいて複数のモダリティを活用しない理由は何か
Yumin Choi, Dongki Kim, Jinheon Baek, et al.
補正方向誘導による妄想耐性のある拡散サンプリング
Hyunmin Cho, Donghoon Ahn, Susung Hong, et al.
カメラで考える:カメラ中心の理解と生成のための統合型マルチモーダルモデル
Kang Liao, Size Wu, Zhonghua Wu, et al.
D2E:エムボディドAIへの転移を目的としたデスクトップデータ上の視覚-行動事前学習のスケーリング
Suwhan Choi, Jaeyoon Jung, Haebin Seong, et al.
Code2Video:教育用動画生成のためのコード中心型パラダイム
Yanzhe Chen, Kevin Qinghong Lin, Mike Zheng Shou
バイアス博士:AIを活用した医療支援における社会的格差
Emma Kondrup, Anne Imouza
大規模言語モデルにおける2次最適化の可能性:フル・ガウス・ニュートン法を用いた研究
Natalie Abreu, Nikhil Vyas, Sham Kakade, et al.
メタ認識が推論モデルを向上させる:自己整合強化学習
Yoonjeon Kim, Doohyuk Jang, Eunho Yang
何が起こったかからなぜ起こったかへ:根拠に基づく化学反応条件の推論のためのマルチエージェントシステム
Cheng Yang, Jiaxuan Lu, Haiyuan Wan, et al.
DreamOmni2:マルチモーダルな指示ベースの編集と生成
Bin Xia, Bohao Peng, Yuechen Zhang, et al.
VideoCanvas:文脈条件付きによる任意の時空間パッチからの統一的動画補完
Minghong Cai, Qiulin Wang, Zongli Ye, et al.
UniVideo:動画の統合的理解・生成・編集
Cong Wei, Quande Liu, Zixuan Ye, et al.
MemMamba:状態空間モデルにおけるメモリパターンの再考
Youjin Wang, Yangjingyi Chen, Jiahao Yan, et al.
PromptCoT 2.0:大規模言語モデル推論のためのプロンプト生成のスケーリング
Xueliang Zhao, Wei Wu, Jian Guan, et al.
抽出-0:ドキュメント情報抽出のための専門化された言語モデル
Henrique Godoy
オムニリターゲット:ヒューマノイド全身運動と操作およびシーンインタラクションのためのインタラクション保持型データ生成
Lujie Yang, Xiaoyu Huang, Zhen Wu, et al.
WildSpeech-Bench:野生環境におけるエンドツーエンド音声LLMのベンチマーク
Linhao Zhang, Jian Zhang, Bokai Lei, et al.
大規模言語モデルの整合性向上のためのトークン認識型内部活性の編集
Tianbo Wang, Yuqing Ma, Kewei Liao, et al.
学びを追求する:リソースが限られた視覚言語モデリングのためのトークン別ダイナミックゲーティング
Bianca-Mihaela Ganescu, Suchir Salhan, Andrew Caines, et al.
エージェントの早期経験を用いた学習
Kai Zhang, Xiangchao Chen, Bo Liu, et al.
MATRIX:インタラクション認識型動画生成のためのマスクトラックアライメント
Siyoon Jin, Seongchan Kim, Dahyun Chung, et al.
RLinf-VLA:VLA+RL学習を統合的かつ効率的に実現するフレームワーク
Hongzhi Zang, Mingjie Wei, Si Xu, et al.
SHANKS:音声言語モデルにおける同時聴取と思考
Cheng-Han Chiang, Xiaofei Wang, Linjie Li, et al.
Lumina-DiMOO:マルチモーダル生成および理解を目的としたオムニ拡散大規模言語モデル
Yi Xin, Qi Qin, Siqi Luo, et al.
キャッシュ間通信:大規模言語モデル間の直接的な意味通信
Tianyu Fu, Zihan Min, Hanling Zhang, et al.
Ming-UniVision:統一連続トークナイザーを用いた画像理解と生成の統合
Ziyuan Huang, DanDan Zheng, Cheng Zou, et al.
DeepSeek-R1:強化学習を用いた大規模言語モデルにおける推論能力の促進
DeepSeek-AI, Daya Guo, Dejian Yang, et al.
Phi-3 技術レポート:あなたのスマートフォン上でローカルに実行可能な高機能な言語モデル
Marah Abdin, Sam Ade Jacobs, Ammar Ahmad Awan, et al.
Qwen2.5 技術報告
Qwen, An Yang, Baosong Yang, et al.
ディープリサーチを組み込んだAlphaEvolveによる科学的アルゴリズムの発見
Gang Liu, Yihan Zhu, Jie Chen, et al.
1
12
13
14
15
16
17
18
39