HyperAI
HyperAI超神経
ホーム
プラットフォーム
ドキュメント
ニュース
論文
Notebooks
データセット
百科事典
SOTA
LLMモデル
GPU ランキング
学会
検索
サイトについて
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
サイトを検索…
⌘
K
Command Palette
Search for a command to run...
Console
サインイン
ホーム
論文
論文
日々更新される最先端AI研究論文、人工知能の最新動向を把握
HyperAI
HyperAI超神経
ホーム
プラットフォーム
ドキュメント
ニュース
論文
Notebooks
データセット
百科事典
SOTA
LLMモデル
GPU ランキング
学会
検索
サイトについて
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
サイトを検索…
⌘
K
Command Palette
Search for a command to run...
Console
サインイン
ホーム
論文
論文
日々更新される最先端AI研究論文、人工知能の最新動向を把握
Console
Console
論文 | HyperAI超神経
Skywork-Reward-V2: ヒューマン-AI 協調による嗜好データのキュレーションのスケーリング
Chris Yuhao Liu, Liang Zeng, Yuzhen Xiao, et al.
LangScene-X: 3D言語埋め込みシーンの一般化再構築に向けたTriMapビデオ拡散モデル
Fangfu Liu, Hao Li, Jiawei Chi, et al.
画像を用いた多モーダル推論の思考:基礎、手法、および将来のフロンティア
Zhaochen Su, Peng Xia, Hangyu Guo, et al.
WebSailor: ウェブエージェントの超人的推論をナビゲートする
Kuan Li, Zhongwang Zhang, Huifeng Yin, et al.
AIリサーチエージェントによる機械学習:MLE-benchにおける探索、探査、および一般化
Edan Toledo, Karen Hambardzumyan, Martin Josifoski, et al.
局所性を考慮した並列デコーディングによる効率的な自己回帰画像生成
Zhuoyang Zhang, Luke J. Huang, Chengyue Wu, et al.
FreeMorph: ディフュージョンモデルを用いたチューニングフリーの汎用画像モーフィング
Yukang Cao, Chenyang Si, Jinghao Wang, et al.
視覚言語行動モデルに関する調査:行動トークン化の観点から
Yifan Zhong, Fengshuo Bai, Shaofei Cai, et al.
任意の条件における任意の深さ
Boyuan Sun, Modi Jin, Bowen Yin, et al.
LongAnimation: 動的なグローバル-ローカルメモリを用いた長尺アニメーション生成
Nan Chen, Mengqi Huang, Yihao Meng, et al.
Kwai Keye-VL 技術報告書
Kwai Keye Team, Biao Yang, Bin Wen, et al.
自動運転向けのビジョン-言語-行動モデルに関する調査
Sicong Jiang, Zilin Huang, Kangan Qian, et al.
モカ: モダリティ認識の継続的前学習が双方向多様性埋め込みを改善する
Haonan Chen, Hong Liu, Yuping Luo, et al.
FreeLong++: マルチバンドスペクトルフュージョンを用いた学習不要の長尺ビデオ生成
Yu Lu, Yi Yang
トークンを超えて考える:脳からインスピレーションを得た知能から人工一般知能の認知的基礎及其の社会的影響まで
Rizwan Qureshi, Ranjan Sapkota, Abbas Shah, et al.
数学的推論が汎用LLMの能力を向上させるか? LLMの推論の転移可能性についての理解
Maggie Huan, Yuetai Li, Tuney Zheng, et al.
SciArena: 科学文献タスクのためのオープン評価プラットフォーム
Yilun Zhao, Kaiyan Zhang, Tiansheng Hu, et al.
GLM-4.1V-Thinking: スケーラブルな強化学習を用いた多様なマルチモーダル推論へのアプローチ
Wenyi Hong, Wenmeng Yu, Xiaotao Gu, et al.
医学における包括的人工知能;性能向上と説明可能性の改善
Periklis Petridis, Georgios Margaritis, Vasiliki Stoumpou, et al.
進化するコンテキスト内のプロンプト:オープンエンドで自己複製的な視点
Wang, Jianyu, Hu, et al.
SPIRAL: ゼロサムゲームにおける自己対戦が、マルチエージェント・マルチターン強化学習を介した推論を奨励する
Bo Liu, Leon Guertler, Simon Yu, et al.
VLMにおける画像選好の聴取者報酬型思考
Alexander Gambashidze, Li Pengyi, Matvey Skripkin, et al.
書道家:フリースタイルテキストイメージのカスタマイズ
Yue Ma, Qingyan Bai, Hao Ouyang, et al.
VMoBA: ブロック混合注意機構を用いたビデオ拡散モデル
Jianzong Wu, Liang Hou, Haotian Yang, et al.
Ovis-U1 技術報告書
Guo-Hua Wang, Shanshan Zhao, Xinjie Zhang, et al.
SMMILE: 多モーダル医療文脈学習の専門家主導ベンチマーク
Melanie Rieff, Maya Varma, Ossian Rabow, et al.
自動化LLMスピードランニングベンチマーク:NanoGPTの改善の再現
Bingchen Zhao, Despoina Magka, Minqi Jiang, et al.
Shape-for-Motion: 3D プロキシを用いた精密で一貫性のあるビデオ編集
Yuhao Liu, Tengfei Wang, Fang Liu, et al.
理想から現実へ:統一的でデータ効率の高い密集予測の実世界シナリオへの適用
Changliang Xia, Chengyou Jia, Zhuohang Dang, et al.
ShotBench: 視覚言語モデルにおける映画的な理解の専門家レベル
Hongbo Liu, Jingwen He, Yi Jin, et al.
XVerse: 複数主題のアイデンティティと意味属性をDiT調節を通じて一貫して制御する方法
Bowen Chen, Mengyi Zhao, Haomiao Sun, et al.
24ウェルプレートにおけるゼロショット抗体設計
Chai Discovery Team
1
32
33
34
35
36
37
38
39
Skywork-Reward-V2: ヒューマン-AI 協調による嗜好データのキュレーションのスケーリング
Chris Yuhao Liu, Liang Zeng, Yuzhen Xiao, et al.
LangScene-X: 3D言語埋め込みシーンの一般化再構築に向けたTriMapビデオ拡散モデル
Fangfu Liu, Hao Li, Jiawei Chi, et al.
画像を用いた多モーダル推論の思考:基礎、手法、および将来のフロンティア
Zhaochen Su, Peng Xia, Hangyu Guo, et al.
WebSailor: ウェブエージェントの超人的推論をナビゲートする
Kuan Li, Zhongwang Zhang, Huifeng Yin, et al.
AIリサーチエージェントによる機械学習:MLE-benchにおける探索、探査、および一般化
Edan Toledo, Karen Hambardzumyan, Martin Josifoski, et al.
局所性を考慮した並列デコーディングによる効率的な自己回帰画像生成
Zhuoyang Zhang, Luke J. Huang, Chengyue Wu, et al.
FreeMorph: ディフュージョンモデルを用いたチューニングフリーの汎用画像モーフィング
Yukang Cao, Chenyang Si, Jinghao Wang, et al.
視覚言語行動モデルに関する調査:行動トークン化の観点から
Yifan Zhong, Fengshuo Bai, Shaofei Cai, et al.
任意の条件における任意の深さ
Boyuan Sun, Modi Jin, Bowen Yin, et al.
LongAnimation: 動的なグローバル-ローカルメモリを用いた長尺アニメーション生成
Nan Chen, Mengqi Huang, Yihao Meng, et al.
Kwai Keye-VL 技術報告書
Kwai Keye Team, Biao Yang, Bin Wen, et al.
自動運転向けのビジョン-言語-行動モデルに関する調査
Sicong Jiang, Zilin Huang, Kangan Qian, et al.
モカ: モダリティ認識の継続的前学習が双方向多様性埋め込みを改善する
Haonan Chen, Hong Liu, Yuping Luo, et al.
FreeLong++: マルチバンドスペクトルフュージョンを用いた学習不要の長尺ビデオ生成
Yu Lu, Yi Yang
トークンを超えて考える:脳からインスピレーションを得た知能から人工一般知能の認知的基礎及其の社会的影響まで
Rizwan Qureshi, Ranjan Sapkota, Abbas Shah, et al.
数学的推論が汎用LLMの能力を向上させるか? LLMの推論の転移可能性についての理解
Maggie Huan, Yuetai Li, Tuney Zheng, et al.
SciArena: 科学文献タスクのためのオープン評価プラットフォーム
Yilun Zhao, Kaiyan Zhang, Tiansheng Hu, et al.
GLM-4.1V-Thinking: スケーラブルな強化学習を用いた多様なマルチモーダル推論へのアプローチ
Wenyi Hong, Wenmeng Yu, Xiaotao Gu, et al.
医学における包括的人工知能;性能向上と説明可能性の改善
Periklis Petridis, Georgios Margaritis, Vasiliki Stoumpou, et al.
進化するコンテキスト内のプロンプト:オープンエンドで自己複製的な視点
Wang, Jianyu, Hu, et al.
SPIRAL: ゼロサムゲームにおける自己対戦が、マルチエージェント・マルチターン強化学習を介した推論を奨励する
Bo Liu, Leon Guertler, Simon Yu, et al.
VLMにおける画像選好の聴取者報酬型思考
Alexander Gambashidze, Li Pengyi, Matvey Skripkin, et al.
書道家:フリースタイルテキストイメージのカスタマイズ
Yue Ma, Qingyan Bai, Hao Ouyang, et al.
VMoBA: ブロック混合注意機構を用いたビデオ拡散モデル
Jianzong Wu, Liang Hou, Haotian Yang, et al.
Ovis-U1 技術報告書
Guo-Hua Wang, Shanshan Zhao, Xinjie Zhang, et al.
SMMILE: 多モーダル医療文脈学習の専門家主導ベンチマーク
Melanie Rieff, Maya Varma, Ossian Rabow, et al.
自動化LLMスピードランニングベンチマーク:NanoGPTの改善の再現
Bingchen Zhao, Despoina Magka, Minqi Jiang, et al.
Shape-for-Motion: 3D プロキシを用いた精密で一貫性のあるビデオ編集
Yuhao Liu, Tengfei Wang, Fang Liu, et al.
理想から現実へ:統一的でデータ効率の高い密集予測の実世界シナリオへの適用
Changliang Xia, Chengyou Jia, Zhuohang Dang, et al.
ShotBench: 視覚言語モデルにおける映画的な理解の専門家レベル
Hongbo Liu, Jingwen He, Yi Jin, et al.
XVerse: 複数主題のアイデンティティと意味属性をDiT調節を通じて一貫して制御する方法
Bowen Chen, Mengyi Zhao, Haomiao Sun, et al.
24ウェルプレートにおけるゼロショット抗体設計
Chai Discovery Team
1
32
33
34
35
36
37
38
39