HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
UI-AGILE:GUIエージェントの強化学習と正確な推論時における接地の進展
監視付き微調整
マルチモーダル
Shuquan Lian, Yuhang Wu, Jia Ma, et al.
DualSG:デュアルストリーム・エクスプレシット・セマンティック・ガイドド多変量時系列予測フレームワーク
LLM
自然言語処理
Kuiye Ding, Fanda Fan, Yao Wang, et al.
トークンが多すぎるとき:画像、動画、音声におけるマルチモーダル長文脈トークン圧縮の調査
Transformer
コンピュータビジョン
Kele Shao, Keda Tao, Kejia Zhang, et al.
SmallThinker: ローカル配備に特化してネイティブに訓練された効率的な大規模言語モデルのファミリー
LLM
Transformer
Yixin Song, Zhenliang Xue, Dongliang Wei, et al.
4D空間知能の再構築:サーベイ
コンピュータビジョン
ビデオ理解
Yukang Cao, Jiahao Lu, Zhisheng Huang, et al.
Rep-MTL:表現レベルのタスクサリエンシーの力を解放するマルチタスク学習
マルチタスク学習
ニューラルネットワーク
Zedong Wang, Siyuan Li, Dan Xu
ARC-Hunyuan-Video-7B:現実世界のショートビデオの構造化理解
ビデオ理解
Video Captioning
Yuying Ge, Yixiao Ge, Chen Li, et al.
エージェント型強化政策最適化
強化学習
エージェント
Guanting Dong, Hangyu Mao, Kai Ma, et al.
仕様の自己修正:テスト時における改善を通じた文脈内報酬の悪用の軽減
LLM
DeepSeek
Víctor Gallego
PRIX:エンドツーエンド自動運転におけるロープレキシスから学ぶ計画
自動運転
コンピュータビジョン
Maciej K. Wozniak, Lianhang Liu, Yixi Cai, et al.
AIとのチャット:リアルタイムビデオ通信が人間からAIへと驚くべき転換を遂げたこと
マルチモーダル
ビデオ理解
Jiangkai Wu, Zhiyuan Ren, Liming Liu, et al.
MMBench-GUI: GUIエージェントのための階層的マルチプラットフォーム評価フレームワーク
ベンチマーク
エージェント
Xuehui Wang, Zhenyu Wu, JingJing Xie, et al.
LLM量子化の幾何学:GPTQはババイの最近接平面アルゴリズムとして
LLM
アルゴリズム
Jiale Chen, Torsten Hoefler, Dan Alistarh
MedIQA:プロンプト駆動型医療画像品質評価のためのスケーラブルなファウンデーションモデル
医療画像
マルチモーダル
Siyi Xun, Yue Sun, Jingkun Chen, et al.
OS-MAP: コンピュータを使用するエージェントは、広さと深さにおいてどのくらい進むことができるのか?
エージェント
ベンチマーク
Xuetian Chen, Yinghao Chen, Xinfeng Yuan, et al.
階層的な予算ポリシー最適化による適応的推論
強化学習
LLM
Shangke Lyu, Linjuan Wu, Yuchen Yan, et al.
キャプテン・シネマ:ショートムービー生成に向けて
テキストから動画
Any-to-Any
Junfei Xiao, Ceyuan Yang, Lvmin Zhang, et al.
LAPO:長さ適応型ポリシー最適化による推論効率の内面化
Reasoning
LLM
Xingyu Wu, Yuchen Yan, Shangke Lyu, et al.
MUR:大規模言語モデルにおけるモーメント不確実性を用いた推論
LLM
Reasoning
Hang Yan, Fangzhi Xu, Rongman Xu, et al.
∇NABLA:近隣適応ブロックレベルアテンション
Transformer
動画生成
Dmitrii Mikhailov, Aleksey Letunovskiy, Maria Kovaleva, et al.
グループシーケンスポリシーオプティマイゼーション
強化学習
LLM
Chujie Zheng, Shixuan Liu, Mingze Li, et al.
SafeWork-R1:AI-45法下における安全と知能の共進化
Reasoning
マルチモーダル
Yicheng Bao, Guanxu Chen, Mingkang Chen, et al.
LLMsにおける知識と推論の分離:認知二重システム理論を用いた探求
LLM
Reasoning
Mutian Yang, Jiandong Gao, Ji Wu
Re:Form -- LLMsにおけるRLを用いたスケーラブルな形式的ソフトウェア検証における人間の事前知識の削減:Dafnyに関する予備的研究
監視付き微調整
LLM
Chuanhao Yan, Fengdi Che, Xuhan Huang, et al.
RAVine:エージェンティック検索におけるリアリティ対応評価
検索拡張生成
エージェント
Yilong Xu, Xiang Long, Zhi Zheng, et al.
一つのドメインが他のドメインを助けることは可能か? マルチドメイン推論におけるデータ中心の研究:強化学習を用いて
強化学習
LLM
Yu Li, Zhuoshi Pan, Honglin Lin, et al.
DesignLab:反復的な検出と修正を通じたスライドの設計
人間-コンピュータインタラクション
ドキュメント理解
Jooyeol Yun, Heng Wang, Yotaro Shimose, et al.
ユメ:インタラクティブな世界生成モデル
画像から動画生成
拡散モデル
Xiaofeng Mao, Shaoheng Lin, Zhen Li, et al.
画素、パターン、しかし詩はなし:人間のように世界を見る
マルチモーダル
ベンチマーク
Hongcheng Gao, Zihao Huang, Lin Xu, et al.
眼科用MLLMの構築:臨床的認知チェーン推論を用いた位置診断協働
視覚質問応答
医療画像
Xinyao Liu, Diping Song
HySafe-AI:AIシステムのためのハイブリッドセーフティアーキテクチャ分析フレームワーク:ケーススタディ
LLM
ケンブリッジ大学
Mandar Pitale, Jelena Frtunikj, Abhinaw Priyadershi, et al.
ゼブラ・コット:インタリーブドビジョン言語推論のためのデータセット
マルチモーダル
Reasoning
Ang Li, Charles Wang, Kaiyu Yue, et al.
1
37
38
39
40
41
42
43
48
UI-AGILE:GUIエージェントの強化学習と正確な推論時における接地の進展
監視付き微調整
マルチモーダル
Shuquan Lian, Yuhang Wu, Jia Ma, et al.
DualSG:デュアルストリーム・エクスプレシット・セマンティック・ガイドド多変量時系列予測フレームワーク
LLM
自然言語処理
Kuiye Ding, Fanda Fan, Yao Wang, et al.
トークンが多すぎるとき:画像、動画、音声におけるマルチモーダル長文脈トークン圧縮の調査
Transformer
コンピュータビジョン
Kele Shao, Keda Tao, Kejia Zhang, et al.
SmallThinker: ローカル配備に特化してネイティブに訓練された効率的な大規模言語モデルのファミリー
LLM
Transformer
Yixin Song, Zhenliang Xue, Dongliang Wei, et al.
4D空間知能の再構築:サーベイ
コンピュータビジョン
ビデオ理解
Yukang Cao, Jiahao Lu, Zhisheng Huang, et al.
Rep-MTL:表現レベルのタスクサリエンシーの力を解放するマルチタスク学習
マルチタスク学習
ニューラルネットワーク
Zedong Wang, Siyuan Li, Dan Xu
ARC-Hunyuan-Video-7B:現実世界のショートビデオの構造化理解
ビデオ理解
Video Captioning
Yuying Ge, Yixiao Ge, Chen Li, et al.
エージェント型強化政策最適化
強化学習
エージェント
Guanting Dong, Hangyu Mao, Kai Ma, et al.
仕様の自己修正:テスト時における改善を通じた文脈内報酬の悪用の軽減
LLM
DeepSeek
Víctor Gallego
PRIX:エンドツーエンド自動運転におけるロープレキシスから学ぶ計画
自動運転
コンピュータビジョン
Maciej K. Wozniak, Lianhang Liu, Yixi Cai, et al.
AIとのチャット:リアルタイムビデオ通信が人間からAIへと驚くべき転換を遂げたこと
マルチモーダル
ビデオ理解
Jiangkai Wu, Zhiyuan Ren, Liming Liu, et al.
MMBench-GUI: GUIエージェントのための階層的マルチプラットフォーム評価フレームワーク
ベンチマーク
エージェント
Xuehui Wang, Zhenyu Wu, JingJing Xie, et al.
LLM量子化の幾何学:GPTQはババイの最近接平面アルゴリズムとして
LLM
アルゴリズム
Jiale Chen, Torsten Hoefler, Dan Alistarh
MedIQA:プロンプト駆動型医療画像品質評価のためのスケーラブルなファウンデーションモデル
医療画像
マルチモーダル
Siyi Xun, Yue Sun, Jingkun Chen, et al.
OS-MAP: コンピュータを使用するエージェントは、広さと深さにおいてどのくらい進むことができるのか?
エージェント
ベンチマーク
Xuetian Chen, Yinghao Chen, Xinfeng Yuan, et al.
階層的な予算ポリシー最適化による適応的推論
強化学習
LLM
Shangke Lyu, Linjuan Wu, Yuchen Yan, et al.
キャプテン・シネマ:ショートムービー生成に向けて
テキストから動画
Any-to-Any
Junfei Xiao, Ceyuan Yang, Lvmin Zhang, et al.
LAPO:長さ適応型ポリシー最適化による推論効率の内面化
Reasoning
LLM
Xingyu Wu, Yuchen Yan, Shangke Lyu, et al.
MUR:大規模言語モデルにおけるモーメント不確実性を用いた推論
LLM
Reasoning
Hang Yan, Fangzhi Xu, Rongman Xu, et al.
∇NABLA:近隣適応ブロックレベルアテンション
Transformer
動画生成
Dmitrii Mikhailov, Aleksey Letunovskiy, Maria Kovaleva, et al.
グループシーケンスポリシーオプティマイゼーション
強化学習
LLM
Chujie Zheng, Shixuan Liu, Mingze Li, et al.
SafeWork-R1:AI-45法下における安全と知能の共進化
Reasoning
マルチモーダル
Yicheng Bao, Guanxu Chen, Mingkang Chen, et al.
LLMsにおける知識と推論の分離:認知二重システム理論を用いた探求
LLM
Reasoning
Mutian Yang, Jiandong Gao, Ji Wu
Re:Form -- LLMsにおけるRLを用いたスケーラブルな形式的ソフトウェア検証における人間の事前知識の削減:Dafnyに関する予備的研究
監視付き微調整
LLM
Chuanhao Yan, Fengdi Che, Xuhan Huang, et al.
RAVine:エージェンティック検索におけるリアリティ対応評価
検索拡張生成
エージェント
Yilong Xu, Xiang Long, Zhi Zheng, et al.
一つのドメインが他のドメインを助けることは可能か? マルチドメイン推論におけるデータ中心の研究:強化学習を用いて
強化学習
LLM
Yu Li, Zhuoshi Pan, Honglin Lin, et al.
DesignLab:反復的な検出と修正を通じたスライドの設計
人間-コンピュータインタラクション
ドキュメント理解
Jooyeol Yun, Heng Wang, Yotaro Shimose, et al.
ユメ:インタラクティブな世界生成モデル
画像から動画生成
拡散モデル
Xiaofeng Mao, Shaoheng Lin, Zhen Li, et al.
画素、パターン、しかし詩はなし:人間のように世界を見る
マルチモーダル
ベンチマーク
Hongcheng Gao, Zihao Huang, Lin Xu, et al.
眼科用MLLMの構築:臨床的認知チェーン推論を用いた位置診断協働
視覚質問応答
医療画像
Xinyao Liu, Diping Song
HySafe-AI:AIシステムのためのハイブリッドセーフティアーキテクチャ分析フレームワーク:ケーススタディ
LLM
ケンブリッジ大学
Mandar Pitale, Jelena Frtunikj, Abhinaw Priyadershi, et al.
ゼブラ・コット:インタリーブドビジョン言語推論のためのデータセット
マルチモーダル
Reasoning
Ang Li, Charles Wang, Kaiyu Yue, et al.
1
37
38
39
40
41
42
43
48