HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
From One to More: Contextual Part Latents for 3D Generation を 一から多へ:3D生成のための文脈に基づいた部分潜在変数
3D生成
拡散モデル
Shaocong Dong, Lihe Ding, Xiao Chen, et al.
オープンビジョンリーズナー:言語認知行動の視覚的推論への転送
視覚質問応答
Reasoning
Yana Wei, Liang Zhao, Jianjian Sun, et al.
Lumos-1: 統一モデルの視点から自己回帰ビデオ生成について
Any-to-Any
LLM
Hangjie Yuan, Weihua Chen, Jun Cen, et al.
ニューラル駆動画像編集
マルチモーダル
画像間変換
Pengfei Zhou, Jie Xia, Xiaopeng Peng, et al.
NeuralOS: ニューラルジェネレーティブモデルを用いたオペレーティングシステムのシミュレーションへ向け偰
人間-コンピュータインタラクション
ビデオ理解
Luke Rivard, Sun Sun, Hongyu Guo, et al.
CLiFT: 圧縮された光線トークンを用いた計算効率の高い適応型ニューラルレンダリング
3D マシンビジョン
深度推定
Zhengqing Wang, Yuefan Wu, Jiacheng Chen, et al.
システム・オブ・システムズのモデリングと最適化:複合モビリティの統合フレームワーク
モデリング
合成
Paul Saves, Jasper Bussemaker, R\u00e9mi Lafage, et al.
全原子拡散トランスフォーマー:分子と材料の統一生成モデリング
拡散モデル
Transformer
Chaitanya K. Joshi, Xiang Fu, Yi-Lun Liao, et al.
OST-Bench: オンライン空間時間シーン理解のMLLMの能力評価
視覚質問応答
エージェント
JingLi Lin, Chenming Zhu, Runsen Xu, et al.
トレーサブル証拠強化視覚基盤リーズニング:評価と方法論
視覚質問応答
Reasoning
Haochen Wang, Xiangtai Li, Zilong Huang, et al.
MIRIX: 多エージェント記憶システム LLMBasedエージェント向け
LLM
視覚質問応答
Yu Wang, Xi Chen
Skywork-R1V3 技術報告書
視覚質問応答
マルチモーダル
Wei Shen, Jiangbo Pei, Yi Peng, et al.
T-LoRA: 単一画像拡散モデルのカスタマイズにおける過学習の回避
拡散モデル
画像生成
Vera Soboleva, Aibek Alanov, Andrey Kuznetsov, et al.
長時間動画へのRLの拡張
視覚質問応答
LLM
Yukang Chen, Wei Huang, Baifeng Shi, et al.
世界モデルの批判
モデリング
Reasoning
Eric Xing, Mingkai Deng, Jinyu Hou, et al.
多様性だけで大規模なロボット操作は可能か?
Any-to-Any
マルチタスク学習
Modi Shi, Li Chen, Jin Chen, et al.
Nile-Chat: アラビア文字とラテン文字のためのエジプト語言語モデル
LLM
テキスト生成
Guokan Shang, Hadi Abdine, Ahmad Chamma, et al.
GTA1: GUI テスト時のスケーリングエージェント
エージェント
人間-コンピュータインタラクション
Yan Yang, Dongxu Li, Yutong Dai, et al.
MedGen: グラナラーに注釈付けられた医療動画のスケーリングによる医療動画生成の解錠
動画生成
テキストから動画
Rongsheng Wang, Junying Chen, Ke Ji, et al.
RLVER: 強化学習による検証可能な感情報酬を用いた共感型エージェント
ベンチマーク
エージェント
Peisong Wang, Ruotian Ma, Bang Zhang, et al.
ユーザーセンタードのジオエクスペリエンス:高度な計画、ナビゲーション、および動的な適応を実現するLLM駆動のフレームワーク
検索拡張生成
LLM
Jieren Deng, Aleksandar Cvetkovic, Pak Kiu Chung, et al.
PLAME: プリトレーニングされた言語モデルを活用して強化されたタンパク質多重配列アライメントを生成する
Transformer
自然言語処理
Hanqun Cao, Xinyi Zhou, Zijun Gao, et al.
CriticLean: Critic-Guided 強化学習による数学的形式化
ベンチマーク
監視付き微調整
Zhongyuan Peng, Yifan Yao, Kaijing Ma, et al.
StreamVLN: ストリーミング視覚言語ナビゲーションを用いたSlowFastコンテキストモデル링
LLM
マルチモーダル
Meng Wei, Chenyang Wan, Xiqian Yu, et al.
OmniPart: 部分認識を備えた意味論的分離と構造的一致性を持つ3D生成
3D生成
Any-to-Any
Yunhan Yang, Yufan Zhou, Yuan-Chen Guo, et al.
SingLoRA: 単一行列を使用した低ランク適応
LLM
Transformer
David Bensa\u00efd, Noam Rotstein, Roy Velich, et al.
潜在的な推論に関する調査
LLM
Reasoning
Rui-Jie Zhu, Tianhao Peng, Tianhao Cheng, et al.
エージェントKB:クロスドメイン経験を活用したエージェンティックな問題解決
エージェント
Reasoning
Xiangru Tang, Tianrui Qin, Tianhao Peng, et al.
ChipSeek-R1: ヒエラルキー報酬駆動強化学習を用いた人間を超えるRTLの生成
LLM
モデル学習
Zhirong Chen, Kaiyan Chang, Zhuolin Li, et al.
MedGemma 技術報告書
Any-to-Any
視覚質問応答
Andrew Sellergren, Sahar Kazemzadeh, Tiam Jaroensri, et al.
BMMR: 大規模な二言語マルチモーダル多分野推論データセット
マルチモーダル
データセット
Zhiheng Xi, Guanyu Li, Yutao Fan, et al.
事前学習されたポリシーディスクリミネーターは一般的な報酬モデルである
Preference Modeling
モデル学習
Shihan Dou, Shichun Liu, Yuming Yang, et al.
1
40
41
42
43
44
45
46
48
From One to More: Contextual Part Latents for 3D Generation を 一から多へ:3D生成のための文脈に基づいた部分潜在変数
3D生成
拡散モデル
Shaocong Dong, Lihe Ding, Xiao Chen, et al.
オープンビジョンリーズナー:言語認知行動の視覚的推論への転送
視覚質問応答
Reasoning
Yana Wei, Liang Zhao, Jianjian Sun, et al.
Lumos-1: 統一モデルの視点から自己回帰ビデオ生成について
Any-to-Any
LLM
Hangjie Yuan, Weihua Chen, Jun Cen, et al.
ニューラル駆動画像編集
マルチモーダル
画像間変換
Pengfei Zhou, Jie Xia, Xiaopeng Peng, et al.
NeuralOS: ニューラルジェネレーティブモデルを用いたオペレーティングシステムのシミュレーションへ向け偰
人間-コンピュータインタラクション
ビデオ理解
Luke Rivard, Sun Sun, Hongyu Guo, et al.
CLiFT: 圧縮された光線トークンを用いた計算効率の高い適応型ニューラルレンダリング
3D マシンビジョン
深度推定
Zhengqing Wang, Yuefan Wu, Jiacheng Chen, et al.
システム・オブ・システムズのモデリングと最適化:複合モビリティの統合フレームワーク
モデリング
合成
Paul Saves, Jasper Bussemaker, R\u00e9mi Lafage, et al.
全原子拡散トランスフォーマー:分子と材料の統一生成モデリング
拡散モデル
Transformer
Chaitanya K. Joshi, Xiang Fu, Yi-Lun Liao, et al.
OST-Bench: オンライン空間時間シーン理解のMLLMの能力評価
視覚質問応答
エージェント
JingLi Lin, Chenming Zhu, Runsen Xu, et al.
トレーサブル証拠強化視覚基盤リーズニング:評価と方法論
視覚質問応答
Reasoning
Haochen Wang, Xiangtai Li, Zilong Huang, et al.
MIRIX: 多エージェント記憶システム LLMBasedエージェント向け
LLM
視覚質問応答
Yu Wang, Xi Chen
Skywork-R1V3 技術報告書
視覚質問応答
マルチモーダル
Wei Shen, Jiangbo Pei, Yi Peng, et al.
T-LoRA: 単一画像拡散モデルのカスタマイズにおける過学習の回避
拡散モデル
画像生成
Vera Soboleva, Aibek Alanov, Andrey Kuznetsov, et al.
長時間動画へのRLの拡張
視覚質問応答
LLM
Yukang Chen, Wei Huang, Baifeng Shi, et al.
世界モデルの批判
モデリング
Reasoning
Eric Xing, Mingkai Deng, Jinyu Hou, et al.
多様性だけで大規模なロボット操作は可能か?
Any-to-Any
マルチタスク学習
Modi Shi, Li Chen, Jin Chen, et al.
Nile-Chat: アラビア文字とラテン文字のためのエジプト語言語モデル
LLM
テキスト生成
Guokan Shang, Hadi Abdine, Ahmad Chamma, et al.
GTA1: GUI テスト時のスケーリングエージェント
エージェント
人間-コンピュータインタラクション
Yan Yang, Dongxu Li, Yutong Dai, et al.
MedGen: グラナラーに注釈付けられた医療動画のスケーリングによる医療動画生成の解錠
動画生成
テキストから動画
Rongsheng Wang, Junying Chen, Ke Ji, et al.
RLVER: 強化学習による検証可能な感情報酬を用いた共感型エージェント
ベンチマーク
エージェント
Peisong Wang, Ruotian Ma, Bang Zhang, et al.
ユーザーセンタードのジオエクスペリエンス:高度な計画、ナビゲーション、および動的な適応を実現するLLM駆動のフレームワーク
検索拡張生成
LLM
Jieren Deng, Aleksandar Cvetkovic, Pak Kiu Chung, et al.
PLAME: プリトレーニングされた言語モデルを活用して強化されたタンパク質多重配列アライメントを生成する
Transformer
自然言語処理
Hanqun Cao, Xinyi Zhou, Zijun Gao, et al.
CriticLean: Critic-Guided 強化学習による数学的形式化
ベンチマーク
監視付き微調整
Zhongyuan Peng, Yifan Yao, Kaijing Ma, et al.
StreamVLN: ストリーミング視覚言語ナビゲーションを用いたSlowFastコンテキストモデル링
LLM
マルチモーダル
Meng Wei, Chenyang Wan, Xiqian Yu, et al.
OmniPart: 部分認識を備えた意味論的分離と構造的一致性を持つ3D生成
3D生成
Any-to-Any
Yunhan Yang, Yufan Zhou, Yuan-Chen Guo, et al.
SingLoRA: 単一行列を使用した低ランク適応
LLM
Transformer
David Bensa\u00efd, Noam Rotstein, Roy Velich, et al.
潜在的な推論に関する調査
LLM
Reasoning
Rui-Jie Zhu, Tianhao Peng, Tianhao Cheng, et al.
エージェントKB:クロスドメイン経験を活用したエージェンティックな問題解決
エージェント
Reasoning
Xiangru Tang, Tianrui Qin, Tianhao Peng, et al.
ChipSeek-R1: ヒエラルキー報酬駆動強化学習を用いた人間を超えるRTLの生成
LLM
モデル学習
Zhirong Chen, Kaiyan Chang, Zhuolin Li, et al.
MedGemma 技術報告書
Any-to-Any
視覚質問応答
Andrew Sellergren, Sahar Kazemzadeh, Tiam Jaroensri, et al.
BMMR: 大規模な二言語マルチモーダル多分野推論データセット
マルチモーダル
データセット
Zhiheng Xi, Guanyu Li, Yutao Fan, et al.
事前学習されたポリシーディスクリミネーターは一般的な報酬モデルである
Preference Modeling
モデル学習
Shihan Dou, Shichun Liu, Yuming Yang, et al.
1
40
41
42
43
44
45
46
48