HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
SPARK:参照なし強化学習における段階的プロセス認識報酬
強化学習
監視付き微調整
Salman Rahman, Sruthi Gorantla, Arpit Gupta, et al.
OneStory: アダプティブメモリを用いた一貫性のあるマルチショット動画生成
動画生成
画像から動画生成
Zhaochong An, Menglin Jia, Haonan Qiu, et al.
ソース動画のリアリズムを保持する:映画級品質の高精細な顔交換
ビデオ処理
コンピュータビジョン
Zekai Luo, Zongze Du, Zhouhang Zhu, et al.
ビジョナリー:WebGPU対応ガウススプラッティングプラットフォーム上に構築された世界モデルキャリア
3Dモデル
3D生成
Yuning Gong, Yifei Liu, Yifan Zhan, et al.
Wan-Move:潜在軌道ガイダンスを用いた運動制御可能な動画生成
動画生成
画像から動画生成
Ruihang Chu, Yefei He, Zhekai Chen, et al.
ソフト適応型方策最適化
強化学習
LLM
Chang Gao, Chujie Zheng, Xiong-Hui Chen, et al.
スケーリングによるゼロショット参照から動画生成
動画生成
テキストから動画
Zijian Zhou, Shikun Liu, Haozhe Liu, et al.
Voxify3D:ピクセルアートがボクセルレンダリングと融合する
3D生成
画像間変換
Yi-Chuan Huang, Jiewen Chan, Hao-Jen Chien, et al.
DoVer:LLMマルチエージェントシステムにおけるインターベンション駆動型自動デバッグ
LLM
エージェント
Ming Ma, Jue Zhang, Fangkai Yang, et al.
時系列推論を用いた統合型ビデオ編集
動画生成
ビデオ処理
Xiangpeng Yang, Ji Xie, Yiyuan Yang, et al.
Beyond Real: 長文脈 LLM における回転位置埋め込みの虚構拡張
Transformer
LLM
Xiaoran Liu, Yuerong Song, Zhigeng Liu, et al.
ネイティブ並列推論者:自己蒸留強化学習を用いた並列推論
LLM
エージェント
Tong Wu, Yang Liu, Jun Bai, et al.
iSeal:信頼性のあるLLM所有権検証のための暗号化されたフィンガープリント技術
LLM
ディープラーニング
Zixun Xiong, Gaoyi Wu, Qingyang Yu, et al.
DAVSP:深層整合視覚安全プロンプトを用いた大規模な視覚言語モデルの安全整合
マルチモーダル
監視付き微調整
Yitong Zhang, Jia Li, Liyi Cai, et al.
WorldGen:テキストから走行可能でインタラクティブな3D世界へ
3D生成
拡散モデル
Dilin Wang, Hyunyoung Jung, Tom Monnier, et al.
Souper-Model:単純な算術が最先端のLLM性能を解き放つメカニズム
LLM
モデル学習
Shalini Maiti, Amar Budhiraja, Bhavul Gauri, et al.
DTS:デコード木スケッチを活用した大規模推論モデルの性能向上
Reasoning
LLM
Zicheng Xu, Guanchu Wang, Yu-Neng Chuang, et al.
ベイズ最適化における適応型カーネル設計は、LLMのおかげでカンタンなケーキである
LLM
モデリング
Richard Cornelius Suwandi, Feng Yin, Juntao Wang, et al.
DePass:シンプルな分解型フォワードパスによる統一的特徴属性付与
Transformer
自然言語処理
Xiangyu Hong, Che Jiang, Kai Tian, et al.
COOPER:空間知能における協調的認識と推論のための統一モデル
マルチモーダル
マルチタスク学習
Zefeng Zhang, Xiangzhao Hao, Hengzhu Tang, et al.
模倣から識別へ:ドメイン間推論タスクを強化する汎用カリキュラム優位性メカニズムへ
強化学習
LLM
Changpeng Yang, Jinyang Wu, Yuchen Liu, et al.
PaCo-RL:ペアワイズ報酬モデリングを用いた一貫性のある画像生成のための強化学習の進展
強化学習
テキストから画像生成
Bowen Ping, Chengyou Jia, Minnan Luo, et al.
EMMA:統一アーキテクチャを用いた効率的なマルチモーダル理解、生成、編集
Any-to-Any
マルチタスク学習
Xin He, Longhui Wei, Jianbo Ouyang, et al.
EditThinker:あらゆるイメージエディタにおける反復的推論を解き放つ
Reasoning
画像生成
Hongyu Li, Manyuan Zhang, Dian Zheng, et al.
TwinFlow:自己対抗的フローを用いた大規模モデルにおけるワンステップ生成の実現
拡散モデル
テキストから画像生成
Zhenglin Cheng, Peng Sun, Jianguo Li, et al.
CARE-PD:パーキンソン病歩行評価を目的とした多施設匿名化臨床データセット
ビデオ理解
データセット
Vida Adeli, Ivan Klabucar, Javad Rajabi, et al.
WenetSpeech-Chuan:方言音声処理のための大規模な四川語コーパスと豊富なアノテーション
音声および音声処理
データセット
Yuhang Dai, Ziyu Zhang, Shuai Wang, et al.
PolypSense3D:内視鏡における深度認識型ポリープサイズ測定のためのマルチソースベンチマークデータセット
深度推定
セマンティックセグメンテーション
Ruyu Liu, Lin Wang, Zhou Mingming, et al.
PhysDrive:車内ドライバー監視を目的としたマルチモーダル遠隔生理測定データセット
マルチモーダル
コンピュータビジョン
Jiyao Wang, Xiao Yang, Qingyong Hu, et al.
人工ハーモニーマインド:言語モデルの無限に続く均質性(それ以上へ)
LLM
データセット
Liwei Jiang, Yuanjun Chai, Margaret Li, et al.
OmniSVG:統合型スケーラブルベクターグラフィックス生成モデル
画像生成
テキストから画像生成
Yiying Yang, Wei Cheng, Sijin Chen, et al.
アルゴリズム的思考理論
Reasoning
LLM
MohammadHossein Bateni, Vincent Cohen-Addad, Yuzhou Gu, et al.
1
9
10
11
12
13
14
15
48
SPARK:参照なし強化学習における段階的プロセス認識報酬
強化学習
監視付き微調整
Salman Rahman, Sruthi Gorantla, Arpit Gupta, et al.
OneStory: アダプティブメモリを用いた一貫性のあるマルチショット動画生成
動画生成
画像から動画生成
Zhaochong An, Menglin Jia, Haonan Qiu, et al.
ソース動画のリアリズムを保持する:映画級品質の高精細な顔交換
ビデオ処理
コンピュータビジョン
Zekai Luo, Zongze Du, Zhouhang Zhu, et al.
ビジョナリー:WebGPU対応ガウススプラッティングプラットフォーム上に構築された世界モデルキャリア
3Dモデル
3D生成
Yuning Gong, Yifei Liu, Yifan Zhan, et al.
Wan-Move:潜在軌道ガイダンスを用いた運動制御可能な動画生成
動画生成
画像から動画生成
Ruihang Chu, Yefei He, Zhekai Chen, et al.
ソフト適応型方策最適化
強化学習
LLM
Chang Gao, Chujie Zheng, Xiong-Hui Chen, et al.
スケーリングによるゼロショット参照から動画生成
動画生成
テキストから動画
Zijian Zhou, Shikun Liu, Haozhe Liu, et al.
Voxify3D:ピクセルアートがボクセルレンダリングと融合する
3D生成
画像間変換
Yi-Chuan Huang, Jiewen Chan, Hao-Jen Chien, et al.
DoVer:LLMマルチエージェントシステムにおけるインターベンション駆動型自動デバッグ
LLM
エージェント
Ming Ma, Jue Zhang, Fangkai Yang, et al.
時系列推論を用いた統合型ビデオ編集
動画生成
ビデオ処理
Xiangpeng Yang, Ji Xie, Yiyuan Yang, et al.
Beyond Real: 長文脈 LLM における回転位置埋め込みの虚構拡張
Transformer
LLM
Xiaoran Liu, Yuerong Song, Zhigeng Liu, et al.
ネイティブ並列推論者:自己蒸留強化学習を用いた並列推論
LLM
エージェント
Tong Wu, Yang Liu, Jun Bai, et al.
iSeal:信頼性のあるLLM所有権検証のための暗号化されたフィンガープリント技術
LLM
ディープラーニング
Zixun Xiong, Gaoyi Wu, Qingyang Yu, et al.
DAVSP:深層整合視覚安全プロンプトを用いた大規模な視覚言語モデルの安全整合
マルチモーダル
監視付き微調整
Yitong Zhang, Jia Li, Liyi Cai, et al.
WorldGen:テキストから走行可能でインタラクティブな3D世界へ
3D生成
拡散モデル
Dilin Wang, Hyunyoung Jung, Tom Monnier, et al.
Souper-Model:単純な算術が最先端のLLM性能を解き放つメカニズム
LLM
モデル学習
Shalini Maiti, Amar Budhiraja, Bhavul Gauri, et al.
DTS:デコード木スケッチを活用した大規模推論モデルの性能向上
Reasoning
LLM
Zicheng Xu, Guanchu Wang, Yu-Neng Chuang, et al.
ベイズ最適化における適応型カーネル設計は、LLMのおかげでカンタンなケーキである
LLM
モデリング
Richard Cornelius Suwandi, Feng Yin, Juntao Wang, et al.
DePass:シンプルな分解型フォワードパスによる統一的特徴属性付与
Transformer
自然言語処理
Xiangyu Hong, Che Jiang, Kai Tian, et al.
COOPER:空間知能における協調的認識と推論のための統一モデル
マルチモーダル
マルチタスク学習
Zefeng Zhang, Xiangzhao Hao, Hengzhu Tang, et al.
模倣から識別へ:ドメイン間推論タスクを強化する汎用カリキュラム優位性メカニズムへ
強化学習
LLM
Changpeng Yang, Jinyang Wu, Yuchen Liu, et al.
PaCo-RL:ペアワイズ報酬モデリングを用いた一貫性のある画像生成のための強化学習の進展
強化学習
テキストから画像生成
Bowen Ping, Chengyou Jia, Minnan Luo, et al.
EMMA:統一アーキテクチャを用いた効率的なマルチモーダル理解、生成、編集
Any-to-Any
マルチタスク学習
Xin He, Longhui Wei, Jianbo Ouyang, et al.
EditThinker:あらゆるイメージエディタにおける反復的推論を解き放つ
Reasoning
画像生成
Hongyu Li, Manyuan Zhang, Dian Zheng, et al.
TwinFlow:自己対抗的フローを用いた大規模モデルにおけるワンステップ生成の実現
拡散モデル
テキストから画像生成
Zhenglin Cheng, Peng Sun, Jianguo Li, et al.
CARE-PD:パーキンソン病歩行評価を目的とした多施設匿名化臨床データセット
ビデオ理解
データセット
Vida Adeli, Ivan Klabucar, Javad Rajabi, et al.
WenetSpeech-Chuan:方言音声処理のための大規模な四川語コーパスと豊富なアノテーション
音声および音声処理
データセット
Yuhang Dai, Ziyu Zhang, Shuai Wang, et al.
PolypSense3D:内視鏡における深度認識型ポリープサイズ測定のためのマルチソースベンチマークデータセット
深度推定
セマンティックセグメンテーション
Ruyu Liu, Lin Wang, Zhou Mingming, et al.
PhysDrive:車内ドライバー監視を目的としたマルチモーダル遠隔生理測定データセット
マルチモーダル
コンピュータビジョン
Jiyao Wang, Xiao Yang, Qingyong Hu, et al.
人工ハーモニーマインド:言語モデルの無限に続く均質性(それ以上へ)
LLM
データセット
Liwei Jiang, Yuanjun Chai, Margaret Li, et al.
OmniSVG:統合型スケーラブルベクターグラフィックス生成モデル
画像生成
テキストから画像生成
Yiying Yang, Wei Cheng, Sijin Chen, et al.
アルゴリズム的思考理論
Reasoning
LLM
MohammadHossein Bateni, Vincent Cohen-Addad, Yuzhou Gu, et al.
1
9
10
11
12
13
14
15
48