Command Palette
Search for a command to run...
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

Wan-Move:潜在軌道ガイダンスを用いた運動制御可能な動画生成

ソフト適応型方策最適化































Wan-Move:潜在軌道ガイダンスを用いた運動制御可能な動画生成

ソフト適応型方策最適化






























スケーリングによるゼロショット参照から動画生成
Voxify3D:ピクセルアートがボクセルレンダリングと融合する
DoVer:LLMマルチエージェントシステムにおけるインターベンション駆動型自動デバッグ
時系列推論を用いた統合型ビデオ編集
Beyond Real: 長文脈 LLM における回転位置埋め込みの虚構拡張
ネイティブ並列推論者:自己蒸留強化学習を用いた並列推論
iSeal:信頼性のあるLLM所有権検証のための暗号化されたフィンガープリント技術
DAVSP:深層整合視覚安全プロンプトを用いた大規模な視覚言語モデルの安全整合
WorldGen:テキストから走行可能でインタラクティブな3D世界へ
Souper-Model:単純な算術が最先端のLLM性能を解き放つメカニズム
DTS:デコード木スケッチを活用した大規模推論モデルの性能向上
ベイズ最適化における適応型カーネル設計は、LLMのおかげでカンタンなケーキである
DePass:シンプルな分解型フォワードパスによる統一的特徴属性付与
COOPER:空間知能における協調的認識と推論のための統一モデル
模倣から識別へ:ドメイン間推論タスクを強化する汎用カリキュラム優位性メカニズムへ
PaCo-RL:ペアワイズ報酬モデリングを用いた一貫性のある画像生成のための強化学習の進展
EMMA:統一アーキテクチャを用いた効率的なマルチモーダル理解、生成、編集
EditThinker:あらゆるイメージエディタにおける反復的推論を解き放つ
TwinFlow:自己対抗的フローを用いた大規模モデルにおけるワンステップ生成の実現
CARE-PD:パーキンソン病歩行評価を目的とした多施設匿名化臨床データセット
WenetSpeech-Chuan:方言音声処理のための大規模な四川語コーパスと豊富なアノテーション
PolypSense3D:内視鏡における深度認識型ポリープサイズ測定のためのマルチソースベンチマークデータセット
PhysDrive:車内ドライバー監視を目的としたマルチモーダル遠隔生理測定データセット
人工ハーモニーマインド:言語モデルの無限に続く均質性(それ以上へ)
OmniSVG:統合型スケーラブルベクターグラフィックス生成モデル
アルゴリズム的思考理論
ロボットワールドモデル:ロボティクスにおけるロバストな方策最適化のためのニューラルネットワークシミュレータ
リワードフォースティング:リワードド分布マッチング蒸留を用いた効率的なストリーミング動画生成
意味が道を示す:非同期潜在拡散を用いた意味表現とテクスチャ表現の調和
ARM-Thinker:エージェントによるツール利用と視覚的推論を活用したマルチモーダル生成型報酬モデルの強化
スケーリングによるゼロショット参照から動画生成
Voxify3D:ピクセルアートがボクセルレンダリングと融合する
DoVer:LLMマルチエージェントシステムにおけるインターベンション駆動型自動デバッグ
時系列推論を用いた統合型ビデオ編集
Beyond Real: 長文脈 LLM における回転位置埋め込みの虚構拡張
ネイティブ並列推論者:自己蒸留強化学習を用いた並列推論
iSeal:信頼性のあるLLM所有権検証のための暗号化されたフィンガープリント技術
DAVSP:深層整合視覚安全プロンプトを用いた大規模な視覚言語モデルの安全整合
WorldGen:テキストから走行可能でインタラクティブな3D世界へ
Souper-Model:単純な算術が最先端のLLM性能を解き放つメカニズム
DTS:デコード木スケッチを活用した大規模推論モデルの性能向上
ベイズ最適化における適応型カーネル設計は、LLMのおかげでカンタンなケーキである
DePass:シンプルな分解型フォワードパスによる統一的特徴属性付与
COOPER:空間知能における協調的認識と推論のための統一モデル
模倣から識別へ:ドメイン間推論タスクを強化する汎用カリキュラム優位性メカニズムへ
PaCo-RL:ペアワイズ報酬モデリングを用いた一貫性のある画像生成のための強化学習の進展
EMMA:統一アーキテクチャを用いた効率的なマルチモーダル理解、生成、編集
EditThinker:あらゆるイメージエディタにおける反復的推論を解き放つ
TwinFlow:自己対抗的フローを用いた大規模モデルにおけるワンステップ生成の実現
CARE-PD:パーキンソン病歩行評価を目的とした多施設匿名化臨床データセット
WenetSpeech-Chuan:方言音声処理のための大規模な四川語コーパスと豊富なアノテーション
PolypSense3D:内視鏡における深度認識型ポリープサイズ測定のためのマルチソースベンチマークデータセット
PhysDrive:車内ドライバー監視を目的としたマルチモーダル遠隔生理測定データセット
人工ハーモニーマインド:言語モデルの無限に続く均質性(それ以上へ)
OmniSVG:統合型スケーラブルベクターグラフィックス生成モデル
アルゴリズム的思考理論
ロボットワールドモデル:ロボティクスにおけるロバストな方策最適化のためのニューラルネットワークシミュレータ
リワードフォースティング:リワードド分布マッチング蒸留を用いた効率的なストリーミング動画生成
意味が道を示す:非同期潜在拡散を用いた意味表現とテクスチャ表現の調和
ARM-Thinker:エージェントによるツール利用と視覚的推論を活用したマルチモーダル生成型報酬モデルの強化