Command Palette
Search for a command to run...
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

解釈可能な物理学的推論と視覚言語モデルにおけるパフォーマンス分類

InternScenes:現実的なレイアウトを備えた大規模なシミュラブルな屋内シーンデータセット































解釈可能な物理学的推論と視覚言語モデルにおけるパフォーマンス分類

InternScenes:現実的なレイアウトを備えた大規模なシミュラブルな屋内シーンデータセット






























UI-S1:セミオンライン強化学習を活用したGUI自動化の進展
OmniWorld:4Dワールドモデリングのためのマルチドメイン・マルチモーダルデータセット
LAVa:階層別KVキャッシュ除外と動的予算割り当て
確率構造統合を用いた世界モデリング
VStyle:音声スタイル適応のためのベンチマーク(口頭指示付き)
HANRAG:ヒューリスティックかつ高精度・ノイズ耐性を備えたマルチホップ質問応答のためのリトリーブ増強生成
InfGen:スケーラビリティを考慮した解像度無差別な画像生成パラダイム
X-Part:高忠実度かつ構造整合性を有する形状分解
リターンの逓減の錯覚:大規模言語モデルにおける長期的実行の測定
IntrEx:教育的対話における関与をモデル化するためのデータセット
Youtu-GraphRAG:グラフ検索拡張型複雑推論のための垂直統合型エージェント
SceneSplat:視覚言語事前学習を活用したガウシアンスプラッティングベースのシーン理解
バーチャルエージェント経済
視覚言語モデルにおける視覚基盤の理解に向けて
Kling-Avatar:段階的長時間アバターアニメーション合成のためのマルチモーダル指示の基盤化
機械学習LM:数百万の合成テーブル予測タスク上で継続的に事前学習された言語モデルが、文脈内機械学習をスケーリングする
エコーエックス:音声対音声LLMにおける音響的・意味的ギャップ低減のためのエコー学習へ
SimpleVLA-RL:強化学習を活用したVLA学習のスケーリング
VLA-Adapter:微小スケール視覚言語行動モデルにおける効果的なパラダイム
scSiameseClu:単細胞RNAシークエンシングデータの解釈を目的としたシアメーズクラスタリングフレームワーク
ST-Raptor:LLM駆動の準構造化テーブル質問応答
OmniSpatial:視覚言語モデルにおける包括的な空間推論ベンチマークへ向けて
交渉ゲームにおける人間エージェントとAIエージェント間の経済的トレードオフの理解
ジュピター:ノートブックおよび推論時価値誘導型探索を活用したLLMデータ分析機能の向上
フニエン-MT 技術報告
P3-SAM:ネイティブ3Dパーツセグメンテーション
AgentGym-RL:マルチターン強化学習を用いた長期意思決定のためのLLMエージェントの訓練
3Dおよび4Dワールドモデリング:サーベイ
RewardDance:視覚生成におけるリワードスケーリング
共有はケアを生む:集団強化学習による効率的な言語モデル後期訓練
UI-S1:セミオンライン強化学習を活用したGUI自動化の進展
OmniWorld:4Dワールドモデリングのためのマルチドメイン・マルチモーダルデータセット
LAVa:階層別KVキャッシュ除外と動的予算割り当て
確率構造統合を用いた世界モデリング
VStyle:音声スタイル適応のためのベンチマーク(口頭指示付き)
HANRAG:ヒューリスティックかつ高精度・ノイズ耐性を備えたマルチホップ質問応答のためのリトリーブ増強生成
InfGen:スケーラビリティを考慮した解像度無差別な画像生成パラダイム
X-Part:高忠実度かつ構造整合性を有する形状分解
リターンの逓減の錯覚:大規模言語モデルにおける長期的実行の測定
IntrEx:教育的対話における関与をモデル化するためのデータセット
Youtu-GraphRAG:グラフ検索拡張型複雑推論のための垂直統合型エージェント
SceneSplat:視覚言語事前学習を活用したガウシアンスプラッティングベースのシーン理解
バーチャルエージェント経済
視覚言語モデルにおける視覚基盤の理解に向けて
Kling-Avatar:段階的長時間アバターアニメーション合成のためのマルチモーダル指示の基盤化
機械学習LM:数百万の合成テーブル予測タスク上で継続的に事前学習された言語モデルが、文脈内機械学習をスケーリングする
エコーエックス:音声対音声LLMにおける音響的・意味的ギャップ低減のためのエコー学習へ
SimpleVLA-RL:強化学習を活用したVLA学習のスケーリング
VLA-Adapter:微小スケール視覚言語行動モデルにおける効果的なパラダイム
scSiameseClu:単細胞RNAシークエンシングデータの解釈を目的としたシアメーズクラスタリングフレームワーク
ST-Raptor:LLM駆動の準構造化テーブル質問応答
OmniSpatial:視覚言語モデルにおける包括的な空間推論ベンチマークへ向けて
交渉ゲームにおける人間エージェントとAIエージェント間の経済的トレードオフの理解
ジュピター:ノートブックおよび推論時価値誘導型探索を活用したLLMデータ分析機能の向上
フニエン-MT 技術報告
P3-SAM:ネイティブ3Dパーツセグメンテーション
AgentGym-RL:マルチターン強化学習を用いた長期意思決定のためのLLMエージェントの訓練
3Dおよび4Dワールドモデリング:サーベイ
RewardDance:視覚生成におけるリワードスケーリング
共有はケアを生む:集団強化学習による効率的な言語モデル後期訓練