Command Palette
Search for a command to run...
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

トレードオフを越えて:推論モデルの指示追随のための自己教師付き強化学習

Llama-3.1-FoundationAI-SecurityLLM-8B-Instruct 技術報告































トレードオフを越えて:推論モデルの指示追随のための自己教師付き強化学習

Llama-3.1-FoundationAI-SecurityLLM-8B-Instruct 技術報告






























CellForge:仮想細胞モデルのエージェント型設計
SitEmb-v1.5:意味的関連性および長編物語理解のための文脈認識型高密度検索の改善
RL-PLUS:ハイブリッド方策最適化を用いた強化学習におけるLLMの能力境界崩壊の是正
GS-Occ3D:ガウススプラッティングを用いた視覚のみによる占有再構成のスケーリング
SWE-Debate:ソフトウェア問題解決のための競争的マルチエージェントディベート
マルチモーダル参照セグメンテーション:サーベイ
3D-R1:3D VLMにおける推論能力の向上による統一的シーン理解の実現
SWE-Exp:経験に基づくソフトウェア問題解決
PixNerd:ピクセルニューラルフィールドドリフト
固定を越えて:拡散大規模言語モデル向け可変長ノイズ除去
Cognitive Kernel-Pro:深層研究エージェントおよびエージェント基盤モデル訓練のためのフレームワーク
共同制作AI:拡張的で参加型のライフサイクルへ
iLRM:反復型大規模3D再構成モデル
villa-X:視覚言語行動モデルにおける潜在行動モデリングの強化
C3:複雑な対話における課題を探究するスプーケン対話モデル向け二か国語ベンチマーク
RecGPT 技術報告
Phi-Groundテクニカルレポート:GUIグラウンディングにおける認識の進展
Seed-Prover:自動定理証明における深く広い推論
野生における合成音声検出における「少即是多」
ソリューション認識型とグローバルなReLU選択:部分MILPがDNN検証において再び力を発揮する
CoT-Self-Instruct:推論および非推論タスク向け高品質な合成プロンプトの構築
参照音声視覚セグメンテーションにおけるオムニモーダル表現と推論の実現へ
弱教師付きで、未知のドメインへの空中画像向け車両検出器の適応
VL-Cogito:高度なマルチモーダル推論のためのプログレッシブカリキュラム強化学習
Falcon-H1:効率性と性能を再定義するハイブリッドヘッド言語モデルの家族
BANG:生成的分解ダイナミクスを用いた3Dアセットの分割
ScreenCoder:モジュール型マルチモーダルエージェントを活用したフロントエンド自動化のための視覚からコード生成の進展
MIRepNet:EEGを用いた運動想起分類のためのパイプラインおよび基礎モデル
ChemDFM-R:原子化化学知識を統合した化学推論型言語モデル
X-Omni:強化学習が離散自己回帰型画像生成モデルを再び優れたものにした
CellForge:仮想細胞モデルのエージェント型設計
SitEmb-v1.5:意味的関連性および長編物語理解のための文脈認識型高密度検索の改善
RL-PLUS:ハイブリッド方策最適化を用いた強化学習におけるLLMの能力境界崩壊の是正
GS-Occ3D:ガウススプラッティングを用いた視覚のみによる占有再構成のスケーリング
SWE-Debate:ソフトウェア問題解決のための競争的マルチエージェントディベート
マルチモーダル参照セグメンテーション:サーベイ
3D-R1:3D VLMにおける推論能力の向上による統一的シーン理解の実現
SWE-Exp:経験に基づくソフトウェア問題解決
PixNerd:ピクセルニューラルフィールドドリフト
固定を越えて:拡散大規模言語モデル向け可変長ノイズ除去
Cognitive Kernel-Pro:深層研究エージェントおよびエージェント基盤モデル訓練のためのフレームワーク
共同制作AI:拡張的で参加型のライフサイクルへ
iLRM:反復型大規模3D再構成モデル
villa-X:視覚言語行動モデルにおける潜在行動モデリングの強化
C3:複雑な対話における課題を探究するスプーケン対話モデル向け二か国語ベンチマーク
RecGPT 技術報告
Phi-Groundテクニカルレポート:GUIグラウンディングにおける認識の進展
Seed-Prover:自動定理証明における深く広い推論
野生における合成音声検出における「少即是多」
ソリューション認識型とグローバルなReLU選択:部分MILPがDNN検証において再び力を発揮する
CoT-Self-Instruct:推論および非推論タスク向け高品質な合成プロンプトの構築
参照音声視覚セグメンテーションにおけるオムニモーダル表現と推論の実現へ
弱教師付きで、未知のドメインへの空中画像向け車両検出器の適応
VL-Cogito:高度なマルチモーダル推論のためのプログレッシブカリキュラム強化学習
Falcon-H1:効率性と性能を再定義するハイブリッドヘッド言語モデルの家族
BANG:生成的分解ダイナミクスを用いた3Dアセットの分割
ScreenCoder:モジュール型マルチモーダルエージェントを活用したフロントエンド自動化のための視覚からコード生成の進展
MIRepNet:EEGを用いた運動想起分類のためのパイプラインおよび基礎モデル
ChemDFM-R:原子化化学知識を統合した化学推論型言語モデル
X-Omni:強化学習が離散自己回帰型画像生成モデルを再び優れたものにした