Command Palette
Search for a command to run...
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

s1:単純なテスト時スケーリング

Search-o1:エージェント型検索強化型大規模推論モデル































s1:単純なテスト時スケーリング

Search-o1:エージェント型検索強化型大規模推論モデル






























LLaVA-Mini:1つのビジョントークンを用いた効率的な画像および動画大規模マルチモーダルモデル
MAmmoTH-VL:スケールにおける指示チューニングを用いたマルチモーダル推論の促進
ShowUI:GUI視覚エージェント向けのワンビジョン・言語・アクションモデル
OS-ATLAS:汎用GUIエージェント向け基盤行動モデル
GPT-4o システムカード
SAM2Long:トレーニング不要メモリツリーを用いたSAM 2の長期動画セグメンテーションへの拡張
アリア:オープンなマルチモーダルネイティブ・ミクスチャーオブエキスパートモデル
Qwen2-VL:任意解像度における視覚言語モデルの世界認識能力の向上
VGGT: Visual Geometry Grounded Transformer VGGT: ビジュアル・ジオメトリ・グラウンデッド・トランスフォーマー
単一ステップ報酬を用いたマルチターンコード生成
大規模言語モデルの構成的一般化能力を命令文理解能力を考慮して再検討する
具現化ウェブエージェント:物理デジタル領域を橋渡しする統合エージェント知能
意味を理解した報酬の体系:自由形式生成におけるオープンエンドR1トレーニング向け
BUTシステムのMLC-SLMチャレンジへの適用
GenRecal: 大規模から小規模への再校正後の生成 言語-視覚モデル
ProtoReasoning: プロトタイプを基盤とするLLMにおける一般化可能な推論
世界探査向けビデオデータセット:Sekai
QFFT、Question-Free Fine-Tuning for Adaptive Reasoning
大規模言語モデル(LLM)はアルゴリズム問題のための高品質なテストケースを生成できるか? TestCase-Eval: 故障カバレッジとエクスポージャの体系的な評価
AceReason-Nemotron 1.1: 数学とコード推論の進歩を図るSFTとRLのシナジー
ストリーム・オムニ:大規模言語-視覚-音声モデルを用いた同時多モーダル相互作用
強化学習を用いた効率的な医療VIE
テスト時の計算量をスケーリングするLLMエージェント
TaskCraft: エージェンティックタスクの自動生成
待つ必要はありません!「思考トークン」の削除が推論効率を向上させる
Ego-R1: 超長時間エゴセントリック動画の推論におけるツール思考チェーン
DeepResearch Bench: 深層研究エージェントのための包括的なベンチマーク
科学者の最初の試験:MLLMの認知能力を知覚、理解、推論を通じて探究する
MiniMax-M1: ライトニング・アテンションを用いてテスト時の計算リソースを効率的にスケーリング
均質アテンションを超えて:フーリエ近似KVキャッシュを用いたメモリ効率の高いLLM
LLaVA-Mini:1つのビジョントークンを用いた効率的な画像および動画大規模マルチモーダルモデル
MAmmoTH-VL:スケールにおける指示チューニングを用いたマルチモーダル推論の促進
ShowUI:GUI視覚エージェント向けのワンビジョン・言語・アクションモデル
OS-ATLAS:汎用GUIエージェント向け基盤行動モデル
GPT-4o システムカード
SAM2Long:トレーニング不要メモリツリーを用いたSAM 2の長期動画セグメンテーションへの拡張
アリア:オープンなマルチモーダルネイティブ・ミクスチャーオブエキスパートモデル
Qwen2-VL:任意解像度における視覚言語モデルの世界認識能力の向上
VGGT: Visual Geometry Grounded Transformer VGGT: ビジュアル・ジオメトリ・グラウンデッド・トランスフォーマー
単一ステップ報酬を用いたマルチターンコード生成
大規模言語モデルの構成的一般化能力を命令文理解能力を考慮して再検討する
具現化ウェブエージェント:物理デジタル領域を橋渡しする統合エージェント知能
意味を理解した報酬の体系:自由形式生成におけるオープンエンドR1トレーニング向け
BUTシステムのMLC-SLMチャレンジへの適用
GenRecal: 大規模から小規模への再校正後の生成 言語-視覚モデル
ProtoReasoning: プロトタイプを基盤とするLLMにおける一般化可能な推論
世界探査向けビデオデータセット:Sekai
QFFT、Question-Free Fine-Tuning for Adaptive Reasoning
大規模言語モデル(LLM)はアルゴリズム問題のための高品質なテストケースを生成できるか? TestCase-Eval: 故障カバレッジとエクスポージャの体系的な評価
AceReason-Nemotron 1.1: 数学とコード推論の進歩を図るSFTとRLのシナジー
ストリーム・オムニ:大規模言語-視覚-音声モデルを用いた同時多モーダル相互作用
強化学習を用いた効率的な医療VIE
テスト時の計算量をスケーリングするLLMエージェント
TaskCraft: エージェンティックタスクの自動生成
待つ必要はありません!「思考トークン」の削除が推論効率を向上させる
Ego-R1: 超長時間エゴセントリック動画の推論におけるツール思考チェーン
DeepResearch Bench: 深層研究エージェントのための包括的なベンチマーク
科学者の最初の試験:MLLMの認知能力を知覚、理解、推論を通じて探究する
MiniMax-M1: ライトニング・アテンションを用いてテスト時の計算リソースを効率的にスケーリング
均質アテンションを超えて:フーリエ近似KVキャッシュを用いたメモリ効率の高いLLM