Search for a command to run...
言語、視覚、視覚言語理解タスク向けの汎用基盤モデル構築への道 (注:LLM/LLMs/Agent/token/tokens などの専門用語は原文のまま保持。翻訳は学術論文の日本語版に準拠した流暢かつ正確な表現を採用。)