Command Palette
Search for a command to run...
Yuwei Niu Weiyang Jin Jiaqi Liao Chaoran Feng Peng Jin Bin Lin Zongjian Li Bin Zhu Weihao Yu Li Yuan

要約
近年、統合型マルチモーダルモデルにおいて顕著な進展が見られつつあるが、根本的な問いが残っている。すなわち、「理解が生成に真正に寄与しているのか」という点である。この問いに答えるため、本研究ではデータ漏洩を回避し、詳細な分析を可能にするために、制御された合成データセットと併用される分離型の評価フレームワーク「UniSandbox」を導入する。得られた結果から、理解と生成の間に顕著なギャップが存在することが明らかになった。このギャップは、主に2つの重要な側面に表れている:推論生成(reasoning generation)と知識移転(knowledge transfer)。具体的には、推論生成タスクにおいて、理解モジュールに明示的な「思考の連鎖(Chain-of-Thought, CoT)」を導入することで、このギャップが効果的に埋められることを観察した。さらに、自己学習(self-training)アプローチがこの能力を内部化できることを示し、生成段階で非明示的な推論が可能になることを実証した。また、知識移転タスクにおいては、CoTが新しく学習した知識の検索を支援することで生成プロセスを助けることが分かった。さらに、クエリベースのアーキテクチャが、知識移転に影響を与える潜在的なCoT類似性(CoT-like properties)を内包していることも発見した。UniSandboxは、今後の統合型アーキテクチャや学習戦略の設計に向けた初期的知見を提供するものであり、理解と生成の間の本質的なギャップを真正に埋める可能性を示唆している。コードとデータは、https://github.com/PKU-YuanGroup/UniSandBox で公開されている。