
要約
ベクトル量子化ネットワーク(VQNs)は、さまざまなタスクにおいて顕著な性能を示している一方で、訓練の不安定性に悩まされており、微細な初期化やモデル蒸留といった技術の導入が必須となるため、訓練プロセスが複雑化している。本研究では、この不安定性の主因として局所最適解の問題を特定した。これを解決するため、最近傍探索に代えて、よりグローバルな情報を反映した割当を実現する最適輸送法を導入した。本研究では、Sinkhornアルゴリズムを用いて最適輸送問題を最適化する新規なベクトル量子化手法OptVQを提案する。これにより、訓練の安定性と効率が向上する。また、Sinkhornアルゴリズムに対する多様なデータ分布の影響を軽減するため、簡潔かつ効果的な正規化戦略を導入した。画像再構成タスクにおける包括的な実験の結果、OptVQはコードブックの100%の利用を達成し、既存の最先端VQNを上回る再構成品質を実現した。