本論文では、分類ラベル位置のランダム初期化による一意なエンコーディングが、視覚的マスク付き自己教師付き事前学習モデルにおける微調整(fine-tuning)後の下流分類タスクに与える影響を調査する。その結果、同じ分類データセットの割り当て戦略を用いても、異なるランダム初期化によって微調整後の性能に顕著な差が生じることが明らかになった。これらの結果間の精度差は、視覚的マスク付き自己教師付き事前学習モデルが特定の分類ラベル位置に対して内在的な好ましさ(inherent preference)を有していることを示唆している。この現象を解明するため、自己教師付きではない視覚的事前学習モデルと比較し、マスク付き自己教師付きモデルが特定のラベル位置に対して自己認識的なバイアス(self-aware bias)を示す可能性を仮説として提示する。このランダムエンコーディングに起因する不安定性を軽減するため、本研究では分類ラベル位置のランク付けアルゴリズム「Label Ranker」を提案する。このアルゴリズムは、線形判別分析(Linear Discriminant Analysis, LDA)を用いた特徴マップの1次元次元削減と、ユークリッド距離の類似性特性を利用した非教師あり特徴クラスタリングに基づく位置ランクエンコーディングを組み合わせたものである。これにより、ラベル位置のエンコーディングがモデルの内在的な好ましさに整合するよう設計されている。CIFAR-100、UCF101、HMDB51の分類データセットを用いたImageMAEおよびVideoMAEモデルに対する広範なアブレーション実験の結果、本手法が視覚的マスク付き自己教師付きモデルにおける分類ラベル位置エンコーディングの安定性を効果的に向上させ、微調整性能の向上を実現できることを実証した。