深層多タスク学習フレームワークを用いた虹彩の同時セグメンテーションとローカライゼーション

非協力環境下での虹彩のセグメンテーションと位置特定は、照明条件の変動、長距離、被写体の動き、ユーザーの限られた協力などの要因により困難です。従来の方法は、これらの条件下で撮影された虹彩画像に対して性能が低下する傾向があります。最近の研究では、深層学習手法が虹彩セグメンテーションタスクにおいて優れた性能を達成できることを示しています。さらに、虹彩が瞳孔と白目の間にある円環状領域として定義されていることから、幾何学的な制約を課すことによって虹彩の位置特定精度を向上させ、セグメンテーション結果を改善することが可能です。本論文では、瞳孔、虹彩、白目の固有の相関関係を利用し、統一モデル内で虹彩セグメンテーションと位置特定の性能向上を目指す深層多タスク学習フレームワークであるIrisParseNet(アイリスパースネット)を提案します。特に、IrisParseNetは最初に完全畳み込みエンコーダーデコーダーアテンションネットワーク(Fully Convolutional Encoder-Decoder Attention Network)を適用して、瞳孔中心位置、虹彩セグメンテーションマスクおよび虹彩内側/外側境界を同時に推定します。その後、効果的な後処理手法を使用して虹彩内側/外側円周の位置特定を行います。提案手法の訓練と評価のために、CASIA-Iris-Distance, UBIRIS.v2, および MICHE-I という3つの挑戦的な虹彩データセットに手動でラベル付けを行いました。これらの新しいアノテーションデータセットに対して広範な実験を行い、結果は我々の手法が様々なベンチマークにおいて最先端手法を上回っていることを示しています。すべての真値アノテーション、アノテーションコードおよび評価プロトコルは公開されており、https://github.com/xiamenwcy/IrisParseNet からアクセスできます。