17日前

一貫性学習を用いた深度ベースの半教師付き3Dハンドポーズ推定における性能限界の追求

Mohammad Rezaei, Farnaz Farahanipad, Alex Dillhoff, Vassilis Athitsos
一貫性学習を用いた深度ベースの半教師付き3Dハンドポーズ推定における性能限界の追求
要約

近年、深度に基づく3D手の姿勢推定手法は著しい進展を遂げているが、依然として高い精度を達成するためには大量のラベル付き学習データが必要である。しかしながら、このようなデータの収集は費用がかかり、時間もかかる。この問題に対処するために、ラベル付き学習データへの依存を大幅に低減するための半教師あり手法を提案する。本手法は、同一の構造を持つ2つのネットワーク(教師ネットワークと学生ネットワーク)を共同で学習させるものである。教師ネットワークは、利用可能なラベル付きデータとラベルなしデータの両方を用いて学習される。特に、ラベルなしデータに対しては、アフィン変換群に対する推定の等価性(equivariance)を促進する損失関数を用いて活用する。一方、学生ネットワークは、教師ネットワークが生成する疑似ラベル(pseudo-labels)を用いてラベルなしデータのみで学習される。テスト時の推論では、学生ネットワークのみを用いる。広範な実験により、提案手法が最先端の半教師あり手法を大きく上回ることを実証した。

一貫性学習を用いた深度ベースの半教師付き3Dハンドポーズ推定における性能限界の追求 | 最新論文 | HyperAI超神経