10일 전

장尾 인식을 위한 최적 운송: 학습 가능한 비용 행렬을 활용한 방법

{Ping Li, Mingming Sun, Hanyu Peng}
장尾 인식을 위한 최적 운송: 학습 가능한 비용 행렬을 활용한 방법
초록

긴꼬리 인식 문제(long-tailed recognition problem)에 대한 관심이 높아지고 있으며, 이는 최근 매우 주목받는 핵심 과제로 부상하고 있다. 기존의 인식 방식과 달리, 이 문제는 학습 데이터셋의 분포가 극도로 왜곡되어 있음을 전제로 하며, 검증 및 테스트 세트는 균형 잡힌 분포를 가진다는 점이 특징이다. 당연히, 학습 데이터와 테스트 데이터 간의 분포 차이로 인해 모델의 일반화 성능에 심각한 도전이 수반된다. 이러한 도전에 대응하기 위한 접근법은 두 가지 주요 그룹으로 나뉜다. 첫째, 학습 과정 중 모델의 잠재력을 활용하여 일반화 능력을 강화하는 ‘학습 인지 기반 방법’이며, 둘째, 학습 인지 기반 방법과 유연하게 결합되는 ‘후처리 보정(post-hoc correction)’ 기법으로, 예측 결과를 후처리 단계에서 가능한 한 정교하게 보정함으로써 단순성과 효과성의 장점을 제공한다. 본 논문에서는 기존의 통계적 방법을 넘어서는 새로운 후처리 보정 방향을 제안한다. 수학적으로는 최적 운반(optimal transport, OT)의 관점에서 문제를 접근하지만, OT를 적용할 때 정확한 비용 행렬(cost matrix)을 선택하는 것은 어렵고, 다양한 작업에 대한 전문 지식이 필요하다는 한계가 있다. 이러한 한계를 극복하기 위해, 필요한 설정 없이 비용 행렬을 적응적으로 학습할 수 있도록 선형 변환(linear mapping)을 도입한다. 실증 실험을 통해 제안한 방법을 검증한 결과, 높은 효율성과 뛰어난 성능을 동시에 달성하였으며, 기존의 모든 방법을 뛰어넘어 현재까지 가장 우수한 성능을 기록하였다.

장尾 인식을 위한 최적 운송: 학습 가능한 비용 행렬을 활용한 방법 | 최신 연구 논문 | HyperAI초신경