18일 전

장기적 동작 평가를 위한 등급 분리 기반 리커트 측정

{Wei-Shi Zheng, Ling-An Zeng, Angchi Xu}
장기적 동작 평가를 위한 등급 분리 기반 리커트 측정
초록

장기적 동작 품질 평가는 긴 영상에서 동작의 수행 수준을 평가하는 작업으로, 즉 장시간 영상으로부터 품질 점수를 추정하는 것을 의미한다. 직관적으로 장기적 동작은 다양한 기술 수준을 보이는 부분을 포함하며, 이러한 기술 수준을 '성과 등급'이라고 부른다. 예를 들어, 한 장기적 동작 내에서 기술적인 하이라이트와 오류가 동시에 나타날 수 있다. 따라서 최종 점수는 영상 내에서 나타난 다양한 등급들의 종합적인 영향에 의해 결정되어야 한다. 이러한 잠재적 관계를 탐구하기 위해, 심리측정학에서 사용되는 리커트 척도(Likert scale)를 영감으로 삼아 새로운 리커트 점수 부여 방식을 설계하였다. 이 방식에서는 등급을 명시적으로 수량화하고, 영상에서 추정된 각 등급에 대한 응답값과 함께 수량화된 값을 조합하여 직접 회귀를 수행하는 대신 최종 품질 점수를 산출한다. 또한, 다양한 학습 가능한 쿼리를 가진 트랜스포머 디코더 아키텍처를 활용하여 등급별 특징을 추출하며, 이는 각 등급의 응답을 추정하는 데 사용된다. 전체 모델은 'Grade-decoupling Likert Transformer(GDLT)'라고 명명하였으며, 두 개의 장기적 동작 평가 데이터셋에서 최신 기술(SOTA) 수준의 성능을 달성하였다.

장기적 동작 평가를 위한 등급 분리 기반 리커트 측정 | 최신 연구 논문 | HyperAI초신경