18일 전

3차원 동작 인식을 위한 글로벌 컨텍스트 인지 주의 LSTM 네트워크

{Ling-Yu Duan, Ping Hu, Gang Wang, Alex C. Kot, Jun Liu}
3차원 동작 인식을 위한 글로벌 컨텍스트 인지 주의 LSTM 네트워크
초록

긴단기기억(LSTM) 네트워크는 시계열 데이터 내의 동적 특성과 의존성을 효과적으로 모델링할 수 있는 능력 덕분에 3차원(3D) 인간 동작 인식에서 우수한 성능을 보여왔다. 그러나 모든 관절이 동작 분석에 유의미한 정보를 제공하는 것은 아니며, 관련 없는 관절은 종종 많은 노이즈를 유발한다. 따라서 유의미한 관절에 더 주의를 기울일 필요가 있다. 그러나 기존의 LSTM은 강력한 주의(attention) 기능을 갖추고 있지 않다. 이를 보완하기 위해 본 논문에서는 3D 동작 인식을 위한 새로운 LSTM 네트워크 클래스인 글로벌 컨텍스트 인식 주의 LSTM(Global Context-Aware Attention LSTM, GCA-LSTM)을 제안한다. 이 네트워크는 글로벌 컨텍스트 정보를 활용하여 동작 시퀀스 내에서 유의미한 관절에 선택적으로 집중할 수 있다. 더욱 신뢰할 수 있는 주의 표현을 얻기 위해, GCA-LSTM 네트워크에 반복적인 주의 메커니즘을 추가로 제안하며, 이는 반복적으로 주의 성능을 향상시킨다. 실험 결과, 제안하는 엔드투엔드 네트워크가 뼈대 시퀀스의 각 프레임에서 가장 유의미한 관절에 안정적으로 집중함을 확인하였다. 또한, 세 가지 도전적인 3D 동작 인식 데이터셋에서 최신 기술 수준(SOTA)의 성능을 달성하였다.

3차원 동작 인식을 위한 글로벌 컨텍스트 인지 주의 LSTM 네트워크 | 최신 연구 논문 | HyperAI초신경