15일 전
ARSC-Net: 채널-공간 주의 메커니즘을 갖춘 병렬 경로를 이용한 부가적 호흡음 분류 네트워크
{Jianxin Wang, Fan Wu, Hulin Kuang, Jin Liu, Jianhong Cheng, Lei Xu}
초록
최근 몇 년간 부정상 호흡음의 자동 식별은 여전히 도전적인 문제로 남아 있다. 이 문제를 해결하기 위해 본 연구에서는 정확한 분류를 가능하게 하기 위해 잔차 블록과 채널-공간 주의 메커니즘을 결합한 부정상 호흡음 분류 네트워크(ARSC-Net)를 제안한다. 구체적으로, 부정상 호흡음으로부터 멜-주파수 체프스트랄 계수(MFCCs)와 멜 스펙트로그램 두 가지 유형의 특징을 추출한다. 이 두 가지 특징은 잔차 주의 메커니즘을 갖춘 병렬 인코더 경로에 입력되어 특징 표현을 추출한 후, 채널-공간 주의 모듈로 융합되며, 분류 작업을 위해 채널과 공간적 부분 간의 중요한 특징에 자동으로 집중할 수 있도록 한다. 또한, 채널-공간 주의 메커니즘은 특징 표현을 강화하며, 채널 주의는 스펙트럼 간의 채널 간 상관관계를 탐색하고, 이후 시공간 주의를 순차적으로 도입하여 공간적 상관관계를 반영하는 맵핑을 생성한다. 제안된 방법은 ICBHI 2017 데이터베이스를 기반으로 평가되었으며, 실험 결과, 정상 소리와 비정상 소리를 구분하는 데 있어 80.0%의 정확도를 달성하였고, 크랙클과 위즈(whistle)를 구분하는 데 있어서는 92.4%의 정확도를 기록하였다. 또한, 부정상 소리의 4가지 클래스 분류에 대해 56.76%의 점수를 기록하며, 여러 최신 기술들보다 우수한 성능을 보였다.