
초록
본 논문에서는 오디오 향상의 광범위한 영역 중 음악 오디오 대역폭 확장을 다룹니다. 우리는 딥 뉴럴 네트워크를 사용하여 대역 제한 신호가 네트워크 입력으로 제공되며, 전체 대역폭 출력을 재구성하는 것을 목표로 하는 대역폭 확장 문제를 정식화합니다. 우리의 주요 기여는 네트워크 학습 및 테스트 시 저통과 필터 선택의 영향에 초점을 맞추고 있습니다. 최신 딥 아키텍처인 ResNet과 U-Net을 사용하여 두 가지 다른 경우에서, 학습용 필터와 테스트용 필터가 일치할 때 최대 7dB까지 신호 대 잡음 비율(SNR)이 개선되는 것을 보여줍니다. 그러나 이러한 필터가 다르면 개선 효과가 크게 감소하며, 일부 학습 조건에서는 대역 제한 입력보다 낮은 SNR 결과를 초래하기도 합니다. 이 필터 형태에 대한 과적합을 방지하기 위해, 학습 과정에서 여러 저통과 필터를 활용하는 데이터 증강 전략을 제안합니다. 이 방법은 테스트 시 미리 본 적 없는 필터링 조건에서도 개선된 일반화 성능을 제공합니다.