17일 전
PESQetarian: 음성 증강에서 굿하르트의 법칙의 관련성에 대하여
Danilo de Oliveira, Simon Welker, Julius Richter, Timo Gerkmann

초록
향상된 음성 강화 모델을 얻기 위해 연구자들은 종종 특정 도구적 지표에 따라 성능을 향상시키는 데 초점을 맞춘다. 그러나 동일한 지표를 모델 최적화를 위한 손실 함수(loss function)에 사용할 경우, 해당 지표가 측정하지 못하는 측면에서는 오히려 부정적인 영향을 미칠 수 있다. 본 논문의 목적은 음성 강화 모델이 평가에 사용된 지표에 과적합(overfitting)되는 위험성을 보여주는 것이다. 이를 위해 우리는 널리 사용되는 PESQ 측정치를 활용하는 강화 모델을 제안한다. 우리의 ‘PESQetarian’ 모델은 VB-DMD에서 3.82의 PESQ 점수를 기록하지만, 청취 실험에서는 매우 낮은 성능을 보인다. 얻어진 3.82의 PESQ 점수는 VB-DMD 벤치마크에서 ‘최첨단’ 수준의 성능을 의미하는 듯 보이지만, 본 연구의 사례들은 지표에 따라 최적화할 때 동일 지표에 대한 고립된 평가가 오해를 불러일으킬 수 있음을 보여준다. 따라서 평가 과정에 다른 지표들을 포함하고, 최종 성능 예측은 청취 검증을 통해 확인되어야 한다.