2달 전
컨벌루션에 의한 카운터포인트
Cheng-Zhi Anna Huang; Tim Cooijmans; Adam Roberts; Aaron Courville; Douglas Eck

초록
음악의 기계 학습 모델은 일반적으로 작곡 과정을 시간 순서대로 나누어, 한 번에 처음부터 끝까지 음악 작품을 완성합니다. 반면에 인간 작곡가는 비선형적인 방식으로 음악을 작곡하며, 여기저기 주제를 적고 종종 이전에 선택한 내용을 다시 방문합니다. 이러한 과정을 더 잘 근사하기 위해, 우리는 부분적인 악보를 완성하도록 합성곱 신경망(CNN)을 훈련시키고, 재작성의 유사체로 차단된 깁스 샘플링(blocked Gibbs sampling)의 사용을 탐구합니다. 모델이나 생성 절차 모두 특정 인과적 작곡 방향에 결속되어 있지 않습니다. 우리의 모델은 순서 없는 NADE(orderless NADE, Uria et al., 2014)의 한 예시로서, 더 직접적인 조상 샘플링(ancestral sampling)을 가능하게 합니다. 그러나 우리는 깁스 샘플링이 샘플 품질을 크게 개선한다는 것을 발견하였으며, 이는 일부 조건부 분포가 잘못 모델링되었기 때문임을 증명하였습니다. 또한, Yao et al. (2014)에서 제안된 저렴한 근사 차단된 깁스 절차 역시 조상 샘플링보다 더 좋은 샘플을 생성함을 로그 우도와 인간 평가를 통해 보여주었습니다.