3달 전

가중 카운터 마이닝 기반의 테스트린 기계: 가중 클라우즈를 활용한 압축 표현

Adrian Phoulady, Ole-Christoffer Granmo, Saeed Rahimi Gorji, Hady Ahmady Phoulady
가중 카운터 마이닝 기반의 테스트린 기계: 가중 클라우즈를 활용한 압축 표현
초록

Tsetlin Machine(TM)은 데이터로부터 조건부 문장을 구성하는 해석 가능한 패턴 인식 기법이다. 이 문장들은 높은 구분 능력을 갖는 빈번한 패턴을 포착하며, 추가되는 각 문장마다 표현 능력이 점진적으로 증가한다. 그러나 이러한 정확도 향상은 계산 시간과 메모리 사용량의 선형 증가라는 비용을 수반한다. 본 논문에서는 문장에 가중치를 부여함으로써 계산 시간과 메모리 사용량을 줄이는 가중 Tsetlin Machine(WTM)을 제안한다. 실수형 가중치는 하나의 문장이 여러 문장을 대체할 수 있게 하며, 각 문장의 영향력을 세밀하게 조정할 수 있도록 한다. 본 연구에서 제안하는 새로운 기법은 문장의 구성과 그 가중치를 동시에 학습한다. 또한, 성공 확률이 $p$인 $k$개의 베르누이 시행을 평균 크기가 $pk$인 균일 표본으로 대체함으로써 학습 효율성을 향상시킨다. 이때 표본 크기는 이항 분포에서 추출된다. 실증 평가 결과, WTM은 MNIST, IMDb, Connect-4에서 TM과 동일한 정확도를 달성하면서 각각 문장 수를 1/4, 1/3, 1/50로 줄일 수 있었다. 동일한 문장 수를 사용할 경우 WTM은 TM을 초과하여 각각 98.63%, 90.37%, 87.91%의 최고 테스트 정확도를 기록했다. 마지막으로, 본 연구에서 제안한 새로운 표본 추출 방식은 표본 생성 시간을 7배 단축시켰다.