11일 전

사전 학습된 워드 표현을 활용한 해석 가능한 절의 의미적 강화

Rohan Kumar Yadav, Lei Jiao, Ole-Christoffer Granmo, Morten Goodwin
사전 학습된 워드 표현을 활용한 해석 가능한 절의 의미적 강화
초록

Tsetlin Machine(TM)은 명제 논리 기반의 해석 가능한 패턴 인식 알고리즘으로, 감정 분석, 텍스트 분류, 단어의 의미 해석(Word Sense Disambiguation) 등 여러 자연어 처리(NLP) 작업에서 경쟁력 있는 성능을 보여왔다. 인간 수준의 해석 가능성을 달성하기 위해 기존의 TM은 주로 단어의 출현 빈도 기반 표현인 Bag-of-Words(BOW)와 같은 부울 입력 특징을 사용해왔다. 그러나 BOW 표현 방식은 사전 훈련된 정보(예: word2vec, GloVe 등)를 활용하기 어렵게 만든다. 이 제약은 TM의 성능이 딥 뉴럴 네트워크(DNN)에 비해 제한적인 이유 중 하나가 되었다. 본 논문에서는 이러한 성능 격차를 줄이기 위해, 사전 훈련된 단어 표현을 TM에 효과적으로 활용할 수 있는 새로운 방법을 제안한다. 제안한 접근법은 TM의 성능과 해석 가능성을 크게 향상시킨다. 이는 사전 훈련된 단어 표현에서 의미적으로 관련된 단어들을 추출하여 TM의 입력 특징으로 사용함으로써 달성된다. 실험 결과, 제안한 방법은 기존의 BOW 기반 TM보다 정확도가 현저히 높으며, DNN 기반 모델 수준의 성능에 도달함을 확인할 수 있었다.

사전 학습된 워드 표현을 활용한 해석 가능한 절의 의미적 강화 | 최신 연구 논문 | HyperAI초신경