17일 전

자기주의 메커니즘을 갖춘 트랜스포머 모델을 사용한 추상적 텍스트 요약 기법

{Arun Solanki, Sandeep Kumar}
초록

자연어 처리(NLP) 분야에서 원문 문서의 의미를 정확히 전달하면서도 요약된 버전을 생성하는 것은 매우 복잡한 과제이다. 추상적 텍스트 요약(ATS)은 원문 문장들에서 도출된 사실들을 통합하여 내용과 의도를 유지하면서도 간결한 표현으로 변환하는 과정이다. 대량의 텍스트를 수작업으로 요약하는 것은 인간에게 매우 어려우며 시간이 많이 소요된다. 따라서 텍스트 요약은 NLP 분야에서 매우 중요한 연구 주제로 부상하고 있다. 본 연구 논문에서는 자기 주의 메커니즘(Self-Attention Mechanism)을 적용한 트랜스포머 기법(T2SAM)을 사용한 ATS 모델을 제안한다. 자기 주의 메커니즘은 텍스트 내 공통 지시어(Coreference) 문제를 해결하기 위해 트랜스포머에 추가되었으며, 이로 인해 시스템이 텍스트를 보다 정확히 이해할 수 있게 되었다. 제안된 T2SAM 모델은 성능 측면에서 기존의 최첨단 기준 모델들을 능가하는 결과를 보였다. 이 모델은 Inshorts 뉴스 데이터셋과 DUC-2004 공동 과제 데이터셋을 결합하여 학습시켰으며, ROUGE 지표를 활용한 성능 평가 결과, 기존의 최신 기술 대비 우수한 성능을 입증하였다. 제안 모델은 30 에포크 동안 학습을 진행하면서 초기 값 10.3058에서 시작한 학습 손실을 최소 1.8220까지 감소시켰으며, Inshorts 및 DUC-2004 뉴스 데이터셋 모두에서 48.50%의 F1 스코어를 달성하여 높은 정확도를 보였다.

자기주의 메커니즘을 갖춘 트랜스포머 모델을 사용한 추상적 텍스트 요약 기법 | 최신 연구 논문 | HyperAI초신경