16일 전

HTSS: 새로운 하이브리드 텍스트 요약 및 단순화 아키텍처

{Raheel Nawaz, Naif Radi Aljohani, Saeed-Ul Hassan, Matthew Shardlow, Farooq Zaman}
초록

텍스트 단순화(Text simplification)와 텍스트 요약(Text summarization)는 자연어 생성(Natural Language Generation) 분야에서 관련되지만 서로 다른 하위 작업이다. 요약은 문서의 길이를 줄이되 원래의 의미를 유지하려는 반면, 단순화는 문서의 복잡성을 낮추는 데 목적이 있다. 본 연구에서는 추상적 요약(abstractive summarization)과 추출적 요약(extractive summarization)의 새로운 하이브리드 아키텍처인 HTSS(Hybrid Text Summarization and Simplification)를 활용하여 두 작업을 통합한다. 또한, 요약과 단순화의 병합 작업을 위해 잘 알려진 포인터 생성자(Pointer Generator) 모델을 확장하였다. 본 연구에서 사용한 병렬 코퍼스는 과학 뉴스 웹사이트인 EurekaAlert(www.eurekalert.org)에 도메인 전문가가 작성한 단순화된 요약본을 기반으로 수집하였다. 실험 결과, 제안하는 HTSS 모델은 SARI 점수에서 신경망 기반 텍스트 단순화(NTS) 모델을, ROUGE 점수에서 추상적 텍스트 요약(ATS) 모델을 각각 상회함을 확인하였다. 또한, SARI와 ROUGE를 결합한 새로운 평가 지표(CSS1)를 도입하여, 단순화와 요약의 통합 작업에서 HTSS 모델이 NTS 및 ATS 모델 대비 각각 38.94%, 53.40%의 성능 향상을 보였음을 입증하였다. 본 연구에서 사용한 모든 코드, 모델 및 코퍼스는 향후 연구를 위해 다음 URL에서 과학 공동체에 공개한다: https://github.com/slab-itu/HTSS/.

HTSS: 새로운 하이브리드 텍스트 요약 및 단순화 아키텍처 | 최신 연구 논문 | HyperAI초신경