11일 전

SATS: 과학 문서의 단순화 인지 텍스트 요약

{Naif Radi Aljohani, Asim Karim, Saeed-Ul Hassan, Matthew Shardlow, Faisal Kamiran, Farooq Zaman}
SATS: 과학 문서의 단순화 인지 텍스트 요약
초록

학술 논문 요약을 단순화하는 것은 과학적 발견을 더 넓은 대중에게 전달하기 위한 인기 있는 방법이다. 텍스트 요약은 긴 문서를 축약하는 것을 목표로 하지만, 단순화는 문서의 복잡성을 줄이는 것을 목적으로 한다. 이러한 작업을 통합적으로 수행하기 위해, 긴 텍스트를 축약하고 단순화할 수 있는 기계 학습 기법 개발이 필요하다. 본 연구는 미래 n-그램 예측 기반의 새로운 단순화 인식 텍스트 요약 모델(Simplification Aware Text Summarization, SATS)을 제안한다. 제안된 SATS 모델은 텍스트 요약 모델인 ProphetNet을 기반으로 하되, 단순화 작업을 위한 단어 빈도 사전을 활용하여 목적 함수를 개선함으로써 기능을 확장하였다. 우리는 최근에 발표된 5,400개의 과학 논문 쌍으로 구성된 텍스트 요약 및 단순화 코퍼스를 기반으로 SATS의 성능을 평가하였다. 자동 평가 결과에 따르면, ROUGE, SARI, CSS1 지표를 기준으로 두 개의 데이터셋에서 SATS는 단순화, 요약, 그리고 통합 단순화-요약 작업 모두에서 최신 기술(SOTA) 모델을 능가하는 성능을 보였다. 또한 SATS 모델이 생성한 요약문에 대한 인공 평가도 수행하였다. 8명의 평가자가 100개의 요약문을 문법, 논리성, 일관성, 자연스러움, 단순성의 측면에서 평가하였으며, 모든 평가 항목에 대한 평균 점수는 1~5점 척도에서 4.0~4.5 사이로 나타났다. 이는 점수가 높을수록 우수함을 의미한다.

SATS: 과학 문서의 단순화 인지 텍스트 요약 | 최신 연구 논문 | HyperAI초신경