
초록
우리는 새로운 텍스트 편집 작업을 제안합니다. 이 작업은 \textit{사실 기반 텍스트 편집}으로 지칭되며, 주어진 문서를 지식 기반(예: 여러 트리플)에 포함된 사실을 더 잘 설명하도록 개정하는 것을 목표로 합니다. 이 작업은 실제에서 중요성이 크며, 텍스트 편집에서 진실을 반영하는 것이 일반적인 요구사항이기 때문입니다. 첫째, 우리는 사실 기반 텍스트 편집 연구를 위한 데이터셋을 자동으로 생성하는 방법을 제안합니다. 각 인스턴스는 초안 텍스트, 개정된 텍스트, 그리고 여러 트리플로 표현된 사실로 구성됩니다. 우리는 이 방법을 두 개의 공개 표-텍스트 데이터셋에 적용하여 각각 233,000개와 37,000개의 인스턴스로 구성된 두 개의 새로운 데이터셋을 얻었습니다. 둘째, 우리는 \textsc{FactEditor}라는 이름의 새로운 신경망 구조를 제안합니다. \textsc{FactEditor}는 버퍼(buffer), 스트림(stream), 메모리(memory)를 사용하여 주어진 사실을 참조하여 초안 텍스트를 수정합니다. 문제를 해결하기 위한 직관적인 접근 방식은 인코더-디코더 모델을 활용하는 것입니다. 두 데이터셋에 대한 실험 결과는 \textsc{FactEditor}가 인코더-디코더 접근 방식보다 충실성(fidelity)과 유창성(fluency) 측면에서 우수한 성능을 보임을 나타냅니다. 또한 실험 결과는 \textsc{FactEditor}가 인코더-디코더 접근 방식보다 추론 속도가 빠르다는 것을 보여줍니다.