
초록
자동 텍스트 요약은 다양한 분야와 언어에서 연구되어 왔다. 그러나 러시아어에 대해서는 이러한 연구가 이루어지지 않았다. 이 문제를 해결하기 위해 우리는 러시아 뉴스 기사의 요약을 위한 첫 번째 데이터셋인 Gazeta를 제안한다. 본 연구에서는 이 데이터셋의 특성에 대해 설명하고, 여러 추출형 및 생성형 모델을 기준으로 성능을 평가한다. 우리는 이 데이터셋이 러시아어 텍스트 요약 기법에 대해 타당한 작업으로서 유효함을 입증한다. 또한, 사전 훈련된 mBART 모델이 러시아어 텍스트 요약에 유용함을 보여준다.