
초록
정신 건강은 세계적으로 공중 보건의 중요한 과제로 남아 있다. 온라인 플랫폼의 인기 증가에 따라 많은 사용자들이 자신의 정신 건강 상태를 공유하고 감정을 표현하며 커뮤니티나 상담사로부터 도움을 요청하는 데 플랫폼을 활용하고 있다. 일부 플랫폼, 예를 들어 Reachout와 같은 전용 포럼은 사용자가 도움을 받기 위해 등록하는 전용 공간을 제공한다. 반면 Reddit과 같은 플랫폼은 사용자가 공개적이지만 익명으로 정신 건강 관련 고통을 게시할 수 있는 서브레딧(subreddits)을 제공한다. 게시물의 길이는 다양하지만, 상담사들이 빠르게 처리할 수 있도록 짧지만 정보가 풍부한 요약을 제공하는 것은 매우 유용하다. 정신 건강 관련 온라인 게시물 요약 연구를 촉진하기 위해, 우리는 43개의 정신 건강 서브레딧에서 수집한 24,000건 이상의 정밀하게 선별된 Reddit 사용자 게시물과 함께, 사용자가 직접 작성한 짧은 요약(즉, TLDR)을 포함한 정신 건강 요약 데이터셋인 MentSum을 소개한다. 이 도메인 특화 데이터셋은 Reddit에서의 짧은 요약 생성뿐 아니라, Reachout와 같은 전용 정신 건강 포럼의 게시물 요약 생성에도 유용할 수 있다. 또한, Rouge 점수를 기준으로 추출형과 생성형 최신 요약 기준 모델들을 평가하였으며, 사용자 작성 요약과 시스템 생성 요약에 대한 심층적인 인간 평가를 수행하여 이 분야의 주요 도전 과제를 제시하였다.