텍스트 요약
텍스트 요약은 긴 문서를 핵심 정보와 의미를 유지하면서 더 짧고 간결한 버전으로 압축하는 자연어 처리의 작업입니다. 이 작업의 목표는 원문의 내용을 정확히 반영하여 사용자가 주요 정보를 빠르게 파악할 수 있는 요약을 생성하는 것입니다. 텍스트 요약은 추출적 방법과 추상적 방법을 포함합니다. 추출적 방법은 중요한 문장이나 구절을 식별하고 추출하는 반면, 추상적 방법은 원문의 내용을 바탕으로 새로운 텍스트를 생성합니다. 텍스트 요약은 뉴스 보도, 과학 문헌, 비즈니스 보고서 등 다양한 분야에서 큰 응용 가치를 가지고 있습니다.
GigaWord
BART-RXF
Pubmed
Arxiv HEP-TH citation graph
MTEB
X-Sum
Selfmem
CNN / Daily Mail (Anonymized)
DUC 2004 Task 1
Transformer+WDrop
SAMSum
Reddit TIFU
arXiv Summarization Dataset
PRIMER
DialogSum
InstructDS
Klexikon
Luhn's algorithm (25 sentences)
BookSum
Echoes-Extractive-Abstractive
GigaWord-10k
ERNIE-GENLARGE (large-scale text corpora)
WikiHow
BertSum
BigPatent
BigBird-Pegasus
GovReport
FactorSum
How2
MeetingBank
OrangeSum
mBARThez (OrangeSum abstract)
ACI-Bench
CriSPO 3-shot
AMI
arXiv
BigBird-Pegasus
BBC XSum
MatchSum
BillSum
Longformer Encoder Decoder
CL-SciSumm
CORD-19
EurekaAlert
Gazeta
Finetuned mBART
LCSTS
LSTM-seq2seq
MediaSum
SRformer-BART
MentSum
MeQSum
BiomedGPT
QMSum
BART-LS
S2ORC
GenCompareSum
Webis-Snippet-20 Corpus
Anchor-context + Query biased
XSum
SRformer-BART