7일 전

PromptRank: 프롬프트를 이용한 비지도 핵심어 추출

Aobo Kong, Shiwan Zhao, Hao Chen, Qicheng Li, Yong Qin, Ruiqi Sun, Xiaoyan Bai
PromptRank: 프롬프트를 이용한 비지도 핵심어 추출
초록

키워드 추출 작업은 주어진 문서의 핵심 내용을 요약할 수 있도록 자동으로 구문을 선택하는 것을 의미한다. 최근에는 임베딩 기반 알고리즘이 최신 기준(SOTA) 성능을 달성하였으며, 문서 임베딩과 후보 구문 임베딩 간의 유사도를 기반으로 후보를 순위 매긴다. 그러나 이러한 기법들은 문서와 후보 사이의 길이 차이 문제를 해결하기 어려우거나, 추가적인 미세조정(fine-tuning) 없이 사전 훈련된 언어 모델(PLM)의 전체 잠재력을 충분히 활용하지 못하는 한계가 있다. 이를 해결하기 위해 본 논문에서는 인코더-디코더 구조를 가진 PLM을 기반으로 한 간단하면서도 효과적인 비지도(unsupervised) 접근법인 PromptRank를 제안한다. 구체적으로 PromptRank는 문서를 인코더에 입력하고, 디코더가 설계된 프롬프트(prompt)를 기반으로 후보 구문을 생성할 확률을 계산한다. 제안된 PromptRank는 널리 사용되는 6개의 벤치마크에서 광범위하게 평가되었으며, 기존 SOTA 방법인 MDERank보다 우수한 성능을 보였다. 특히, 반환 결과 수가 5개, 10개, 15개일 때 각각 F1 점수를 34.18%, 24.87%, 17.57% 상대적으로 향상시켰다. 이는 프롬프트를 활용한 비지도 키워드 추출의 큰 잠재력을 입증한다. 본 연구의 코드는 https://github.com/HLT-NLP/PromptRank 에 공개된다.

PromptRank: 프롬프트를 이용한 비지도 핵심어 추출 | 최신 연구 논문 | HyperAI초신경