
예상치 못한 변화로, 대형 언어 모델(Large Language Models, LLMs)과 프롬프트 기반 휴리스틱의 증가하는 무기고는 이제 다양한 고전적인 자연어 처리(NLP) 문제에 대한 소수 샷(few-shot) 솔루션을 제공하는 강력한 사전 제작된 접근 방식을 제시하고 있습니다. 그러나 초기 유망한 결과에도 불구하고, 이러한 LLM 기반의 소수 샷 방법들은 여전히 명명 실체 인식(Named Entity Recognition, NER) 분야에서 최신 기술(state of the art)과는 거리가 멉니다. 현재의 주요 방법들은 단일 구조 이해를 통한 표현 학습과 표준 라벨링된 코퍼스에서의 미세 조정(fine-tuning)을 포함합니다.본 논문에서는 새로운 최신 알고리즘인 PromptNER를 소개합니다. PromptNER는 새로운 NER 작업에 적응하기 위해 표준 소수 샷 예제 외에도 엔티티 정의 집합이 필요합니다. 문장이 주어지면, PromptNER는 LLM에게 잠재적 엔티티 목록과 해당 엔티티 타입 정의와의 일치성을 설명하는 내용을 생성하도록 요청합니다. 놀랍게도, PromptNER는 소수 샷 NER에서 최신 성능을 달성하며, ConLL 데이터셋에서 F1 점수가 4%(절대값) 향상되었으며, GENIA 데이터셋에서는 9%(절대값) 향상되었고, FewNERD 데이터셋에서는 4%(절대값) 향상되었습니다. 또한 PromptNER는 크로스 도메인 NER에서도 최신 기술을 발전시키며, 이전 방법들(소수 샷 설정에 제한되지 않은 것들을 포함하여)보다 우수한 성능을 보여주며, 사용 가능한 데이터의 2% 미만을 사용함에도 불구하고 5개 중 3개 크로스 도메인 NER 대상 영역에서 평균 F1 점수가 3% 향상되었습니다.