2달 전

다양한 다른 클래스에서 인과 효과를 추출하여 지속적인 명명된 실체 인식 수행

Junhao Zheng; Zhanxian Liang; Haibin Chen; Qianli Ma
다양한 다른 클래스에서 인과 효과를 추출하여 지속적인 명명된 실체 인식 수행
초록

명명된 실체 인식을 위한 연속 학습(CL-NER)은 시간이 지남에 따라 데이터 스트림에서 점점 더 많은 실체 유형을 학습하는 것을 목표로 합니다. 그러나 새로운 실체 유형과 동일한 방식으로 Other-Class를 학습하면 재앙적인 잊어버림(catastrophic forgetting)이 증폭되어 성능이 크게 저하됩니다. 이 현상의 주요 원인은 Other-Class 샘플이 일반적으로 과거의 실체 유형을 포함하고 있으며, 이러한 Other-Class 샘플 내의 과거 지식이 적절히 보존되지 않기 때문입니다. 인과 추론(causal inference) 덕분에, 우리는 이 잊어버림이 과거 데이터에서 부족한 인과 효과(causal effect)에 의해 발생함을 확인하였습니다. 이를 해결하기 위해, 우리는 새로운 실체 유형과 Other-Class 모두에서 인과성을 추출하기 위한 통합된 인과 프레임워크를 제안합니다. 또한, 커리큘럼 학습(curriculum learning)을 적용하여 라벨 노이즈(label noise)의 영향을 완화시키고, 새로운 실체 유형과 Other-Class 간의 인과 효과를 균형 있게 유지하기 위한 자기 적응 가중치(self-adaptive weight)를 도입하였습니다. 세 개의 벤치마크 데이터셋에 대한 실험 결과는 우리의 방법이 최신 기술(state-of-the-art method)보다 크게 우수함을 보여주며, 또한 우리의 방법은 기존 최신 기술들과 결합하여 CL-NER의 성능을 향상시킬 수 있음을 입증하였습니다.

다양한 다른 클래스에서 인과 효과를 추출하여 지속적인 명명된 실체 인식 수행 | 최신 연구 논문 | HyperAI초신경