18일 전

LLM을 활용한 모델 앙상블 기반 중국어 텍스트 분류

{Hailong Yin, Feipeng Dai, Wenlong Fang, Chengyan Wu}
초록

자동 의료 텍스트 분류는 의료진이 환자 정보를 효율적으로 관리하는 데 도움을 줄 수 있다. 환자들의 증상 기술 내용과 같은 텍스트 정보를 분류함으로써, 의료진은 핵심 정보를 쉽게 파악하고 진단 과정을 가속화하며, 더 우수한 의료 조언을 제공할 수 있으며, 스마트 진단 및 의료 자동 질의응답(QA) 서비스의 성공적인 추진에도 기여할 수 있다. 본 논문에서는 제9회 중국 건강정보처리 학술대회(CHIP 2023)의 오픈 공유 과제에서 의료 텍스트 분류를 위한 새로운 접근법을 제안한다. 이 과제의 주요 도전 과제는 복잡한 텍스트 관계를 다루는 것이다. 본 연구에서는 세 가지 서로 다른 하위 모델 간의 보완적 관계를 활용하여 의료 텍스트 분류 문제를 효과적으로 해결하는 모델 통합 기법을 제안한다. 또한, 분류가 어려운 어려운 샘플에 대해 타깃 데이터 증강을 위한 외부 도구를 제공함으로써 오분류를 줄이는 데 기여한다. 최종 결과는 각 모델 간 투표 메커니즘을 통해 도출된다. 실험 결과에 따르면 제안한 방법은 92%의 정확도를 달성하며, 모델의 효과성도 입증하였다.

LLM을 활용한 모델 앙상블 기반 중국어 텍스트 분류 | 최신 연구 논문 | HyperAI초신경