2달 전

TagRec: 질문의 계층적 학습세분화 자동 태깅

Venktesh V; Mukesh Mohania; Vikram Goyal
TagRec: 질문의 계층적 학습세분화 자동 태깅
초록

온라인 교육 플랫폼은 학문적 질문을 주제-챕터-주제와 같은 계층적 학습 분류 체계에 따라 정리합니다. 기존 분류 체계로 새로운 질문을 자동으로 태깅하면 이러한 질문들을 챕터와 같은 요소별로 검색할 수 있도록 하여 다양한 계층적 분류 체계로 조직화하는 데 도움이 됩니다. 이 작업은 평면 다중 클래스 분류 문제로 표현될 수 있습니다. 일반적으로 평면 분류 기반 방법들은 계층적 분류 체계의 용어들과 질문들 사이의 의미적 관련성을 무시합니다. 일부 전통적인 방법들은 계층 구조를 무시하고 단지 말단 노드만 고려하기 때문에 클래스 불균형 문제에도 취약합니다. 따라서, 우리는 이 문제를 유사성 기반 검색 작업으로 설정하여 분류 체계와 질문 간의 의미적 관련성을 최적화하였습니다.우리는 이 방법이 미처 보지 못한 라벨을 처리하는 데 도움이 되므로 실제 환경에서의 분류 체계 태깅에 사용될 수 있음을 보여줍니다. 이 방법에서는 질문에 해당하는 답변을 추가하여 더 많은 의미 정보를 포착하고, 그런 다음 질문-답변 쌍의 문맥 벡터 표현을 해당 라벨(분류 체계) 벡터 표현과 일치시키는 과정을 거칩니다. 표현들은 코사인 유사도와 힌지 순위 손실 함수(Hinge Rank Loss)의 조합을 사용하여 미세 조정된 트랜스포머 기반 모델로 일치됩니다. 손실 함수는 올바른 라벨 표현과 질문-답변 쌍 간의 유사성을 최대화하면서 관련성이 없는 라벨 간의 유사성을 최소화합니다.마지막으로, 우리는 두 개의 실제 데이터셋에서 실험을 수행하였습니다. Recall@k 지표로 측정했을 때 제안된 학습 방법이 다중 클래스 분류 방법 및 다른 최신 방법보다 6% 우수한 성능을 보임을 입증하였습니다. 또한, 네트워크를 재학습하지 않고도 미처 보지 못한 그러나 관련 있는 학습 내용(예: 학습 목표)에서 제안된 방법의 성능도 시연하였습니다.

TagRec: 질문의 계층적 학습세분화 자동 태깅 | 최신 연구 논문 | HyperAI초신경