Command Palette

Search for a command to run...

4달 전

지식 강화 마스킹 언어 모델을 활용한 입장 탐지

{Lisa Singh Kornraphop Kawintiranon}

지식 강화 마스킹 언어 모델을 활용한 입장 탐지

초록

트위터에서 입장을 탐지하는 것은 각 트윗의 짧은 길이, 지속적인 새로운 용어와 해시태그의 창출, 그리고 표준 문체와는 다른 문장 구조로 인해 특히 도전적이다. 대규모 도메인 내 데이터를 활용한 미세조정 언어 모델은 여러 자연어 처리(NLP) 과제, 특히 입장 탐지 분야에서 새로운 최고 성능 기준으로 입증되었다. 본 논문에서는 입장 탐지에 적합한 마스킹 언어 모델을 향상시키기 위해 새로운 BERT 기반 미세조정 방법을 제안한다. 무작위 토큰 마스킹 대신, 입장 구분 능력이 높은 단어를 가중치가 부여된 로그 오즈 비율(Weighted Log-Odds-Ratio)을 활용해 식별하고, 이러한 단어에 주목하는 주의 메커니즘을 모델링한다. 제안하는 방법이 2020년 미국 대통령 선거 관련 트위터 데이터에 대한 입장 탐지에서 기존 최고 성능 기준을 능가함을 입증하였다.

벤치마크

벤치마크방법론지표
stance-detection-us-election-2020-biden-onKE-MLM
Average F1: 0.7577
stance-detection-us-election-2020-trump-onKE-MLM
Average F1: 0.7877

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 공동 코딩, 즉시 사용 가능한 환경, 최적 가격 GPU로 AI 개발을 가속화하세요.

AI 공동 코딩
즉시 사용 가능한 GPU
최적 가격
시작하기

Hyper Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp
지식 강화 마스킹 언어 모델을 활용한 입장 탐지 | 연구 논문 | HyperAI초신경