2달 전

ChatGPT를 사용한 열 유형 주석

Keti Korini; Christian Bizer
ChatGPT를 사용한 열 유형 주석
초록

열 유형 주석은 관계형 테이블의 각 열에 해당 열에 포함된 값의 의미론적 유형을 부여하는 작업입니다. 데이터 레이크 환경에서 데이터 검색과 데이터 통합을 위한 중요한 전처리 단계로 열 유형 주석이 사용됩니다. 최신 열 유형 주석 방법들은 지식 그래프의 속성과 테이블 열을 일치시키는 방식이나 BERT와 같은 사전 학습된 언어 모델을 미세 조정(fine-tune)하여 열 유형 주석을 수행하는 방식을 기반으로 합니다. 본 연구에서는 이러한 접근법과 달리 ChatGPT를 활용한 열 유형 주석 방법을 탐구합니다. 우리는 제로샷(zero-shot) 및 소수 샷(few-shot) 설정에서 다양한 프롬프트 설계를 평가하고, 모델에 작업 정의와 상세 지침을 제공하는 실험을 진행하였습니다. 또한, 먼저 테이블에서 설명되는 엔티티의 클래스를 결정하고, 이 클래스에 따라 전체 어휘집(vocabulary)의 관련 부분 집합만 사용하여 ChatGPT에게 열 주석을 요청하는 두 단계 테이블 주석 파이프라인을 구현하였습니다. 지침과 두 단계 파이프라인을 사용함으로써, ChatGPT는 제로샷 및 원샷(one-shot) 설정에서 85% 이상의 F1 점수를 달성하였습니다. RoBERTa 모델이 비슷한 F1 점수를 얻기 위해서는 356개의 예제로 미세 조정(fine-tune)되어야 하는데, 이 비교 결과는 ChatGPT가 작업 특异性가 없는 혹은 최소한의 작업 특异性 시연만으로도 경쟁력 있는 결과를 제공할 수 있음을 보여줍니다.

ChatGPT를 사용한 열 유형 주석 | 최신 연구 논문 | HyperAI초신경