2달 전

UnifiedSKG: 텍스트-텍스트 언어 모델을 활용한 통합 및 다중 작업 구조화 지식 기반

Tianbao Xie; Chen Henry Wu; Peng Shi; Ruiqi Zhong; Torsten Scholak; Michihiro Yasunaga; Chien-Sheng Wu; Ming Zhong; Pengcheng Yin; Sida I. Wang; Victor Zhong; Bailin Wang; Chengzu Li; Connor Boyle; Ansong Ni; Ziyu Yao; Dragomir Radev; Caiming Xiong; Lingpeng Kong; Rui Zhang; Noah A. Smith; Luke Zettlemoyer; Tao Yu
UnifiedSKG: 텍스트-텍스트 언어 모델을 활용한 통합 및 다중 작업 구조화 지식 기반
초록

구조화된 지식 기반(Structured Knowledge Grounding, SKG)은 데이터베이스의 의미 해석과 지식 베이스의 질문 응답 등과 같은 사용자 요청을 완료하기 위해 구조화된 지식을 활용합니다. SKG 작업의 입력과 출력이 이질적이기 때문에, 서로 다른 커뮤니티에서 별도로 연구되어 왔으며, 이는 체계적이고 호환 가능한 SKG 연구를 제한해왔습니다. 본 논문에서는 이러한 제한을 극복하기 위해 21개의 SKG 작업을 텍스트-텍스트 형식으로 통합하는 UnifiedSKG 프레임워크를 제안합니다. 이 프레임워크는 단일 작업, 영역, 또는 데이터셋에 국한되지 않고 체계적인 SKG 연구를 촉진하는 것을 목표로 합니다. 우리는 UnifiedSKG를 사용하여 다양한 크기의 T5 모델을 벤치마킹하고, 필요한 경우 간단한 수정을 통해 T5가 21개 작업 중 거의 모든 작업에서 최신 성능을 달성함을 보여줍니다. 또한 다중 작업 프리픽스 튜닝(multi-task prefix-tuning)이 대부분의 작업에서 성능을 개선하며, 전체적으로 크게 성능이 향상됨을 입증하였습니다. UnifiedSKG는 제로샷 및 소수 샷 학습(zero-shot and few-shot learning)에 대한 조사도 용이하게 하며, T0, GPT-3, 그리고 Codex가 SKG에서 제로샷 및 소수 샷 학습에 어려움을 겪음을 보여주었습니다. 우리는 또한 UnifiedSKG를 사용하여 SKG 작업 간 구조화된 지식 인코딩 변형에 대한 일련의 제어 실험(controlled experiments)을 수행하였습니다. UnifiedSKG는 더 많은 작업으로 쉽게 확장될 수 있으며, 오픈 소스 형태로 https://github.com/hkunlp/unifiedskg 에서 제공됩니다.

UnifiedSKG: 텍스트-텍스트 언어 모델을 활용한 통합 및 다중 작업 구조화 지식 기반 | 최신 연구 논문 | HyperAI초신경