2달 전
IPC: 그래프 구조 데이터 학습을 위한 벤치마크 데이터 세트
Patrick Ferber; Tengfei Ma; Siyu Huo; Jie Chen; Michael Katz

초록
벤치마크 데이터 세트는 그래프 기반 머신 러닝 방법의 평가에 있어 필수적인 요소입니다. 우리는 그래프 분류, 회귀 및 관련 작업을 벤치마킹하기 위해 국제 플래닝 경진대회(International Planning Competitions, IPC)에서 편집한 새로운 데이터 세트를 공개합니다. 이 데이터 세트는 AI 계획 문제를 기반으로 한 그래프 구조 자체가 흥미로울 뿐만 아니라, 일반적으로 사용되는 벤치마크와는 명확히 다른 특성을 가지고 있습니다. 이 데이터 세트는 IPC라는 이름으로, 큰 크기와 왜도 분포를 가진 그래프들을 포함하는 두 가지 독립된 버전인 그라운드(grounded)와 리프트(lifted)로 구성되어 있습니다. 이러한 특성은 그래프 커널과 그래프 신경망 등의 그래프 모델 계산에 상당한 도전을 제시합니다. 이 데이터 세트의 그래프들은 방향성이 있으며, 리프트 버전은 순환하지 않는(acyclic) 구조를 가지고 있어 방향성(순환하지 않는) 구조에 특화된 모델들의 벤치마킹 기회를 제공합니다. 또한, 그래프 생성기와 라벨링이 컴퓨터 프로그램으로 이루어져 있어 더 큰 규모의 데이터 세트 확장이 용이하게 이루어질 수 있습니다. 이 데이터 세트는 \url{https://github.com/IBM/IPC-graph-data}에서 접근할 수 있습니다.