CORD 信息抽取数据集

CORD 全称 Consolidated Receipt Dataset for Post-OCR Parsing,是一个用于 Post-OCR 解析的收据数据集。该数据集包含数千张印度尼西亚收据(包含用于 OCR 的图像及 box/text 标注,以及用于解析的多级语义标签)。