树库 Treebank

树库是一种深加工语料库,其可被用于对句子进行分词、词性标注和句法结构关系的标注。

树库的分类

树库大体上可分为两类:短语结构树库、依存结构树库。

  • 短语结构树库:一般用句子的结构成分描述句子;
  • 依存结构树库:根据句子的依存结构建立。

树库的作用

  • 为自动句法分析器提供数据和平台;
  • 为句法学研究提供真实文本标注素材;
  • 进行句子内部词语义项和语义关系标注的基础。

参考来源

【1】王跃龙, 姬东鸿. 汉语树库综述 [J]. 当代语言学, 2009(1):47-55.