自然语言生成 Natural Language Generation

自然语言生成 NLG 是让计算机具有与人一样的表达和写作能力的技术,即可根据一些关键信息及其在机器内部的表达形式,经过规划自动生成一段高质量的自然语言文本。

NLG 和 NLP 的联系

自然语言生成是自然语言处理的一部分,指基于知识库或逻辑形式等机器表述系统生成自然语言,可看作是将资料转换成自然语言表述的翻译器。

自然语言生成可视为自然语言理解的反向:自然语言理解系统须要厘清输入句的意涵,从而产生机器表述语言;自然语言生成系统则是决定如何把概念转化成语言。

NLG 实现模型

  • 明确的语言模型(例如文法);
  • 运用根据真人所写的文本分析而成的统计模型。

NLG 实现方法

  • 决定内容:决定在文本里置入哪些资讯;
  • 架构文件:所传达资讯的整体组织;
  • 聚集语句:合并类似的句子,让文本更可读、更自然;
  • 选择字词:选用表达概念的文字;
  • 指涉语生成:产生能辨认物体或地区的指涉语;
  • 实现文本:根据语法学、构词学、正写法的规则产生实际的文本。
相关词:自然语言处理、自然语言生成