2 个月前

PIQA:自然语言中的物理常识推理

Yonatan Bisk; Rowan Zellers; Ronan Le Bras; Jianfeng Gao; Yejin Choi
PIQA:自然语言中的物理常识推理
摘要

在不使用刷子的情况下涂抹眼影时,应该使用棉签还是牙签?这类需要物理常识的问题对当今的自然语言理解系统构成了挑战。尽管最近的预训练模型(如BERT)在回答抽象领域的提问方面取得了进展——例如新闻文章和百科全书条目,这些领域中文字资料丰富——但在物理领域,由于报告偏差的存在,文字资料本身具有局限性。人工智能系统能否在没有亲身体验物理世界的情况下学会可靠地回答物理常识问题?本文介绍了物理常识推理任务及相应的基准数据集“物理交互:问题解答”(Physical Interaction: Question Answering, PIQA)。虽然人类在处理该数据集时表现出较高的准确性(95%),但大型预训练模型的表现却较为挣扎(77%)。我们分析了现有模型所缺乏的知识维度,这为未来的研究提供了重要的机会。