
摘要
本技术报告描述了针对自然问题(Natural Questions)数据集的新基线模型。我们的模型基于BERT,分别在长答案和短答案任务上将原始数据集论文中报告的模型F1分数与人类上限之间的差距相对减少了30%和50%。该基线模型已提交至官方NQ排行榜,网址为:ai.google.com/research/NaturalQuestions。代码、预处理数据和预训练模型可在以下地址获取:https://github.com/google-research/language/tree/master/language/question_answering/bert_joint。