
摘要
本文探讨了从现实世界的食物消费数据中识别食物对之间替代关系的问题,作为向更健康的食物推荐迈出的第一步。我们的方法受到语言学中的分布假设的启发。具体而言,我们认为在相似情境下被消费的食物更有可能在营养上具有相似性。例如,如果火鸡三明治和鸡肉三明治通常都与薯条和沙拉一起食用,那么火鸡三明治可以被视为鸡肉三明治的一个合适替代品。为了评估我们的方法,我们从MyFitnessPal的公开食物日记条目中构建了一个现实世界的食物消费数据集,并通过众包服务获得了人类对食物替代品的真实判断。实验结果表明,该方法在识别合适的替代品方面是有效的。