
摘要
在物体识别任务中,哪种范式更优——判别式推理(速度快,但可能存在捷径学习问题)还是生成式模型(速度较慢,但可能更具鲁棒性)?我们基于生成建模领域的最新进展,将文本到图像模型转化为分类器,从而得以系统研究其行为,并与判别式模型及人类心理物理学数据进行对比。研究揭示了生成式分类器的四个引人注目的涌现特性:其形状偏好(shape bias)达到创纪录的人类水平(Imagen模型为99%),在分布外样本上的准确率接近人类水平,与人类分类错误模式的对齐程度达到当前最优,且能够理解某些知觉错觉。结果表明,尽管当前主流的人类物体识别建模范式仍以判别式推理为主,但零样本生成式模型在拟合人类物体识别行为方面表现出令人惊讶的优异性能。