12 days ago
PrefPalette:基于潜在属性的个性化偏好建模
Shuyue Stella Li, Melanie Sclar, Hunter Lang, Ansong Ni, Jacqueline He, Puxin Xu, et al

摘要
个性化人工智能系统不仅需要了解用户偏好,还需要理解这些偏好的背后原因——然而,当前的偏好模型通常将人类判断视为黑箱。我们介绍了PrefPalette框架,该框架将偏好分解为属性维度,并以人类可解释的方式针对不同社会群体的价值观定制其偏好预测。PrefPalette通过两种方式实现了认知科学中称为多属性决策的原则:(1) 可扩展的反事实属性合成步骤,涉及生成合成训练数据以隔离单个属性效应(例如,正式性、幽默感、文化价值观);(2) 基于注意力的偏好建模,学习不同社会群体如何动态地权衡这些属性。这种方法超越了聚合偏好建模,捕捉到驱动人类判断的多样化评估框架。在对来自在线平台Reddit的45个社会群体进行评估时,PrefPalette在平均预测准确性上比GPT-4o高出46.6%。除了预测性能的提升外,PrefPalette还揭示了直观且特定于社区的特征:学术社区重视详尽性和刺激性,冲突导向社区看重讽刺和直接性,而支持型社区则强调同理心。通过建模由属性介导的人类判断结构,PrefPalette不仅提供了更优的偏好建模,还带来了透明且可解释的洞察,并为更加可信、价值意识更强的个性化应用迈出了第一步。