实测HackerRank开源ATS:同份简历得分频繁变动
近日,HackerRank 推出的开源简历筛选系统在开发者社区引发热议。工程师实测指出,该工具对同一份简历的评分存在严重波动,暴露出大语言模型在招聘初筛中的根本性缺陷。 该ATS系统将简历解析为文本后,多次调用大语言模型提取结构化信息并结合开源代码库进行综合打分。为抑制随机性,系统默认模型温度设为0.1,但实测发现,即使温度降至0,项目与工作经验等主观维度的评分仍呈现剧烈方差。测试显示,部分候选人的项目评分在多次运行间相差超十分,而经验评分虽保持固定却缺乏有效锚点,无法区分初级与资深工程师。此外,系统赋予开源项目高达65%的权重,导致筛选标准过度偏向开源贡献,忽视传统工程背景人才,偏离实际技术价值评估。 行业分析认为,大语言模型虽擅长客观信息抽取,但难以胜任依赖上下文判断的经验评估。此类评分非确定性并非程序缺陷,而是提示词设计与评估框架的固有局限。业内警示,企业若盲目部署此类AI初筛工具,算法随机性将导致高质量简历被误筛。技术决策者在引入自动化招聘系统前,亟需重新校准评估维度与权重分配,以确保人才筛选的精准与公平。
