8 个月前

自然语言处理

自然语言处理

Florian Bremm¹ Patrick Gustav Blaneck¹ Tobias Bornheim² Niklas Grieger¹,³ Stephan Bialonski¹,∗

摘要

在线媒体评论中的性别歧视是一个普遍存在的挑战，通常以微妙的方式表现出来，这使得管理工作变得复杂，因为不同个体对何为性别歧视的解读可能存在差异。我们研究了单语和多语种的开源文本嵌入模型，旨在可靠地检测奥地利一家报纸德语在线评论中的性别歧视和厌女症。我们观察到，基于文本嵌入训练的分类器能够密切模仿人类标注者的个人判断。我们的方法在 GermEval 2024 GerMS-Detect 子任务 1 挑战中表现出稳健的性能，平均宏 F1 分数达到 0.597（排名第 4，根据 Codabench 报告）。在 GerMS-Detect 子任务 2 中，该方法也准确预测了人类标注的分布情况，平均 Jensen-Shannon 距离为 0.301（排名第 2）。我们方法的计算效率表明其具有跨多种语言和语言环境的大规模应用潜力。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

8 个月前

自然语言处理

自然语言处理

Florian Bremm¹ Patrick Gustav Blaneck¹ Tobias Bornheim² Niklas Grieger¹,³ Stephan Bialonski¹,∗

摘要

在线媒体评论中的性别歧视是一个普遍存在的挑战，通常以微妙的方式表现出来，这使得管理工作变得复杂，因为不同个体对何为性别歧视的解读可能存在差异。我们研究了单语和多语种的开源文本嵌入模型，旨在可靠地检测奥地利一家报纸德语在线评论中的性别歧视和厌女症。我们观察到，基于文本嵌入训练的分类器能够密切模仿人类标注者的个人判断。我们的方法在 GermEval 2024 GerMS-Detect 子任务 1 挑战中表现出稳健的性能，平均宏 F1 分数达到 0.597（排名第 4，根据 Codabench 报告）。在 GerMS-Detect 子任务 2 中，该方法也准确预测了人类标注的分布情况，平均 Jensen-Shannon 距离为 0.301（排名第 2）。我们方法的计算效率表明其具有跨多种语言和语言环境的大规模应用潜力。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供