计算机科学 > 计算机与社会
[提交于 2025年10月14日
]
标题: 伦理-BERT:一种用于伦理和非伦理内容分类的增强深度学习模型
标题: Ethic-BERT: An Enhanced Deep Learning Model for Ethical and Non-Ethical Content Classification
摘要: 开发能够进行微妙伦理推理的AI系统至关重要,因为它们越来越多地影响人类决策,但现有模型通常依赖于表面相关性,而不是基于原则的道德理解。 本文介绍了Ethic-BERT,这是一个基于BERT的模型,用于四个领域的伦理内容分类:常识、正义、美德和义务论。 利用ETHICS数据集,我们的方法结合了强大的预处理以解决词汇稀疏性和上下文模糊性,同时采用了先进的微调策略,如完整模型解冻、梯度累积和自适应学习率调度。 为了评估鲁棒性,我们采用了一个对抗过滤的“Hard Test”分割,隔离复杂的伦理困境。 实验结果表明,Ethic-BERT优于基线模型,在标准测试中平均准确率达到82.32%,在正义和美德方面有显著提升。 此外,提出的Ethic-BERT在HardTest中平均准确率提高了15.28%。 这些发现有助于通过具有偏差意识的预处理和提出的增强AI模型实现性能提升和可靠决策。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.