Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:2510.13902

帮助 | 高级搜索

计算机科学 > 计算与语言

arXiv:2510.13902 (cs)
[提交于 2025年10月14日 ]

标题: 通过道德基础理论调查大型语言模型中的政治和人口统计学关联

标题: Investigating Political and Demographic Associations in Large Language Models Through Moral Foundations Theory

Authors:Nicole Smith-Vaniz, Harper Lyon, Lorraine Steigner, Ben Armstrong, Nicholas Mattei
摘要: 大型语言模型(LLMs)已经越来越多地融入日常生活中,对于许多互联网用户来说,在医学、人际关系甚至法律事务等领域,它们扮演着重要的建议者角色。这些角色的重要性引发了关于LLMs在困难的政治和道德领域中如何以及作出什么回应的问题,特别是关于可能的偏见的问题。为了量化LLMs中潜在偏见的性质,各种研究已经应用了道德基础理论(MFT),这是一个将人类道德推理分为五个维度的框架:伤害、公平性、群体忠诚、权威和纯洁性。先前的研究已经使用MFT来测量人类参与者在政治、国家和文化线上的差异。尽管已有部分分析针对角色扮演场景中LLMs对政治立场的回应进行了分析,但到目前为止,还没有研究直接评估LLMs回应中的道德倾向,也没有将LLMs的输出与可靠的人类数据联系起来。在本文中,我们直接分析LLMs的MFT回应与现有人类研究之间的差异,探讨常见可用的LLMs回应是否表现出意识形态倾向:通过其固有的回应、直接的政治意识形态表示,或者在从构建的人类角色视角进行回应时。我们评估LLMs是否固有地生成更符合某种政治意识形态的回应,并进一步检查LLMs通过明确提示和基于人口统计的角色扮演准确代表意识形态观点的能力。通过系统地分析LLMs在这些条件和实验中的行为,我们的研究提供了关于AI生成回应中政治和人口统计依赖程度的见解。
摘要: Large Language Models (LLMs) have become increasingly incorporated into everyday life for many internet users, taking on significant roles as advice givers in the domains of medicine, personal relationships, and even legal matters. The importance of these roles raise questions about how and what responses LLMs make in difficult political and moral domains, especially questions about possible biases. To quantify the nature of potential biases in LLMs, various works have applied Moral Foundations Theory (MFT), a framework that categorizes human moral reasoning into five dimensions: Harm, Fairness, Ingroup Loyalty, Authority, and Purity. Previous research has used the MFT to measure differences in human participants along political, national, and cultural lines. While there has been some analysis of the responses of LLM with respect to political stance in role-playing scenarios, no work so far has directly assessed the moral leanings in the LLM responses, nor have they connected LLM outputs with robust human data. In this paper we analyze the distinctions between LLM MFT responses and existing human research directly, investigating whether commonly available LLM responses demonstrate ideological leanings: either through their inherent responses, straightforward representations of political ideologies, or when responding from the perspectives of constructed human personas. We assess whether LLMs inherently generate responses that align more closely with one political ideology over another, and additionally examine how accurately LLMs can represent ideological perspectives through both explicit prompting and demographic-based role-playing. By systematically analyzing LLM behavior across these conditions and experiments, our study provides insight into the extent of political and demographic dependency in AI-generated responses.
主题: 计算与语言 (cs.CL) ; 计算机与社会 (cs.CY)
引用方式: arXiv:2510.13902 [cs.CL]
  (或者 arXiv:2510.13902v1 [cs.CL] 对于此版本)
  https://doi.org/10.48550/arXiv.2510.13902
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Nicholas Mattei [查看电子邮件]
[v1] 星期二, 2025 年 10 月 14 日 19:36:36 UTC (337 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
许可图标 查看许可
当前浏览上下文:
cs.CY
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-10
切换浏览方式为:
cs
cs.CL

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号