Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > econ > arXiv:1809.00741

帮助 | 高级搜索

经济学 > 一般经济学

arXiv:1809.00741 (econ)
[提交于 2018年9月3日 ]

标题: “读我的嘴唇”:使用自动文本分析将政治家按党派和意识形态分类

标题: "Read My Lips": Using Automatic Text Analysis to Classify Politicians by Party and Ideology

Authors:Eitan Sapiro-Gheiler
摘要: 政治话语的日益数字化为使用文本分析研究政治行为的新维度打开了大门。 这项工作研究了来自美国国会记录的单词级统计数据的价值——其中包含了美国国会所有演讲的全文——用于研究参议员的思想立场和行为。 应用机器学习技术,我们利用这些数据根据政党自动分类参议员,根据所使用的具体方法,准确率在70%到95%之间。 我们还表明,使用文本预测DW-NOMINATE分数——一种常用的思想代理指标——并不能改善这些已经成功的成果。 当将这种分类应用于与训练集相隔四年或更久的国会会议文本时,效果会下降,这表明选民需要动态更新他们根据政治话语评估政党的启发式方法。 基于文本的预测不如基于投票行为的预测准确,这支持了这样的理论:即投票记录代表了政治家更大的承诺,因此是他们思想偏好更准确的反映。 然而,这里研究的机器学习方法的整体成功表明,政治演讲对党派归属具有高度预测性。 除了这些发现之外,这项工作还介绍了与使用政治话语数据相关的计算工具和方法。
摘要: The increasing digitization of political speech has opened the door to studying a new dimension of political behavior using text analysis. This work investigates the value of word-level statistical data from the US Congressional Record--which contains the full text of all speeches made in the US Congress--for studying the ideological positions and behavior of senators. Applying machine learning techniques, we use this data to automatically classify senators according to party, obtaining accuracy in the 70-95% range depending on the specific method used. We also show that using text to predict DW-NOMINATE scores, a common proxy for ideology, does not improve upon these already-successful results. This classification deteriorates when applied to text from sessions of Congress that are four or more years removed from the training set, pointing to a need on the part of voters to dynamically update the heuristics they use to evaluate party based on political speech. Text-based predictions are less accurate than those based on voting behavior, supporting the theory that roll-call votes represent greater commitment on the part of politicians and are thus a more accurate reflection of their ideological preferences. However, the overall success of the machine learning approaches studied here demonstrates that political speeches are highly predictive of partisan affiliation. In addition to these findings, this work also introduces the computational tools and methods relevant to the use of political speech data.
主题: 一般经济学 (econ.GN) ; 计算与语言 (cs.CL)
引用方式: arXiv:1809.00741 [econ.GN]
  (或者 arXiv:1809.00741v1 [econ.GN] 对于此版本)
  https://doi.org/10.48550/arXiv.1809.00741
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Eitan Sapiro-Gheiler [查看电子邮件]
[v1] 星期一, 2018 年 9 月 3 日 23:13:00 UTC (592 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • 其他格式
查看许可
当前浏览上下文:
econ.GN
< 上一篇   |   下一篇 >
新的 | 最近的 | 2018-09
切换浏览方式为:
cs
cs.CL
econ
q-fin
q-fin.EC

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号