Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:2508.01779

帮助 | 高级搜索

计算机科学 > 计算机与社会

arXiv:2508.01779 (cs)
[提交于 2025年8月3日 ]

标题: 人工智能增强的研究过程:历史学家的视角

标题: The AI-Augmented Research Process: A Historian's Perspective

Authors:Christian Henriot
摘要: 本文详细介绍了人工智能,尤其是大型语言模型如何融入历史研究工作流程的案例研究。 该工作流程分为九个步骤,涵盖了从问题提出到传播和可重复性的整个研究周期,并包括两个框架阶段,分别处理设置和文档记录。 每个研究步骤在三个操作领域中进行映射:1. LLM,指分配给语言模型的任务;2. 思维,指历史学家的概念和解释性贡献;3. 计算,指基于传统编程的方法,如Python、R、Cytoscape等。 该研究强调,LLM并不是领域专业知识的替代品,但可以支持并扩展历史学家处理、验证和解释大量文本语料库的能力。 同时,它突出了严格质量控制、交叉核对输出结果以及保持学术标准的必要性。 通过对三位上海商人的深入研究,本文还提出了一种基于真实案例研究的结构化工作流程,该流程将历史学家的认知劳动与计算工具和生成式AI结合起来。 本文通过展示如何通过透明和可重复的工作流程负责任地将人工智能纳入历史研究,做出了方法论和认识论上的贡献。 本文旨在为面对日益复杂的AI增强学术环境的历史学者提供实用指南和批判性反思。
摘要: This paper presents a detailed case study of how artificial intelligence, especially large language models, can be integrated into historical research workflows. The workflow is divided into nine steps, covering the full research cycle from question formulation to dissemination and reproducibility, and includes two framing phases that address setup and documentation. Each research step is mapped across three operational domains: 1. LLM, referring to tasks delegated to language models; 2. Mind, referring to conceptual and interpretive contributions by the historian; and 3. Computational, referring to conventional programming-based methods like Python, R, Cytoscape, etc. The study emphasizes that LLMs are not replacements for domain expertise but can support and expand capacity of historians to process, verify, and interpret large corpora of texts. At the same time, it highlights the necessity of rigorous quality control, cross-checking outputs, and maintaining scholarly standards. Drawing from an in-depth study of three Shanghai merchants, the paper also proposes a structured workflow based on a real case study hat articulates the cognitive labor of the historian with both computational tools and generative AI. This paper makes both a methodological and epistemological contribution by showing how AI can be responsibly incorporated into historical research through transparent and reproducible workflows. It is intended as a practical guide and critical reflection for historians facing the increasingly complex landscape of AI-enhanced scholarship.
评论: 57页,6图
主题: 计算机与社会 (cs.CY)
引用方式: arXiv:2508.01779 [cs.CY]
  (或者 arXiv:2508.01779v1 [cs.CY] 对于此版本)
  https://doi.org/10.48550/arXiv.2508.01779
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Christian Henriot [查看电子邮件]
[v1] 星期日, 2025 年 8 月 3 日 14:34:36 UTC (1,911 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
许可图标 查看许可
当前浏览上下文:
cs.CY
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-08
切换浏览方式为:
cs

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号