计算机科学 > 信息检索
[提交于 2025年10月2日
]
标题: IoD研究:通过数据互联网对私有异构数据的深度研究
标题: IoDResearch: Deep Research on Private Heterogeneous Data via the Internet of Data
摘要: 多源、异构和多模态科学数据的快速增长日益暴露了传统数据管理的局限性。 大多数现有的深度研究(DR)工作主要集中在网络搜索上,而忽略了本地私有数据。 因此,这些框架对于私有数据的检索效率较低,并且无法符合FAIR原则,最终导致效率低下和可重用性有限。 为此,我们提出了IoDResearch(数据研究互联网),一种以私有数据为中心的深度研究框架,实现了数据互联网范式。 IoDResearch将异构资源封装为符合FAIR原则的数字对象,并进一步将其细化为原子知识单元和知识图谱,形成异构图索引,用于多粒度检索。 在此表示基础上,一个多智能体系统支持可靠的问答和结构化科学报告生成。 此外,我们建立了IoD深度研究基准,以系统评估IoD场景下的数据表示和深度研究能力。 在检索、问答和报告写作任务上的实验结果表明,IoDResearch始终超越了代表性的RAG和深度研究基线。 总体而言,IoDResearch展示了在数据互联网范式下以私有数据为中心的深度研究的可行性,为更可信、可重用和自动化的科学发现铺平了道路。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.