计算机科学 > 数据库
[提交于 2025年8月4日
(v1)
,最后修订 2025年8月5日 (此版本, v2)]
标题: M2:用于多模型工作负载的具有专用存储引擎的分析系统
标题: M2: An Analytic System with Specialized Storage Engines for Multi-Model Workloads
摘要: 现代数据分析工作负载越来越需要同时处理多种数据模型。 两种主要方法满足这一需求:多语言持久化和多模型数据库系统。 多语言持久化使用协调程序来管理多个独立的数据库系统,但由于其物理上分散的架构,导致通信成本较高。 同时,现有的多模型数据库系统依赖于针对特定数据模型优化的单一存储引擎,导致在不同数据模型上的处理效率低下。 为了解决这些限制,我们提出了M2,一个具有集成存储引擎的多模型分析系统。 M2将所有数据模型视为第一类实体,生成包含跨模型操作的查询计划。 为了有效结合不同模型的数据,该系统引入了一种称为多阶段哈希连接的专用跨模型连接算法。 我们的评估表明,M2在多模型分析中的性能比现有方法快达188倍,证实了我们所提出技术的有效性。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.