Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:2509.21729

帮助 | 高级搜索

计算机科学 > 数据结构与算法

arXiv:2509.21729 (cs)
[提交于 2025年9月26日 ]

标题: 新的并行和流式算法用于有向密集子图

标题: New Parallel and Streaming Algorithms for Directed Densest Subgraph

Authors:Slobodan Mitrović, Theodore Pan, Mahdi Qaempanah, Mohammad Amin Raeisi
摘要: 寻找密集子图是一个基本问题,广泛应用于社区检测、聚类和数据挖掘。 我们的工作集中在计算模型中查找有向图中的近似最稠密子图,这些计算模型用于处理大规模数据。 我们考虑了两种这样的模型:大规模并行计算(MPC)和半流式计算。 我们展示了如何在 $\tilde{O}(\sqrt{\log n})$ MPC 轮次中找到一个 $(2+\varepsilon)$-近似解,且每台机器的内存使用量为次线性。 这比 Bahmani 等人(WAW 2014)和 Mitrović & Pan(ICML 2024)的最新结果有所改进。 此外,我们展示了如何在半流式计算中通过一次遍历找到一个 $O(\log n)$-近似解。 这与之前的工作形成鲜明对比,之前的工作表明一次遍历只能得到 $\tilde{\Omega}(n^{1/6})$-近似解;只有在随机流的情况下才能获得更好的近似(Mitrović & Pan)。 这是第一个确定性的单遍历半流式算法,用于最稠密子图问题,适用于无向图和有向图。 我们的半流式方法也是一种仅插入的动态算法,在使用次线性内存的同时,实现了首个具有 $O(\log^2 n)$ 最坏情况更新时间的有向最稠密子图算法。 我们以两种方式对我们的方法进行了实证评估。 首先,我们展示了我们的单遍历半流式算法的表现远优于理论保证。 具体来说,它在时间序列数据集上的近似效果与 Bahmani 等人(VLDB 2012)提出的 $O(\log n)$-遍历算法的 $(2+\varepsilon)$-近似效果相匹配。 其次,我们证明了我们的 MPC 算法所需的轮次数少于之前的工作。
摘要: Finding dense subgraphs is a fundamental problem with applications to community detection, clustering, and data mining. Our work focuses on finding approximate densest subgraphs in directed graphs in computational models for processing massive data. We consider two such models: Massively Parallel Computation (MPC) and semi-streaming. We show how to find a $(2+\varepsilon)$-approximation in $\tilde{O}(\sqrt{\log n})$ MPC rounds with sublinear memory per machine. This improves the state-of-the-art results by Bahmani et al. (WAW 2014) and Mitrovi\'c & Pan (ICML 2024). Moreover, we show how to find an $O(\log n)$-approximation in a single pass in semi-streaming. This is in stark contrast to prior work, which implies $\tilde{\Omega}(n^{1/6})$-approximation for a single pass; a better approximation is known only for randomized streams (Mitrovi\'c & Pan). This is the first deterministic single-pass semi-streaming algorithm for the densest subgraph problem, both for undirected and directed graphs. Our semi-streaming approach is also an insertion-only dynamic algorithm, attaining the first directed densest subgraph algorithm with $O(\log^2 n)$ worst-case update time while using sub-linear memory. We empirically evaluate our approaches in two ways. First, we illustrate that our single-pass semi-streaming algorithm performs much better than the theoretical guarantee. Specifically, its approximation on temporal datasets matches the $(2+\varepsilon)$-approximation of an $O(\log n)$-pass algorithm by Bahmani et al. (VLDB 2012). Second, we demonstrate that our MPC algorithm requires fewer rounds than prior work.
主题: 数据结构与算法 (cs.DS)
引用方式: arXiv:2509.21729 [cs.DS]
  (或者 arXiv:2509.21729v1 [cs.DS] 对于此版本)
  https://doi.org/10.48550/arXiv.2509.21729
通过 DataCite 发表的 arXiv DOI(待注册)

提交历史

来自: Theodore Pan [查看电子邮件]
[v1] 星期五, 2025 年 9 月 26 日 00:56:11 UTC (207 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
  • 其他格式
许可图标 查看许可
当前浏览上下文:
cs.DS
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-09
切换浏览方式为:
cs

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号