Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:2508.01733

帮助 | 高级搜索

计算机科学 > 计算几何

arXiv:2508.01733 (cs)
[提交于 2025年8月3日 ]

标题: 拓扑:具有抗非度量性和稀疏性鲁棒性的差异数据的力导向欧几里得嵌入

标题: Topolow: Force-Directed Euclidean Embedding of Dissimilarity Data with Robustness Against Non-Metricity and Sparsity

Authors:Omid Arhami, Pejman Rohani
摘要: 基于成对差异矩阵将一组对象嵌入到低维欧几里得空间中的问题是数据分析、机器学习和统计学中的基本问题。 然而,当输入的差异不满足度量或欧几里得公理时,许多标准分析方法的假设会被违反。 我们提出了Topolow的数学和统计基础,Topolow是一种受物理学启发的、无需梯度的优化框架,用于此类嵌入问题。 Topolow在概念上与力导向图绘制算法相关,但其目标是定量度量重建,这使其根本区别于其他方法。 它将对象建模为物理系统中的粒子,并通过顺序的、随机的成对交互进行新颖的优化方案,从而避免计算全局梯度,并在面对稀疏数据时对收敛到局部最优具有鲁棒性。 Topolow在拉普拉斯误差模型下最大化似然,对异常值和异质误差具有鲁棒性,并能正确处理截断数据。 至关重要的是,Topolow不需要输入的差异是度量的,这使其成为将非度量测量嵌入有效欧几里得空间的鲁棒解决方案,从而使得可以使用标准分析工具。 我们展示了Topolow在重建稀疏和非欧几里得数据几何结构方面相比标准多维尺度分析(MDS)方法的优越性能。 本文正式化了该算法,该算法最初在抗原映射背景下以Topolow的形式提出(Arhami和Rohani,2025)(开放获取),并着重介绍了其度量嵌入和数学特性,以供更广泛的受众了解。 通用函数Euclidify可在R包topolow中使用。
摘要: The problem of embedding a set of objects into a low-dimensional Euclidean space based on a matrix of pairwise dissimilarities is fundamental in data analysis, machine learning, and statistics. However, the assumptions of many standard analytical methods are violated when the input dissimilarities fail to satisfy metric or Euclidean axioms. We present the mathematical and statistical foundations of Topolow, a physics-inspired, gradient-free optimization framework for such embedding problems. Topolow is conceptually related to force-directed graph drawing algorithms but is fundamentally distinguished by its goal of quantitative metric reconstruction. It models objects as particles in a physical system, and its novel optimization scheme proceeds through sequential, stochastic pairwise interactions, which circumvents the need to compute a global gradient and provides robustness against convergence to local optima, especially for sparse data. Topolow maximizes the likelihood under a Laplace error model, robust to outliers and heterogeneous errors, and properly handles censored data. Crucially, Topolow does not require the input dissimilarities to be metric, making it a robust solution for embedding non-metric measurements into a valid Euclidean space, thereby enabling the use of standard analytical tools. We demonstrate the superior performance of Topolow compared to standard Multidimensional Scaling (MDS) methods in reconstructing the geometry of sparse and non-Euclidean data. This paper formalizes the algorithm, first introduced as Topolow in the context of antigenic mapping in (Arhami and Rohani, 2025) (open access), with emphasis on its metric embedding and mathematical properties for a broader audience. The general-purpose function Euclidify is available in the R package topolow.
主题: 计算几何 (cs.CG) ; 机器学习 (stat.ML)
引用方式: arXiv:2508.01733 [cs.CG]
  (或者 arXiv:2508.01733v1 [cs.CG] 对于此版本)
  https://doi.org/10.48550/arXiv.2508.01733
通过 DataCite 发表的 arXiv DOI(待注册)

提交历史

来自: Omid Arhami [查看电子邮件]
[v1] 星期日, 2025 年 8 月 3 日 12:19:17 UTC (231 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
  • 其他格式
许可图标 查看许可
当前浏览上下文:
cs.CG
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-08
切换浏览方式为:
cs
stat
stat.ML

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号