计算机科学 > 机器学习
[提交于 2023年5月29日
(v1)
,最后修订 2023年7月31日 (此版本, v2)]
标题: DeepVAT:一种用于图像数据集聚类评估的自监督技术
标题: DeepVAT: A Self-Supervised Technique for Cluster Assessment in Image Datasets
摘要: 估计无标签、复杂且高维数据集(如图像)中的聚类数量和聚类结构对传统聚类算法来说是一个挑战。 近年来,一种基于矩阵重新排序的算法称为视觉评估趋势(VAT),以及其变体吸引了来自不同领域的许多研究人员,以估计数据中存在的聚类数量和固有聚类结构。 然而,这些算法在处理图像数据时面临重大挑战,因为它们无法有效捕捉图像中固有的关键特征。 为了克服这些限制,我们提出了一种基于深度学习的框架,以实现对复杂图像数据集的聚类结构评估。 我们的方法利用自监督深度神经网络生成数据的代表性嵌入。 这些嵌入随后通过t分布随机邻域嵌入(t-SNE)降维到2维,并输入到基于VAT的算法中以估计潜在的聚类结构。 重要的是,我们的框架不依赖于聚类数量的先验知识。 我们在四个基准图像数据集(即MNIST、FMNIST、CIFAR-10和INTEL)上,与最先进的VAT家族算法以及其他两种深度聚类算法相比,展示了更优越的性能。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.