天体物理学 > 地球与行星天体物理学
[提交于 2022年1月7日
]
标题: 无监督机器学习在系外行星传输光谱探索性数据分析中的应用
标题: Unsupervised Machine Learning for Exploratory Data Analysis of Exoplanet Transmission Spectra
摘要: 凌星光谱学是一种强大的工具,可用于解码太阳系外行星大气的化学组成。 本文专注于分析凌星系外行星光谱数据的无监督技术。 我们演示了以下方法:i) 数据清理与验证,ii) 基于汇总统计量(位置和变异性估计)的初始探索性数据分析,iii) 探索和量化数据中存在的相关性,iv) 数据预处理和线性变换到主成分,v) 维度约简和流形学习,vi) 聚类和异常检测,vii) 数据可视化与解释。 为了说明所提出的无监督方法,我们使用了一个著名的公共基准合成凌星光谱数据集。 我们发现光谱数据具有高度的相关性,这需要适当的低维表示。 我们探索了许多用于此类维度约简的技术,并在汇总统计量、主成分等方面确定了几种合适的选项。 我们在主成分基中发现了有趣结构,即对应于底层大气不同化学环境的良好定义的分支。 我们证明,这些分支可以成功地通过K均值聚类算法以完全无监督的方式恢复。 我们提倡用前三个主成分来表示光谱数据,以便揭示数据中的现有结构并快速表征行星的化学类别。
当前浏览上下文:
astro-ph.EP
切换浏览方式为:
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.