Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:2508.09160

帮助 | 高级搜索

计算机科学 > 机器学习

arXiv:2508.09160 (cs)
[提交于 2025年8月5日 ]

标题: 展示DiaData用于1型糖尿病研究

标题: Presenting DiaData for Research on Type 1 Diabetes

Authors:Beyza Cinar, Maria Maleshkova
摘要: 1型糖尿病(T1D)是一种自身免疫性疾病,会导致产生胰岛素的细胞被破坏,从而引起胰岛素缺乏,因此受影响个体依赖外部胰岛素注射。 然而,胰岛素可以降低血糖水平,并可能导致低血糖。 低血糖是血糖水平过低($\le$70 mg/dL)的严重事件,具有头晕、昏迷或死亡等危险副作用。 数据分析可以通过识别导致不良事件的个人模式和趋势,显著提升糖尿病护理。 特别是,机器学习(ML)模型可以预测血糖水平并提供早期警报。 然而,糖尿病和低血糖研究受限于大规模数据集的不可用性。 因此,这项工作系统地整合了15个数据集,以提供一个包含2510名受试者的大型数据库,其中血糖测量每5分钟记录一次。 总共包括1.49亿次测量,其中4%表示处于低血糖范围内的数值。 此外,提取了两个子数据库。 子数据库I包含人口统计信息,子数据库II包含心率数据。 整合后的数据集在性别和不同年龄层次上具有均衡分布。 作为进一步的贡献,评估了数据质量,揭示出数据不平衡和缺失值是一个重大挑战。 此外,对血糖水平和心率数据进行了相关性研究,显示在低血糖发生前15至55分钟之间存在关联。
摘要: Type 1 diabetes (T1D) is an autoimmune disorder that leads to the destruction of insulin-producing cells, resulting in insulin deficiency, as to why the affected individuals depend on external insulin injections. However, insulin can decrease blood glucose levels and can cause hypoglycemia. Hypoglycemia is a severe event of low blood glucose levels ($\le$70 mg/dL) with dangerous side effects of dizziness, coma, or death. Data analysis can significantly enhance diabetes care by identifying personal patterns and trends leading to adverse events. Especially, machine learning (ML) models can predict glucose levels and provide early alarms. However, diabetes and hypoglycemia research is limited by the unavailability of large datasets. Thus, this work systematically integrates 15 datasets to provide a large database of 2510 subjects with glucose measurements recorded every 5 minutes. In total, 149 million measurements are included, of which 4% represent values in the hypoglycemic range. Moreover, two sub-databases are extracted. Sub-database I includes demographics, and sub-database II includes heart rate data. The integrated dataset provides an equal distribution of sex and different age levels. As a further contribution, data quality is assessed, revealing that data imbalance and missing values present a significant challenge. Moreover, a correlation study on glucose levels and heart rate data is conducted, showing a relation between 15 and 55 minutes before hypoglycemia.
评论: 11页,7图,3表
主题: 机器学习 (cs.LG) ; 数据库 (cs.DB); 定量方法 (q-bio.QM)
引用方式: arXiv:2508.09160 [cs.LG]
  (或者 arXiv:2508.09160v1 [cs.LG] 对于此版本)
  https://doi.org/10.48550/arXiv.2508.09160
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Beyza Cinar [查看电子邮件]
[v1] 星期二, 2025 年 8 月 5 日 14:29:43 UTC (1,380 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
  • 其他格式
许可图标 查看许可
当前浏览上下文:
cs.LG
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-08
切换浏览方式为:
cs
cs.DB
q-bio
q-bio.QM

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号