Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:2508.00287

帮助 | 高级搜索

计算机科学 > 计算机视觉与模式识别

arXiv:2508.00287 (cs)
[提交于 2025年8月1日 ]

标题: 基于空间自注意力和联邦学习的隐私保护驾驶员困倦检测

标题: Privacy-Preserving Driver Drowsiness Detection with Spatial Self-Attention and Federated Learning

Authors:Tran Viet Khoa, Do Hai Son, Mohammad Abu Alsheikh, Yibeltal F Alem, Dinh Thai Hoang
摘要: 驾驶疲劳是交通事故的主要原因之一,被公认为导致交通相关死亡的主要因素之一。然而,在现实世界环境中,由于不同个体的面部数据是分散且高度多样的,准确检测疲劳仍然是一项具有挑战性的任务。在本文中,我们提出了一种新的疲劳检测框架,该框架旨在与异构和分散的数据有效配合。我们的方法开发了一种新的空间自注意力(SSA)机制,结合长短期记忆(LSTM)网络,以更好地提取关键面部特征并提高检测性能。为了支持联邦学习,我们采用了一种梯度相似性比较(GSC),在聚合之前从不同操作员中选择最相关的训练模型。这提高了全局模型的准确性和鲁棒性,同时保护了用户隐私。我们还开发了一个定制工具,通过提取帧、检测和裁剪人脸以及应用旋转、翻转、亮度调整和缩放等数据增强技术,自动处理视频数据。实验结果表明,在联邦学习环境下,我们的框架实现了89.9%的检测准确率,在各种部署场景下优于现有方法。结果展示了我们方法在处理现实世界数据变化方面的有效性,并突显了其在智能交通系统中部署的潜力,通过早期可靠的疲劳检测来提高道路安全。
摘要: Driver drowsiness is one of the main causes of road accidents and is recognized as a leading contributor to traffic-related fatalities. However, detecting drowsiness accurately remains a challenging task, especially in real-world settings where facial data from different individuals is decentralized and highly diverse. In this paper, we propose a novel framework for drowsiness detection that is designed to work effectively with heterogeneous and decentralized data. Our approach develops a new Spatial Self-Attention (SSA) mechanism integrated with a Long Short-Term Memory (LSTM) network to better extract key facial features and improve detection performance. To support federated learning, we employ a Gradient Similarity Comparison (GSC) that selects the most relevant trained models from different operators before aggregation. This improves the accuracy and robustness of the global model while preserving user privacy. We also develop a customized tool that automatically processes video data by extracting frames, detecting and cropping faces, and applying data augmentation techniques such as rotation, flipping, brightness adjustment, and zooming. Experimental results show that our framework achieves a detection accuracy of 89.9% in the federated learning settings, outperforming existing methods under various deployment scenarios. The results demonstrate the effectiveness of our approach in handling real-world data variability and highlight its potential for deployment in intelligent transportation systems to enhance road safety through early and reliable drowsiness detection.
主题: 计算机视觉与模式识别 (cs.CV)
引用方式: arXiv:2508.00287 [cs.CV]
  (或者 arXiv:2508.00287v1 [cs.CV] 对于此版本)
  https://doi.org/10.48550/arXiv.2508.00287
通过 DataCite 发表的 arXiv DOI(待注册)

提交历史

来自: Viet Khoa Tran [查看电子邮件]
[v1] 星期五, 2025 年 8 月 1 日 03:12:01 UTC (1,451 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
  • 其他格式
许可图标 查看许可
当前浏览上下文:
cs.CV
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-08
切换浏览方式为:
cs

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号