计算机科学 > 计算机视觉与模式识别
[提交于 2025年8月20日
]
标题: 通过领域提示和并行注意进行对话中的可推广参与度估计
标题: Generalizable Engagement Estimation in Conversation via Domain Prompting and Parallel Attention
摘要: 准确的参与度估计对于自适应人机交互系统至关重要,然而在不同领域中的鲁棒部署受到跨领域泛化能力差和建模复杂交互动态挑战的阻碍。为解决这些问题,我们提出了DAPA(领域自适应并行注意力),一种用于可泛化对话参与度建模的新框架。 DAPA通过在输入前添加可学习的领域特定向量引入领域提示机制,明确地将模型条件设置为数据来源,以促进领域感知的适应,同时保持可泛化的参与度表示。 为了捕捉交互同步性,该框架还集成了一个并行交叉注意力模块,该模块显式地对齐参与者之间的反应状态(前向BiLSTM)和预期状态(后向BiLSTM)。大量实验表明,DAPA在多个跨文化及跨语言基准上建立了新的最先进性能,特别是在NoXi-J测试集上,相对于强基线模型,其一致性相关系数(CCC)绝对提升了0.45。 我们的方法优势也通过在MultiMediate'25多领域参与度估计挑战赛中获得第一名得到了证实。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.