计算机科学 > 人机交互
[提交于 2025年8月14日
]
标题: MCP2OSC:通过自然语言的参数控制
标题: MCP2OSC: Parametric Control by Natural Language
摘要: 文本提示使得内容创作更加直观,但在实现复杂任务的高精度方面可能不足;旋钮或滑动条控制提供了精确调整,但代价是增加了复杂性。 为弥合旋钮和提示之间的差距,提出了一种新的MCP(模型上下文协议)服务器和一组独特的提示设计标准,以通过自然语言提示探索参数化的OSC(开放声音控制)控制。 通过14个实际的问答示例以及最佳实践和通用提示模板,本研究发现与MCP2OSC服务器集成的Claude在通过自然语言生成OSC消息、解释、搜索和可视化OSC消息、验证和调试OSC消息以及管理OSC地址模式方面是有效的。 MCP2OSC通过利用LLM(大型语言模型)处理复杂的OSC开发任务,并通过一个具有灵活精度控制的直观语言界面赋予人类创造力,从而增强人机协作:一种基于提示的OSC工具。 本研究通过利用LLM直接处理和生成可读性良好的OSC消息的优势,在网络协议层面上提供了一种创造性的MCP应用新视角。 结果表明其在基于LLM的多媒体设备通用控制机制方面的潜力。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.