计算机科学 > 信息检索
[提交于 2025年10月16日
]
标题: 使用因果语言模型进行领英动态的大规模检索
标题: Large Scale Retrieval for the LinkedIn Feed using Causal Language Models
摘要: 在像LinkedIn动态这样的大规模推荐系统中,检索阶段对于将数亿个潜在候选者缩小到可管理的子集以进行排序至关重要。LinkedIn的动态从成员网络之外提供基于成员主题兴趣的建议内容,其中在几毫秒的延迟预算和每秒数千次的入站QPS下,从数亿个候选者中检索出2000个候选者。本文介绍了一种新颖的检索方法,该方法微调了一个大型因果语言模型(Meta的LLaMA 3)作为双编码器,仅使用文本输入为用户(成员)和内容(项目)生成高质量的嵌入。我们描述了端到端的流程,包括嵌入生成的提示设计、在LinkedIn规模上的微调技术以及低延迟、成本效益高的在线服务基础设施。我们分享了关于如何在提示中量化数值特征以使信息在嵌入中正确编码的发现,从而促进检索层和排序层之间的更好对齐。该系统通过离线指标和在线A/B测试进行了评估,结果显示了成员参与度的显著提升。我们观察到新成员有显著的提升,他们通常缺乏强大的网络连接,这表明高质量的建议内容有助于留存。这项工作展示了生成式语言模型如何在工业应用中有效适应实时、高吞吐量的检索。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.