Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:2511.02826

帮助 | 高级搜索

计算机科学 > 计算机视觉与模式识别

arXiv:2511.02826 (cs)
[提交于 2025年11月4日 ]

标题: PLUTO-4:前沿病理学基础模型

标题: PLUTO-4: Frontier Pathology Foundation Models

Authors:Harshith Padigela, Shima Nofallah, Atchuth Naveen Chilaparasetti, Ryun Han, Andrew Walker, Judy Shen, Chintan Shah, Blake Martin, Aashish Sood, Elliot Miller, Ben Glass, Andy Beck, Harsha Pokkalla, Syed Ashar Javed
摘要: 基于大规模病理图像语料库训练的基础模型在多种组织病理学任务中表现出强大的迁移能力。 在此基础上,我们引入了PLUTO-4,这是我们下一代病理基础模型,将病理通用Transformer(PLUTO)扩展到前沿规模。 我们在PLUTO-4系列中分享了两种互补的视觉Transformer架构:一种是紧凑高效的PLUTO-4S模型,采用FlexiViT设置和2D-RoPE嵌入,优化了多尺度部署;另一种是前沿规模的PLUTO-4G模型,使用单一补丁大小进行训练,以最大化表示能力和稳定性。 这两种模型都在一个包含来自50多家机构的137,144名患者的551,164张全视野图像的大型多机构语料库上进行预训练,涵盖了超过60种疾病类型和超过100种染色方法,使用来自DINOv2的自监督目标进行预训练。 在公共和内部基准上的全面评估表明,PLUTO-4在需要不同空间和生物学背景的任务中实现了最先进的性能,包括补丁级分类、分割和幻灯片级诊断。 紧凑的PLUTO-4S为实际部署提供了高通量和稳健的性能,而PLUTO-4G在多个病理基准上建立了新的性能前沿,包括皮肤病理学诊断提高了11%。 这些多样化的改进突显了PLUTO-4作为转化研究和诊断用例基础的潜力。
摘要: Foundation models trained on large-scale pathology image corpora have demonstrated strong transfer capabilities across diverse histopathology tasks. Building on this progress, we introduce PLUTO-4, our next generation of pathology foundation models that extend the Pathology-Universal Transformer (PLUTO) to frontier scale. We share two complementary Vision Transformer architectures in the PLUTO-4 family: a compact and efficient PLUTO-4S model optimized for multi-scale deployment using a FlexiViT setup with 2D-RoPE embeddings, and a frontier-scale PLUTO-4G model trained with a single patch size to maximize representation capacity and stability. Both models are pretrained using a self-supervised objective derived from DINOv2 on a large multi-institutional corpus containing 551,164 WSIs from 137,144 patients across over 50 institutions, spanning over 60 disease types and over 100 stains. Comprehensive evaluation across public and internal benchmarks demonstrates that PLUTO-4 achieves state-of-the-art performance on tasks requiring varying spatial and biological context, including patch-level classification, segmentation, and slide-level diagnosis. The compact PLUTO-4S provides high-throughput and robust performance for practical deployment, while PLUTO-4G establishes new performance frontiers across multiple pathology benchmarks, including an 11% improvement in dermatopathology diagnosis. These diverse improvements underscore PLUTO-4's potential to transform real-world applications as a backbone for translational research and diagnostic use cases.
主题: 计算机视觉与模式识别 (cs.CV)
引用方式: arXiv:2511.02826 [cs.CV]
  (或者 arXiv:2511.02826v1 [cs.CV] 对于此版本)
  https://doi.org/10.48550/arXiv.2511.02826
通过 DataCite 发表的 arXiv DOI(待注册)

提交历史

来自: Harshith Padigela [查看电子邮件]
[v1] 星期二, 2025 年 11 月 4 日 18:54:58 UTC (570 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
许可图标 查看许可
当前浏览上下文:
cs.CV
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-11
切换浏览方式为:
cs

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号