Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs.CV

帮助 | 高级搜索

计算机视觉与模式识别

最近提交的作者和标题

  • 2025年09月19日, 星期五
  • 2025年09月18日, 星期四
  • 2025年09月17日, 星期三
  • 2025年09月16日, 星期二
  • 2025年09月15日, 星期一

查看今天的 新的 变化

总共 569 条目 : 1-50 51-100 101-150 151-200 ... 551-569
显示最多 50 每页条目: 较少 | 更多 | 所有

2025年09月19日, 星期五 (展示 首先 82 之 50 条目 )

[1] arXiv:2509.15226 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 校准感知的提示学习用于医疗视觉-语言模型
标题: Calibration-Aware Prompt Learning for Medical Vision-Language Models
Abhishek Basu, Fahad Shamshad, Ashshak Sharifdeen, Karthik Nandakumar, Muhammad Haris Khan
评论: 被BMVC 2025接受
主题: 计算机视觉与模式识别 (cs.CV)
[2] arXiv:2509.15225 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 翻译中的迷失? 用于开放词汇语义分割的无源域适应词汇对齐
标题: Lost in Translation? Vocabulary Alignment for Source-Free Domain Adaptation in Open-Vocabulary Semantic Segmentation
Silvio Mazzucco, Carl Persson, Mattia Segu, Pier Luigi Dovesi, Federico Tombari, Luc Van Gool, Matteo Poggi
评论: BMVC 2025 - 项目页面:https://thegoodailab.org/blog/vocalign - 代码:https://github.com/Sisso16/VocAlign
主题: 计算机视觉与模式识别 (cs.CV)
[3] arXiv:2509.15224 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 深度任意事件:基于事件的单目深度估计的跨模态蒸馏范式
标题: Depth AnyEvent: A Cross-Modal Distillation Paradigm for Event-Based Monocular Depth Estimation
Luca Bartolomei, Enrico Mannocci, Fabio Tosi, Matteo Poggi, Stefano Mattoccia
评论: ICCV 2025. 代码:https://github.com/bartn8/depthanyevent/ 项目页面:https://bartn8.github.io/depthanyevent/
主题: 计算机视觉与模式识别 (cs.CV)
[4] arXiv:2509.15221 (交叉列表自 cs.CV) [中文pdf, pdf, 其他]
标题: ScaleCUA:利用跨平台数据扩展开源计算机使用代理
标题: ScaleCUA: Scaling Open-Source Computer Use Agents with Cross-Platform Data
Zhaoyang Liu, JingJing Xie, Zichen Ding, Zehao Li, Bowen Yang, Zhenyu Wu, Xuehui Wang, Qiushi Sun, Shi Liu, Weiyun Wang, Shenglong Ye, Qingyun Li, Zeyue Tian, Gen Luo, Xiangyu Yue, Biqing Qi, Kai Chen, Bowen Zhou, Yu Qiao, Qifeng Chen, Wenhai Wang
主题: 计算机视觉与模式识别 (cs.CV)
[5] arXiv:2509.15220 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 轻量且准确的多视图立体视觉与置信度感知扩散模型
标题: Lightweight and Accurate Multi-View Stereo with Confidence-Aware Diffusion Model
Fangjinhua Wang, Qingshan Xu, Yew-Soon Ong, Marc Pollefeys
评论: 已被IEEE T-PAMI 2025接收。代码:https://github.com/cvg/diffmvs
主题: 计算机视觉与模式识别 (cs.CV)
[6] arXiv:2509.15219 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 视线外轨迹:跟踪、融合与预测
标题: Out-of-Sight Trajectories: Tracking, Fusion, and Prediction
Haichao Zhang, Yi Xu, Yun Fu
主题: 计算机视觉与模式识别 (cs.CV) ; 机器学习 (cs.LG) ; 多智能体系统 (cs.MA) ; 多媒体 (cs.MM) ; 机器人技术 (cs.RO)
[7] arXiv:2509.15212 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: RynnVLA-001:使用人类示范来改进机器人操作
标题: RynnVLA-001: Using Human Demonstrations to Improve Robot Manipulation
Yuming Jiang, Siteng Huang, Shengke Xue, Yaxi Zhao, Jun Cen, Sicong Leng, Kehan Li, Jiayan Guo, Kexiang Wang, Mingxiu Chen, Fan Wang, Deli Zhao, Xin Li
评论: GitHub 项目:https://github.com/alibaba-damo-academy/RynnVLA-001
主题: 计算机视觉与模式识别 (cs.CV) ; 机器人技术 (cs.RO)
[8] arXiv:2509.15208 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 几何图像同步与深度水印技术
标题: Geometric Image Synchronization with Deep Watermarking
Pierre Fernandez, Tomáš Souček, Nikola Jovanović, Hady Elsahar, Sylvestre-Alvise Rebuffi, Valeriu Lacatusu, Tuan Tran, Alexandre Mourachko
评论: 预印本。代码地址:https://github.com/facebookresearch/wmar/tree/main/syncseal
主题: 计算机视觉与模式识别 (cs.CV)
[9] arXiv:2509.15185 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 在生成之前理解:自引导的自回归图像生成训练
标题: Understand Before You Generate: Self-Guided Training for Autoregressive Image Generation
Xiaoyu Yue, Zidong Wang, Yuqing Wang, Wenlong Zhang, Xihui Liu, Wanli Ouyang, Lei Bai, Luping Zhou
评论: 被NeurIPS 2025接收
主题: 计算机视觉与模式识别 (cs.CV)
[10] arXiv:2509.15181 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 玉米幼苗检测数据集(MSDD):一个经过整理的高分辨率RGB数据集,用于使用YOLOv9、YOLO11、YOLOv12和Faster-RCNN进行幼苗玉米检测和基准测试
标题: Maize Seedling Detection Dataset (MSDD): A Curated High-Resolution RGB Dataset for Seedling Maize Detection and Benchmarking with YOLOv9, YOLO11, YOLOv12 and Faster-RCNN
Dewi Endah Kharismawati, Toni Kazic
评论: 18页,10图,8表。提交至IEEE《信号处理精选主题期刊》(JSTSP)人工智能在智能农业专题系列
主题: 计算机视觉与模式识别 (cs.CV)
[11] arXiv:2509.15178 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 释放多模态大语言模型在零样本时空视频定位中的潜力
标题: Unleashing the Potential of Multimodal LLMs for Zero-Shot Spatio-Temporal Video Grounding
Zaiquan Yang, Yuhao Liu, Gerhard Hancke, Rynson W.H. Lau
期刊参考: 神经信息处理系统大会2025
主题: 计算机视觉与模式识别 (cs.CV)
[12] arXiv:2509.15177 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 一种无种族偏见的面部老化模型用于可靠的家庭关系验证
标题: A Race Bias Free Face Aging Model for Reliable Kinship Verification
Ali Nazari, Bardiya Kariminia, Mohsen Ebrahimi Moghaddam
主题: 计算机视觉与模式识别 (cs.CV)
[13] arXiv:2509.15167 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 从2D自然图像预训练模型进行半监督的3D医学分割
标题: Semi-Supervised 3D Medical Segmentation from 2D Natural Images Pretrained Model
Pak-Hei Yeung, Jayroop Ramesh, Pengfei Lyu, Ana Namburete, Jagath Rajapakse
评论: 机器学习在医学影像(MLMI)2025 口头报告
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 机器学习 (cs.LG)
[14] arXiv:2509.15159 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: AIP:通过对抗性指令提示颠覆检索增强生成
标题: AIP: Subverting Retrieval-Augmented Generation via Adversarial Instructional Prompt
Saket S. Chaturvedi, Gaurav Bagwe, Lan Zhang, Xiaoyong Yuan
评论: 被EMNLP 2025会议接受
主题: 计算机视觉与模式识别 (cs.CV) ; 计算与语言 (cs.CL)
[15] arXiv:2509.15156 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 利用几何视觉错觉作为视觉模型的感知归纳偏差
标题: Leveraging Geometric Visual Illusions as Perceptual Inductive Biases for Vision Models
Haobo Yang, Minghao Guo, Dequan Yang, Wenyu Wang
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[16] arXiv:2509.15154 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: MedFact-R1:通过伪标签增强实现事实性医学推理
标题: MedFact-R1: Towards Factual Medical Reasoning via Pseudo-Label Augmentation
Gengliang Li, Rongyu Chen, Bin Li, Linlin Yang, Guodong Ding
评论: 技术报告
主题: 计算机视觉与模式识别 (cs.CV)
[17] arXiv:2509.15123 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 仅RGB监督的动态场景中相机参数优化
标题: RGB-Only Supervised Camera Parameter Optimization in Dynamic Scenes
Fang Li, Hao Zhang, Narendra Ahuja
评论: 神经信息处理系统大会 2025
主题: 计算机视觉与模式识别 (cs.CV)
[18] arXiv:2509.15096 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: OmniSegmentor:一种用于语义分割的灵活多模态学习框架
标题: OmniSegmentor: A Flexible Multi-Modal Learning Framework for Semantic Segmentation
Bo-Wen Yin, Jiao-Long Cao, Xuying Zhang, Yuming Chen, Ming-Ming Cheng, Qibin Hou
评论: 被NeurIPS 2025接受
主题: 计算机视觉与模式识别 (cs.CV)
[19] arXiv:2509.15083 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 移植可用? 评估严重肺部疾病患者中的AI肺分割模型
标题: Transplant-Ready? Evaluating AI Lung Segmentation Models in Candidates with Severe Lung Disease
Jisoo Lee, Michael R. Harowicz, Yuwen Chen, Hanxue Gu, Isaac S. Alderete, Lin Li, Maciej A. Mazurowski, Matthew G. Hartwig
评论: 24页
主题: 计算机视觉与模式识别 (cs.CV)
[20] arXiv:2509.15045 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 使用YOLOv11和领域随机化策略的合成到真实目标检测
标题: Synthetic-to-Real Object Detection using YOLOv11 and Domain Randomization Strategies
Luisa Torquato Niño, Hamza A. A. Gardi
主题: 计算机视觉与模式识别 (cs.CV) ; 机器学习 (cs.LG)
[21] arXiv:2509.15031 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: AutoEdit:图像编辑的自动超参数调整
标题: AutoEdit: Automatic Hyperparameter Tuning for Image Editing
Chau Pham, Quan Dao, Mahesh Bhosale, Yunjie Tian, Dimitris Metaxas, David Doermann
评论: 被NeurIPS 2025接收
主题: 计算机视觉与模式识别 (cs.CV)
[22] arXiv:2509.15017 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 无模态遗漏:通过知识蒸馏适应缺失模态用于脑肿瘤分割
标题: No Modality Left Behind: Adapting to Missing Modalities via Knowledge Distillation for Brain Tumor Segmentation
Shenghao Zhu, Yifei Chen, Weihong Chen, Shuo Jiang, Guanyu Zhou, Yuanhan Wang, Feiwei Qin, Changmiao Wang, Qiyuan Tian
评论: 38页,9图
主题: 计算机视觉与模式识别 (cs.CV)
[23] arXiv:2509.15011 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 透过散射光线看世界:重新审视现实水下图像生成的图像形成模型
标题: Sea-ing Through Scattered Rays: Revisiting the Image Formation Model for Realistic Underwater Image Generation
Vasiliki Ismiroglou, Malte Pedersen, Stefan H. Bengtson, Andreas Aakerberg, Thomas B. Moeslund
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[24] arXiv:2509.14989 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: UCorr:自主无人机的线检测和深度估计
标题: UCorr: Wire Detection and Depth Estimation for Autonomous Drones
Benedikt Kolbeinsson, Krystian Mikolajczyk
评论: 发表于《第四届机器人、计算机视觉与智能系统国际会议(ROBOVIS)》论文集,2024年
期刊参考: 第4届国际机器人、计算机视觉与智能系统会议论文集(ROBOVIS),2024
主题: 计算机视觉与模式识别 (cs.CV)
[25] arXiv:2509.14985 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: PRISM:使用混合匹配的购物车产品检索
标题: PRISM: Product Retrieval In Shopping Carts using Hybrid Matching
Arda Kabadayi, Senem Velipasalar, Jiajing Chen
主题: 计算机视觉与模式识别 (cs.CV)
[26] arXiv:2509.14981 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: SPATIALGEN:布局引导的3D室内场景生成
标题: SPATIALGEN: Layout-guided 3D Indoor Scene Generation
Chuan Fang, Heng Li, Yixun Liang, Jia Zheng, Yongsen Mao, Yuan Liu, Rui Tang, Zihan Zhou, Ping Tan
评论: 3D场景生成;扩散模型;场景重建与理解
主题: 计算机视觉与模式识别 (cs.CV)
[27] arXiv:2509.14977 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: EchoVLM:用于通用超声智能的动态专家混合视觉-语言模型
标题: EchoVLM: Dynamic Mixture-of-Experts Vision-Language Model for Universal Ultrasound Intelligence
Chaoyin She, Ruifang Lu, Lida Chen, Wei Wang, Qinghua Huang
主题: 计算机视觉与模式识别 (cs.CV)
[28] arXiv:2509.14975 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 超越随机遮蔽:一种双流方法用于旋转不变点云遮蔽自编码器
标题: Beyond Random Masking: A Dual-Stream Approach for Rotation-Invariant Point Cloud Masked Autoencoders
Xuanhua Yin, Dingxin Zhang, Yu Feng, Shunqi Mao, Jianhui Yu, Weidong Cai
评论: 8页,4张图,已被DICTA 2025接收
主题: 计算机视觉与模式识别 (cs.CV)
[29] arXiv:2509.14966 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: RoboEye:通过选择性3D几何关键点匹配增强2D机器人物体识别
标题: RoboEye: Enhancing 2D Robotic Object Identification with Selective 3D Geometric Keypoint Matching
Xingwu Zhang, Guanxuan Li, Zhuocheng Zhang, Zijun Long
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 机器人技术 (cs.RO)
[30] arXiv:2509.14965 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: Brain-HGCN:用于脑功能网络分析的双曲图卷积网络
标题: Brain-HGCN: A Hyperbolic Graph Convolutional Network for Brain Functional Network Analysis
Junhao Jia, Yunyou Liu, Cheng Yang, Yifei Sun, Feiwei Qin, Changmiao Wang, Yong Peng
主题: 计算机视觉与模式识别 (cs.CV)
[31] arXiv:2509.14958 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 通过二维镜头看到三维:通过跨模态几何校正的三维少样本类增量学习
标题: Seeing 3D Through 2D Lenses: 3D Few-Shot Class-Incremental Learning via Cross-Modal Geometric Rectification
Xiang Tuo, Xu Xuemiao, Liu Bangzhen, Li Jinyi, Li Yong, He Shengfeng
评论: ICCV2025
主题: 计算机视觉与模式识别 (cs.CV)
[32] arXiv:2509.14957 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: DF-LLaVA:通过提示引导的知识注入解锁多模态大语言模型在合成图像检测中的潜力
标题: DF-LLaVA: Unlocking MLLM's potential for Synthetic Image Detection via Prompt-Guided Knowledge Injection
Zhuokang Shen, Kaisen Zhang, Bohan Jia, Yuan Fang, Zhou Yu, Shaohui Lin
评论: 正在审核中
主题: 计算机视觉与模式识别 (cs.CV)
[33] arXiv:2509.14927 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: GenKOL:可扩展虚拟KOL生成的模块化生成人工智能框架
标题: GenKOL: Modular Generative AI Framework For Scalable Virtual KOL Generation
Tan-Hiep To, Duy-Khang Nguyen, Tam V. Nguyen, Minh-Triet Tran, Trung-Nghia Le
主题: 计算机视觉与模式识别 (cs.CV)
[34] arXiv:2509.14921 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 基于生物特征应用微调的基础模型的跨领域泛化中的权衡
标题: Trade-offs in Cross-Domain Generalization of Foundation Model Fine-Tuned for Biometric Applications
Tahar Chettaoui, Naser Damer, Fadi Boutros
评论: 被IEEE国际生物特征会议2025年(IJCB 2025)接受
主题: 计算机视觉与模式识别 (cs.CV)
[35] arXiv:2509.14901 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 伪标签增强级联框架:LSVOS 2025 VOS赛道第二份技术报告
标题: Pseudo-Label Enhanced Cascaded Framework: 2nd Technical Report for LSVOS 2025 VOS Track
An Yan, Leilei Cao, Feng Lu, Ran Hong, Youhai Jiang, Fengjie Zhu
主题: 计算机视觉与模式识别 (cs.CV)
[36] arXiv:2509.14890 (交叉列表自 cs.CV) [中文pdf, pdf, 其他]
标题: 基于NeRF的3D线索可视化支持数据驱动的航天器位姿估计
标题: NeRF-based Visualization of 3D Cues Supporting Data-Driven Spacecraft Pose Estimation
Antoine Legrand, Renaud Detry, Christophe De Vleeschouwer
评论: 正在审阅(8页,2图)
主题: 计算机视觉与模式识别 (cs.CV)
[37] arXiv:2509.14872 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 乳腺癌新辅助治疗后病理完全缓解预测的表型轨迹时间表示学习
标题: Temporal Representation Learning of Phenotype Trajectories for pCR Prediction in Breast Cancer
Ivana Janíčková, Yen Y. Tan, Thomas H. Helbich, Konstantin Miloserdov, Zsuzsanna Bago-Horvath, Ulrike Heber, Georg Langs
主题: 计算机视觉与模式识别 (cs.CV)
[38] arXiv:2509.14866 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 通过扩散修复的可控局部人脸匿名化
标题: Controllable Localized Face Anonymization Via Diffusion Inpainting
Ali Salar, Qing Liu, Guoying Zhao
主题: 计算机视觉与模式识别 (cs.CV)
[39] arXiv:2509.14860 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: MARIC:图像分类的多智能体推理
标题: MARIC: Multi-Agent Reasoning for Image Classification
Wonduk Seo, Minhyeong Yu, Hyunjin An, Seunghyun Lee
评论: 预印本
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 计算与语言 (cs.CL) ; 多智能体系统 (cs.MA)
[40] arXiv:2509.14846 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: [回复] 提高视觉变压器的解释忠实度
标题: [Re] Improving Interpretation Faithfulness for Vision Transformers
Izabela Kurek, Wojciech Trejter, Stipe Frkovic, Andro Erdelez
评论: 13页的文章,29页的PDF,19张图表,MLRC
期刊参考: I. Kurek, W. Trejter, S. Frkovic, A. Erdelez [重] 提高视觉变压器解释的忠实度(2025),机器学习研究汇刊
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[41] arXiv:2509.14841 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 并非所有退化都相同:一种针对特征去噪的通用图像超分辨率框架
标题: Not All Degradations Are Equal: A Targeted Feature Denoising Framework for Generalizable Image Super-Resolution
Hongjun Wang, Jiyuan Chen, Zhengwei Yin, Xuan Song, Yinqiang Zheng
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[42] arXiv:2509.14839 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: MapAnything:使用单张街景图像映射城市资产
标题: MapAnything: Mapping Urban Assets using Single Street-View Images
Miriam Louise Carnot, Jonas Kunze, Erik Fastermann, Eric Peukert, André Ludwig, Bogdan Franczyk
主题: 计算机视觉与模式识别 (cs.CV)
[43] arXiv:2509.14830 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: ProtoMedX:面向骨健康分类的可解释多模态原型学习
标题: ProtoMedX: Towards Explainable Multi-Modal Prototype Learning for Bone Health Classification
Alvaro Lopez Pellicer, Andre Mariucci, Plamen Angelov, Marwan Bukhari, Jemma G. Kerns
评论: 被ICCV 2025接受。人工智能中的适应性、公平性和可解释性 医学影像(PHAROS-AFE-AIMI研讨会)。8页,5图,4表
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 机器学习 (cs.LG)
[44] arXiv:2509.14827 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 基于模板的皮层表面重建与最小能量变形
标题: Template-Based Cortical Surface Reconstruction with Minimal Energy Deformation
Patrick Madlindl, Fabian Bongratz, Christian Wachinger
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 机器学习 (cs.LG) ; 神经与认知 (q-bio.NC) ; 机器学习 (stat.ML)
[45] arXiv:2509.14817 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 骨折交互测地线活动轮廓用于骨分割
标题: Fracture interactive geodesic active contours for bone segmentation
Liheng Wang, Licheng Zhang, Hailin Xu, Jingxin Zhao, Xiuyun Su, Jiantao Li, Miutian Tang, Weilu Gao, Chong Chen
评论: 27页,10图,1表
主题: 计算机视觉与模式识别 (cs.CV) ; 数值分析 (math.NA)
[46] arXiv:2509.14780 (交叉列表自 cs.CV) [中文pdf, pdf, 其他]
标题: 放射学报告条件3D CT生成与多编码器潜在扩散模型
标题: Radiology Report Conditional 3D CT Generation with Multi Encoder Latent diffusion Model
Sina Amirrajab, Zohaib Salahuddin, Sheng Kuang, Henry C. Woodruff, Philippe Lambin
主题: 计算机视觉与模式识别 (cs.CV)
[47] arXiv:2509.14777 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 无类别标签和预训练模型的超分辨率数据集浓缩
标题: Dataset Distillation for Super-Resolution without Class Labels and Pre-trained Models
Sunwoo Cho, Yejin Jung, Nam Ik Cho, Jae Woong Soh
主题: 计算机视觉与模式识别 (cs.CV)
[48] arXiv:2509.14773 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 点云的实时多模型参数表示
标题: A Real-Time Multi-Model Parametric Representation of Point Clouds
Yuan Gao, Wei Dong
主题: 计算机视觉与模式识别 (cs.CV) ; 机器人技术 (cs.RO)
[49] arXiv:2509.14769 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 框架采样策略很重要:小视觉语言模型的基准
标题: Frame Sampling Strategies Matter: A Benchmark for small vision language models
Marija Brkic, Anas Filali Razzouki, Yannis Tevissen, Khalil Guetari, Mounim A. El Yacoubi
主题: 计算机视觉与模式识别 (cs.CV) ; 计算与语言 (cs.CL)
[50] arXiv:2509.14755 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 通过潜在扩散模型的数据增强用于检测历史艺术品中的与气味相关的物体
标题: Data Augmentation via Latent Diffusion Models for Detecting Smell-Related Objects in Historical Artworks
Ahmed Sheta, Mathias Zinnen, Aline Sindel, Andreas Maier, Vincent Christlein
评论: 出现在第四届国际美术图案提取与识别研讨会(FAPER 2025)上,与ICIAP 2025同时举行;论文集将收录于ICIAP 2025研讨会(LNCS,Springer)中
主题: 计算机视觉与模式识别 (cs.CV)
总共 569 条目 : 1-50 51-100 101-150 151-200 ... 551-569
显示最多 50 每页条目: 较少 | 更多 | 所有
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号