Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs.CV

帮助 | 高级搜索

计算机视觉与模式识别

最近提交的作者和标题

  • 2025年09月19日, 星期五
  • 2025年09月18日, 星期四
  • 2025年09月17日, 星期三
  • 2025年09月16日, 星期二
  • 2025年09月15日, 星期一

查看今天的 新的 变化

总共 569 条目 : 1-50 51-100 101-150 151-200 201-250 251-300 301-350 ... 551-569
显示最多 50 每页条目: 较少 | 更多 | 所有

2025年09月18日, 星期四 (继续, 展示 最后 98 之 30 条目 )

[151] arXiv:2509.13504 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: LivePyxel:通过集成Python的网络摄像头实时流加速图像标注
标题: LivePyxel: Accelerating image annotations with a Python-integrated webcam live streaming
Uriel Garcilazo-Cruz, Joseph O. Okeme, Rodrigo A. Vargas--Hernández
评论: 8页,10图,SM,5页,4图
主题: 计算机视觉与模式识别 (cs.CV)
[152] arXiv:2509.13496 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: BiasMap:利用交叉注意力发现和减轻文本到图像生成中的隐藏社会偏见
标题: BiasMap: Leveraging Cross-Attentions to Discover and Mitigate Hidden Social Biases in Text-to-Image Generation
Rajatsubhra Chakraborty, Xujun Che, Depeng Xu, Cori Faklaris, Xi Niu, Shuhan Yuan
主题: 计算机视觉与模式识别 (cs.CV) ; 机器学习 (cs.LG)
[153] arXiv:2509.13484 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: MINGLE:用于城市场景中语义复杂区域检测的视觉语言模型
标题: MINGLE: VLMs for Semantically Complex Region Detection in Urban Scenes
Liu Liu, Alexandra Kudaeva, Marco Cipriano, Fatimeh Al Ghannam, Freya Tan, Gerard de Melo, Andres Sevtsuk
评论: 13页,4图
主题: 计算机视觉与模式识别 (cs.CV) ; 计算机与社会 (cs.CY)
[154] arXiv:2509.13482 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 通过场景自适应格子矢量量化改进3D高斯点云压缩
标题: Improving 3D Gaussian Splatting Compression by Scene-Adaptive Lattice Vector Quantization
Hao Xu, Xiaolin Wu, Xi Zhang
评论: 代码可在 https://github.com/hxu160/SALVQ 获取
主题: 计算机视觉与模式识别 (cs.CV)
[155] arXiv:2509.13474 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 语义增强的跨模态场景识别用于鲁棒的机器人定位
标题: Semantic-Enhanced Cross-Modal Place Recognition for Robust Robot Localization
Yujia Lin, Nicholas Evans
主题: 计算机视觉与模式识别 (cs.CV)
[156] arXiv:2509.13414 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: MapAnything:通用前馈度量3D重建
标题: MapAnything: Universal Feed-Forward Metric 3D Reconstruction
Nikhil Keetha, Norman Müller, Johannes Schönberger, Lorenzo Porzi, Yuchen Zhang, Tobias Fischer, Arno Knapitsch, Duncan Zauss, Ethan Weber, Nelson Antunes, Jonathon Luiten, Manuel Lopez-Antequera, Samuel Rota Bulò, Christian Richardt, Deva Ramanan, Sebastian Scherer, Peter Kontschieder
评论: 项目页面:https://map-anything.github.io/
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 机器学习 (cs.LG) ; 机器人技术 (cs.RO)
[157] arXiv:2509.13399 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: EdiVal-代理:一种面向对象的框架,用于多轮编辑的自动化、可扩展、细粒度评估
标题: EdiVal-Agent: An Object-Centric Framework for Automated, Scalable, Fine-Grained Evaluation of Multi-Turn Editing
Tianyu Chen, Yasi Zhang, Zhi Zhang, Peiyu Yu, Shu Wang, Zhendong Wang, Kevin Lin, Xiaofei Wang, Zhengyuan Yang, Linjie Li, Chung-Ching Lin, Jianwen Xie, Oscar Leong, Lijuan Wang, Ying Nian Wu, Mingyuan Zhou
评论: 陈天宇和张亚斯共同贡献;梁志鸿、王丽娟、吴英年和周明远同等建议
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 机器学习 (cs.LG)
[158] arXiv:2509.13396 (交叉列表自 cs.CV) [中文pdf, pdf, 其他]
标题: 基于特征的边缘智能在电力系统中实时检测和跟踪外来物体入侵
标题: Real-Time Detection and Tracking of Foreign Object Intrusions in Power Systems via Feature-Based Edge Intelligence
Xinan Wang, Di Shi, Fengyu Wang
评论: 12页的期刊论文,被IEEE开放获取电力与能源期刊接受
主题: 计算机视觉与模式识别 (cs.CV) ; 系统与控制 (eess.SY)
[159] arXiv:2509.13388 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 利用遥感和机器学习进行土地覆盖分类和变化检测:斐济西部案例研究
标题: Landcover classification and change detection using remote sensing and machine learning: a case study of Western Fiji
Yadvendra Gurjar, Ruoni Wan, Ehsan Farahbakhsh, Rohitash Chandra
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 应用 (stat.AP)
[160] arXiv:2509.13385 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 曲率作为评估降维和估计内在维度的工具
标题: Curvature as a tool for evaluating dimensionality reduction and estimating intrinsic dimension
Charlotte Beylier, Parvaneh Joharinad, Jürgen Jost, Nahid Torbati
评论: 31页,14图
主题: 计算机视觉与模式识别 (cs.CV) ; 离散数学 (cs.DM) ; 机器学习 (cs.LG)
[161] arXiv:2509.13375 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 基于VLM的OOD检测实证分析:机制、优势和敏感性
标题: An Empirical Analysis of VLM-based OOD Detection: Mechanisms, Advantages, and Sensitivity
Yuxiao Lee, Xiaofeng Cao, Wei Ye, Jiangchao Yao, Jingkuan Song, Heng Tao Shen
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[162] arXiv:2509.13366 (交叉列表自 cs.CV) [中文pdf, pdf, 其他]
标题: 基于人工智能的卷积神经网络停车空间真实情况测试自动化
标题: Parking Space Ground Truth Test Automation by Artificial Intelligence Using Convolutional Neural Networks
Tony Rohe, Martin Margreiter, Markus Moertl
评论: 10页,5图
主题: 计算机视觉与模式识别 (cs.CV)
[163] arXiv:2509.13361 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 基于YOLOv11-DIoU和GRU-Attention的高速公路拥堵预警技术研究
标题: Research on Expressway Congestion Warning Technology Based on YOLOv11-DIoU and GRU-Attention
Tong Yulin, Liang Xuechen
主题: 计算机视觉与模式识别 (cs.CV)
[164] arXiv:2509.13353 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 基于混合量子-经典模型的图像分类
标题: Hybrid Quantum-Classical Model for Image Classification
Muhammad Adnan Shahzad
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 机器学习 (cs.LG)
[165] arXiv:2509.13338 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 基于接近度的不确定性感知神经网络证据检索
标题: Proximity-Based Evidence Retrieval for Uncertainty-Aware Neural Networks
Hassan Gharoun, Mohammad Sadegh Khorshidi, Kasra Ranjbarigderi, Fang Chen, Amir H. Gandomi
评论: 15页,4图,3表
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 机器学习 (cs.LG) ; 神经与进化计算 (cs.NE)
[166] arXiv:2509.14191 (交叉列表自 cs.RO) [中文pdf, pdf, html, 其他]
标题: MCGS-SLAM:一种使用高斯点云的多相机SLAM框架用于高保真建图
标题: MCGS-SLAM: A Multi-Camera SLAM Framework Using Gaussian Splatting for High-Fidelity Mapping
Zhihao Cao, Hanyu Wu, Li Wa Tang, Zizhou Luo, Zihan Zhu, Wei Zhang, Marc Pollefeys, Martin R. Oswald
主题: 机器人技术 (cs.RO) ; 计算机视觉与模式识别 (cs.CV)
[167] arXiv:2509.13965 (交叉列表自 cs.RO) [中文pdf, pdf, html, 其他]
标题: MetricNet:在生成导航策略中恢复度量尺度
标题: MetricNet: Recovering Metric Scale in Generative Navigation Policies
Abhijeet Nayak, Débora N.P. Oliveira, Samiran Gode, Cordelia Schmid, Wolfram Burgard
主题: 机器人技术 (cs.RO) ; 计算机视觉与模式识别 (cs.CV)
[168] arXiv:2509.13926 (交叉列表自 cs.RO) [中文pdf, pdf, html, 其他]
标题: MAP:基于地图的端到端自动驾驶
标题: MAP: End-to-End Autonomous Driving with Map-Assisted Planning
Huilin Yin, Yiming Kan, Daniel Watzenig
评论: 8页,2图,被ICCVW接收。作者列表已更新以匹配最终版本,符合会议政策
主题: 机器人技术 (cs.RO) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV)
[169] arXiv:2509.13857 (交叉列表自 cs.RO) [中文pdf, pdf, html, 其他]
标题: InterKey:用于OpenStreetMap全局定位的跨模态交点关键点
标题: InterKey: Cross-modal Intersection Keypoints for Global Localization on OpenStreetMap
Nguyen Hoang Khoi Tran, Julie Stephany Berrio, Mao Shan, Stewart Worrall
评论: 8页,5图
主题: 机器人技术 (cs.RO) ; 计算机视觉与模式识别 (cs.CV)
[170] arXiv:2509.13642 (交叉列表自 cs.LG) [中文pdf, pdf, html, 其他]
标题: LLM-I:大语言模型是自然交错的多模态创作者
标题: LLM-I: LLMs are Naturally Interleaved Multimodal Creators
Zirun Guo, Feng Zhang, Kai Jia, Tao Jin
主题: 机器学习 (cs.LG) ; 计算机视觉与模式识别 (cs.CV)
[171] arXiv:2509.13612 (交叉列表自 q-bio.NC) [中文pdf, pdf, html, 其他]
标题: Rest2Visual:从静息态扫描预测视觉诱发的fMRI
标题: Rest2Visual: Predicting Visually Evoked fMRI from Resting-State Scans
Chuyang Zhou, Ziao Ji, Daochang Liu, Dongang Wang, Chenyu Wang, Chang Xu
主题: 神经与认知 (q-bio.NC) ; 计算机视觉与模式识别 (cs.CV)
[172] arXiv:2509.13591 (交叉列表自 cs.RO) [中文pdf, pdf, html, 其他]
标题: 通过灵巧触觉进行物体位姿估计
标题: Object Pose Estimation through Dexterous Touch
Amir-Hossein Shahidzadeh, Jiyue Zhu, Kezhou Chen, Sha Yi, Cornelia Fermüller, Yiannis Aloimonos, Xiaolong Wang
主题: 机器人技术 (cs.RO) ; 计算机视觉与模式识别 (cs.CV)
[173] arXiv:2509.13576 (交叉列表自 eess.IV) [中文pdf, pdf, html, 其他]
标题: 基于跨分布扩散先验的稀疏视图CT迭代重建
标题: Cross-Distribution Diffusion Priors-Driven Iterative Reconstruction for Sparse-View CT
Haodong Li, Shuo Han, Haiyang Mao, Yu Shi, Changsheng Fang, Jianjia Zhang, Weiwen Wu, Hengyong Yu
评论: 11页,8图,正在接受IEEE TMI的审稿
主题: 图像与视频处理 (eess.IV) ; 计算机视觉与模式识别 (cs.CV)
[174] arXiv:2509.13541 (交叉列表自 cs.RO) [中文pdf, pdf, html, 其他]
标题: 带有SLAM的中央气道阻塞语义3D重建
标题: Semantic 3D Reconstructions with SLAM for Central Airway Obstruction
Ayberk Acar, Fangjie Li, Hao Li, Lidia Al-Zogbi, Kanyifeechukwu Jane Oguine, Susheela Sharma Stern, Jesse F. d'Almeida, Robert J. Webster III, Ipek Oguz, Jie Ying Wu
评论: 5页,2图,1表
主题: 机器人技术 (cs.RO) ; 计算机视觉与模式识别 (cs.CV)
[175] arXiv:2509.13428 (交叉列表自 q-bio.PE) [中文pdf, pdf, 其他]
标题: 人工智能在英国自主报告正常胸部X光片。 我们可以将人类排除在流程之外吗?
标题: Autonomous Reporting of Normal Chest X-rays by Artificial Intelligence in the United Kingdom. Can We Take the Human Out of the Loop?
Katrina Nash, James Vaz, Ahmed Maiter, Christopher Johns, Nicholas Woznitza, Aditya Kale, Abdala Espinosa Morgado, Rhidian Bramley, Mark Hall, David Lowe, Alex Novak, Sarim Ather
主题: 种群与进化 (q-bio.PE) ; 计算机视觉与模式识别 (cs.CV)
[176] arXiv:2509.13390 (交叉列表自 cs.SD) [中文pdf, pdf, 其他]
标题: 一种基于领域知识的电动汽车内部声音异常检测方法
标题: A Domain Knowledge Informed Approach for Anomaly Detection of Electric Vehicle Interior Sounds
Deepti Kunte, Bram Cornelis, Claudio Colangeli, Karl Janssens, Brecht Van Baelen, Konstantinos Gryllias
评论: 提交至:机械系统与信号处理
主题: 声音 (cs.SD) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV) ; 机器学习 (cs.LG) ; 音频与语音处理 (eess.AS)
[177] arXiv:2509.13379 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: “可能”的艺术:一种用于VLMs不确定性基准测试的共形透镜
标题: The Art of Saying "Maybe": A Conformal Lens for Uncertainty Benchmarking in VLMs
Asif Azad, Mohammad Sadat Hossain, MD Sadik Hossain Shanto, M Saifur Rahman, Md Rizwan Parvez
主题: 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV)
[178] arXiv:2509.13372 (交叉列表自 eess.IV) [中文pdf, pdf, html, 其他]
标题: 用于从对比增强X射线荧光成像中生成交互式提示驱动的2D到3D血管重建的Fontan几何结构的生成AI流水线
标题: Generative AI Pipeline for Interactive Prompt-driven 2D-to-3D Vascular Reconstruction for Fontan Geometries from Contrast-Enhanced X-Ray Fluoroscopy Imaging
Prahlad G Menon
主题: 图像与视频处理 (eess.IV) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV) ; 新兴技术 (cs.ET) ; 定量方法 (q-bio.QM)
[179] arXiv:2509.13360 (交叉列表自 eess.IV) [中文pdf, pdf, html, 其他]
标题: PREDICT-GBM:胶质母细胞瘤个体化计算肿瘤模型的稳健评估和开发平台
标题: PREDICT-GBM: Platform for Robust Evaluation and Development of Individualized Computational Tumor Models in Glioblastoma
L. Zimmer, J. Weidner, M. Balcerak, F. Kofler, I. Ezhov, B. Menze, B. Wiestler
主题: 图像与视频处理 (eess.IV) ; 计算机视觉与模式识别 (cs.CV) ; 机器学习 (cs.LG) ; 定量方法 (q-bio.QM)
[180] arXiv:2509.13358 (交叉列表自 eess.IV) [中文pdf, pdf, 其他]
标题: 基于双平面X射线图像的冠状血管树三维重建的几何方法
标题: 3D Reconstruction of Coronary Vessel Trees from Biplanar X-Ray Images Using a Geometric Approach
Ethan Koland, Lin Xi, Nadeev Wijesuriya, YingLiang Ma
主题: 图像与视频处理 (eess.IV) ; 计算机视觉与模式识别 (cs.CV)

2025年09月17日, 星期三 (展示 首先 132 之 20 条目 )

[181] arXiv:2509.13317 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 3D感知区域提示视觉语言模型
标题: 3D Aware Region Prompted Vision Language Model
An-Chieh Cheng, Yang Fu, Yukang Chen, Zhijian Liu, Xiaolong Li, Subhashree Radhakrishnan, Song Han, Yao Lu, Jan Kautz, Pavlo Molchanov, Hongxu Yin, Xiaolong Wang, Sifei Liu
评论: 项目网站:https://www.anjiecheng.me/sr3d
主题: 计算机视觉与模式识别 (cs.CV)
[182] arXiv:2509.13301 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: StyleSculptor:具有纹理-几何双重指导的零样本风格可控3D资产生成
标题: StyleSculptor: Zero-Shot Style-Controllable 3D Asset Generation with Texture-Geometry Dual Guidance
Zefan Qu, Zhenwei Wang, Haoyuan Wang, Ke Xu, Gerhard Hancke, Rynson W.H. Lau
评论: SIGGRAPH Asia 2025,项目页面:https://stylesculptor.github.io
主题: 计算机视觉与模式识别 (cs.CV)
[183] arXiv:2509.13289 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 基于多模态特征的图像真实感评估与定位
标题: Image Realness Assessment and Localization with Multimodal Features
Lovish Kaushik, Agnij Biswas, Somdyuti Paul
主题: 计算机视觉与模式识别 (cs.CV) ; 图像与视频处理 (eess.IV)
[184] arXiv:2509.13270 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: RadGame:一种人工智能驱动的放射学教育平台
标题: RadGame: An AI-Powered Platform for Radiology Education
Mohammed Baharoon, Siavash Raissi, John S. Jun, Thibault Heintz, Mahmoud Alabbad, Ali Alburkani, Sung Eun Kim, Kent Kleinschmidt, Abdulrahman O. Alhumaydhi, Mohannad Mohammed G. Alghamdi, Jeremy Francis Palacio, Mohammed Bukhaytan, Noah Michael Prudlo, Rithvik Akula, Brady Chrisler, Benjamin Galligos, Mohammed O. Almutairi, Mazeen Mohammed Alanazi, Nasser M. Alrashdi, Joel Jihwan Hwang, Sri Sai Dinesh Jaliparthi, Luke David Nelson, Nathaniel Nguyen, Sathvik Suryadevara, Steven Kim, Mohammed F. Mohammed, Yevgeniy R. Semenov, Kun-Hsing Yu, Abdulrhman Aljouie, Hassan AlOmaish, Adam Rodman, Pranav Rajpurkar
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[185] arXiv:2509.13255 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 用于高效时间密集视频编码的ResidualViT
标题: ResidualViT for Efficient Temporally Dense Video Encoding
Mattia Soldan, Fabian Caba Heilbron, Bernard Ghanem, Josef Sivic, Bryan Russell
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 信息检索 (cs.IR) ; 图像与视频处理 (eess.IV)
[186] arXiv:2509.13250 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 智能真空热成型工艺
标题: Intelligent Vacuum Thermoforming Process
Andi Kuswoyo, Christos Margadji, Sebastian W. Pattinson
评论: 总共包含6幅图,15页。正在修订中,供《智能制造杂志》发表
主题: 计算机视觉与模式识别 (cs.CV) ; 机器学习 (cs.LG)
[187] arXiv:2509.13229 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 课程多任务自监督改进轻量级架构用于机载卫星高光谱图像分割
标题: Curriculum Multi-Task Self-Supervision Improves Lightweight Architectures for Onboard Satellite Hyperspectral Image Segmentation
Hugo Carlesso, Josiane Mothe, Radu Tudor Ionescu
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 机器学习 (cs.LG)
[188] arXiv:2509.13214 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: End4:面向端到端去噪扩散的基于扩散的修补检测
标题: End4: End-to-end Denoising Diffusion for Diffusion-Based Inpainting Detection
Fei Wang, Xuecheng Wu, Zheng Zhang, Danlei Huang, Yuheng Huang, Bo Wang
主题: 计算机视觉与模式识别 (cs.CV)
[189] arXiv:2509.13210 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: Vi-SAFE:一种用于公共监控中高效暴力检测的时空框架
标题: Vi-SAFE: A Spatial-Temporal Framework for Efficient Violence Detection in Public Surveillance
Ligang Chang, Shengkai Xu, Liangchang Shen, Binhan Xu, Junqiao Wang, Tianyu Shi, Yanhui Du
主题: 计算机视觉与模式识别 (cs.CV)
[190] arXiv:2509.13181 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 道路障碍物视频分割
标题: Road Obstacle Video Segmentation
Shyam Nandan Rai, Shyamgopal Karthik, Mariana-Iuliana Georgescu, Barbara Caputo, Carlo Masone, Zeynep Akata
评论: GCPR 2025
主题: 计算机视觉与模式识别 (cs.CV)
[191] arXiv:2509.13175 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 更高效且可扩展:重新思考大语言模型时代放射学中的对比视觉-语言预训练
标题: More performant and scalable: Rethinking contrastive vision-language pre-training of radiology in the LLM era
Yingtai Li, Haoran Lai, Xiaoqian Zhou, Shuai Ming, Wenxin Ma, Wei Wei, Shaohua Kevin Zhou
评论: MICCAI 2025
主题: 计算机视觉与模式识别 (cs.CV)
[192] arXiv:2509.13172 (交叉列表自 cs.CV) [中文pdf, pdf, 其他]
标题: WHU-STree:用于街道树木清单的多模态基准数据集
标题: WHU-STree: A Multi-modal Benchmark Dataset for Street Tree Inventory
Ruifei Ding, Zhe Chen, Wen Fan, Chen Long, Huijuan Xiao, Yelu Zeng, Zhen Dong, Bisheng Yang
主题: 计算机视觉与模式识别 (cs.CV)
[193] arXiv:2509.13161 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 用结构化多视频协作推理增强视频大语言模型(早期版本)
标题: Enhancing Video Large Language Models with Structured Multi-Video Collaborative Reasoning (early version)
Zhihao He, Tianyao He, Tieyuan Chen, Yun Xu, Huabin Liu, Chaofan Gan, Gui Zou, Weiyao Lin
主题: 计算机视觉与模式识别 (cs.CV)
[194] arXiv:2509.13151 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: TexTAR:多领域和多语言文档图像中的文本属性识别
标题: TexTAR : Textual Attribute Recognition in Multi-domain and Multi-lingual Document Images
Rohan Kumar, Jyothi Swaroopa Jinka, Ravi Kiran Sarvadevabhatla
评论: 被ICDAR 2025接收(口头报告)
主题: 计算机视觉与模式识别 (cs.CV)
[195] arXiv:2509.13149 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: MSDNet:通过多阶段蒸馏实现高效的4D雷达超分辨率
标题: MSDNet: Efficient 4D Radar Super-Resolution via Multi-Stage Distillation
Minqing Huang, Shouyi Lu, Boyuan Zheng, Ziyao Li, Xiao Tang, Guirong Zhuo
评论: 8页,5图
主题: 计算机视觉与模式识别 (cs.CV)
[196] arXiv:2509.13133 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 基于大规模数据集和半监督基线的现实世界停车位检测进展
标题: Advancing Real-World Parking Slot Detection with Large-Scale Dataset and Semi-Supervised Baseline
Zhihao Zhang, Chunyu Lin, Lang Nie, Jiyuan Wang, Yao Zhao
评论: IEEE智能交通系统汇刊(T-ITS)
主题: 计算机视觉与模式识别 (cs.CV)
[197] arXiv:2509.13116 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 弱监督和自监督的类无关运动预测用于自动驾驶
标题: Weakly and Self-Supervised Class-Agnostic Motion Prediction for Autonomous Driving
Ruibo Li, Hanyu Shi, Zhe Wang, Guosheng Lin
评论: 我们2023年CVPR论文的扩展版,“自动驾驶的弱监督类无关运动预测”,已接受发表于TPAMI
主题: 计算机视觉与模式识别 (cs.CV)
[198] arXiv:2509.13107 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 面向多维面部伪造检测的分层深度融合框架 - 2024年全球深度伪造图像检测挑战赛
标题: Hierarchical Deep Fusion Framework for Multi-dimensional Facial Forgery Detection - The 2024 Global Deepfake Image Detection Challenge
Kohou Wang, Huan Hu, Xiang Liu, Zezhou Chen, Ping Chen, Zhaoxiang Liu, Shiguo Lian
评论: 2024年全球深度伪造图像检测挑战赛前20名奖励,5页
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[199] arXiv:2509.13089 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 用于支持制造业中小企业视觉装配控制的合成数据流水线
标题: A Synthetic Data Pipeline for Supporting Manufacturing SMEs in Visual Assembly Control
Jonas Werheid, Shengjie He, Aymen Gannouni, Anas Abdelrazeq, Robert H. Schmitt
期刊参考: 在第二届国际生成式人工智能与计算语言建模会议(GACLM 2025)上发表,并即将被IEEE收录
主题: 计算机视觉与模式识别 (cs.CV) ; 机器人技术 (cs.RO)
[200] arXiv:2509.13084 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 基于双网络的半监督医学图像分割的不确定性引导伪标签方法增强
标题: Enhancing Dual Network Based Semi-Supervised Medical Image Segmentation with Uncertainty-Guided Pseudo-Labeling
Yunyao Lu, Yihang Wu, Ahmad Chaddad, Tareef Daqqaq, Reem Kateb
评论: 被接受于基于知识的系统
主题: 计算机视觉与模式识别 (cs.CV)
总共 569 条目 : 1-50 51-100 101-150 151-200 201-250 251-300 301-350 ... 551-569
显示最多 50 每页条目: 较少 | 更多 | 所有
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号