计算机视觉与模式识别

最近提交的作者和标题

查看今天的新的变化

总共 569 条目 : 1-50 ... 201-250 251-300 301-350 313-362 351-400 401-450 451-500 ... 551-569

显示最多 50 每页条目：较少 | 更多 | 所有

[313] arXiv:2509.12204 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：以角色为中心的动画电影理解

标题： Character-Centric Understanding of Animated Movies

Zhongrui Gui, Junyu Xie, Tengda Han, Weidi Xie, Andrew Zisserman

主题：计算机视觉与模式识别 (cs.CV)
[314] arXiv:2509.12203 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： LazyDrag：通过显式对应在多模态扩散变换器上实现稳定的基于拖动的编辑

标题： LazyDrag: Enabling Stable Drag-Based Editing on Multi-Modal Diffusion Transformers via Explicit Correspondence

Zixin Yin, Xili Dai, Duomin Wang, Xianfang Zeng, Lionel M. Ni, Gang Yu, Heung-Yeung Shum

主题：计算机视觉与模式识别 (cs.CV)
[315] arXiv:2509.12201 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： OmniWorld：用于4D世界建模的多领域和多模态数据集

标题： OmniWorld: A Multi-Domain and Multi-Modal Dataset for 4D World Modeling

Yang Zhou, Yifan Wang, Jianjun Zhou, Wenzheng Chang, Haoyu Guo, Zizun Li, Kaijing Ma, Xinyue Li, Yating Wang, Haoyi Zhu, Mingyu Liu, Dingning Liu, Jiange Yang, Zhoujie Fu, Junyi Chen, Chunhua Shen, Jiangmiao Pang, Kaipeng Zhang, Tong He

评论： https://yangzhou24.github.io/OmniWorld/

主题：计算机视觉与模式识别 (cs.CV)
[316] arXiv:2509.12197 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：从LiDAR点云中进行三维人体姿态和形状估计：综述

标题： 3D Human Pose and Shape Estimation from LiDAR Point Clouds: A Review

Salma Galaaoui, Eduardo Valle, David Picard, Nermin Samet

主题：计算机视觉与模式识别 (cs.CV)
[317] arXiv:2509.12193 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：领域自适应预训练提高灵长类行为识别

标题： Domain-Adaptive Pretraining Improves Primate Behavior Recognition

Felix B. Mueller, Timo Lueddecke, Richard Vogg, Alexander S. Ecker

评论：在CVPR 2025研讨会CV4Animals上的口头报告

主题：计算机视觉与模式识别 (cs.CV)
[318] arXiv:2509.12187 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：全息服装：真实场景服装的360°新视角合成

标题： HoloGarment: 360° Novel View Synthesis of In-the-Wild Garments

Johanna Karras, Yingwei Li, Yasamin Jafarian, Ira Kemelmacher-Shlizerman

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 图形学 (cs.GR) ; 机器学习 (cs.LG)
[319] arXiv:2509.12155 (交叉列表自 cs.CV) [中文pdf, pdf, 其他]: 标题：基于LoRA微调的大规模视觉模型用于立体定向体外放射治疗后肺损伤的自动评估

标题： LoRA-fine-tuned Large Vision Models for Automated Assessment of Post-SBRT Lung Injury

M. Bolhassani, B. Veasey, E. Daugherty, S. Keltner, N. Kumar, N. Dunlap, A. Amini

评论： 5页，5图

主题：计算机视觉与模式识别 (cs.CV)
[320] arXiv:2509.12146 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：多器官X射线基础模型

标题： Multi Anatomy X-Ray Foundation Model

Nishank Singla, Krisztian Koos, Farzin Haddadpour, Amin Honarmandi Shandiz, Lovish Chum, Xiaojian Xu, Qing Jin, Erhan Bas

评论：此作品已提交给IEEE以可能发表

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[321] arXiv:2509.12145 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：基于视觉语言模型的开放式分层流式视频理解

标题： Open-ended Hierarchical Streaming Video Understanding with Vision Language Models

Hyolim Kang, Yunsu Park, Youngbeom Yoo, Yeeun Choi, Seon Joo Kim

评论： 17页

主题：计算机视觉与模式识别 (cs.CV)
[322] arXiv:2509.12143 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： 3DViT-GAT：一种基于统一图谱的三维视觉变换器和图学习框架，用于使用结构磁共振成像数据检测重度抑郁症

标题： 3DViT-GAT: A Unified Atlas-Based 3D Vision Transformer and Graph Learning Framework for Major Depressive Disorder Detection Using Structural MRI Data

Nojod M. Alotaibi, Areej M. Alhothali, Manar S. Ali

评论： 14页，1图，7表

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[323] arXiv:2509.12132 (交叉列表自 cs.CV) [中文pdf, pdf, 其他]: 标题：再看一遍，慢慢思考：增强视觉语言模型中的视觉反思

标题： Look Again, Think Slowly: Enhancing Visual Reflection in Vision-Language Models

Pu Jian, Junhong Wu, Wei Sun, Chen Wang, Shuo Ren, Jiajun Zhang

评论： EMNLP2025 主会议

主题：计算机视觉与模式识别 (cs.CV) ; 计算与语言 (cs.CL)
[324] arXiv:2509.12125 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： RailSafeNet：有轨电车安全的视觉场景理解

标题： RailSafeNet: Visual Scene Understanding for Tram Safety

Ondřej Valach, Ivan Gruber

评论： 11页，5图，EPIA2025

主题：计算机视觉与模式识别 (cs.CV)
[325] arXiv:2509.12105 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： FS-SAM2：通过低秩适应将分割任何模型2用于少样本语义分割

标题： FS-SAM2: Adapting Segment Anything Model 2 for Few-Shot Semantic Segmentation via Low-Rank Adaptation

Bernardo Forni, Gabriele Lombardi, Federico Pozzi, Mirco Planamente

评论：已被ICIAP 2025接收

主题：计算机视觉与模式识别 (cs.CV)
[326] arXiv:2509.12090 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：端到端跨全栈和稀疏心脏MRI的4D心脏网格恢复

标题： End-to-End 4D Heart Mesh Recovery Across Full-Stack and Sparse Cardiac MRI

Yihong Chen, Jiancheng Yang, Deniz Sayin Mercadier, Hieu Le, Juerg Schwitter, Pascal Fua

主题：计算机视觉与模式识别 (cs.CV)
[327] arXiv:2509.12079 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：基于渐进流的谱压缩成像展开

标题： Progressive Flow-inspired Unfolding for Spectral Compressive Imaging

Xiaodong Wang, Ping Wang, Zijun He, Mengjie Qin, Xin Yuan

主题：计算机视觉与模式识别 (cs.CV)
[328] arXiv:2509.12069 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： U-Mamba2：在锥形束CT中用于牙体解剖分割的状态空间模型扩展

标题： U-Mamba2: Scaling State Space Models for Dental Anatomy Segmentation in CBCT

Zhi Qin Tan, Xiatian Zhu, Owen Addison, Yunpeng Li

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[329] arXiv:2509.12068 (交叉列表自 cs.CV) [中文pdf, pdf, 其他]: 标题：从三维医学影像数据中端到端学习多器官隐式表面

标题： End-to-End Learning of Multi-Organ Implicit Surfaces from 3D Medical Imaging Data

Farahdiba Zarin, Nicolas Padoy, Jérémy Dana, Vinkle Srivastav

主题：计算机视觉与模式识别 (cs.CV)
[330] arXiv:2509.12062 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：通过跨种群增强实现不同孕周的鲁棒胎儿姿态估计

标题： Robust Fetal Pose Estimation across Gestational Ages via Cross-Population Augmentation

Sebastian Diaz, Benjamin Billot, Neel Dey, Molin Zhang, Esra Abaci Turk, P. Ellen Grant, Polina Golland, Elfar Adalsteinsson

评论：被MICCAI 2025接受

主题：计算机视觉与模式识别 (cs.CV)
[331] arXiv:2509.12052 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： AvatarSync：通过自回归视角重新思考说话头动画

标题： AvatarSync: Rethinking Talking-Head Animation through Autoregressive Perspective

Yuchen Deng, Xiuyang Wu, Hai-Tao Zheng, Suiyang Zhang, Yi He, Yuxing Han

主题：计算机视觉与模式识别 (cs.CV)
[332] arXiv:2509.12047 (交叉列表自 cs.CV) [中文pdf, pdf, 其他]: 标题：基于计算机视觉的个体行为分析流水线：在爱丁堡猪数据集上的基准测试

标题： A Computer Vision Pipeline for Individual-Level Behavior Analysis: Benchmarking on the Edinburgh Pig Dataset

Haiyu Yang, Enhong Liu, Jennifer Sun, Sumit Sharma, Meike van Leerdam, Sebastien Franceschini, Puchun Niu, Miel Hostens

评论： 9个图，提交给《计算机与农业电子》

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[333] arXiv:2509.12046 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：基于结构化掩码的布局条件自回归文本到图像生成

标题： Layout-Conditioned Autoregressive Text-to-Image Generation via Structured Masking

Zirui Zheng, Takashi Isobe, Tong Shen, Xu Jia, Jianbin Zhao, Xiaomin Li, Mengmeng Ge, Baolu Li, Qinghe Wang, Dong Li, Dong Zhou, Yunzhi Zhuge, Huchuan Lu, Emad Barsoum

评论： 10页，3图

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[334] arXiv:2509.12040 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：探索遥感中的高效开放词汇分割

标题： Exploring Efficient Open-Vocabulary Segmentation in the Remote Sensing

Bingyu Li, Haocheng Dong, Da Zhang, Zhiyuan Zhao, Junyu Gao, Xuelong Li

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[335] arXiv:2509.12039 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： RAM++：通过自适应掩码的鲁棒表示学习用于一体化图像修复

标题： RAM++: Robust Representation Learning via Adaptive Mask for All-in-One Image Restoration

Zilong Zhang, Chujie Qin, Chunle Guo, Yong Zhang, Chao Xue, Ming-Ming Cheng, Chongyi Li

评论： 18页，22图

主题：计算机视觉与模式识别 (cs.CV)
[336] arXiv:2509.12024 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：扩散模型中的鲁棒概念擦除：安全性和鲁棒性的理论视角

标题： Robust Concept Erasure in Diffusion Models: A Theoretical Perspective on Security and Robustness

Zixuan Fu, Yan Ren, Finn Carter, Chenyue Wen, Le Ku, Daheng Yu, Emily Davis, Bo Zhang

评论：最终版

主题：计算机视觉与模式识别 (cs.CV)
[337] arXiv:2509.11986 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：嵌入中的迷失：视觉-语言模型中的信息丢失

标题： Lost in Embeddings: Information Loss in Vision-Language Models

Wenyan Li, Raphael Tang, Chengzu Li, Caiqi Zhang, Ivan Vulić, Anders Søgaard

主题：计算机视觉与模式识别 (cs.CV) ; 计算与语言 (cs.CL)
[338] arXiv:2509.11959 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：学习生成4D LiDAR序列

标题： Learning to Generate 4D LiDAR Sequences

Ao Liang, Youquan Liu, Yu Yang, Dongyue Lu, Linfeng Li, Lingdong Kong, Huaici Zhao, Wei Tsang Ooi

评论：摘要论文（非归档）@ ICCV 2025 Wild3D 工作坊；GitHub 仓库地址为 https://lidarcrafter.github.io/

主题：计算机视觉与模式识别 (cs.CV) ; 机器人技术 (cs.RO)
[339] arXiv:2509.11952 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： CLAIRE：一种基于RIFT损失和Phi-3小型语言模型的双编码器网络，用于跨模态合成孔径雷达和光学土地覆盖分割

标题： CLAIRE: A Dual Encoder Network with RIFT Loss and Phi-3 Small Language Model Based Interpretability for Cross-Modality Synthetic Aperture Radar and Optical Land Cover Segmentation

Debopom Sutradhar, Arefin Ittesafun Abian, Mohaimenul Azam Khan Raiaan, Reem E. Mohamed, Sheikh Izzal Azid, Sami Azam

评论： 23页，6图，10表

主题：计算机视觉与模式识别 (cs.CV)
[340] arXiv:2509.11948 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： Sphere-GAN：一种基于GAN的360°视频显著性估计方法

标题： Sphere-GAN: a GAN-based Approach for Saliency Estimation in 360° Videos

Mahmoud Z. A. Wahba, Sara Baldoni, Federica Battisti

主题：计算机视觉与模式识别 (cs.CV) ; 多媒体 (cs.MM) ; 图像与视频处理 (eess.IV)
[341] arXiv:2509.11926 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：基于 Douglas-Rachford 迭代的图像插值图算法展开

标题： Graph Algorithm Unrolling with Douglas-Rachford Iterations for Image Interpolation with Guaranteed Initialization

Xue Zhang, Bingshuo Hu, Gene Cheung

主题：计算机视觉与模式识别 (cs.CV)
[342] arXiv:2509.11924 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：用于3D颈动脉MRI斑块易损性自动诊断的增强文本引导变分多模态知识蒸馏网络（VMD）

标题： Enriched text-guided variational multimodal knowledge distillation network (VMD) for automated diagnosis of plaque vulnerability in 3D carotid artery MRI

Bo Cao, Fan Yu, Mengmeng Feng, SenHao Zhang, Xin Meng, Yue Zhang, Zhen Qian, Jie Lu

主题：计算机视觉与模式识别 (cs.CV)
[343] arXiv:2509.11916 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： NeuroGaze-Distill：脑启发的蒸馏和抑郁启发的几何先验用于鲁棒的面部情绪识别

标题： NeuroGaze-Distill: Brain-informed Distillation and Depression-Inspired Geometric Priors for Robust Facial Emotion Recognition

Zilin Li, Weiwei Xu, Xuanqi Zhao, Yiran Zhu

评论：预印本。仅部署视觉；EEG仅用于形成静态原型。包含附录、7幅图和3张表。考虑提交至2026年国际学习表示大会（ICLR），巴西里约热内卢

主题：计算机视觉与模式识别 (cs.CV)
[344] arXiv:2509.11895 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：基于先验观测的增量3D场景图预测

标题： Integrating Prior Observations for Incremental 3D Scene Graph Prediction

Marian Renz, Felix Igelbrink, Martin Atzmueller

评论：被第24届国际机器学习与应用会议（ICMLA'25）接受

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[345] arXiv:2509.11892 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： Logit 混合异常暴露用于细粒度分布外检测

标题： Logit Mixture Outlier Exposure for Fine-grained Out-of-Distribution Detection

Akito Shinohara, Kohei Fukuda, Hiroaki Aizawa

评论：被DICTA2025接受

主题：计算机视觉与模式识别 (cs.CV)
[346] arXiv:2509.11885 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： BREA-Depth：支气管镜真实气道几何深度估计

标题： BREA-Depth: Bronchoscopy Realistic Airway-geometric Depth Estimation

Francis Xiatian Zhang, Emile Mackute, Mohammadreza Kasaei, Kevin Dhaliwal, Robert Thomson, Mohsen Khadem

评论：论文已被接受至MICCAI 2025

主题：计算机视觉与模式识别 (cs.CV)
[347] arXiv:2509.11884 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： SAM-TTT：通过反向参数配置和测试时训练的伪装目标检测的通用分割模型

标题： SAM-TTT: Segment Anything Model via Reverse Parameter Configuration and Test-Time Training for Camouflaged Object Detection

Zhenni Yu, Li Zhao, Guobao Xiao, Xiaoqin Zhang

评论：被ACM MM 25接受

主题：计算机视觉与模式识别 (cs.CV)
[348] arXiv:2509.11878 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：自定义（DIY）：在零样本设置中使用加权提示操作对诗歌图像进行修改

标题： Do It Yourself (DIY): Modifying Images for Poems in a Zero-Shot Setting Using Weighted Prompt Manipulation

Sofia Jamil, Kotla Sai Charan, Sriparna Saha, Koustava Goswami, K J Joseph

主题：计算机视觉与模式识别 (cs.CV)
[349] arXiv:2509.11873 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：多动物跟踪在转变中：对已知和新兴方法的比较见解

标题： Multi-animal tracking in Transition: Comparative Insights into Established and Emerging Methods

Anne Marthe Sophie Ngo Bibinbe, Patrick Gagnon, Jamie Ahloy-Dallaire, Eric R. Paquet

评论： 21页，3图，5表

主题：计算机视觉与模式识别 (cs.CV)
[350] arXiv:2509.11866 (交叉列表自 cs.CV) [中文pdf, pdf, 其他]: 标题： Dr.V：一种分层感知-时间-认知框架，通过细粒度时空定位诊断视频幻觉

标题： Dr.V: A Hierarchical Perception-Temporal-Cognition Framework to Diagnose Video Hallucination by Fine-grained Spatial-Temporal Grounding

Meng Luo, Shengqiong Wu, Liqiang Jing, Tianjie Ju, Li Zheng, Jinxiang Lai, Tianlong Wu, Xinya Du, Jian Li, Siyuan Yan, Jiebo Luo, William Yang Wang, Hao Fei, Mong-Li Lee, Wynne Hsu

评论： 25页，16图

主题：计算机视觉与模式识别 (cs.CV)
[351] arXiv:2509.11862 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：将视觉语言模型与符号基础相结合用于视频问答

标题： Bridging Vision Language Models and Symbolic Grounding for Video Question Answering

Haodi Ma, Vyom Pathak, Daisy Zhe Wang

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 机器学习 (cs.LG)
[352] arXiv:2509.11853 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：基于分割的稀疏视图3D高斯点云初始化

标题： Segmentation-Driven Initialization for Sparse-view 3D Gaussian Splatting

Yi-Hsin Li, Thomas Sikora, Sebastian Knorr, Måarten Sjöström

主题：计算机视觉与模式识别 (cs.CV)
[353] arXiv:2509.11840 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：开放词汇零样本分割的合成标题

标题： Synthetic Captions for Open-Vocabulary Zero-Shot Segmentation

Tim Lebailly, Vijay Veerabadran, Satwik Kottur, Karl Ridgeway, Michael Louis Iuzzolino

评论： ICCV 2025 CDEL 工作坊

主题：计算机视觉与模式识别 (cs.CV)
[354] arXiv:2509.11838 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：高维空间中的概率鲁棒性分析：语义分割网络的应用

标题： Probabilistic Robustness Analysis in High Dimensional Space: Application to Semantic Segmentation Network

Navid Hashemi, Samuel Sasaki, Diego Manzanas Lopez, Ipek Oguz, Meiyi Ma, Taylor T. Johnson

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[355] arXiv:2509.11817 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： MAFS：用于红外可见图像融合和语义分割的掩码自编码器

标题： MAFS: Masked Autoencoder for Infrared-Visible Image Fusion and Semantic Segmentation

Liying Wang, Xiaoli Zhang, Chuanmin Jia, Siwei Ma

评论：被TIP 2025接受

主题：计算机视觉与模式识别 (cs.CV)
[356] arXiv:2509.11815 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： SpecVLM：视觉语言模型中的快速推测解码

标题： SpecVLM: Fast Speculative Decoding in Vision-Language Models

Haiduo Huang, Fuwei Yang, Zhenhua Liu, Xuanwu Yin, Dong Li, Pengju Ren, Emad Barsoum

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[357] arXiv:2509.11811 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： LFRA-Net：一种轻量级焦点和区域感知注意力网络用于视网膜血管分割

标题： LFRA-Net: A Lightweight Focal and Region-Aware Attention Network for Retinal Vessel Segmentatio

Mehwish Mehmood, Shahzaib Iqbal, Tariq Mahmood Khan, Ivor Spence, Muhammad Fahim

主题：计算机视觉与模式识别 (cs.CV)
[358] arXiv:2509.11800 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：伪D：通过校准的神经训练动力学指导多视图不确定性估计

标题： Pseudo-D: Informing Multi-View Uncertainty Estimation with Calibrated Neural Training Dynamics

Ang Nan Gu, Michael Tsang, Hooman Vaseli, Purang Abolmaesumi, Teresa Tsang

主题：计算机视觉与模式识别 (cs.CV)
[359] arXiv:2509.11796 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： FineQuest：通过思维代理推理的自适应知识辅助体育视频理解

标题： FineQuest: Adaptive Knowledge-Assisted Sports Video Understanding via Agent-of-Thoughts Reasoning

Haodong Chen, Haojian Huang, XinXiang Yin, Dian Shao

评论： ACM MM 2025

主题：计算机视觉与模式识别 (cs.CV)
[360] arXiv:2509.11774 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： SA-UNetv2：重新思考空间注意力U-Net用于视网膜血管分割

标题： SA-UNetv2: Rethinking Spatial Attention U-Net for Retinal Vessel Segmentation

Changlu Guo, Anders Nymark Christensen, Anders Bjorholm Dahl, Yugen Yi, Morten Rieger Hannemose

评论：代码可在github.com/clguo/SA-UNetv2获取

主题：计算机视觉与模式识别 (cs.CV)
[361] arXiv:2509.11772 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： Seg2Track-SAM2：基于SAM2的零样本泛化多目标跟踪与分割

标题： Seg2Track-SAM2: SAM2-based Multi-object Tracking and Segmentation for Zero-shot Generalization

Diogo Mendonça, Tiago Barros, Cristiano Premebida, Urbano J. Nunes

主题：计算机视觉与模式识别 (cs.CV)
[362] arXiv:2509.11763 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： MSMA：从非约束图像中进行多属性三维人脸重建的多尺度特征融合

标题： MSMA: Multi-Scale Feature Fusion For Multi-Attribute 3D Face Reconstruction From Unconstrained Images

Danling Cao

主题：计算机视觉与模式识别 (cs.CV)

总共 569 条目 : 1-50 ... 201-250 251-300 301-350 313-362 351-400 401-450 451-500 ... 551-569

显示最多 50 每页条目：较少 | 更多 | 所有

计算机视觉与模式识别

最近提交的作者和标题

2025年09月16日， 星期二 (展示 首先 184 之 50 条目 )

2025年09月16日，星期二 (展示首先 184 之 50 条目 )