Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs.CV

帮助 | 高级搜索

计算机视觉与模式识别

最近提交的作者和标题

  • 2025年09月19日, 星期五
  • 2025年09月18日, 星期四
  • 2025年09月17日, 星期三
  • 2025年09月16日, 星期二
  • 2025年09月15日, 星期一

查看今天的 新的 变化

总共 569 条目 : 1-50 ... 201-250 251-300 301-350 313-362 351-400 401-450 451-500 ... 551-569
显示最多 50 每页条目: 较少 | 更多 | 所有

2025年09月16日, 星期二 (展示 首先 184 之 50 条目 )

[313] arXiv:2509.12204 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 以角色为中心的动画电影理解
标题: Character-Centric Understanding of Animated Movies
Zhongrui Gui, Junyu Xie, Tengda Han, Weidi Xie, Andrew Zisserman
主题: 计算机视觉与模式识别 (cs.CV)
[314] arXiv:2509.12203 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: LazyDrag:通过显式对应在多模态扩散变换器上实现稳定的基于拖动的编辑
标题: LazyDrag: Enabling Stable Drag-Based Editing on Multi-Modal Diffusion Transformers via Explicit Correspondence
Zixin Yin, Xili Dai, Duomin Wang, Xianfang Zeng, Lionel M. Ni, Gang Yu, Heung-Yeung Shum
主题: 计算机视觉与模式识别 (cs.CV)
[315] arXiv:2509.12201 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: OmniWorld:用于4D世界建模的多领域和多模态数据集
标题: OmniWorld: A Multi-Domain and Multi-Modal Dataset for 4D World Modeling
Yang Zhou, Yifan Wang, Jianjun Zhou, Wenzheng Chang, Haoyu Guo, Zizun Li, Kaijing Ma, Xinyue Li, Yating Wang, Haoyi Zhu, Mingyu Liu, Dingning Liu, Jiange Yang, Zhoujie Fu, Junyi Chen, Chunhua Shen, Jiangmiao Pang, Kaipeng Zhang, Tong He
评论: https://yangzhou24.github.io/OmniWorld/
主题: 计算机视觉与模式识别 (cs.CV)
[316] arXiv:2509.12197 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 从LiDAR点云中进行三维人体姿态和形状估计:综述
标题: 3D Human Pose and Shape Estimation from LiDAR Point Clouds: A Review
Salma Galaaoui, Eduardo Valle, David Picard, Nermin Samet
主题: 计算机视觉与模式识别 (cs.CV)
[317] arXiv:2509.12193 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 领域自适应预训练提高灵长类行为识别
标题: Domain-Adaptive Pretraining Improves Primate Behavior Recognition
Felix B. Mueller, Timo Lueddecke, Richard Vogg, Alexander S. Ecker
评论: 在CVPR 2025研讨会CV4Animals上的口头报告
主题: 计算机视觉与模式识别 (cs.CV)
[318] arXiv:2509.12187 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 全息服装:真实场景服装的360°新视角合成
标题: HoloGarment: 360° Novel View Synthesis of In-the-Wild Garments
Johanna Karras, Yingwei Li, Yasamin Jafarian, Ira Kemelmacher-Shlizerman
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 图形学 (cs.GR) ; 机器学习 (cs.LG)
[319] arXiv:2509.12155 (交叉列表自 cs.CV) [中文pdf, pdf, 其他]
标题: 基于LoRA微调的大规模视觉模型用于立体定向体外放射治疗后肺损伤的自动评估
标题: LoRA-fine-tuned Large Vision Models for Automated Assessment of Post-SBRT Lung Injury
M. Bolhassani, B. Veasey, E. Daugherty, S. Keltner, N. Kumar, N. Dunlap, A. Amini
评论: 5页,5图
主题: 计算机视觉与模式识别 (cs.CV)
[320] arXiv:2509.12146 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 多器官X射线基础模型
标题: Multi Anatomy X-Ray Foundation Model
Nishank Singla, Krisztian Koos, Farzin Haddadpour, Amin Honarmandi Shandiz, Lovish Chum, Xiaojian Xu, Qing Jin, Erhan Bas
评论: 此作品已提交给IEEE以可能发表
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[321] arXiv:2509.12145 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 基于视觉语言模型的开放式分层流式视频理解
标题: Open-ended Hierarchical Streaming Video Understanding with Vision Language Models
Hyolim Kang, Yunsu Park, Youngbeom Yoo, Yeeun Choi, Seon Joo Kim
评论: 17页
主题: 计算机视觉与模式识别 (cs.CV)
[322] arXiv:2509.12143 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 3DViT-GAT:一种基于统一图谱的三维视觉变换器和图学习框架,用于使用结构磁共振成像数据检测重度抑郁症
标题: 3DViT-GAT: A Unified Atlas-Based 3D Vision Transformer and Graph Learning Framework for Major Depressive Disorder Detection Using Structural MRI Data
Nojod M. Alotaibi, Areej M. Alhothali, Manar S. Ali
评论: 14页,1图,7表
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[323] arXiv:2509.12132 (交叉列表自 cs.CV) [中文pdf, pdf, 其他]
标题: 再看一遍,慢慢思考:增强视觉语言模型中的视觉反思
标题: Look Again, Think Slowly: Enhancing Visual Reflection in Vision-Language Models
Pu Jian, Junhong Wu, Wei Sun, Chen Wang, Shuo Ren, Jiajun Zhang
评论: EMNLP2025 主会议
主题: 计算机视觉与模式识别 (cs.CV) ; 计算与语言 (cs.CL)
[324] arXiv:2509.12125 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: RailSafeNet:有轨电车安全的视觉场景理解
标题: RailSafeNet: Visual Scene Understanding for Tram Safety
Ondřej Valach, Ivan Gruber
评论: 11页,5图,EPIA2025
主题: 计算机视觉与模式识别 (cs.CV)
[325] arXiv:2509.12105 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: FS-SAM2:通过低秩适应将分割任何模型2用于少样本语义分割
标题: FS-SAM2: Adapting Segment Anything Model 2 for Few-Shot Semantic Segmentation via Low-Rank Adaptation
Bernardo Forni, Gabriele Lombardi, Federico Pozzi, Mirco Planamente
评论: 已被ICIAP 2025接收
主题: 计算机视觉与模式识别 (cs.CV)
[326] arXiv:2509.12090 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 端到端跨全栈和稀疏心脏MRI的4D心脏网格恢复
标题: End-to-End 4D Heart Mesh Recovery Across Full-Stack and Sparse Cardiac MRI
Yihong Chen, Jiancheng Yang, Deniz Sayin Mercadier, Hieu Le, Juerg Schwitter, Pascal Fua
主题: 计算机视觉与模式识别 (cs.CV)
[327] arXiv:2509.12079 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 基于渐进流的谱压缩成像展开
标题: Progressive Flow-inspired Unfolding for Spectral Compressive Imaging
Xiaodong Wang, Ping Wang, Zijun He, Mengjie Qin, Xin Yuan
主题: 计算机视觉与模式识别 (cs.CV)
[328] arXiv:2509.12069 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: U-Mamba2:在锥形束CT中用于牙体解剖分割的状态空间模型扩展
标题: U-Mamba2: Scaling State Space Models for Dental Anatomy Segmentation in CBCT
Zhi Qin Tan, Xiatian Zhu, Owen Addison, Yunpeng Li
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[329] arXiv:2509.12068 (交叉列表自 cs.CV) [中文pdf, pdf, 其他]
标题: 从三维医学影像数据中端到端学习多器官隐式表面
标题: End-to-End Learning of Multi-Organ Implicit Surfaces from 3D Medical Imaging Data
Farahdiba Zarin, Nicolas Padoy, Jérémy Dana, Vinkle Srivastav
主题: 计算机视觉与模式识别 (cs.CV)
[330] arXiv:2509.12062 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 通过跨种群增强实现不同孕周的鲁棒胎儿姿态估计
标题: Robust Fetal Pose Estimation across Gestational Ages via Cross-Population Augmentation
Sebastian Diaz, Benjamin Billot, Neel Dey, Molin Zhang, Esra Abaci Turk, P. Ellen Grant, Polina Golland, Elfar Adalsteinsson
评论: 被MICCAI 2025接受
主题: 计算机视觉与模式识别 (cs.CV)
[331] arXiv:2509.12052 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: AvatarSync:通过自回归视角重新思考说话头动画
标题: AvatarSync: Rethinking Talking-Head Animation through Autoregressive Perspective
Yuchen Deng, Xiuyang Wu, Hai-Tao Zheng, Suiyang Zhang, Yi He, Yuxing Han
主题: 计算机视觉与模式识别 (cs.CV)
[332] arXiv:2509.12047 (交叉列表自 cs.CV) [中文pdf, pdf, 其他]
标题: 基于计算机视觉的个体行为分析流水线:在爱丁堡猪数据集上的基准测试
标题: A Computer Vision Pipeline for Individual-Level Behavior Analysis: Benchmarking on the Edinburgh Pig Dataset
Haiyu Yang, Enhong Liu, Jennifer Sun, Sumit Sharma, Meike van Leerdam, Sebastien Franceschini, Puchun Niu, Miel Hostens
评论: 9个图,提交给《计算机与农业电子》
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[333] arXiv:2509.12046 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 基于结构化掩码的布局条件自回归文本到图像生成
标题: Layout-Conditioned Autoregressive Text-to-Image Generation via Structured Masking
Zirui Zheng, Takashi Isobe, Tong Shen, Xu Jia, Jianbin Zhao, Xiaomin Li, Mengmeng Ge, Baolu Li, Qinghe Wang, Dong Li, Dong Zhou, Yunzhi Zhuge, Huchuan Lu, Emad Barsoum
评论: 10页,3图
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[334] arXiv:2509.12040 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 探索遥感中的高效开放词汇分割
标题: Exploring Efficient Open-Vocabulary Segmentation in the Remote Sensing
Bingyu Li, Haocheng Dong, Da Zhang, Zhiyuan Zhao, Junyu Gao, Xuelong Li
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[335] arXiv:2509.12039 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: RAM++:通过自适应掩码的鲁棒表示学习用于一体化图像修复
标题: RAM++: Robust Representation Learning via Adaptive Mask for All-in-One Image Restoration
Zilong Zhang, Chujie Qin, Chunle Guo, Yong Zhang, Chao Xue, Ming-Ming Cheng, Chongyi Li
评论: 18页,22图
主题: 计算机视觉与模式识别 (cs.CV)
[336] arXiv:2509.12024 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 扩散模型中的鲁棒概念擦除:安全性和鲁棒性的理论视角
标题: Robust Concept Erasure in Diffusion Models: A Theoretical Perspective on Security and Robustness
Zixuan Fu, Yan Ren, Finn Carter, Chenyue Wen, Le Ku, Daheng Yu, Emily Davis, Bo Zhang
评论: 最终版
主题: 计算机视觉与模式识别 (cs.CV)
[337] arXiv:2509.11986 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 嵌入中的迷失:视觉-语言模型中的信息丢失
标题: Lost in Embeddings: Information Loss in Vision-Language Models
Wenyan Li, Raphael Tang, Chengzu Li, Caiqi Zhang, Ivan Vulić, Anders Søgaard
主题: 计算机视觉与模式识别 (cs.CV) ; 计算与语言 (cs.CL)
[338] arXiv:2509.11959 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 学习生成4D LiDAR序列
标题: Learning to Generate 4D LiDAR Sequences
Ao Liang, Youquan Liu, Yu Yang, Dongyue Lu, Linfeng Li, Lingdong Kong, Huaici Zhao, Wei Tsang Ooi
评论: 摘要论文(非归档)@ ICCV 2025 Wild3D 工作坊;GitHub 仓库地址为 https://lidarcrafter.github.io/
主题: 计算机视觉与模式识别 (cs.CV) ; 机器人技术 (cs.RO)
[339] arXiv:2509.11952 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: CLAIRE:一种基于RIFT损失和Phi-3小型语言模型的双编码器网络,用于跨模态合成孔径雷达和光学土地覆盖分割
标题: CLAIRE: A Dual Encoder Network with RIFT Loss and Phi-3 Small Language Model Based Interpretability for Cross-Modality Synthetic Aperture Radar and Optical Land Cover Segmentation
Debopom Sutradhar, Arefin Ittesafun Abian, Mohaimenul Azam Khan Raiaan, Reem E. Mohamed, Sheikh Izzal Azid, Sami Azam
评论: 23页,6图,10表
主题: 计算机视觉与模式识别 (cs.CV)
[340] arXiv:2509.11948 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: Sphere-GAN:一种基于GAN的360°视频显著性估计方法
标题: Sphere-GAN: a GAN-based Approach for Saliency Estimation in 360° Videos
Mahmoud Z. A. Wahba, Sara Baldoni, Federica Battisti
主题: 计算机视觉与模式识别 (cs.CV) ; 多媒体 (cs.MM) ; 图像与视频处理 (eess.IV)
[341] arXiv:2509.11926 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 基于 Douglas-Rachford 迭代的图像插值图算法展开
标题: Graph Algorithm Unrolling with Douglas-Rachford Iterations for Image Interpolation with Guaranteed Initialization
Xue Zhang, Bingshuo Hu, Gene Cheung
主题: 计算机视觉与模式识别 (cs.CV)
[342] arXiv:2509.11924 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 用于3D颈动脉MRI斑块易损性自动诊断的增强文本引导变分多模态知识蒸馏网络(VMD)
标题: Enriched text-guided variational multimodal knowledge distillation network (VMD) for automated diagnosis of plaque vulnerability in 3D carotid artery MRI
Bo Cao, Fan Yu, Mengmeng Feng, SenHao Zhang, Xin Meng, Yue Zhang, Zhen Qian, Jie Lu
主题: 计算机视觉与模式识别 (cs.CV)
[343] arXiv:2509.11916 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: NeuroGaze-Distill:脑启发的蒸馏和抑郁启发的几何先验用于鲁棒的面部情绪识别
标题: NeuroGaze-Distill: Brain-informed Distillation and Depression-Inspired Geometric Priors for Robust Facial Emotion Recognition
Zilin Li, Weiwei Xu, Xuanqi Zhao, Yiran Zhu
评论: 预印本。仅部署视觉;EEG仅用于形成静态原型。包含附录、7幅图和3张表。考虑提交至2026年国际学习表示大会(ICLR),巴西里约热内卢
主题: 计算机视觉与模式识别 (cs.CV)
[344] arXiv:2509.11895 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 基于先验观测的增量3D场景图预测
标题: Integrating Prior Observations for Incremental 3D Scene Graph Prediction
Marian Renz, Felix Igelbrink, Martin Atzmueller
评论: 被第24届国际机器学习与应用会议(ICMLA'25)接受
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[345] arXiv:2509.11892 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: Logit 混合异常暴露用于细粒度分布外检测
标题: Logit Mixture Outlier Exposure for Fine-grained Out-of-Distribution Detection
Akito Shinohara, Kohei Fukuda, Hiroaki Aizawa
评论: 被DICTA2025接受
主题: 计算机视觉与模式识别 (cs.CV)
[346] arXiv:2509.11885 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: BREA-Depth:支气管镜真实气道几何深度估计
标题: BREA-Depth: Bronchoscopy Realistic Airway-geometric Depth Estimation
Francis Xiatian Zhang, Emile Mackute, Mohammadreza Kasaei, Kevin Dhaliwal, Robert Thomson, Mohsen Khadem
评论: 论文已被接受至MICCAI 2025
主题: 计算机视觉与模式识别 (cs.CV)
[347] arXiv:2509.11884 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: SAM-TTT:通过反向参数配置和测试时训练的伪装目标检测的通用分割模型
标题: SAM-TTT: Segment Anything Model via Reverse Parameter Configuration and Test-Time Training for Camouflaged Object Detection
Zhenni Yu, Li Zhao, Guobao Xiao, Xiaoqin Zhang
评论: 被ACM MM 25接受
主题: 计算机视觉与模式识别 (cs.CV)
[348] arXiv:2509.11878 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 自定义(DIY):在零样本设置中使用加权提示操作对诗歌图像进行修改
标题: Do It Yourself (DIY): Modifying Images for Poems in a Zero-Shot Setting Using Weighted Prompt Manipulation
Sofia Jamil, Kotla Sai Charan, Sriparna Saha, Koustava Goswami, K J Joseph
主题: 计算机视觉与模式识别 (cs.CV)
[349] arXiv:2509.11873 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 多动物跟踪在转变中:对已知和新兴方法的比较见解
标题: Multi-animal tracking in Transition: Comparative Insights into Established and Emerging Methods
Anne Marthe Sophie Ngo Bibinbe, Patrick Gagnon, Jamie Ahloy-Dallaire, Eric R. Paquet
评论: 21页,3图,5表
主题: 计算机视觉与模式识别 (cs.CV)
[350] arXiv:2509.11866 (交叉列表自 cs.CV) [中文pdf, pdf, 其他]
标题: Dr.V:一种分层感知-时间-认知框架,通过细粒度时空定位诊断视频幻觉
标题: Dr.V: A Hierarchical Perception-Temporal-Cognition Framework to Diagnose Video Hallucination by Fine-grained Spatial-Temporal Grounding
Meng Luo, Shengqiong Wu, Liqiang Jing, Tianjie Ju, Li Zheng, Jinxiang Lai, Tianlong Wu, Xinya Du, Jian Li, Siyuan Yan, Jiebo Luo, William Yang Wang, Hao Fei, Mong-Li Lee, Wynne Hsu
评论: 25页,16图
主题: 计算机视觉与模式识别 (cs.CV)
[351] arXiv:2509.11862 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 将视觉语言模型与符号基础相结合用于视频问答
标题: Bridging Vision Language Models and Symbolic Grounding for Video Question Answering
Haodi Ma, Vyom Pathak, Daisy Zhe Wang
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 机器学习 (cs.LG)
[352] arXiv:2509.11853 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 基于分割的稀疏视图3D高斯点云初始化
标题: Segmentation-Driven Initialization for Sparse-view 3D Gaussian Splatting
Yi-Hsin Li, Thomas Sikora, Sebastian Knorr, Måarten Sjöström
主题: 计算机视觉与模式识别 (cs.CV)
[353] arXiv:2509.11840 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 开放词汇零样本分割的合成标题
标题: Synthetic Captions for Open-Vocabulary Zero-Shot Segmentation
Tim Lebailly, Vijay Veerabadran, Satwik Kottur, Karl Ridgeway, Michael Louis Iuzzolino
评论: ICCV 2025 CDEL 工作坊
主题: 计算机视觉与模式识别 (cs.CV)
[354] arXiv:2509.11838 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 高维空间中的概率鲁棒性分析:语义分割网络的应用
标题: Probabilistic Robustness Analysis in High Dimensional Space: Application to Semantic Segmentation Network
Navid Hashemi, Samuel Sasaki, Diego Manzanas Lopez, Ipek Oguz, Meiyi Ma, Taylor T. Johnson
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[355] arXiv:2509.11817 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: MAFS:用于红外可见图像融合和语义分割的掩码自编码器
标题: MAFS: Masked Autoencoder for Infrared-Visible Image Fusion and Semantic Segmentation
Liying Wang, Xiaoli Zhang, Chuanmin Jia, Siwei Ma
评论: 被TIP 2025接受
主题: 计算机视觉与模式识别 (cs.CV)
[356] arXiv:2509.11815 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: SpecVLM:视觉语言模型中的快速推测解码
标题: SpecVLM: Fast Speculative Decoding in Vision-Language Models
Haiduo Huang, Fuwei Yang, Zhenhua Liu, Xuanwu Yin, Dong Li, Pengju Ren, Emad Barsoum
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[357] arXiv:2509.11811 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: LFRA-Net:一种轻量级焦点和区域感知注意力网络用于视网膜血管分割
标题: LFRA-Net: A Lightweight Focal and Region-Aware Attention Network for Retinal Vessel Segmentatio
Mehwish Mehmood, Shahzaib Iqbal, Tariq Mahmood Khan, Ivor Spence, Muhammad Fahim
主题: 计算机视觉与模式识别 (cs.CV)
[358] arXiv:2509.11800 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 伪D:通过校准的神经训练动力学指导多视图不确定性估计
标题: Pseudo-D: Informing Multi-View Uncertainty Estimation with Calibrated Neural Training Dynamics
Ang Nan Gu, Michael Tsang, Hooman Vaseli, Purang Abolmaesumi, Teresa Tsang
主题: 计算机视觉与模式识别 (cs.CV)
[359] arXiv:2509.11796 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: FineQuest:通过思维代理推理的自适应知识辅助体育视频理解
标题: FineQuest: Adaptive Knowledge-Assisted Sports Video Understanding via Agent-of-Thoughts Reasoning
Haodong Chen, Haojian Huang, XinXiang Yin, Dian Shao
评论: ACM MM 2025
主题: 计算机视觉与模式识别 (cs.CV)
[360] arXiv:2509.11774 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: SA-UNetv2:重新思考空间注意力U-Net用于视网膜血管分割
标题: SA-UNetv2: Rethinking Spatial Attention U-Net for Retinal Vessel Segmentation
Changlu Guo, Anders Nymark Christensen, Anders Bjorholm Dahl, Yugen Yi, Morten Rieger Hannemose
评论: 代码可在github.com/clguo/SA-UNetv2获取
主题: 计算机视觉与模式识别 (cs.CV)
[361] arXiv:2509.11772 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: Seg2Track-SAM2:基于SAM2的零样本泛化多目标跟踪与分割
标题: Seg2Track-SAM2: SAM2-based Multi-object Tracking and Segmentation for Zero-shot Generalization
Diogo Mendonça, Tiago Barros, Cristiano Premebida, Urbano J. Nunes
主题: 计算机视觉与模式识别 (cs.CV)
[362] arXiv:2509.11763 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: MSMA:从非约束图像中进行多属性三维人脸重建的多尺度特征融合
标题: MSMA: Multi-Scale Feature Fusion For Multi-Attribute 3D Face Reconstruction From Unconstrained Images
Danling Cao
主题: 计算机视觉与模式识别 (cs.CV)
总共 569 条目 : 1-50 ... 201-250 251-300 301-350 313-362 351-400 401-450 451-500 ... 551-569
显示最多 50 每页条目: 较少 | 更多 | 所有
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号