Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs.CV

帮助 | 高级搜索

计算机视觉与模式识别

最近提交的作者和标题

  • 2026年01月12日, 星期一
  • 2026年01月09日, 星期五
  • 2026年01月08日, 星期四
  • 2026年01月07日, 星期三
  • 2026年01月06日, 星期二

查看今天的 新的 变化

总共 532 条目 : 1-50 51-100 101-150 151-200 186-235 201-250 251-300 301-350 ... 501-532
显示最多 50 每页条目: 较少 | 更多 | 所有

2026年01月08日, 星期四 (继续, 展示 88 之 50 条目 )

[186] arXiv:2601.03416 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: GAMBIT:一种用于多模态大语言模型的博弈化破解框架
标题: GAMBIT: A Gamified Jailbreak Framework for Multimodal Large Language Models
Shuyan Bai, Tingfa Xu, Peifu Liu, Yuhao Qiu, Huiyan Bai, Huan Chen, Yanyan Peng, Jianan Li
主题: 计算机视觉与模式识别 (cs.CV)
[187] arXiv:2601.03392 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 更好,但不足:针对猕猴IT动态测试视频ANNs
标题: Better, But Not Sufficient: Testing Video ANNs Against Macaque IT Dynamics
Xiaoxian Shen, Yuhui Zhang, Sahithi Ankireddy, Xiaohan Wang, Maya Varma, Henry Guo, Curtis Langlotz, Serena Yeung-Levy
评论: 在2025年ICCV第二届仿人计算机视觉研讨会的扩展摘要
主题: 计算机视觉与模式识别 (cs.CV) ; 神经与进化计算 (cs.NE)
[188] arXiv:2601.03369 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: RiskCueBench:从视频语言模型中的早期风险线索进行前瞻性推理的基准测试
标题: RiskCueBench: Benchmarking Anticipatory Reasoning from Early Risk Cues in Video-Language Models
Donghwan Lee, Byeongjin Kim, Geunhee Kim, Hyukjin Kwon, Nahyeon Maeng, Wooju Kim
主题: 计算机视觉与模式识别 (cs.CV) ; 计算与语言 (cs.CL)
[189] arXiv:2601.03736 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: HyperCOD:第一个高光谱伪装目标检测的挑战性基准和基线
标题: HyperCOD: The First Challenging Benchmark and Baseline for Hyperspectral Camouflaged Object Detection
Zhipeng Qian, Zihan Liang, Yufei Ma, Ben Chen, Huangyu Dai, Yiwei Ma, Jiayi Ji, Chenyi Lei, Han Li, Xiaoshuai Sun
主题: 计算机视觉与模式识别 (cs.CV)
[190] arXiv:2601.03733 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: RadDiff:用自然语言描述放射学图像集中的差异
标题: RadDiff: Describing Differences in Radiology Image Sets with Natural Language
Wenyong Li, Qi Jiang, Weijian Hu, Kailun Yang, Zhanjun Zhang, Wenjun Tian, Kaiwei Wang, Jian Bai
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 计算与语言 (cs.CL) ; 计算机与社会 (cs.CY) ; 机器学习 (cs.LG)
[191] arXiv:2601.03729 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: MATANet:一种多上下文注意力和分类学感知网络,用于海洋物种的细粒度水下识别
标题: MATANet: A Multi-context Attention and Taxonomy-Aware Network for Fine-Grained Underwater Recognition of Marine Species
Qingyao Tian, Bingyu Yang, Huai Liao, Xinyan Huang, Junyong Li, Dong Yi, Hongbin Liu
主题: 计算机视觉与模式识别 (cs.CV)
[192] arXiv:2601.03713 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: BREATH-VL:通过语义-几何融合的视觉-语言引导的6-DoF支气管镜定位
标题: BREATH-VL: Vision-Language-Guided 6-DoF Bronchoscopy Localization via Semantic-Geometric Fusion
Dennis Holzmann, Sven Wachsmuth
主题: 计算机视觉与模式识别 (cs.CV)
[193] arXiv:2601.04137 (交叉列表自 cs.RO) [中文pdf, pdf, html, 其他]
标题: 哇, wo, val! 一个综合的具身世界模型评估图灵测试
标题: Wow, wo, val! A Comprehensive Embodied World Model Evaluation Turing Test
Siddarth Nilol Kundur Satish, Devesh Jaiswal, Hongyu Chen, Abhishek Bakshi
主题: 机器人技术 (cs.RO) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV)
[194] arXiv:2601.03633 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: MFC-RFNet:一种多尺度引导的校正流网络用于雷达序列预测
标题: MFC-RFNet: A Multi-scale Guided Rectified Flow Network for Radar Sequence Prediction
Jiangyuan Liu, Hongxuan Ma, Yuhao Zhao, Zhe Liu, Jian Wang, Wei Zou
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[195] arXiv:2601.03528 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: CloudMatch:半监督云检测的弱到强一致性学习
标题: CloudMatch: Weak-to-Strong Consistency Learning for Semi-Supervised Cloud Detection
Jinsong Zhou, Yihua Du, Xinli Xu, Luozhou Wang, Zijie Zhuang, Yehang Zhang, Shuaibo Li, Xiaojun Hu, Bolan Su, Ying-cong Chen
评论: 应用遥感杂志
主题: 计算机视觉与模式识别 (cs.CV)
[196] arXiv:2601.03510 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: G2P:高斯到点属性对齐用于边界感知的3D语义分割
标题: G2P: Gaussian-to-Point Attribute Alignment for Boundary-Aware 3D Semantic Segmentation
Babak Asadi, Peiyang Wu, Mani Golparvar-Fard, Ramez Hajj
评论: 预印本。正在审稿中
主题: 计算机视觉与模式识别 (cs.CV)
[197] arXiv:2601.04163 (交叉列表自 eess.IV) [中文pdf, pdf, html, 其他]
标题: 扫描仪引起的领域偏移削弱了病理学基础模型的鲁棒性
标题: Scanner-Induced Domain Shifts Undermine the Robustness of Pathology Foundation Models
Wenjie Luo, Chuanhu Deng, Chaorong Li, Rongyao Deng, Qiang Yang
主题: 图像与视频处理 (eess.IV) ; 计算机视觉与模式识别 (cs.CV) ; 机器学习 (cs.LG)
[198] arXiv:2601.03667 (交叉列表自 cs.CV) [中文pdf, pdf, 其他]
标题: TRec:通过2D点轨迹运动学习手-物体交互
标题: TRec: Learning Hand-Object Interactions through 2D Point Track Motion
Bimal Kumar Ray
评论: 提交至ICPR 2026
主题: 计算机视觉与模式识别 (cs.CV) ; 机器学习 (cs.LG)
[199] arXiv:2601.03431 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: WeedRepFormer:可重新参数化的视觉变压器用于实时水麻分割和性别分类
标题: WeedRepFormer: Reparameterizable Vision Transformers for Real-Time Waterhemp Segmentation and Gender Classification
Samson Oseiwe Ajadalu
评论: 11页,5图
主题: 计算机视觉与模式识别 (cs.CV)
[200] arXiv:2601.03362 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 发丝守护者:深度、立体视觉和新视角中的软边界拯救
标题: Guardians of the Hair: Rescuing Soft Boundaries in Depth, Stereo, and Novel Views
Pratyush Jena, Amal Joseph, Arnav Sharma, Ravi Kiran Sarvadevabhatla
主题: 计算机视觉与模式识别 (cs.CV)
[201] arXiv:2601.03357 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: RelightAnyone:一种通用的可重新照明的3D高斯头部模型
标题: RelightAnyone: A Generalized Relightable 3D Gaussian Head Model
Qianyu Guo, Jingrong Wu, Jieji Ren, Weifeng Ge, Wenqiang Zhang
主题: 计算机视觉与模式识别 (cs.CV) ; 图形学 (cs.GR)
[202] arXiv:2601.03655 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 视频内存:通过内存集成实现一致的视频生成
标题: VideoMemory: Toward Consistent Video Generation via Memory Integration
Zhongbin Guo, Zhen Yang, Yushan Li, Xinyue Zhang, Wenyu Gao, Jiacheng Wang, Chengzhi Li, Xiangrui Liu, Ping Jian
评论: 项目页面:https://hit-perfect.github.io/VideoMemory/
主题: 计算机视觉与模式识别 (cs.CV)
[203] arXiv:2601.03596 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 环境扰动下鲁棒的少样本分割自适应注意力蒸馏
标题: Adaptive Attention Distillation for Robust Few-Shot Segmentation under Environmental Perturbations
Yakun Niu, Yingjian Chen, Lei Zhang
评论: 12页,5图
主题: 计算机视觉与模式识别 (cs.CV)
[204] arXiv:2601.03590 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: LLMs能没有像素就看到吗? 从文本描述中进行空间智能基准测试
标题: Can LLMs See Without Pixels? Benchmarking Spatial Intelligence from Textual Descriptions
Tianyi Shang, Pengjie Xu, Zhaojun Deng, Zhenyu Li, Zhicong Chen, Lijun Wu
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[205] arXiv:2601.03586 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 通过真实图像的分布偏差检测人工智能生成的图像
标题: Detecting AI-Generated Images via Distributional Deviations from Real Images
Guobin Tu, Di Weng
主题: 计算机视觉与模式识别 (cs.CV)
[206] arXiv:2601.03579 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: SpatiaLoc:利用多级空间增强描述符进行跨模态定位
标题: SpatiaLoc: Leveraging Multi-Level Spatial Enhanced Descriptors for Cross-Modal Localization
Jiayi Zhao, Changlu Chen, Jingsheng Li, Tianxiang Xue, Kun Zhan
主题: 计算机视觉与模式识别 (cs.CV)
[207] arXiv:2601.03549 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: EASLT:情绪感知的手语翻译
标题: EASLT: Emotion-Aware Sign Language Translation
Zhicheng Zhao, Fengjiao Peng, Jinquan Yan, Wei Lu, Chenglong Li, Jin Tang
主题: 计算机视觉与模式识别 (cs.CV) ; 计算与语言 (cs.CL)
[208] arXiv:2601.03517 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 语义信念状态世界模型用于3D人体运动预测
标题: Semantic Belief-State World Model for 3D Human Motion Prediction
Sarim Chaudhry
主题: 计算机视觉与模式识别 (cs.CV)
[209] arXiv:2601.03490 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: CroBIM-U:不确定性驱动的指代遥感图像分割
标题: CroBIM-U: Uncertainty-Driven Referring Remote Sensing Image Segmentation
Hojun Song, Chae-yeong Song, Jeong-hun Hong, Chaewon Moon, Dong-hwi Kim, Gahyeon Kim, Soo Ye Kim, Yiyi Liao, Jaehyup Lee, Sang-hyo Park
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[210] arXiv:2601.03468 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 理解文本到图像强化学习中的奖励黑客行为
标题: Understanding Reward Hacking in Text-to-Image Reinforcement Learning
Qiang Zhang, Tong Xiao, Haroun Habeeb, Larissa Laich, Sofien Bouaziz, Patrick Snape, Wenjing Zhang, Matthew Cioffi, Peizhao Zhang, Pavel Pidlypenskyi, Winnie Lin, Luming Ma, Mengjiao Wang, Kunpeng Li, Chengjiang Long, Steven Song, Martin Prazak, Alexander Sjoholm, Ajinkya Deogade, Jaebong Lee, Julio Delgado Mangas, Amaury Aubel
主题: 计算机视觉与模式识别 (cs.CV)
[211] arXiv:2601.03637 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: CrackSegFlow:具有50K图像-掩码基准的可控制流匹配合成用于可泛化的裂缝分割
标题: CrackSegFlow: Controllable Flow Matching Synthesis for Generalizable Crack Segmentation with a 50K Image-Mask Benchmark
Yuxuan Xia, Siheng Wang, Peng Li
主题: 计算机视觉与模式识别 (cs.CV)
[212] arXiv:2601.03400 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 眼-Q:多语言视觉单词谜题求解和图像到短语推理基准
标题: Eye-Q: A Multilingual Benchmark for Visual Word Puzzle Solving and Image-to-Phrase Reasoning
Yuzhe Sun, Zhe Dong, Haochen Jiang, Tianzhu Liu, Yanfeng Gu
评论: 8页
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[213] arXiv:2601.03326 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 高阶PCA类似旋转不变特征用于旋转模的详细形状描述符
标题: Higher order PCA-like rotation-invariant features for detailed shape descriptors modulo rotation
Yunqi Hong, Kuei-Chun Kao, Hengguang Zhou, Cho-Jui Hsieh
评论: 4页,4图
主题: 计算机视觉与模式识别 (cs.CV) ; 机器学习 (cs.LG)
[214] arXiv:2601.03302 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: CageDroneRF:一个大规模的RF基准和无人机感知工具包
标题: CageDroneRF: A Large-Scale RF Benchmark and Toolkit for Drone Perception
Hengjia Li, Liming Jiang, Qing Yan, Yizhi Song, Hao Kang, Zichuan Liu, Xin Lu, Boxi Wu, Deng Cai
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 机器人技术 (cs.RO)
[215] arXiv:2601.03665 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: PhysVideoGenerator:通过潜在物理引导实现物理感知的视频生成
标题: PhysVideoGenerator: Towards Physically Aware Video Generation via Latent Physics Guidance
Joshua Salako
评论: 9页,2张图表,项目页面:https://github.com/CVFall2025-Project/PhysVideoGenerator
主题: 计算机视觉与模式识别 (cs.CV)
[216] arXiv:2601.03463 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 轻量级和深度CNN模型在多样化数据集上的实验比较
标题: Experimental Comparison of Light-Weight and Deep CNN Models Across Diverse Datasets
Md. Hefzul Hossain Papon, Shadman Rabby
评论: 25页,11图
主题: 计算机视觉与模式识别 (cs.CV) ; 机器学习 (cs.LG)
[217] arXiv:2601.03728 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: CSMCIR:基于记忆库的组合图像检索的CoT增强对称对齐
标题: CSMCIR: CoT-Enhanced Symmetric Alignment with Memory Bank for Composed Image Retrieval
Zeyu Dong, Yimin Zhu, Yu Wu, Yu Sun
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[218] arXiv:2601.03467 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: ThinkRL-Edit:强化学习中的思考用于推理导向的图像编辑
标题: ThinkRL-Edit: Thinking in Reinforcement Learning for Reasoning-Centric Image Editing
Toqi Tahamid Sarker, Taminul Islam, Khaled R. Ahmed, Cristiana Bernardi Rankrape, Kaitlin E. Creager, Karla Gage
主题: 计算机视觉与模式识别 (cs.CV)
[219] arXiv:2601.04126 (交叉列表自 cs.CL) [中文pdf, pdf, html, 其他]
标题: 无限网络:用于GUI代理训练的可扩展网络环境合成
标题: InfiniteWeb: Scalable Web Environment Synthesis for GUI Agent Training
Xiangdong Hu, Yangyang Jiang, Qin Hu, Xiaojun Jia
评论: 进行中
主题: 计算与语言 (cs.CL) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV)
[220] arXiv:2601.03718 (交叉列表自 cs.CV) [中文pdf, pdf, 其他]
标题: 通过领域自适应实现无标签数据的真实镜头主动对准
标题: Towards Real-world Lens Active Alignment with Unlabeled Data via Domain Adaptation
Ali Najar, Alireza Mirrokni, Arshia Izadyari, Sadegh Mohammadian, Amir Homayoon Sharifizade, Asal Meskin, Mobin Bagherian, Ehsaneddin Asgari
主题: 计算机视觉与模式识别 (cs.CV) ; 图像与视频处理 (eess.IV) ; 光学 (physics.optics)
[221] arXiv:2601.03331 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: MMErroR:视觉-语言模型中错误推理的基准测试
标题: MMErroR: A Benchmark for Erroneous Reasoning in Vision-Language Models
Matteo Dunnhofer, Christian Micheloni, Kohitij Kar
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 机器学习 (cs.LG)
[222] arXiv:2601.03317 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 基于深度学习的软壳虾图像识别分类
标题: Deep Learning-Based Image Recognition for Soft-Shell Shrimp Classification
Lord Sen, Shyamapada Mukherjee
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[223] arXiv:2601.03305 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 概念层次结构中扩散模型的概念擦除
标题: Mass Concept Erasure in Diffusion Models with Concept Hierarchy
Sha Luo, Yogesh Prabhu, Tim Ossowski, Kaiping Chen, Junjie Hu
评论: 这篇论文已被AAAI 2026接受
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 计算机与社会 (cs.CY)
[224] arXiv:2601.03625 (交叉列表自 cs.CV) [中文pdf, pdf, 其他]
标题: 使用近似凸分段特征的形状分类
标题: Shape Classification using Approximately Convex Segment Features
Xiang Zhang, Yang Zhang, Lukas Mehl, Markus Gross, Christopher Schroers
主题: 计算机视觉与模式识别 (cs.CV)
[225] arXiv:2601.03609 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 揭示困难石刻文本:一种字符-上下文-感知的补丁策略用于二值化
标题: Unveiling Text in Challenging Stone Inscriptions: A Character-Context-Aware Patching Strategy for Binarization
Yingyan Xu, Pramod Rao, Sebastian Weiss, Gaspard Zoss, Markus Gross, Christian Theobalt, Marc Habermann, Derek Bradley
主题: 计算机视觉与模式识别 (cs.CV)
[226] arXiv:2601.03507 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: REFA:虚拟现实中的实时第一视角面部动画
标题: REFA: Real-time Egocentric Facial Animations for Virtual Reality
Yang Shi, Yifeng Xie, Minzhe Guo, Liangsi Lu, Mingxuan Huang, Jingchao Wang, Zhihong Zhu, Boyan Xu, Zhiqi Huang
评论: CVPR 2024 工作坊
主题: 计算机视觉与模式识别 (cs.CV)
[227] arXiv:2601.03500 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: SDCD:结构破坏对比解码,用于减轻大型视觉-语言模型中的幻觉
标题: SDCD: Structure-Disrupted Contrastive Decoding for Mitigating Hallucinations in Large Vision-Language Models
Jarek Duda
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[228] arXiv:2601.03660 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: MGPC:具有模态丢失和渐进解码的通用点云补全多模态网络
标题: MGPC: Multimodal Network for Generalizable Point Cloud Completion With Modality Dropout and Progressive Decoding
Yun-Hao Zhang, I-Hsien Ting, Dario Liberona, Yun-Hsiu Liu, Kazunori Minetaki
评论: 代码和数据集可在 https://github.com/L-J-Yuan/MGPC 获取
主题: 计算机视觉与模式识别 (cs.CV)
[229] arXiv:2601.03617 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 单目伪LiDAR三维检测的深度主干和语义线索系统评估
标题: Systematic Evaluation of Depth Backbones and Semantic Cues for Monocular Pseudo-LiDAR 3D Detection
Jianke Zhang, Xiaoyu Chen, Qiuyue Wang, Mingsheng Li, Yanjiang Guo, Yucheng Hu, Jiajun Zhang, Shuai Bai, Junyang Lin, Jianyu Chen
评论: 7页,4图
主题: 计算机视觉与模式识别 (cs.CV) ; 机器学习 (cs.LG) ; 机器人技术 (cs.RO)
[230] arXiv:2601.03526 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 基于物理约束的跨分辨率增强网络用于光学引导热红外无人机图像超分辨率
标题: Physics-Constrained Cross-Resolution Enhancement Network for Optics-Guided Thermal UAV Image Super-Resolution
Jiahang Tu, Ye Li, Yiming Wu, Hanbin Zhao, Chao Zhang, Hui Qian
主题: 计算机视觉与模式识别 (cs.CV)
[231] arXiv:2601.03466 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 味觉的潜在几何:可扩展的低秩矩阵分解
标题: Latent Geometry of Taste: Scalable Low-Rank Matrix Factorization
Mohammad Rostami, Atik Faysal, Hongtao Xia, Hadi Kasasbeh, Ziang Gao, Huaxia Wang
主题: 计算机视觉与模式识别 (cs.CV) ; 机器学习 (cs.LG)
[232] arXiv:2601.03460 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: FROST-Drive:具有冻结视觉编码器的可扩展高效端到端驾驶
标题: FROST-Drive: Scalable and Efficient End-to-End Driving with a Frozen Vision Encoder
NAVER Cloud HyperCLOVA X Team
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[233] arXiv:2601.03382 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 一种新颖的统一方法用于深度伪造检测
标题: A Novel Unified Approach to Deepfake Detection
Erik Thiringer, Fredrik K. Gustafsson, Kajsa Ledesma Eriksson, Mattias Rantalainen
主题: 计算机视觉与模式识别 (cs.CV)
[234] arXiv:2601.03309 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: VLM4VLA:在视觉-语言-动作模型中重新审视视觉-语言模型
标题: VLM4VLA: Revisiting Vision-Language-Models in Vision-Language-Action Models
Chun-Kai Fan, Xiaowei Chi, Xiaozhu Ju, Hao Li, Yong Bao, Yu-Kai Wang, Lizhang Chen, Zhiyuan Jiang, Kuangzhi Ge, Ying Li, Weishi Mi, Qingpo Wuwu, Peidong Jia, Yulin Luo, Kevin Zhang, Zhiyuan Qin, Yong Dai, Sirui Han, Yike Guo, Shanghang Zhang, Jian Tang
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[235] arXiv:2601.03286 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 超CLOVA X 32B 思考
标题: HyperCLOVA X 32B Think
Ziyun Zhang, Zezhou Wang, Xiaoyi Zhang, Zongyu Guo, Jiahao Li, Bin Li, Yan Lu
评论: 技术报告
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 计算与语言 (cs.CL) ; 机器学习 (cs.LG)
总共 532 条目 : 1-50 51-100 101-150 151-200 186-235 201-250 251-300 301-350 ... 501-532
显示最多 50 每页条目: 较少 | 更多 | 所有
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号