计算机视觉与模式识别

最近提交的作者和标题

查看今天的新的变化

总共 532 条目 : 1-50 51-100 101-150 151-200 186-235 201-250 251-300 301-350 ... 501-532

显示最多 50 每页条目：较少 | 更多 | 所有

[186] arXiv:2601.03416 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： GAMBIT：一种用于多模态大语言模型的博弈化破解框架

标题： GAMBIT: A Gamified Jailbreak Framework for Multimodal Large Language Models

Shuyan Bai, Tingfa Xu, Peifu Liu, Yuhao Qiu, Huiyan Bai, Huan Chen, Yanyan Peng, Jianan Li

主题：计算机视觉与模式识别 (cs.CV)
[187] arXiv:2601.03392 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：更好，但不足：针对猕猴IT动态测试视频ANNs

标题： Better, But Not Sufficient: Testing Video ANNs Against Macaque IT Dynamics

Xiaoxian Shen, Yuhui Zhang, Sahithi Ankireddy, Xiaohan Wang, Maya Varma, Henry Guo, Curtis Langlotz, Serena Yeung-Levy

评论：在2025年ICCV第二届仿人计算机视觉研讨会的扩展摘要

主题：计算机视觉与模式识别 (cs.CV) ; 神经与进化计算 (cs.NE)
[188] arXiv:2601.03369 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： RiskCueBench：从视频语言模型中的早期风险线索进行前瞻性推理的基准测试

标题： RiskCueBench: Benchmarking Anticipatory Reasoning from Early Risk Cues in Video-Language Models

Donghwan Lee, Byeongjin Kim, Geunhee Kim, Hyukjin Kwon, Nahyeon Maeng, Wooju Kim

主题：计算机视觉与模式识别 (cs.CV) ; 计算与语言 (cs.CL)
[189] arXiv:2601.03736 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： HyperCOD：第一个高光谱伪装目标检测的挑战性基准和基线

标题： HyperCOD: The First Challenging Benchmark and Baseline for Hyperspectral Camouflaged Object Detection

Zhipeng Qian, Zihan Liang, Yufei Ma, Ben Chen, Huangyu Dai, Yiwei Ma, Jiayi Ji, Chenyi Lei, Han Li, Xiaoshuai Sun

主题：计算机视觉与模式识别 (cs.CV)
[190] arXiv:2601.03733 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： RadDiff：用自然语言描述放射学图像集中的差异

标题： RadDiff: Describing Differences in Radiology Image Sets with Natural Language

Wenyong Li, Qi Jiang, Weijian Hu, Kailun Yang, Zhanjun Zhang, Wenjun Tian, Kaiwei Wang, Jian Bai

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 计算与语言 (cs.CL) ; 计算机与社会 (cs.CY) ; 机器学习 (cs.LG)
[191] arXiv:2601.03729 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： MATANet：一种多上下文注意力和分类学感知网络，用于海洋物种的细粒度水下识别

标题： MATANet: A Multi-context Attention and Taxonomy-Aware Network for Fine-Grained Underwater Recognition of Marine Species

Qingyao Tian, Bingyu Yang, Huai Liao, Xinyan Huang, Junyong Li, Dong Yi, Hongbin Liu

主题：计算机视觉与模式识别 (cs.CV)
[192] arXiv:2601.03713 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： BREATH-VL：通过语义-几何融合的视觉-语言引导的6-DoF支气管镜定位

标题： BREATH-VL: Vision-Language-Guided 6-DoF Bronchoscopy Localization via Semantic-Geometric Fusion

Dennis Holzmann, Sven Wachsmuth

主题：计算机视觉与模式识别 (cs.CV)
[193] arXiv:2601.04137 (交叉列表自 cs.RO) [中文pdf, pdf, html, 其他]: 标题：哇， wo， val！一个综合的具身世界模型评估图灵测试

标题： Wow, wo, val! A Comprehensive Embodied World Model Evaluation Turing Test

Siddarth Nilol Kundur Satish, Devesh Jaiswal, Hongyu Chen, Abhishek Bakshi

主题：机器人技术 (cs.RO) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV)
[194] arXiv:2601.03633 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： MFC-RFNet：一种多尺度引导的校正流网络用于雷达序列预测

标题： MFC-RFNet: A Multi-scale Guided Rectified Flow Network for Radar Sequence Prediction

Jiangyuan Liu, Hongxuan Ma, Yuhao Zhao, Zhe Liu, Jian Wang, Wei Zou

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[195] arXiv:2601.03528 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： CloudMatch：半监督云检测的弱到强一致性学习

标题： CloudMatch: Weak-to-Strong Consistency Learning for Semi-Supervised Cloud Detection

Jinsong Zhou, Yihua Du, Xinli Xu, Luozhou Wang, Zijie Zhuang, Yehang Zhang, Shuaibo Li, Xiaojun Hu, Bolan Su, Ying-cong Chen

评论：应用遥感杂志

主题：计算机视觉与模式识别 (cs.CV)
[196] arXiv:2601.03510 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： G2P：高斯到点属性对齐用于边界感知的3D语义分割

标题： G2P: Gaussian-to-Point Attribute Alignment for Boundary-Aware 3D Semantic Segmentation

Babak Asadi, Peiyang Wu, Mani Golparvar-Fard, Ramez Hajj

评论：预印本。正在审稿中

主题：计算机视觉与模式识别 (cs.CV)
[197] arXiv:2601.04163 (交叉列表自 eess.IV) [中文pdf, pdf, html, 其他]: 标题：扫描仪引起的领域偏移削弱了病理学基础模型的鲁棒性

标题： Scanner-Induced Domain Shifts Undermine the Robustness of Pathology Foundation Models

Wenjie Luo, Chuanhu Deng, Chaorong Li, Rongyao Deng, Qiang Yang

主题：图像与视频处理 (eess.IV) ; 计算机视觉与模式识别 (cs.CV) ; 机器学习 (cs.LG)
[198] arXiv:2601.03667 (交叉列表自 cs.CV) [中文pdf, pdf, 其他]: 标题： TRec：通过2D点轨迹运动学习手-物体交互

标题： TRec: Learning Hand-Object Interactions through 2D Point Track Motion

Bimal Kumar Ray

评论：提交至ICPR 2026

主题：计算机视觉与模式识别 (cs.CV) ; 机器学习 (cs.LG)
[199] arXiv:2601.03431 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： WeedRepFormer：可重新参数化的视觉变压器用于实时水麻分割和性别分类

标题： WeedRepFormer: Reparameterizable Vision Transformers for Real-Time Waterhemp Segmentation and Gender Classification

Samson Oseiwe Ajadalu

评论： 11页，5图

主题：计算机视觉与模式识别 (cs.CV)
[200] arXiv:2601.03362 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：发丝守护者：深度、立体视觉和新视角中的软边界拯救

标题： Guardians of the Hair: Rescuing Soft Boundaries in Depth, Stereo, and Novel Views

Pratyush Jena, Amal Joseph, Arnav Sharma, Ravi Kiran Sarvadevabhatla

主题：计算机视觉与模式识别 (cs.CV)
[201] arXiv:2601.03357 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： RelightAnyone：一种通用的可重新照明的3D高斯头部模型

标题： RelightAnyone: A Generalized Relightable 3D Gaussian Head Model

Qianyu Guo, Jingrong Wu, Jieji Ren, Weifeng Ge, Wenqiang Zhang

主题：计算机视觉与模式识别 (cs.CV) ; 图形学 (cs.GR)
[202] arXiv:2601.03655 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：视频内存：通过内存集成实现一致的视频生成

标题： VideoMemory: Toward Consistent Video Generation via Memory Integration

Zhongbin Guo, Zhen Yang, Yushan Li, Xinyue Zhang, Wenyu Gao, Jiacheng Wang, Chengzhi Li, Xiangrui Liu, Ping Jian

评论：项目页面：https://hit-perfect.github.io/VideoMemory/

主题：计算机视觉与模式识别 (cs.CV)
[203] arXiv:2601.03596 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：环境扰动下鲁棒的少样本分割自适应注意力蒸馏

标题： Adaptive Attention Distillation for Robust Few-Shot Segmentation under Environmental Perturbations

Yakun Niu, Yingjian Chen, Lei Zhang

评论： 12页，5图

主题：计算机视觉与模式识别 (cs.CV)
[204] arXiv:2601.03590 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： LLMs能没有像素就看到吗？从文本描述中进行空间智能基准测试

标题： Can LLMs See Without Pixels? Benchmarking Spatial Intelligence from Textual Descriptions

Tianyi Shang, Pengjie Xu, Zhaojun Deng, Zhenyu Li, Zhicong Chen, Lijun Wu

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[205] arXiv:2601.03586 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：通过真实图像的分布偏差检测人工智能生成的图像

标题： Detecting AI-Generated Images via Distributional Deviations from Real Images

Guobin Tu, Di Weng

主题：计算机视觉与模式识别 (cs.CV)
[206] arXiv:2601.03579 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： SpatiaLoc：利用多级空间增强描述符进行跨模态定位

标题： SpatiaLoc: Leveraging Multi-Level Spatial Enhanced Descriptors for Cross-Modal Localization

Jiayi Zhao, Changlu Chen, Jingsheng Li, Tianxiang Xue, Kun Zhan

主题：计算机视觉与模式识别 (cs.CV)
[207] arXiv:2601.03549 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： EASLT：情绪感知的手语翻译

标题： EASLT: Emotion-Aware Sign Language Translation

Zhicheng Zhao, Fengjiao Peng, Jinquan Yan, Wei Lu, Chenglong Li, Jin Tang

主题：计算机视觉与模式识别 (cs.CV) ; 计算与语言 (cs.CL)
[208] arXiv:2601.03517 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：语义信念状态世界模型用于3D人体运动预测

标题： Semantic Belief-State World Model for 3D Human Motion Prediction

Sarim Chaudhry

主题：计算机视觉与模式识别 (cs.CV)
[209] arXiv:2601.03490 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： CroBIM-U：不确定性驱动的指代遥感图像分割

标题： CroBIM-U: Uncertainty-Driven Referring Remote Sensing Image Segmentation

Hojun Song, Chae-yeong Song, Jeong-hun Hong, Chaewon Moon, Dong-hwi Kim, Gahyeon Kim, Soo Ye Kim, Yiyi Liao, Jaehyup Lee, Sang-hyo Park

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[210] arXiv:2601.03468 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：理解文本到图像强化学习中的奖励黑客行为

标题： Understanding Reward Hacking in Text-to-Image Reinforcement Learning

Qiang Zhang, Tong Xiao, Haroun Habeeb, Larissa Laich, Sofien Bouaziz, Patrick Snape, Wenjing Zhang, Matthew Cioffi, Peizhao Zhang, Pavel Pidlypenskyi, Winnie Lin, Luming Ma, Mengjiao Wang, Kunpeng Li, Chengjiang Long, Steven Song, Martin Prazak, Alexander Sjoholm, Ajinkya Deogade, Jaebong Lee, Julio Delgado Mangas, Amaury Aubel

主题：计算机视觉与模式识别 (cs.CV)
[211] arXiv:2601.03637 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： CrackSegFlow：具有50K图像-掩码基准的可控制流匹配合成用于可泛化的裂缝分割

标题： CrackSegFlow: Controllable Flow Matching Synthesis for Generalizable Crack Segmentation with a 50K Image-Mask Benchmark

Yuxuan Xia, Siheng Wang, Peng Li

主题：计算机视觉与模式识别 (cs.CV)
[212] arXiv:2601.03400 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：眼-Q：多语言视觉单词谜题求解和图像到短语推理基准

标题： Eye-Q: A Multilingual Benchmark for Visual Word Puzzle Solving and Image-to-Phrase Reasoning

Yuzhe Sun, Zhe Dong, Haochen Jiang, Tianzhu Liu, Yanfeng Gu

评论： 8页

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[213] arXiv:2601.03326 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：高阶PCA类似旋转不变特征用于旋转模的详细形状描述符

标题： Higher order PCA-like rotation-invariant features for detailed shape descriptors modulo rotation

Yunqi Hong, Kuei-Chun Kao, Hengguang Zhou, Cho-Jui Hsieh

评论： 4页，4图

主题：计算机视觉与模式识别 (cs.CV) ; 机器学习 (cs.LG)
[214] arXiv:2601.03302 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： CageDroneRF：一个大规模的RF基准和无人机感知工具包

标题： CageDroneRF: A Large-Scale RF Benchmark and Toolkit for Drone Perception

Hengjia Li, Liming Jiang, Qing Yan, Yizhi Song, Hao Kang, Zichuan Liu, Xin Lu, Boxi Wu, Deng Cai

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 机器人技术 (cs.RO)
[215] arXiv:2601.03665 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： PhysVideoGenerator：通过潜在物理引导实现物理感知的视频生成

标题： PhysVideoGenerator: Towards Physically Aware Video Generation via Latent Physics Guidance

Joshua Salako

评论： 9页，2张图表，项目页面：https://github.com/CVFall2025-Project/PhysVideoGenerator

主题：计算机视觉与模式识别 (cs.CV)
[216] arXiv:2601.03463 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：轻量级和深度CNN模型在多样化数据集上的实验比较

标题： Experimental Comparison of Light-Weight and Deep CNN Models Across Diverse Datasets

Md. Hefzul Hossain Papon, Shadman Rabby

评论： 25页，11图

主题：计算机视觉与模式识别 (cs.CV) ; 机器学习 (cs.LG)
[217] arXiv:2601.03728 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： CSMCIR：基于记忆库的组合图像检索的CoT增强对称对齐

标题： CSMCIR: CoT-Enhanced Symmetric Alignment with Memory Bank for Composed Image Retrieval

Zeyu Dong, Yimin Zhu, Yu Wu, Yu Sun

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[218] arXiv:2601.03467 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： ThinkRL-Edit：强化学习中的思考用于推理导向的图像编辑

标题： ThinkRL-Edit: Thinking in Reinforcement Learning for Reasoning-Centric Image Editing

Toqi Tahamid Sarker, Taminul Islam, Khaled R. Ahmed, Cristiana Bernardi Rankrape, Kaitlin E. Creager, Karla Gage

主题：计算机视觉与模式识别 (cs.CV)
[219] arXiv:2601.04126 (交叉列表自 cs.CL) [中文pdf, pdf, html, 其他]: 标题：无限网络：用于GUI代理训练的可扩展网络环境合成

标题： InfiniteWeb: Scalable Web Environment Synthesis for GUI Agent Training

Xiangdong Hu, Yangyang Jiang, Qin Hu, Xiaojun Jia

评论：进行中

主题：计算与语言 (cs.CL) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV)
[220] arXiv:2601.03718 (交叉列表自 cs.CV) [中文pdf, pdf, 其他]: 标题：通过领域自适应实现无标签数据的真实镜头主动对准

标题： Towards Real-world Lens Active Alignment with Unlabeled Data via Domain Adaptation

Ali Najar, Alireza Mirrokni, Arshia Izadyari, Sadegh Mohammadian, Amir Homayoon Sharifizade, Asal Meskin, Mobin Bagherian, Ehsaneddin Asgari

主题：计算机视觉与模式识别 (cs.CV) ; 图像与视频处理 (eess.IV) ; 光学 (physics.optics)
[221] arXiv:2601.03331 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： MMErroR：视觉-语言模型中错误推理的基准测试

标题： MMErroR: A Benchmark for Erroneous Reasoning in Vision-Language Models

Matteo Dunnhofer, Christian Micheloni, Kohitij Kar

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 机器学习 (cs.LG)
[222] arXiv:2601.03317 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：基于深度学习的软壳虾图像识别分类

标题： Deep Learning-Based Image Recognition for Soft-Shell Shrimp Classification

Lord Sen, Shyamapada Mukherjee

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[223] arXiv:2601.03305 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：概念层次结构中扩散模型的概念擦除

标题： Mass Concept Erasure in Diffusion Models with Concept Hierarchy

Sha Luo, Yogesh Prabhu, Tim Ossowski, Kaiping Chen, Junjie Hu

评论：这篇论文已被AAAI 2026接受

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 计算机与社会 (cs.CY)
[224] arXiv:2601.03625 (交叉列表自 cs.CV) [中文pdf, pdf, 其他]: 标题：使用近似凸分段特征的形状分类

标题： Shape Classification using Approximately Convex Segment Features

Xiang Zhang, Yang Zhang, Lukas Mehl, Markus Gross, Christopher Schroers

主题：计算机视觉与模式识别 (cs.CV)
[225] arXiv:2601.03609 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：揭示困难石刻文本：一种字符-上下文-感知的补丁策略用于二值化

标题： Unveiling Text in Challenging Stone Inscriptions: A Character-Context-Aware Patching Strategy for Binarization

Yingyan Xu, Pramod Rao, Sebastian Weiss, Gaspard Zoss, Markus Gross, Christian Theobalt, Marc Habermann, Derek Bradley

主题：计算机视觉与模式识别 (cs.CV)
[226] arXiv:2601.03507 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： REFA：虚拟现实中的实时第一视角面部动画

标题： REFA: Real-time Egocentric Facial Animations for Virtual Reality

Yang Shi, Yifeng Xie, Minzhe Guo, Liangsi Lu, Mingxuan Huang, Jingchao Wang, Zhihong Zhu, Boyan Xu, Zhiqi Huang

评论： CVPR 2024 工作坊

主题：计算机视觉与模式识别 (cs.CV)
[227] arXiv:2601.03500 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： SDCD：结构破坏对比解码，用于减轻大型视觉-语言模型中的幻觉

标题： SDCD: Structure-Disrupted Contrastive Decoding for Mitigating Hallucinations in Large Vision-Language Models

Jarek Duda

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[228] arXiv:2601.03660 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： MGPC：具有模态丢失和渐进解码的通用点云补全多模态网络

标题： MGPC: Multimodal Network for Generalizable Point Cloud Completion With Modality Dropout and Progressive Decoding

Yun-Hao Zhang, I-Hsien Ting, Dario Liberona, Yun-Hsiu Liu, Kazunori Minetaki

评论：代码和数据集可在 https://github.com/L-J-Yuan/MGPC 获取

主题：计算机视觉与模式识别 (cs.CV)
[229] arXiv:2601.03617 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：单目伪LiDAR三维检测的深度主干和语义线索系统评估

标题： Systematic Evaluation of Depth Backbones and Semantic Cues for Monocular Pseudo-LiDAR 3D Detection

Jianke Zhang, Xiaoyu Chen, Qiuyue Wang, Mingsheng Li, Yanjiang Guo, Yucheng Hu, Jiajun Zhang, Shuai Bai, Junyang Lin, Jianyu Chen

评论： 7页，4图

主题：计算机视觉与模式识别 (cs.CV) ; 机器学习 (cs.LG) ; 机器人技术 (cs.RO)
[230] arXiv:2601.03526 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：基于物理约束的跨分辨率增强网络用于光学引导热红外无人机图像超分辨率

标题： Physics-Constrained Cross-Resolution Enhancement Network for Optics-Guided Thermal UAV Image Super-Resolution

Jiahang Tu, Ye Li, Yiming Wu, Hanbin Zhao, Chao Zhang, Hui Qian

主题：计算机视觉与模式识别 (cs.CV)
[231] arXiv:2601.03466 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：味觉的潜在几何：可扩展的低秩矩阵分解

标题： Latent Geometry of Taste: Scalable Low-Rank Matrix Factorization

Mohammad Rostami, Atik Faysal, Hongtao Xia, Hadi Kasasbeh, Ziang Gao, Huaxia Wang

主题：计算机视觉与模式识别 (cs.CV) ; 机器学习 (cs.LG)
[232] arXiv:2601.03460 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： FROST-Drive：具有冻结视觉编码器的可扩展高效端到端驾驶

标题： FROST-Drive: Scalable and Efficient End-to-End Driving with a Frozen Vision Encoder

NAVER Cloud HyperCLOVA X Team

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[233] arXiv:2601.03382 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：一种新颖的统一方法用于深度伪造检测

标题： A Novel Unified Approach to Deepfake Detection

Erik Thiringer, Fredrik K. Gustafsson, Kajsa Ledesma Eriksson, Mattias Rantalainen

主题：计算机视觉与模式识别 (cs.CV)
[234] arXiv:2601.03309 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： VLM4VLA：在视觉-语言-动作模型中重新审视视觉-语言模型

标题： VLM4VLA: Revisiting Vision-Language-Models in Vision-Language-Action Models

Chun-Kai Fan, Xiaowei Chi, Xiaozhu Ju, Hao Li, Yong Bao, Yu-Kai Wang, Lizhang Chen, Zhiyuan Jiang, Kuangzhi Ge, Ying Li, Weishi Mi, Qingpo Wuwu, Peidong Jia, Yulin Luo, Kevin Zhang, Zhiyuan Qin, Yong Dai, Sirui Han, Yike Guo, Shanghang Zhang, Jian Tang

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI)
[235] arXiv:2601.03286 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：超CLOVA X 32B 思考

标题： HyperCLOVA X 32B Think

Ziyun Zhang, Zezhou Wang, Xiaoyi Zhang, Zongyu Guo, Jiahao Li, Bin Li, Yan Lu

评论：技术报告

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 计算与语言 (cs.CL) ; 机器学习 (cs.LG)

总共 532 条目 : 1-50 51-100 101-150 151-200 186-235 201-250 251-300 301-350 ... 501-532

显示最多 50 每页条目：较少 | 更多 | 所有

计算机视觉与模式识别

最近提交的作者和标题

2026年01月08日， 星期四 (继续， 展示 88 之 50 条目 )

2026年01月08日，星期四 (继续，展示 88 之 50 条目 )