Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > eess.IV

帮助 | 高级搜索

图像与视频处理

2025年08月 的作者和标题

总共 367 条目 : 1-25 ... 226-250 251-275 276-300 301-325 326-350 351-367
显示最多 25 每页条目: 较少 | 更多 | 所有
[301] arXiv:2508.08588 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: RealisMotion:世界空间中分解的人体运动控制与视频生成
标题: RealisMotion: Decomposed Human Motion Control and Video Generation in the World Space
Jingyun Liang, Jingkai Zhou, Shikai Li, Chenjie Cao, Lei Sun, Yichen Qian, Weihua Chen, Fan Wang
评论: 项目页面:https://jingyunliang.github.io/RealisMotion
主题: 计算机视觉与模式识别 (cs.CV) ; 图像与视频处理 (eess.IV)
[302] arXiv:2508.09215 (交叉列表自 q-bio.QM) [中文pdf, pdf, 其他]
标题: 实时深度学习相位成像流式细胞计数器揭示血液细胞团块生物标志物用于血液病诊断
标题: Real-time deep learning phase imaging flow cytometer reveals blood cell aggregate biomarkers for haematology diagnostics
Kerem Delikoyun, Qianyu Chen, Liu Wei, Si Ko Myo, Johannes Krell, Martin Schlegel, Win Sen Kuan, John Tshon Yit Soong, Gerhard Schneider, Clarissa Prazeres da Costa, Percy A. Knolle, Laurent Renia, Matthew Edward Cove, Hwee Kuan Lee, Klaus Diepold, Oliver Hayden
主题: 定量方法 (q-bio.QM) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV) ; 机器学习 (cs.LG) ; 图像与视频处理 (eess.IV)
[303] arXiv:2508.10184 (交叉列表自 physics.med-ph) [中文pdf, pdf, 其他]
标题: MIMOSA:使用多回波的多参数成像,通过优化的同步采集实现高效定量MRI
标题: MIMOSA: Multi-parametric Imaging using Multiple-echoes with Optimized Simultaneous Acquisition for highly-efficient quantitative MRI
Yuting Chen, Yohan Jun, Amir Heydari, Xingwang Yong, Jiye Kim, Jongho Lee, Huafeng Liu, Huihui Ye, Borjan Gagoski, Shohei Fujita, Berkin Bilgic
评论: 48页,21图,3表
主题: 医学物理 (physics.med-ph) ; 图像与视频处理 (eess.IV) ; 信号处理 (eess.SP)
[304] arXiv:2508.10298 (交叉列表自 cs.LG) [中文pdf, pdf, html, 其他]
标题: SynBrain:通过概率表示学习增强视觉到fMRI合成
标题: SynBrain: Enhancing Visual-to-fMRI Synthesis via Probabilistic Representation Learning
Weijian Mai, Jiamin Wu, Yu Zhu, Zhouheng Yao, Dongzhan Zhou, Andrew F. Luo, Qihao Zheng, Wanli Ouyang, Chunfeng Song
主题: 机器学习 (cs.LG) ; 计算机视觉与模式识别 (cs.CV) ; 图像与视频处理 (eess.IV)
[305] arXiv:2508.10617 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: FIND-Net -- 傅里叶积分网络与字典核用于金属伪影减少
标题: FIND-Net -- Fourier-Integrated Network with Dictionary Kernels for Metal Artifact Reduction
Farid Tasharofi, Fuxin Fan, Melika Qahqaie, Mareike Thies, Andreas Maier
评论: 已接受于MICCAI 2025。这是在同行评审之前的投稿版本。最终的正式版本将出现在MICCAI 2025论文集(Springer LNCS)中
主题: 计算机视觉与模式识别 (cs.CV) ; 图像与视频处理 (eess.IV)
[306] arXiv:2508.10933 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 基于姿态自编码器的相对位姿回归:提升零售应用中的准确性与数据效率
标题: Relative Pose Regression with Pose Auto-Encoders: Enhancing Accuracy and Data Efficiency for Retail Applications
Yoli Shavit, Yosi Keller
评论: 被ICCVW 2025接收
主题: 计算机视觉与模式识别 (cs.CV) ; 图像与视频处理 (eess.IV)
[307] arXiv:2508.10934 (交叉列表自 cs.CV) [中文pdf, pdf, 其他]
标题: ViPE:用于3D几何感知的视频姿态引擎
标题: ViPE: Video Pose Engine for 3D Geometric Perception
Jiahui Huang, Qunjie Zhou, Hesam Rabeti, Aleksandr Korovko, Huan Ling, Xuanchi Ren, Tianchang Shen, Jun Gao, Dmitry Slepichev, Chen-Hsuan Lin, Jiawei Ren, Kevin Xie, Joydeep Biswas, Laura Leal-Taixe, Sanja Fidler
评论: 论文网站:https://research.nvidia.com/labs/toronto-ai/vipe/
主题: 计算机视觉与模式识别 (cs.CV) ; 图形学 (cs.GR) ; 机器人技术 (cs.RO) ; 图像与视频处理 (eess.IV)
[308] arXiv:2508.10946 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: IPG:用于广义对抗性补丁训练的增量补丁生成
标题: IPG: Incremental Patch Generation for Generalized Adversarial Patch Training
Wonho Lee, Hyunsik Na, Jisu Lee, Daeseon Choi
主题: 计算机视觉与模式识别 (cs.CV) ; 图像与视频处理 (eess.IV)
[309] arXiv:2508.11100 (交叉列表自 physics.med-ph) [中文pdf, pdf, html, 其他]
标题: 基于体积-表面积分方程和CT获取的非均匀颅骨数据的经颅超声全波建模
标题: Full-Wave Modeling of Transcranial Ultrasound using Volume-Surface Integral Equations and CT-Derived Heterogeneous Skull Data
Alberto Almuna-Morales, Danilo Aballay, Pierre Gélat, Reza Haqshenas, Elwin van 't Wout
主题: 医学物理 (physics.med-ph) ; 图像与视频处理 (eess.IV) ; 数值分析 (math.NA) ; 计算物理 (physics.comp-ph)
[310] arXiv:2508.11716 (交叉列表自 cs.CR) [中文pdf, pdf, html, 其他]
标题: 隐私感知的虚假身份文件检测:方法论、基准和改进算法(FakeIDet2)
标题: Privacy-Aware Detection of Fake Identity Documents: Methodology, Benchmark, and Improved Algorithms (FakeIDet2)
Javier Muñoz-Haro, Ruben Tolosana, Julian Fierrez, Ruben Vera-Rodriguez, Aythami Morales
主题: 密码学与安全 (cs.CR) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV) ; 图像与视频处理 (eess.IV)
[311] arXiv:2508.11834 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 无人机应用中的Transformer和大型语言模型的最新进展
标题: Recent Advances in Transformer and Large Language Models for UAV Applications
Hamza Kheddar, Yassine Habchi, Mohamed Chahine Ghanem, Mustapha Hemis, Dusit Niyato
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 机器人技术 (cs.RO) ; 图像与视频处理 (eess.IV) ; 系统与控制 (eess.SY)
[312] arXiv:2508.11849 (交叉列表自 cs.RO) [中文pdf, pdf, html, 其他]
标题: LocoMamba:通过Mamba的端到端深度强化学习实现视觉驱动的运动
标题: LocoMamba: Vision-Driven Locomotion via End-to-End Deep Reinforcement Learning with Mamba
Yinuo Wang, Gavin Tao
评论: 13页
主题: 机器人技术 (cs.RO)
[313] arXiv:2508.11886 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: EVTP-IVS:用于统一多模态大语言模型指令视觉分割的有效视觉标记剪枝
标题: EVTP-IVS: Effective Visual Token Pruning For Unifying Instruction Visual Segmentation In Multi-Modal Large Language Models
Wenhui Zhu, Xiwen Chen, Zhipeng Wang, Shao Tang, Sayan Ghosh, Xuanzhao Dong, Rajat Koner, Yalin Wang
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 计算与语言 (cs.CL) ; 机器学习 (cs.LG) ; 图像与视频处理 (eess.IV)
[314] arXiv:2508.11893 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 大型核调制网络用于高效图像超分辨率
标题: Large Kernel Modulation Network for Efficient Image Super-Resolution
Quanwei Hu, Yinggan Tang, Xuguang Zhang
主题: 计算机视觉与模式识别 (cs.CV) ; 图像与视频处理 (eess.IV)
[315] arXiv:2508.13049 (交叉列表自 cs.AR) [中文pdf, pdf, html, 其他]
标题: XR-NPE:用于扩展现实感知工作负载的高吞吐量混合精度SIMD神经处理引擎
标题: XR-NPE: High-Throughput Mixed-precision SIMD Neural Processing Engine for Extended Reality Perception Workloads
Tejas Chaudhari, Akarsh J., Tanushree Dewangan, Mukul Lokhande, Santosh Kumar Vishvakarma
主题: 硬件架构 (cs.AR) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV) ; 图像与视频处理 (eess.IV)
[316] arXiv:2508.13096 (交叉列表自 physics.optics) [中文pdf, pdf, 其他]
标题: 通过ENZ材料散射实现无暗角上转换成像的混合深度重建
标题: Hybrid Deep Reconstruction for Vignetting-Free Upconversion Imaging through Scattering in ENZ Materials
Hao Zhang, Yang Xu, Wenwen Zhang, Saumya Choudhary, M. Zahirul Alam, Long D. Nguyen, Matthew Klein, Shivashankar Vangala, J. Keith Miller, Eric G. Johnson, Joshua R. Hendrickson, Robert W. Boyd, Sergio Carbajo
主题: 光学 (physics.optics) ; 图像与视频处理 (eess.IV)
[317] arXiv:2508.13157 (交叉列表自 cs.AR) [中文pdf, pdf, html, 其他]
标题: Image2Net:数据集、基准测试和混合框架,用于将模拟电路图转换为网表
标题: Image2Net: Datasets, Benchmark and Hybrid Framework to Convert Analog Circuit Diagrams into Netlists
Haohang Xu, Chengjie Liu, Qihang Wang, Wenhao Huang, Yongjian Xu, Weiyu Chen, Anlan Peng, Zhijun Li, Bo Li, Lei Qi, Jun Yang, Yuan Du, Li Du
评论: 10页,12图,6表
主题: 硬件架构 (cs.AR) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV) ; 图像与视频处理 (eess.IV)
[318] arXiv:2508.13205 (交叉列表自 cs.CV) [中文pdf, pdf, 其他]
标题: YOLO11-CR:一种轻量级卷积与注意力框架,用于准确的疲劳驾驶检测
标题: YOLO11-CR: a Lightweight Convolution-and-Attention Framework for Accurate Fatigue Driving Detection
Zhebin Jin, Ligang Dong
主题: 计算机视觉与模式识别 (cs.CV) ; 图像与视频处理 (eess.IV)
[319] arXiv:2508.13228 (交叉列表自 cs.GR) [中文pdf, pdf, html, 其他]
标题: PreSem-Surf: 基于渐进语义建模和SG-MLP预渲染机制的RGB-D表面重建
标题: PreSem-Surf: RGB-D Surface Reconstruction with Progressive Semantic Modeling and SG-MLP Pre-Rendering Mechanism
Yuyan Ye, Hang Xu, Yanghang Huang, Jiali Huang, Qian Weng
评论: 2025年国际神经网络联合会议(IJCNN 2025)
主题: 图形学 (cs.GR) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV) ; 图像与视频处理 (eess.IV)
[320] arXiv:2508.13244 (交叉列表自 cs.AR) [中文pdf, pdf, html, 其他]
标题: 基于资源受限微控制器的亚毫秒事件驱动眼动追踪
标题: Sub-Millisecond Event-Based Eye Tracking on a Resource-Constrained Microcontroller
Marco Giordano, Pietro Bonazzi, Luca Benini, Michele Magno
主题: 硬件架构 (cs.AR) ; 图像与视频处理 (eess.IV)
[321] arXiv:2508.13304 (交叉列表自 physics.med-ph) [中文pdf, pdf, html, 其他]
标题: 用于X射线成像中刚体运动估计的可微分前向和反向投影器
标题: Differentiable Forward and Back-Projector for Rigid Motion Estimation in X-ray Imaging
Xiao Jiang, Xin Wang, Ali Uneri, Wojciech B. Zbijewski, J. Webster Stayman
主题: 医学物理 (physics.med-ph) ; 图像与视频处理 (eess.IV)
[322] arXiv:2508.13402 (交叉列表自 cs.MM) [中文pdf, pdf, html, 其他]
标题: 基于LEO卫星星座的鲁棒实时流媒体:测量、分析与切换感知适应
标题: Robust Live Streaming over LEO Satellite Constellations: Measurement, Analysis, and Handover-Aware Adaptation
Hao Fang, Haoyuan Zhao, Jianxin Shi, Miao Zhang, Guanzhen Wu, Yi Ching Chou, Feng Wang, Jiangchuan Liu
评论: 被ACM多媒体2024接受
主题: 多媒体 (cs.MM) ; 图像与视频处理 (eess.IV)
[323] arXiv:2508.13439 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 结构化提示和多智能体知识蒸馏用于交通视频解释和风险推断
标题: Structured Prompting and Multi-Agent Knowledge Distillation for Traffic Video Interpretation and Risk Inference
Yunxiang Yang, Ningning Xu, Jidong J. Yang
评论: 16页,10图,1表
主题: 计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 计算与语言 (cs.CL) ; 图像与视频处理 (eess.IV)
[324] arXiv:2508.13479 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: AIM 2025 竞赛关于逆色调映射的报告:方法与结果
标题: AIM 2025 challenge on Inverse Tone Mapping Report: Methods and Results
Chao Wang, Francesco Banterle, Bin Ren, Radu Timofte, Xin Lu, Yufeng Peng, Chengjie Ge, Zhijing Sun, Ziang Zhou, Zihao Li, Zishun Liao, Qiyu Kang, Xueyang Fu, Zheng-Jun Zha, Zhijing Sun, Xingbo Wang, Kean Liu, Senyan Xu, Yang Qiu, Yifan Ding, Gabriel Eilertsen, Jonas Unger, Zihao Wang, Ke Wu, Jinshan Pan, Zhen Liu, Zhongyang Li, Shuaicheng Liu, S.M Nadim Uddin
主题: 计算机视觉与模式识别 (cs.CV) ; 图像与视频处理 (eess.IV)
[325] arXiv:2508.13503 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]
标题: 自适应AE:动态场景中HDR捕捉的自适应曝光策略
标题: AdaptiveAE: An Adaptive Exposure Strategy for HDR Capturing in Dynamic Scenes
Tianyi Xu, Fan Zhang, Boxin Shi, Tianfan Xue, Yujin Wang
评论: 被ICCV 2025接收
主题: 计算机视觉与模式识别 (cs.CV) ; 图像与视频处理 (eess.IV)
总共 367 条目 : 1-25 ... 226-250 251-275 276-300 301-325 326-350 351-367
显示最多 25 每页条目: 较少 | 更多 | 所有
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号