图像与视频处理

2025年08月的作者和标题

总共 367 条目 : 1-25 ... 226-250 251-275 276-300 301-325 326-350 351-367

显示最多 25 每页条目：较少 | 更多 | 所有

[301] arXiv:2508.08588 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： RealisMotion：世界空间中分解的人体运动控制与视频生成

标题： RealisMotion: Decomposed Human Motion Control and Video Generation in the World Space

Jingyun Liang, Jingkai Zhou, Shikai Li, Chenjie Cao, Lei Sun, Yichen Qian, Weihua Chen, Fan Wang

评论：项目页面：https://jingyunliang.github.io/RealisMotion

主题：计算机视觉与模式识别 (cs.CV) ; 图像与视频处理 (eess.IV)
[302] arXiv:2508.09215 (交叉列表自 q-bio.QM) [中文pdf, pdf, 其他]: 标题：实时深度学习相位成像流式细胞计数器揭示血液细胞团块生物标志物用于血液病诊断

标题： Real-time deep learning phase imaging flow cytometer reveals blood cell aggregate biomarkers for haematology diagnostics

Kerem Delikoyun, Qianyu Chen, Liu Wei, Si Ko Myo, Johannes Krell, Martin Schlegel, Win Sen Kuan, John Tshon Yit Soong, Gerhard Schneider, Clarissa Prazeres da Costa, Percy A. Knolle, Laurent Renia, Matthew Edward Cove, Hwee Kuan Lee, Klaus Diepold, Oliver Hayden

主题：定量方法 (q-bio.QM) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV) ; 机器学习 (cs.LG) ; 图像与视频处理 (eess.IV)
[303] arXiv:2508.10184 (交叉列表自 physics.med-ph) [中文pdf, pdf, 其他]: 标题： MIMOSA：使用多回波的多参数成像，通过优化的同步采集实现高效定量MRI

标题： MIMOSA: Multi-parametric Imaging using Multiple-echoes with Optimized Simultaneous Acquisition for highly-efficient quantitative MRI

Yuting Chen, Yohan Jun, Amir Heydari, Xingwang Yong, Jiye Kim, Jongho Lee, Huafeng Liu, Huihui Ye, Borjan Gagoski, Shohei Fujita, Berkin Bilgic

评论： 48页，21图，3表

主题：医学物理 (physics.med-ph) ; 图像与视频处理 (eess.IV) ; 信号处理 (eess.SP)
[304] arXiv:2508.10298 (交叉列表自 cs.LG) [中文pdf, pdf, html, 其他]: 标题： SynBrain：通过概率表示学习增强视觉到fMRI合成

标题： SynBrain: Enhancing Visual-to-fMRI Synthesis via Probabilistic Representation Learning

Weijian Mai, Jiamin Wu, Yu Zhu, Zhouheng Yao, Dongzhan Zhou, Andrew F. Luo, Qihao Zheng, Wanli Ouyang, Chunfeng Song

主题：机器学习 (cs.LG) ; 计算机视觉与模式识别 (cs.CV) ; 图像与视频处理 (eess.IV)
[305] arXiv:2508.10617 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： FIND-Net -- 傅里叶积分网络与字典核用于金属伪影减少

标题： FIND-Net -- Fourier-Integrated Network with Dictionary Kernels for Metal Artifact Reduction

Farid Tasharofi, Fuxin Fan, Melika Qahqaie, Mareike Thies, Andreas Maier

评论：已接受于MICCAI 2025。这是在同行评审之前的投稿版本。最终的正式版本将出现在MICCAI 2025论文集（Springer LNCS）中

主题：计算机视觉与模式识别 (cs.CV) ; 图像与视频处理 (eess.IV)
[306] arXiv:2508.10933 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：基于姿态自编码器的相对位姿回归：提升零售应用中的准确性与数据效率

标题： Relative Pose Regression with Pose Auto-Encoders: Enhancing Accuracy and Data Efficiency for Retail Applications

Yoli Shavit, Yosi Keller

评论：被ICCVW 2025接收

主题：计算机视觉与模式识别 (cs.CV) ; 图像与视频处理 (eess.IV)
[307] arXiv:2508.10934 (交叉列表自 cs.CV) [中文pdf, pdf, 其他]: 标题： ViPE：用于3D几何感知的视频姿态引擎

标题： ViPE: Video Pose Engine for 3D Geometric Perception

Jiahui Huang, Qunjie Zhou, Hesam Rabeti, Aleksandr Korovko, Huan Ling, Xuanchi Ren, Tianchang Shen, Jun Gao, Dmitry Slepichev, Chen-Hsuan Lin, Jiawei Ren, Kevin Xie, Joydeep Biswas, Laura Leal-Taixe, Sanja Fidler

评论：论文网站：https://research.nvidia.com/labs/toronto-ai/vipe/

主题：计算机视觉与模式识别 (cs.CV) ; 图形学 (cs.GR) ; 机器人技术 (cs.RO) ; 图像与视频处理 (eess.IV)
[308] arXiv:2508.10946 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： IPG：用于广义对抗性补丁训练的增量补丁生成

标题： IPG: Incremental Patch Generation for Generalized Adversarial Patch Training

Wonho Lee, Hyunsik Na, Jisu Lee, Daeseon Choi

主题：计算机视觉与模式识别 (cs.CV) ; 图像与视频处理 (eess.IV)
[309] arXiv:2508.11100 (交叉列表自 physics.med-ph) [中文pdf, pdf, html, 其他]: 标题：基于体积-表面积分方程和CT获取的非均匀颅骨数据的经颅超声全波建模

标题： Full-Wave Modeling of Transcranial Ultrasound using Volume-Surface Integral Equations and CT-Derived Heterogeneous Skull Data

Alberto Almuna-Morales, Danilo Aballay, Pierre Gélat, Reza Haqshenas, Elwin van 't Wout

主题：医学物理 (physics.med-ph) ; 图像与视频处理 (eess.IV) ; 数值分析 (math.NA) ; 计算物理 (physics.comp-ph)
[310] arXiv:2508.11716 (交叉列表自 cs.CR) [中文pdf, pdf, html, 其他]: 标题：隐私感知的虚假身份文件检测：方法论、基准和改进算法（FakeIDet2）

标题： Privacy-Aware Detection of Fake Identity Documents: Methodology, Benchmark, and Improved Algorithms (FakeIDet2)

Javier Muñoz-Haro, Ruben Tolosana, Julian Fierrez, Ruben Vera-Rodriguez, Aythami Morales

主题：密码学与安全 (cs.CR) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV) ; 图像与视频处理 (eess.IV)
[311] arXiv:2508.11834 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：无人机应用中的Transformer和大型语言模型的最新进展

标题： Recent Advances in Transformer and Large Language Models for UAV Applications

Hamza Kheddar, Yassine Habchi, Mohamed Chahine Ghanem, Mustapha Hemis, Dusit Niyato

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 机器人技术 (cs.RO) ; 图像与视频处理 (eess.IV) ; 系统与控制 (eess.SY)
[312] arXiv:2508.11849 (交叉列表自 cs.RO) [中文pdf, pdf, html, 其他]: 标题： LocoMamba：通过Mamba的端到端深度强化学习实现视觉驱动的运动

标题： LocoMamba: Vision-Driven Locomotion via End-to-End Deep Reinforcement Learning with Mamba

Yinuo Wang, Gavin Tao

评论： 13页

主题：机器人技术 (cs.RO)
[313] arXiv:2508.11886 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： EVTP-IVS：用于统一多模态大语言模型指令视觉分割的有效视觉标记剪枝

标题： EVTP-IVS: Effective Visual Token Pruning For Unifying Instruction Visual Segmentation In Multi-Modal Large Language Models

Wenhui Zhu, Xiwen Chen, Zhipeng Wang, Shao Tang, Sayan Ghosh, Xuanzhao Dong, Rajat Koner, Yalin Wang

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 计算与语言 (cs.CL) ; 机器学习 (cs.LG) ; 图像与视频处理 (eess.IV)
[314] arXiv:2508.11893 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：大型核调制网络用于高效图像超分辨率

标题： Large Kernel Modulation Network for Efficient Image Super-Resolution

Quanwei Hu, Yinggan Tang, Xuguang Zhang

主题：计算机视觉与模式识别 (cs.CV) ; 图像与视频处理 (eess.IV)
[315] arXiv:2508.13049 (交叉列表自 cs.AR) [中文pdf, pdf, html, 其他]: 标题： XR-NPE：用于扩展现实感知工作负载的高吞吐量混合精度SIMD神经处理引擎

标题： XR-NPE: High-Throughput Mixed-precision SIMD Neural Processing Engine for Extended Reality Perception Workloads

Tejas Chaudhari, Akarsh J., Tanushree Dewangan, Mukul Lokhande, Santosh Kumar Vishvakarma

主题：硬件架构 (cs.AR) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV) ; 图像与视频处理 (eess.IV)
[316] arXiv:2508.13096 (交叉列表自 physics.optics) [中文pdf, pdf, 其他]: 标题：通过ENZ材料散射实现无暗角上转换成像的混合深度重建

标题： Hybrid Deep Reconstruction for Vignetting-Free Upconversion Imaging through Scattering in ENZ Materials

Hao Zhang, Yang Xu, Wenwen Zhang, Saumya Choudhary, M. Zahirul Alam, Long D. Nguyen, Matthew Klein, Shivashankar Vangala, J. Keith Miller, Eric G. Johnson, Joshua R. Hendrickson, Robert W. Boyd, Sergio Carbajo

主题：光学 (physics.optics) ; 图像与视频处理 (eess.IV)
[317] arXiv:2508.13157 (交叉列表自 cs.AR) [中文pdf, pdf, html, 其他]: 标题： Image2Net：数据集、基准测试和混合框架，用于将模拟电路图转换为网表

标题： Image2Net: Datasets, Benchmark and Hybrid Framework to Convert Analog Circuit Diagrams into Netlists

Haohang Xu, Chengjie Liu, Qihang Wang, Wenhao Huang, Yongjian Xu, Weiyu Chen, Anlan Peng, Zhijun Li, Bo Li, Lei Qi, Jun Yang, Yuan Du, Li Du

评论： 10页，12图，6表

主题：硬件架构 (cs.AR) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV) ; 图像与视频处理 (eess.IV)
[318] arXiv:2508.13205 (交叉列表自 cs.CV) [中文pdf, pdf, 其他]: 标题： YOLO11-CR：一种轻量级卷积与注意力框架，用于准确的疲劳驾驶检测

标题： YOLO11-CR: a Lightweight Convolution-and-Attention Framework for Accurate Fatigue Driving Detection

Zhebin Jin, Ligang Dong

主题：计算机视觉与模式识别 (cs.CV) ; 图像与视频处理 (eess.IV)
[319] arXiv:2508.13228 (交叉列表自 cs.GR) [中文pdf, pdf, html, 其他]: 标题： PreSem-Surf: 基于渐进语义建模和SG-MLP预渲染机制的RGB-D表面重建

标题： PreSem-Surf: RGB-D Surface Reconstruction with Progressive Semantic Modeling and SG-MLP Pre-Rendering Mechanism

Yuyan Ye, Hang Xu, Yanghang Huang, Jiali Huang, Qian Weng

评论： 2025年国际神经网络联合会议（IJCNN 2025）

主题：图形学 (cs.GR) ; 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV) ; 图像与视频处理 (eess.IV)
[320] arXiv:2508.13244 (交叉列表自 cs.AR) [中文pdf, pdf, html, 其他]: 标题：基于资源受限微控制器的亚毫秒事件驱动眼动追踪

标题： Sub-Millisecond Event-Based Eye Tracking on a Resource-Constrained Microcontroller

Marco Giordano, Pietro Bonazzi, Luca Benini, Michele Magno

主题：硬件架构 (cs.AR) ; 图像与视频处理 (eess.IV)
[321] arXiv:2508.13304 (交叉列表自 physics.med-ph) [中文pdf, pdf, html, 其他]: 标题：用于X射线成像中刚体运动估计的可微分前向和反向投影器

标题： Differentiable Forward and Back-Projector for Rigid Motion Estimation in X-ray Imaging

Xiao Jiang, Xin Wang, Ali Uneri, Wojciech B. Zbijewski, J. Webster Stayman

主题：医学物理 (physics.med-ph) ; 图像与视频处理 (eess.IV)
[322] arXiv:2508.13402 (交叉列表自 cs.MM) [中文pdf, pdf, html, 其他]: 标题：基于LEO卫星星座的鲁棒实时流媒体：测量、分析与切换感知适应

标题： Robust Live Streaming over LEO Satellite Constellations: Measurement, Analysis, and Handover-Aware Adaptation

Hao Fang, Haoyuan Zhao, Jianxin Shi, Miao Zhang, Guanzhen Wu, Yi Ching Chou, Feng Wang, Jiangchuan Liu

评论：被ACM多媒体2024接受

主题：多媒体 (cs.MM) ; 图像与视频处理 (eess.IV)
[323] arXiv:2508.13439 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：结构化提示和多智能体知识蒸馏用于交通视频解释和风险推断

标题： Structured Prompting and Multi-Agent Knowledge Distillation for Traffic Video Interpretation and Risk Inference

Yunxiang Yang, Ningning Xu, Jidong J. Yang

评论： 16页，10图，1表

主题：计算机视觉与模式识别 (cs.CV) ; 人工智能 (cs.AI) ; 计算与语言 (cs.CL) ; 图像与视频处理 (eess.IV)
[324] arXiv:2508.13479 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题： AIM 2025 竞赛关于逆色调映射的报告：方法与结果

标题： AIM 2025 challenge on Inverse Tone Mapping Report: Methods and Results

Chao Wang, Francesco Banterle, Bin Ren, Radu Timofte, Xin Lu, Yufeng Peng, Chengjie Ge, Zhijing Sun, Ziang Zhou, Zihao Li, Zishun Liao, Qiyu Kang, Xueyang Fu, Zheng-Jun Zha, Zhijing Sun, Xingbo Wang, Kean Liu, Senyan Xu, Yang Qiu, Yifan Ding, Gabriel Eilertsen, Jonas Unger, Zihao Wang, Ke Wu, Jinshan Pan, Zhen Liu, Zhongyang Li, Shuaicheng Liu, S.M Nadim Uddin

主题：计算机视觉与模式识别 (cs.CV) ; 图像与视频处理 (eess.IV)
[325] arXiv:2508.13503 (交叉列表自 cs.CV) [中文pdf, pdf, html, 其他]: 标题：自适应AE：动态场景中HDR捕捉的自适应曝光策略

标题： AdaptiveAE: An Adaptive Exposure Strategy for HDR Capturing in Dynamic Scenes

Tianyi Xu, Fan Zhang, Boxin Shi, Tianfan Xue, Yujin Wang

评论：被ICCV 2025接收

主题：计算机视觉与模式识别 (cs.CV) ; 图像与视频处理 (eess.IV)

总共 367 条目 : 1-25 ... 226-250 251-275 276-300 301-325 326-350 351-367

显示最多 25 每页条目：较少 | 更多 | 所有

图像与视频处理

2025年08月 的作者和标题

2025年08月的作者和标题