我院科研团队面向国家重大需求,以攻克恶劣环境下的视觉感知为目标,在高效低光图像增强、可见光与红外图像融合检测以及伪装目标检测等方面取得三项科研成果,被CVPR 2022 (Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition)录用,录用率仅为25.33%(2067/8161)。CVPR是CCF推荐A类会议,计算机视觉三大顶级会议之一。根据谷歌2021学术影响力榜单,CVPR在工程和计算机科学类榜单所有期刊与会议中排名第一。
我院博士研究生马龙、硕士研究生马腾宇、刘日升教授、樊鑫教授与罗钟铉教授共同合作完成的论文“Toward Fast, Flexible, and Robust Low-Light Image Enhancement”针对现有技术存在的效率低、视觉质量差、对下游视觉任务不友好等问题,聚焦于网络训练过程,构造了全新的自校准光照学习(SCI)框架,具备增强效果佳、推理速度快等优势。如下图所示,对于视觉增强而言,PSNR提升10%以上,模型大小减少75%以上,速度提升60%以上,在1080P数据的帧率达到150FPS以上。此外夜间人脸检测的性能提升超过5%,夜间分割性能提升超过2%,堪称名副其实的“六边形战士”。
代码地址:https://github.com/tengyu1998/SCI
我院博士研究生刘晋源、樊鑫教授、本科生黄展搏、本科生吴冠尧、刘日升教授,仲维副教授与罗钟铉教授共同合作完成的论文“Target-aware Dual Adversarial Learning and a Multi-scenario Multi-Modality Benchmark to Fuse Infrared and Visible for Object Detection”针对多模态图像融合存在的融合后目标不清晰、视觉质量差、对下游视觉任务不友好等问题,提出了联合图像融合与下游视觉任务的双层优化框架,该框架“求同存异”探究了融合图像与源图像中背景与显著目标物两方面的差异,从而更好地从红外和可见光源图像中提取并保留目标的结构信息和纹理细节。此外,构建了一个红外和可见光传四目同步成像系统,建立了大型全天候多场景数据集(4000+成对数据及20000+的标注)。该研究的方法不仅在视觉上具有吸引力、定性分析中各融合指标有明显优势,且在多种挑战环境的场景下,融合后的目标检测结果的mAP率较现有SOTA方法提升10%以上。
代码地址:
https://github.com/JinyuanLiu-CV/TarDAL
我院贾棋副教授、硕士研究生姚水连、刘宇副教授、樊鑫教授、刘日升教授与罗钟铉教授共同合作完成的论文“Segment, Magnify and Reiterate: Detecting Camouflaged Objects the Hard Way”针对小型伪装物体检测难的问题,提出了一种新的伪装目标检测迭代细化框架(SegMaR),此框架是伪装目标检测领域第一个使用迭代细化进行检测的框架。如下图所示,此框架在无需扩大图像大小的基础上,利用基于注意力的采样器逐步放大对象区域,达到逐步精细检测的效果。实验表明,SegMaR能够有效提升网络的检测性能,在小型伪装物体的评估指标上提升更为显著,较最先进方法提升7.4%,且适用于其他伪装目标检测网络。
代码地址:
https://github.com/YAOSL98/Segment-Magnify-and-Reiterate-Detecting-Camouflaged-Objects-the-Hard-Way
国际信息与软件学院科研团队一直致力于面向国家重大需求,加强关键共性技术研究,已经在开展全天候车载多波段立体视觉感知单元研发、重大项目实物竞标、水下目标抓取机器人研发、水下目标自主抓取等研究方向中取得突破。
相关介绍:
几何计算与智能媒体技术研究团队隶属于大连理工大学国际信息与软件学院,与立命馆大学合作建立健康医疗智能计算联合研究中心。研究课题包括机器学习、深度学习、计算机视觉、多媒体技术、优化方法等当前最前沿的领域,及其在医疗和健康领域中的应用。近年来在IEEE TPAMI、TIP、TNNLS、TMM、NeurIPS、IJCAI、AAAI、CVPR、ECCV、ACM MM等人工智能、多媒体技术等多领域的重要期刊及会议上发表论文达100余篇。近一年来针对可学习优化的理论及应用研究已发表顶级会议和期刊(包括NeurIPS、AAAI、IJCAI、ACM MM、TIP、TNNLS等)论文50余篇。
供稿:马龙
责任编辑:潘树孟