近日,我院几何计算与智能媒体技术研究所以智能感知为突破口,在鲁棒低光图像增强、高质量显著性检测、高效水下目标检测、高精度图像融合方向取得四项科研成果,被多媒体领域顶级会议ACM Multimedia 2020(简称ACM MM,该会议是CCF推荐A类会议,并被认为是多媒体技术领域奥运级别的顶级盛会)录用。其中由刘日升教授与樊鑫教授共同指导的2017级本科生金典同学的论文被大会全文录用,这一成果也是团队本科生近期发表的第二篇A类论文。
论文“Bridging the Gap between Low-Light Scenes: Bilevel Learning for Fast Adaptation”由本科生金典(即将攻读圣路易斯华盛顿大学硕士研究生)、博士研究生马龙、刘日升教授、樊鑫教授共同合作完成。该工作通过一种超参数优化视角,针对一般的低光场景制定了全新的双层学习方案,以解决现有方法在面对以前从未遇到过的真实场景时,其性能无法保障的挑战。该方案刻画了不同数据分布之间的潜在对应关系和各个数据的特征。随后通过引入单步近似和有限差分来设计了高效计算方法。同时,设计了对抗性损失函数用于实现自适应去噪,这也进一步提升了模型的泛化能力。大量的实验性验证充分表明了提出算法的有效性。
论文“Auto-MSFNet: Search Multi-scale Fusion Network for Salient Object Detection”由我院硕士研究生刘廷位、姚舜禹,张淼副教授完成。该工作针对现有RGD显著性检测方法中存在多尺度融合策略仍需手工设计的问题,设计了一个自动搜索框架,能将目前主流的多尺度融合方法考虑其中,让网络自动化地学习一条最优的多尺度特征融合策略。其提出的注意力机制驱动的搜索空间,解决了由渐进式融合引起的不完整显著性物体结构等问题,并设计了渐进式抛光损失函数,以获得精细化的边缘结构。最后在5个RGB数据集上证明了提出网络的有效性并在4个评估指标上实现了最先进的性能。
论文“Underwater Species Detection using Channel Sharpening Attention”由我院硕士研究生姜立浩、王祎副教授、贾棋副教授、硕士研究生许生威、刘宇副教授、樊鑫教授、李豪杰教授、刘日升教授、薛昕惟博士和新西兰梅西大学王瑞利教授共同合作完成,该工作提出了基于通道锐化注意力机制的水下物体检测方法,突破了现有通用目标检测在水下复杂环境的局限性,解决了物体和背景相似的检测问题并显著提高检测精度。该团队还贡献了标准的真实世界水下目标检测数据集UODD。大量实验表明,提出的模块拥有更少的计算量和更快的检测速度。且在复杂模糊的真实水下环境的数据中可以获得更优的性能。
论文“Searching a Hierarchically Aggregated Fusion Architecture for Fast Multi-Modality Image Fusion”由我院刘日升教授、硕士研究生刘铸、博士研究生刘晋源、樊鑫教授共同合作完成。该工作为解决现有手工设计的网络方法目标不清晰,细节不丰富等问题,以网络结构搜索为手段,通过构造分层聚合融合架构从特征级和目标级融合角度提取和细化融合特征,从而得到互补的背景和细节表征。进一步通过构造协作搜索策略,设计不同的面向融合的损失函数和延迟约束,从高效搜索空间中来控制网络搜索过程,从而得到模型轻量,表征能力强的高效网络结构。最后,多种融合任务的应用充分表明了该方法的卓越性。
相关介绍:
几何计算与智能媒体技术研究团队隶属于大连理工大学国际信息与软件学院,与立命馆大学合作建立健康医疗智能计算联合研究中心。研究课题包括机器学习、深度学习、计算机视觉、多媒体技术、优化方法等当前最前沿的领域,及其在医疗和健康领域中的应用。近年来在IEEE TPAMI、TIP、TNNLS、TMM、NeurIPS、IJCAI、AAAI、CVPR、ECCV、ACM MM等人工智能、多媒体技术等多领域的重要期刊及会议上发表论文达100余篇。近一年来针对可学习优化的理论及应用研究已发表顶级会议和期刊(包括NeurIPS, AAAI, IJCAI, ACM MM, TIP, TNNLS等)论文30余篇。研究所在科学研究的基础上,还面向国家重大战略需求,如开展全天候车载多波段立体视觉感知单元研发,在重大项目实物竞标中取得第一名;开展水下目标抓取机器人研发,在水下目标自主抓取中取得突破等。
责任编辑:潘树孟