近日,大连理工大学-立命馆大学国际信息与软件学院几何计算与智能媒体技术研究所一项成果被神经信息处理系统大会(Conference on Neural Information Processing Systems 2019)录用。NeurIPS是机器学习领域最高级别的会议,根据谷歌2019最新发布的学术指标(Google Scholar Metrics)榜单位列第27位,h5指数为169。该会议的论文集代表了机器学习领域最新的发展方向和水平。本届NIPS大会共收到6743篇论文投稿,录用1428篇,录用率仅为21%。
录取论文简介
论文“Memory-oriented Decoder for Light Field Salient Object Detection”由国际信息与软件学院几何计算与智能媒体技术研究团队张淼副教授、研究生冀炜、研究生李婧婧与信息与通信工程学院的朴永日副教授、卢湖川教授合作完成。该项研究创新性的将4D光场数据与深度神经网络结合在一起,设计了一个记忆力导向的解码器去充分融合4D光场和RGB图像之间的互补信息。启发于光场数据丰富的空间信息和多聚集信息,专门设计了基于记忆力导向的空间融合模块去加权不同光场特征的优势,并且利用可卷积的长短期记忆力网络去总结不同光场特征之间的空间关系,然后通过设计全局感知模块和深层监督机制去加强特征的高阶信息并且使网络更加清晰地学习有用特征。在最后的解码阶段,设计了一个记忆导向的特征整合模块,利用递归的注意力网络去逐步提高网络的定位能力,并且优化结果的空间细节,同时也是此领域首次使用递归的网络结构进行解码网络。此外,该项研究提供了一个大规模的4D光场数据集,为深度学习在光场显著性领域的应用提供了重要的数据支撑,解决了目前光场数据匮乏的问题。并且通过三个公共数据集上的大量实验证明,该方法优于目前最先进的25个显著性物体检测方法,尤其是在复杂场景中。
相关介绍
几何计算与智能媒体技术研究团队依托于辽宁省泛在网络与服务软件重点实验室。研究课题包括机器学习、深度学习、计算机视觉、多媒体技术、优化方法等当前最前沿的领域。近年来在IEEE TPAMI、TIP、TNNLS、TMM、NeurIPS、IJCAI、AAAI、CVPR、ECCV、ACM MM等人工智能、多媒体技术等多方领域的重要期刊及会议上发表论文达100余篇。近一年来针对可学习优化的理论及应用研究已发表顶级会议和期刊(包括NeurIPS, AAAI, IJCAI, ACM MM, TIP, TNNLS等)论文30余篇。