近日,大连理工大学-立命馆大学国际信息与软件学院几何计算与数字媒体技术团队()研究工作Learning Collaborative Generation Correction Modules for Blind Image Deblurring and Beyond 被多媒体领域顶级学术会议ACM Multimedia(CCF A)录用为Oral Presentation(录用率约为8.5%)。ACM是世界上最大的计算机领域专业性学术组织,其评选的图灵奖(A.M. Turing Award)被公认为世界计算机领域的诺贝尔奖。而ACM Multimedia是公认的多媒体技术领域奥运会级别的顶级盛会(CCF认定A类会议),各类机构都将在会议上分享、交流最新研究成果。本年度大会收到757篇有效投稿、其中144篇被录用为海报展示(Poster),64篇录用为口头报告(Oral)。几何计算与数字媒体技术团队的本项工作是我校在该顶级会议上的首篇口头报告论文。
在深度学习领域,由于生成对抗式的学习策略难以有效反映问题的物理规律等本质属性,且训练难度较大,探索新的学习机制成为近年来深度学习领域的研究热点。刘日升副教授,何意(研一),程世超(博士生),樊鑫教授和罗钟铉教授共同合作完成的这一研究工作中,提出了一种可学习的生成协同矫正框架,并在此基础上设计了一种全新的领域知识与网络结构协同工作的图像盲复原新算法。图像盲复原问题是计算机视觉中经典并极具挑战性的核心问题,传统方法需要手工设计复杂的图像先验,而这些先验往往难以优化,且极易得到平凡解,而现有的深度学习方法完全依赖于训练数据,难以处理大尺度的模糊数据,并且无法在理论上给出有效性保证。本工作中提出的框架利用级联残差网络结构作为生成器,利用能量下降准则作为矫正器,引导求解过程,从而实现了协同学习潜在数据分布和领域知识的深度学习新机制,并从理论上证明了该协同学习网络的有效性。此外,通过引入更加广泛的矫正策略,该框架还可以被应用到其它底层计算机视觉核心问题中,如图像插值,图像保边平滑等。
几何计算与数字媒体技术团队在罗钟铉教授、樊鑫教授、李豪杰教授的带领下,近年来在IEEE TPAMI、TIP、TNNLS、TMM、NIPS、IJCAI、AAAI、CVPR、ECCV、ACM MM等人工智能、多媒体技术等领域重要期刊会议发表论文一百余篇,2018年以来已经发表/录用CCF认定A类论文7篇,相关研究成果将进一步推动我校在软件工程领域的研究。