近日,国际信息与软件学院几何计算与数字媒体技术团队罗钟铉教授、樊鑫教授、刘日升副教授等在深度学习理论与应用领域取得的三项研究成果同时被人工智能顶级国际会议AAAI(CCF认定A类会议)录用。该系列工作在优化展开深度网络建模,样本生成和序列行为分析等方面取得突破,相关研究成果为深度学习理论分析,特别是网络可解释性和收敛性等问题提供了全新的解决方案,并且在人脸检测与序列分析应用中得到了成功应用。
近年来,深度学习模型在许多应用领域都取得了巨大的成功,但是其可解释性和理论分析问题仍然没有得到有效解决。几何计算与数字媒体技术团队的一项研究成果“Proximal Alternating Direction Network: A Globally Converged Deep Unrolling Framework”提出了一种全新的基于优化展开策略的深度模型设计和分析新框架,并对所设计网络模型前向传播的收敛性进行了理论分析。该工作的最大亮点在于其设计的神经网络的前向传播可以被严格证明全局收敛到特定的潜在能量,从提供了一种严谨的神经网络理论分析和设计工具。其有效性在多个计算机视觉问题中得到了验证,该方法的性能明显优于传统的模型优化算法和启发式网络设计方法。
人脸对齐是人脸分析中的重要环节,该团队的研究成果“Self-Reinforced Cascaded Regression for Face Alignment”针对人脸特征点回归过程中需要大量人工标定训练样本的问题,提出了一种半监督的人脸特征点检测算法训练框架,通过引入一种局部纹理约束和一种基于特征数的几何约束实现了从小规模训练样本生成大规模训练样本的半监督学习。该方法有效克服在只有少量训练样本情况下,回归算法难以学习的问题。
另一项研究成果“Unsupervised Representation Learning with Long-Term Dynamics for Skeleton Based Action Recognition”则针对动作识别提出了一种序列数据驱动的无监督表示学习框架。该方法将有缺失的动作序列编码成一个固定长度的表示,利用元素损失函数和对抗损失函数训练一个解码器,并利用这个解码器对得到的表示进行修复。该方法很大程度上减少了序列修复过程中的错误。在多个具有挑战的动作识别数据集上的定性和定量实验中,该方法都取得了最好的结果。
AAAI会议介绍:AAAI(Association for the Advancement of Artificial Intelligence)是人工智能领域的顶级会议,代表了人工智能技术研究的年度最高水准。本届AAAI大会收到创纪录的超过3800篇论文投稿,最终论文录用率低于25%。
论文列表:
[1].Risheng Liu (通讯), Xin Fan, Shichao Cheng, Xiangyu Wang and Zhongxuan Luo. Proximal Alternating Direction Networks: A Globally Converged Deep Unrolling Framework. AAAI 2018 (CCF认定A类会议).
[2].Xin Fan (通讯), Risheng Liu, Kang Huyan and Zhongxuan Luo. Self-reinforced Cascaded Regression for Face Alignment. AAAI 2018 (CCF认定A类会议).
[3].Nenggan Zheng, Jun Wen, Risheng Liu (通讯), Liangqu Long, Jianhua Dai and Zhefeng Gong. Unsupervised Representation Learning with Long-Term Dynamics for Skeleton Based Action Recognition. AAAI 2018 (CCF认定A类会议).