近日,我院几何计算与智能媒体技术研究领域取得系列研究成果,2项研究成果被ACM Multimedia Conference 2024录用。ACM MM(国际多媒体会议)是多媒体领域的顶级会议,也是中国计算机学会推荐的A类国际学术会议。
研究成果“Unseen No More: Unlocking the Potential of CLIP for Generative Zero-shot HOI Detection”由郭益鑫博士研究生、刘宇副教授(通讯作者)、李江浩硕士研究生、王维民副教授和贾棋副教授共同合作完成。此项研究针对目前零样本人物交互检测领域在测试期间出现可见类别与不可见类别混淆的问题,创新地提出了一种通过CLIP注入特征生成器生成特征进行零样本人物交互检测的方法HOIGen。与此同时,还引入多知识原型库来增强人物交互得分,解决了现有方法在零样本人物交互检测上的核心挑战,并在多种零样本设置下达到了卓越的性能。该相关工作已开源至https://github.com/soberguo/HOIGen。
研究成果“Two Teachers are Better Than One: Semi-supervised Elliptical Object Detection by Dual-Teacher Collaborative Guidance” 由刘宇副教授、冯龙晗硕士研究生、贾棋副教授(通讯作者)和刘泽正硕士研究生共同合作完成。此研究考虑到现有方法在参数配置上的困难,提出了一种面向标签稀疏场景下的师生半监督学习框架——双教师协作指导。通过使用特征交互模块和协同训练策略以互补的方式指导学生的训练。该相关工作已开源至https://github.com/FengLongHan/DTCG。