第33届ACM国际多媒体大会(ACM International Conference on Multimedia, ACM MM)论文录用结果近日揭晓,我院泛在网络与智能感知研究所樊鑫教授团队在水下三维重建和水下目标检测方面的两项研究成果被录用。ACM MM是多媒体领域的顶级国际会议,也是中国计算机协会(CCF)推荐A类会议,ACM MM 2025将于2025年10月27日-10月31日在爱尔兰都柏林举办,共收到有效论文投稿4711篇,其中1251篇论文被录用,录用率为26.6%。
研究成果1::TNT-GS: Truncated and Tailored Gaussian Splatting
该研究由刘小锋博士研究生、孟冠辰博士研究生、冯重阳硕士研究生、刘日升教授、罗钟铉教授和樊鑫教授(通讯作者)合作完成。针对现有高斯泼溅方法在高频细节表达与模型效率之间的矛盾,提出了一种具有代表性的改进框架——截断高斯泼溅,提出的边界调控机制能够对不同区域的表征基元施加可调的锐/滑过渡,使模型在平滑区域仍可保持准确性,同时不丢失高频结构,在水下这种高噪声/低特征环境中尤为重要。该研究的致密化策略可以提升稀疏视角/稀疏点云下的建图精度,切合高质量水下数据拍摄难、代价大的痛点,为水下3D场景高质量建模与实时渲染提供了兼顾精度、效率与紧凑表示的新思路,展示了团队在视觉渲染基础表示方法上的持续探索与创新能力。其中多项技术改进可为水下视觉重建、环境感知、三维识别与导航建图等核心问题带来直接提升。该工作已开源至https://github.com/GoogolplexGoodenough/TNT-GS。

研究成果2:Physics-Guided Sonar Image Fine-grained Recognition under Scarce Annotations
该研究由李承洲博士研究生、刘晓康博士研究生、贾棋副教授(通讯作者)、刘晋源博士、姜智颖博士、冯龙晗硕士研究生、刘宇副教授、罗钟铉教授、樊鑫教授(通讯作者)合作完成。声呐图像识别是水下探测系统中的关键技术。然而,相较于自然图像,声呐图像纹理细节较少且易受强噪声影响,使得专家在区分类别细微差别时面临较大挑战。针对水下场景中标注数据稀缺导致模型泛化能力有限的问题,该研究提出了一种物理引导的教师-学生框架(PGTS),用于挖掘声呐图像中的物理特征,并有效缓解标注不足带来的不利影响。实验结果表明,在标注比例仅为1%的极端条件下,PGTS方法的性能依然显著优于现有方法,推动了水下低标注场景下语义理解技术的研究进展。

近年来,学院在海洋信息处理与计算领域持续深耕,在项目立项、科技奖励、成果转化等方面取得了丰硕成果。此次录用的两项研究成果是国家自然科学基金委重大项目“恶劣海洋环境下的具身智能系统精准感知与交互协同”的重要研究内容,为水下视觉重建、环境感知、三维识别与标注稀缺等核心问题提供了新思路。研究团队将致力突破恶劣海洋环境下自主作业瓶颈,构建具有主动探索-持续学习-自主演进能力的具身智能新理论新技术,推动我国海洋智能系统技术迈向新高度,增强对海洋资源的开发、利用与保护能力。