近期,新濠峰娱乐
2023级硕士研究生陈俊宇完成的一篇关于通用场景图文匹配方法的研究论文“Ambiguity-Aware and High-order Relation learning for multi-grained image–text matching”被中科院1区Top期刊《Knowledge-Based Systems》接收并发表。该论文是在李明勇教授指导下完成的。
该研究针对现有图像-文本匹配方法在处理语义歧义和高阶关联建模中的不足,提出了一种歧义感知与高阶关系学习框架。首先,通过动态聚类与原型对比学习构建统一表征空间,有效解决了语义相似样本的误匹配问题;其次,设计全局-局部特征协同提取机制与自适应聚合网络,显著提升了多粒度语义理解能力;进一步引入多模态语义关联图与图神经网络,深度挖掘样本间的邻域关系,同时结合动量对比学习策略扩展负样本集,显著提升了模型的判别能力。实验表明,该方法在多个基准数据集上均取得最优性能,展示了良好的泛化能力和实际应用价值。完整代码及预训练模型已开源。
《Knowledge-Based Systems》是国际人工智能与知识工程领域的高质量学术期刊,位居中科院1区Top期刊行列,五年影响因子7.4。该期刊聚焦知识驱动型智能系统的理论构建与工程应用,涵盖多模态表征学习、跨模态语义理解、动态知识图谱构建、智能决策系统等前沿方向,推动人工智能与自然语言处理、计算机视觉及认知科学领域的深度融合。
论文链接://doi.org/10.1016/j.knosys.2025.113355