近期,新濠峰娱乐
2021级硕士研究生赵洪刚完成的一篇基于注意力和对比学习的研究论文“MccSTN: Multi-Scale Contrast and Fine-Grained Feature Fusion Networks for Subject-driven Style Transfer”被CCF B类推荐会议《LREC-COLING 2024》接收并发表。该论文是在李明勇博士指导下完成的。
这篇论文提出了一种新颖的图像风格迁移框架。引入了一个新颖的风格转换框架,该模块可以将风格图像中的美学特征与内容图像中的细粒度特征进行融合,从而生成高质量的风格化图像。特征融合:Mccformer模块通过计算注意力分数,将内容图像和风格图像的特征图进行融合,有效避免了传统方法中常见的伪影问题。多尺度对比增强:通过引入多尺度对比增强模块,研究团队能够从大量图像对中学习风格表示,从而提高模型的训练效率并优化参数。新方法考虑了特定风格与整体风格分布的关系,显著减少了模型训练时间同时保持了生成图像的高质量。
图1 论文提出方法框架图。它主要包含用于图像序列处理的mccform模块和用于模型训练优化的对比学习模块
国际计算语言学会议(International Conference On Computational Linguistics,COLING)是自然语言处理和计算语言学领域最具权威性的三大会议(ACL、EMNLP、COLING)之一,每两年举办一次,被中国计算机学会(CCF)推荐为B类会议,在领域内享有广泛的学术声誉。计算语言学领域的两大国际重要组织——欧洲语言资源协会 (ELRA) 和国际计算语言学委员会 (ICCL) 联合组织 2024 年计算语言学、语言资源和评估联合国际会议(LREC-COLING 2024)。该会议于 2024 年 5 月 20-25 日在意大利都灵举行。