在刚公布的国际万维网会议The Web Conference 2025 (WWW’25)论文录用结果中,我院教师张佳乐副教授与硕士生李昊轩等人的论文“Beyond Dataset Watermarking: Model-Level Copyright Protection for Code Summarization Models”被录用。

后门水印(Backdoor Watermarking)技术通过在模型中嵌入可验证的标识符,旨在保护模型的版权、追踪模型的来源,并防止未经授权的复制或篡改。在代码模型领域,国内外学者多集中于在数据集中嵌入后门以实现可验证的数字水印,但往往忽视了水印的隐蔽性以及其在多种编程语言场景下的普适性。本文通过实证研究,首次提出了直接修改模型本身以嵌入隐蔽后门水印的方法。具体而言,该方法通过微调代码模型中的组件分词器,利用分词器独特的映射机制,实现了稳定的水印有效验证率,并具备了对多种编程语言场景的广泛适应性。此外,采用加噪方法对触发器进行扰动,进一步提升了水印的隐蔽性。
WWW是由国际万维网会议委员会发起主办的顶级国际学术会议,创始于1994年,每年举办一届,是CCF-A类、Core Conference Ranking A*类会议。