强制性国家标准《网络安全技术 人工智能生成合成内容标识方法》发布,强标配套服务平台GCmark正式开放

发布者:何璐发布时间:2025-03-15浏览次数:10

近日,我国首个人工智能生成合成内容治理领域的强制性国家标准《网络安全技术  人工智能生成合成内容标识方法》(以下简称《标识标准》)正式发布。作为支撑《人工智能生成合成内容标识办法》(以下简称《标识办法》)的配套服务标准,《标识标准》系统构建了涵盖文本、图片、音频、视频等多模态内容的标识技术体系,切实强化人工智能生成合成内容的可识别性与可溯源性,标志着我国在人工智能安全治理领域迈出关键一步。浙江大学区块链与数据安全全国重点实验室配合中国电子技术标准化研究院研发的人工智能生成合成内容标识服务平台(以下简称GCmark)作为强标配套服务平台,同步开放了服务提供者编码服务和标识合规性检测服务两大功能,协助相关网络信息服务提供者有效落实《标识办法》和《标识标准》相关要求。  







近年来,生成式人工智能正以前所未有的速度发展,其广泛应用推动了各行各业的技术革新,为经济增长和社会进步带来了新的机遇。《生成式人工智能应用发展报告(2024)》显示,截至2024年6月,我国生成式人工智能产品的用户规模达2.3亿人。与此同时,生成式人工智能愈发强大的内容生成能力带来了伪造信息传播等新型安全风险,导致舆论诱导、电信诈骗、认知混淆等安全事件频发。如何建立并完善生成合成内容治理体系已成为一个重要议题,生成合成内容标识技术将是生成合成内容治理体系中的关键一环。

以美国、欧盟为代表的国际社会陆续出台生成合成内容标识相关举措。美国发布了安全、可靠和可信地开发和使用人工智能的行政令,要求使用生成合成内容标识来有效识别生成合成内容;欧盟颁布了人工智能法案,要求生成合成内容标识的实现,并将此项要求列入2025年工作。同时,国际人工智能巨头企业均开始着手实现生成合成内容标识。OpenAI、Microsoft、Meta、Google、Amazon等企业成立C2PA组织,定义互联网多媒体内容来源信息规范格式,其中,OpenAI将来源信息嵌入生成内容的文件元数据字段内。Google、Microsoft、Amazon等企业各自研发并部署隐式水印系统,用户可使用隐式水印信息提取服务完成生成合成内容鉴别。

我国高度重视生成合成内容治理体系建设,2023年1月10日起施行的《互联网信息服务深度合成管理规定》要求深度合成服务提供者对使用其服务生成或编辑的信息内容,应当添加不影响使用的标识;2023年8月15日起施行的《生成式人工智能服务管理暂行办法》要求应对图片、视频等生成内容进行标识;今日发布的《人工智能生成合成内容标识办法》是首个专门针对生成合成内容标识的管理性文件。为了落实《标识办法》要求,配套研制的强标规定了人工智能生成合成内容标识的技术规范,包括显式标识方法与隐式标识方法。显式标识方法规定了对文本、图片、音频、视频和交互场景界面等添加显著标识的具体要求,隐式标识方法规定了对文件元数据写入包括标签、服务提供者等要素的具体要求。

为解决生成合成内容标识实现示范性样例空缺、标识领域内平台化能力落后的问题,浙江大学为强标核心编制单位,依托区块链与数据安全全国重点实验室推出标准配套服务平台GCmark,指导生成合成服务提供者和内容传播服务提供者开展人工智能生成合成标识活动与标识合规性检查,为监管部门提供生成合成内容标识合规性检测手段,为生成合成内容治理体系的建设提供技术支撑。


平台介绍













GCmark平台已向公众开放服务提供者编码功能和标识合规性检测功能,有效助力强标落地实践。同时,平台专注于生成合成内容标识前沿研究,以提升安全性和扩展功能性为导向,实现可验证鲁棒、用户溯源、内容证伪等创新标识技术,推动生成合成内容标识领域技术发展。

1. 强标配套服务平台


浙江大学深度参与多项人工智能安全系列标准撰写,并作为排序第一的非政府核心编制单位参与强标制定。浙江大学区块链与数据安全全国重点实验室推出的配套服务平台GCmark,汇总了相关政策标准文件和实践指南,主要为生成合成服务提供者和内容传播服务提供者提供编码辅助生成、编码规则校验等服务提供者编码服务功能及多模态标识合规性检测等编码服务功能。GCmark平台现已开放服务功能在线使用和API服务调用,可通过链接https://gcmark.org:20018/访问平台。


编码服

为协助网络信息服务提供者践行强标系列实践指南《网络安全标准实践指南——人工智能生成合成内容标识 服务提供者编码规则》的要求,编码服务开放了编码辅助生成、编码规则校验功能。编码辅助生成为组织和个人等类型的主体,按照编码规则生成二十七位服务提供者编码。服务提供者填入主体信息、模型/应用信息即可一键获取编码(图1 )。编码规则校验为组织和个人等类型的主体,按照规则校验自有编码是否符合规范。服务提供者填入基础信息和自有编码,即可实时进行编码合规性校验(图2)。

图1: 编码辅助生成演示


图2: 编码规则校验演示


标识服务

为协助网络信息服务提供者直观理解《标识标准》要求,标识服务开放了多模态显式标识和隐式标识检测功能。标识检测支持文本、图片、音频、视频等多种模态和交互场景的标识检测,服务提供者通过标识示例在平台上获取到生成合成内容标识准确要求,通过标识检测验证多种模态的标识对象是否满足强标要求。服务提供者上传图片标识文件后,平台给出待测对象的包含标识情况及合规检测结果(图3)。


图3  图片标识检测结果

同时,平台开放了编码服务API(图4)和标识服务API(图5),服务提供者亦可通过调用API获取编码服务生成、编码规则校验等编码功能及多模态标识检测功能,同时可获取API使用说明文档和技术支持,以满足服务提供者的多样化需求。


图4: 编码规则校验API接口



图5: 音频显式标识检测API接口


2. 科研亮点与特色


高安全性

在AIGC技术高速发展的背景下,隐式水印方法面临由AIGC赋能的新型多样化安全问题,攻击者可以实现水印去除、水印伪造等目标。GCmark从水印算法本身设计优化入手,研究隐式水印安全加固方法。

可验证鲁棒文本水印技术

为解决在面对未知攻击时文本中水印鲁棒性无法得到保证的问题,结合对抗训练与随机平滑技术,得到水印文本可承受的扰动范围,在范围内的扰动无法擦除水印,为水印文本提供鲁棒性保证。

为解决在面对未知攻击时文本中水印鲁棒性无法得到保证的问题,结合对抗训练与随机平滑技术,得到水印文本可承受的扰动范围,在范围内的扰动无法擦除水印,为水印文本提供鲁棒性保证。


理论可验证三防水印技术

为应对现有水印算法在实际人工智能合成图像检测应用中面临的三大安全威胁,在水印嵌入与水印提取验证过程中引入图像本身语义信息,使得水印算法在面对具有较大扰动的输入时,仍能够根据语义特征识别水印,同时结合对抗训练与随机平滑技术,实现去除攻击、伪造攻击和篡改攻击的三重抵御。


AIGC场景覆盖全面性

随着生成式人工智能技术的不断发展,AIGC场景下也会不断涌现各类新需求。GCmark深入研究扩展隐式水印的功能性,以满足大模型新业态下AIGC场景带来的新需求。

用户溯源技术

针对内容责任用户统一溯源手段缺失、现有开源模型使用的水印易被去除等问题,基于多方联合训练策略,提出第三方可验证的文生图大模型内生水印,实现大容量高效模型水印嵌入和不同模型合成内容统一用户溯源功能,支持大模型API黑盒服务使用场景和开源模型分发使用场景。

内容篡改证伪技术

针对鲁棒水印技术应用时存在的局部恶意内容篡改但维持原始标识实现诬陷攻击的严峻安全挑战,团队提出基于半易碎水印的内容篡改检测与证伪标识技术,在鲁棒水印溯源的基础上,针对深度篡改等人类感知无法分辨的伪造手段,充分发挥半易碎水印的易碎特性,精准检测出被篡改的内容部分并实现证伪,保障标识嵌入方面对诬陷时可自证清白以维护自身权益。

模型水印与指纹技术

针对现有黑盒模型水印方案应用时存在的有害性和脆弱性问题,区块链与数据安全全重团队提出了基于解释域水印的模型水印范式,适用于大模型在内的广泛的深度学习模型,显著提高了黑盒模型水印容量和水印的无害性,并具有出色的鲁棒性;针对现有的模型指纹方法存在的易伪造性和难迁移性的挑战,全重实验室团队提出了基于目标化指纹的模型指纹技术,能够抵御适应性的伪造攻击,显著降低假阳性率,能够适用于不同任务的模型的指纹比较,提高了模型指纹应用的安全性和实用性。

生成式人工智能在赋予人们生活生产便捷性的同时带来了众多安全问题,引起国内外高度关注。《人工智能生成合成内容标识办法》和强制性国家标准《网络安全技术  人工智能生成合成内容标识方法》的发布是合成内容治理体系建设的一项重要举措。浙江大学区块链与数据安全全国重点实验室深度聚焦人工智能合成内容安全,研发可验证鲁棒、用户溯源水印、半易碎水印等创新标识技术,发布标准配套服务平台GCmark,持续为人工智能生成合成内容服务提供者和网络信息内容传播服务提供者等公众开放编码服务和标识服务,打造强标示范性样例,为强标落地推广提供有力支撑。

展望未来,GCmark将以需求为导向,深化合成内容标识研究,从平台维护、开源生态、产业应用等方面推动标识技术的创新发展,继续推进人工智能生成合成内容标识标准制定与完善,为降低人工智能技术滥用做出贡献。团队将积极与社会各界开展深入的合作与交流,诚挚欢迎各界人士对平台提出宝贵的反馈意见,联系邮箱gcmark@bcds.org.cn。