据全国信息安全标准化技术委员会网站,该会组织制定的技术文件《生成式人工智能服务安全基本要求》(下称《要求》)已于10月11日形成征求意见稿,现将技术文件面向社会公开征求意见,如有意见或建议,需在10月25日24:00前反馈。《要求》提出,建立语料来源黑名单,不得使用黑名单来源的数据进行训练。应对各来源语料进行安全评估,单一来源语料内容含违法不良信息超5%应将其加入黑名单。应使用包含个人信息的语料时,获得对应个人信息主体的授权同意,或满足其他合法使用该个人信息的条件。应使用包含人脸等生物特征信息的语料时,获得对应个人信息主体的书面授权同意,或满足其他合法使用该生物特征信息的条件。在训练过程中,应将生成内容安全性作为评价生成结果优劣的主要考虑指标之一。
政策全文
《生成式人工智能服务安全基本要求》
01.范围
本文件给出了生成式人工智能服务在安全方面的基本要求,包括语料安全、模型安全、安全措施、安全评估等。
本文件适用于面向我国境内公众提供生成式人工智能服务的提供者提高服务安全水平,适用于提供者自行或委托第三方开展安全评估,也可为相关主管部门评判生成式人工智能服务的安全水平提供参考。02.规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。
GB/T 25069―2022 信息安全技术 术语03.术语和定义
GB/T 25069―2022界定的以及下列术语和定义适用于本文件。
1、生成式人工智能服务 generative artificial intelligence service
基于数据、算法、模型、规则,能够根据使用者提示生成文本、图片、音频、视频等内容的人工智能服务。
2、提供者 provider
以交互界面、可编程接口等形式面向我国境内公众提供生成式人工智能服务的组织或个人。
3、训练语料 training data
所有直接作为模型训练输入的数据,包括预训练、优化训练过程中的输入数据。
4、违法不良信息 illegal and unhealthy information
《网络信息内容生态治理规定》中指出的11类违法信息以及9类不良信息的统称。
5、抽样合格率 sampling qualified rate
抽样中不包含本文件附录A所列出31种安全风险的样本所占的比例。04.总则
本文件支撑《生成式人工智能服务管理暂行办法》,提出了提供者需遵循的安全基本要求。提供者在向相关主管部门提出生成式人工智能服务上线的备案申请前,应按照本文件中各项要求逐条进行安全性评估,并将评估结果以及证明材料在备案时提交。
除本文件提出的基本要求外,提供者还应自行按照我国法律法规以及国家标准相关要求做好网络安全、数据安全、个人信息保护等方面的其他安全工作。05.语料安全要求
1、语料来源安全要求对提供者的要求如下。
a)语料来源管理方面:
1)应建立语料来源黑名单,不使用黑名单来源的数据进行训练;
2)应对各来源语料进行安全评估,单一来源语料内容中含违法不良信息超过5%的,应将该来源加入黑名单。
b)不同来源语料搭配方面:
应提高多样性,对每一种语言,如中文、英文等,以及每一种语料类型,如文本、图片、视频、音频等,均应有多个语料来源;并应合理搭配境内外来源语料。
c)语料来源可追溯方面:
1)使用开源语料时,应具有该语料来源的开源授权协议或相关授权文件;
注1:对于汇聚了网络地址、数据链接等能够指向或生成其他数据的情况,如果需要使用这些被指向或生成的内容作为训练语料,应将其视同于自采语料。
2)使用自采语料时,应具有采集记录,不应采集他人已明确声明不可采集的语料;
注2:自采语料包括自行生产的语料以及从互联网采集的语料。
注3:声明不可采集的方式包括但不限于robots协议等。
3)使用商业语料时:
――应有具备法律效力的交易合同、合作协议等;
――交易方或合作方不能提供语料合法性证明材料时,不应使用该语料。
4)将使用者输入信息当作语料时,应具有使用者授权记录。
d)按照我国网络安全相关法律要求阻断的信息,不应作为训练语料。
注4:相关法律法规要求包括但不限于《网络安全法》第五十条等。
2、语料内容安全要求对提供者的要求如下。
a)训练语料内容过滤方面:
应采取关键词、分类模型、人工抽检等方式,充分过滤全部语料中违法不良信息。
b)知识产权方面:
1)应设置语料以及生成内容的知识产权负责人,并建立知识产权管理策略;
2)语料用于训练前,知识产权相关负责人等应对语料中的知识产权侵权情况进行识别,提供者不应使用有侵权问题的语料进行训练:
――训练语料包含文学、艺术、科学作品的,应重点识别训练语料以及生成内容中的著作权侵权问题;
――对训练语料中的商业语料以及使用者输入信息,应重点识别侵犯商业秘密的问题;
――训练语料中涉及商标以及专利的,应重点识别是否符合商标权、专利权有关法律法规的规定。
3)应建立知识产权问题的投诉举报以及处理渠道;
4)应在用户服务协议中,向使用者告知生成内容使用时的知识产权相关风险,并与使用者约定关于知识产权问题识别的责任与义务;
5)应及时根据国家政策以及第三方投诉情况更新知识产权相关策略;
6)宜具备以下知识产权措施:
――公开训练语料中涉及知识产权部分的摘要信息;
――在投诉举报渠道中支持第三方就语料使用情况以及相关知识产权情况进行查询。
c)个人信息方面:
1)应使用包含个人信息的语料时,获得对应个人信息主体的授权同意,或满足其他合法使用该个人信息的条件;
2)应使用包含敏感个人信息的语料时,获得对应个人信息主体的单独授权同意,或满足其他合法使用该敏感个人信息的条件;
3)应使用包含人脸等生物特征信息的语料时,获得对应个人信息主体的书面授权同意,或满足其他合法使用该生物特征信息的条件。
3、语料标注安全要求对提供者的要求如下。
a)标注人员方面:
1)应自行对标注人员进行考核,给予合格者标注资质,并有定期重新培训考核以及必要时暂停或取消标注资质的机制;
2)应将标注人员职能至少划分为数据标注、数据审核等;在同一标注任务下,同一标注人员不应承担多项职能;
3)应为标注人员执行每项标注任务预留充足、合理的标注时间。
b)标注规则方面:
1)标注规则应至少包括标注目标、数据格式、标注方法、质量指标等内容;
2)应对功能性标注以及安全性标注分别制定标注规则,标注规则应至少覆盖数据标注以及数据审核等环节;
3)功能性标注规则应能指导标注人员按照特定领域特点生产具备真实性、准确性、客观性、多样性的标注语料;
4)安全性标注规则应能指导标注人员围绕语料及生成内容的主要安全风险进行标注,对本文件附录A中的全部31种安全风险均应有对应的标注规则。