上海公布2项数据分类分级、制定重要数据目录试点优秀案例

 
 
 
 
 
 

来源:网信上海

 

静安区政府办公室、区委网信办、区政务数据管理中心试点优秀案例——《静安区公共数据分类分级导则》

一、引言

为加快建立健全数据分类分级保护制度及重要数据目录管理机制,促进数据共享应用,2022年7月至12月,市委网信办会同市政府办公厅成立试点工作组,组织开展了数据分类分级、制定重要数据目录试点工作,遴选出一批试点优秀单位和试点优秀案例。

 
今天分享静安区政府办公室、区委网信办、区政务数据管理中心试点优秀案例——《静安区公共数据分类分级导则》。
二、案例概述
本案例围绕数据分类分级规则、重要数据识别规则、数据分级保护体系,从静安区公共数据分类分级方法及流程、重要数据识别规则、不同生命周期公共数据分级安全保护要求等方面,阐述静安区“1+N”模式的数据分类分级保护制度体系,对数据分类分级及安全管控工作具有参考意义。
三、案例展示
静安区公共数据分类分级导则
(节选)

1、范围

 
本导则给出了公共数据分类分级的原则、框架和方法等。
本导则适用于指导静安区公共数据分类分级。
2、数据分类分级基本原则

数据分类分级的基本原则为科学实用原则、边界清晰原则、就高从严原则、点面结合原则、动态更新原则

3、数据分类方法

1)数据分类框架

本导则采用点面结合的形式。常见的数据分类维度,包括但不限于公民个人维度、公共管理维度、信息传播维度、组织经营维度。

数据处理者可采用点面结合的方式对数据进行分类,在遵循国家和行业数据分类要求的基础上,对不同维度的数据类别进行标识,再进一步细分每个维度的数据类型。

2)用户数据分类
a)个人信息分类
按照涉及的自然人特征,个人信息可分为个人基本资料、个人身份信息等二十一个类别。
b)组织信息分类
组织信息分类可根据组织架构实际情况,对组织信息进行细化分类。
c)业务数据分类
业务数据分类可根据各部门业务具体情况,对业务数据进行细化分类。
d)管理数据分类
管理数据分类可根据各部门实际管理情况,对管理数据进行细化分类。
e)监管数据分类
监管数据分类可根据各监管部门实际监管情况,对监管数据进行细化分类。
4、数据分级方法
数据分级主要是从数据安全保护的角度,考虑影响对象、影响程度两个要素进行分级。数据分级为核心数据、重要数据、一般数据(1级、2级、3级、4级)。
 
资源目录数据分级是指区数据责任部门在公共数据库表目录基础上定期、按需梳理和编制全量公共数据资源目录,评估公共数据资源目录中所编数据的潜在影响,定义公共数据资源目录中的数据集及其数据项的安全级别,并对其安全分级进行评审,提交区公共数据主管部门审核。若有属于国家核心数据或重要数据目录的,还应上报市有关部门备案。
1)影响对象
影响对象是指数据一旦遭到泄露、篡改、破坏或者非法获取、非法利用、非法共享,可能影响的对象。影响对象通常包括国家安全、经济运行、社会稳定、公共利益、组织权益、个人权益等。
2)影响程度
影响程度是指数据一旦遭到泄露、篡改、破坏或者非法获取、非法利用、非法共享,可能造成的影响程度。影响程度从高到低可分为特别严重危害、严重危害、一般危害。
3)基本分级原则
影响对象、影响程度与数据级别的关系如表1所示。在分级要素识别、数据影响分析的基础上,可参考以下规则确定数据级别。
a)核心数据为对领域、群体、区域具有较高覆盖度或达到较高精度、较大规模、一定深度的重要数据,一旦被非法使用或共享,可能直接影响政治安全。满足以下任一条件的数据,可考虑确定为核心数据:
i.数据一旦被泄露、篡改、损毁或者非法获取、非法使用、非法共享,可能直接对国家安全造成特别严重危害(如直接影响政治安全)或严重危害(如关系国家安全重点领域);
ii.数据一旦被泄露、篡改、损毁或者非法获取、非法使用、非法共享,可能直接对经济运行造成特别严重危害(如关系国民经济命脉);
iii.数据一旦被泄露、篡改、损毁或者非法获取、非法使用、非法共享,可能直接对社会稳定造成特别严重危害(如关系重要民生);
iv.数据一旦被泄露、篡改、损毁或者非法获取、非法使用、非法共享,可能直接对公共利益造成特别严重危害(如关系重大公共利益);
v.对领域、群体或区域具有较高覆盖度,可能直接影响政治安全、国家安全重点领域、国民经济命脉、重要民生、重大公共利益的重要数据;
vi.达到较高精度、较大规模或一定深度,可能直接影响政治安全、国家安全重点领域、国民经济命脉、重要民生、重大公共利益的重要数据;
vii.经有关部门评估确定的核心数据。
b)重要数据为特定领域、特定群体、特定区域或达到一定精度和规模的数据,一旦被泄露或篡改、损毁,可能直接危害国家安全、经济运行、社会稳定、公共健康和安全。满足以下任一条件的数据,可考虑确定为重要数据:
i.数据一旦被泄露、篡改、损毁或者非法获取、非法使用、非法共享,可能直接对国家安全造成一般危害;
ii.数据一旦被泄露、篡改、损毁或者非法获取、非法使用、非法共享,可能直接对经济运行造成严重危害或一般危害;
iii.数据一旦被泄露、篡改、损毁或者非法获取、非法使用、非法共享,可能直接对社会稳定造成严重危害;
iv.数据一旦被泄露、篡改、损毁或者非法获取、非法使用、非法共享,可能直接对公共利益造成严重危害(如危害公共健康和安全);
v.数据直接关系国家安全、经济运行、社会稳定、公共健康和安全的特定领域、特定群体或特定区域;
vi.数据达到一定精度、规模或深度,可能直接影响国家安全、经济运行、社会稳定、公共健康和安全;
vii.经行业领域主管(监管)部门评估确定的重要数据。
c)满足以下任一条件的数据,可定级为一般数据:
i.数据一旦遭到篡改、破坏、泄露或者非法获取、非法利用、非法共享,仅可能对社会稳定造成一般危害;
ii.数据一旦遭到篡改、破坏、泄露或者非法获取、非法利用、非法共享,仅可能对公共利益造成一般危害;
iii.数据一旦遭到篡改、破坏、泄露或者非法获取、非法利用、非法共享,仅影响组织合法权益;
iv.数据一旦遭到篡改、破坏、泄露或者非法获取、非法利用、非法共享,仅影响公民合法权益;
v.经国家有关部门、各行业各领域主管(监管)部门和各地区、各部门等评估,均未被确定为核心数据和重要数据的数据。
表1 数据分级参考规则

4)一般数据分级原则
按照数据一旦遭到篡改、破坏、泄露或者非法获取、非法利用,对个人、组织合法权益造成的危害程度,将一般数据从高到低分为四级、三级、二级、一级。
注:针对一般数据中的个人敏感信息,若个人敏感信息涉及10万人以上则将数据提级为重要数据;针对一般数据中的个人信息涉及100万人以上,则将数据提级为重要数据。
5)一般数据最低参考级别
一般数据分级考虑敏感个人信息等特定类型数据的敏感性,特定类型数据最低参考级别包括:
a)敏感个人信息不低于“四级”,一般个人信息不低于“二级”;
b)组织内部员工个人信息不低于“二级”;
c)去标识化的个人信息不低于“二级”,匿名化个人信息不低于“一级”;
d)个人标签信息不低于“二级”;
e)有条件开放/共享的公共数据级别不低于“二级”,禁止开放/共享的公共数据或政务数据不低于“四级”。
6)衍生数据安全参考级别
衍生数据安全级别可参考其所对应的原始数据集级别,综合考虑数据加工对分级要素、影响对象、影响程度的影响:
a)脱敏数据级别可以比原始数据集级别降低;
b)标签数据级别可以比原始数据集级别降低;
c)统计数据如涉及大规模群体特征或行动轨迹,应设置比原始数据集级别更高的级别;
d)融合数据级别要考虑数据汇聚融合结果,如果结果数据是对大量多维数据进行关联、分析或挖掘,汇聚了更大规模的原始数据或分析挖掘出更敏感、更深层的数据,级别可以升高,但如果结果数据降低了标识化程度等,级别可以降低。
7)重要数据识别规则
识别重要数据遵循的原则如下:
a)聚焦安全影响:从国家安全、经济运行、社会稳定、公共健康和安全等角度识别重要数据,仅影响组织自身或公民个体的数据一般不作为重要数据,但要考虑对海量数据挖掘分析的结果;
b)突出保护重点:通过对数据分级,明确重点保护对象,使重要数据在满足安全保护要求前提下有序流动;
c)衔接既有规定:充分考虑地方已有管理要求和行业特性,与地方、部门已经制定实施的有关数据管理政策和标准规范紧密衔接;
d)综合考虑风险:根据数据所在领域、覆盖群体、用途、面临威胁等不同因素,综合考虑数据遭到篡改、破坏、丢失、泄露或者非法获取、非法利用等风险,从保密性、完整性、可用性、真实性、准确性等多个角度分析判断数据的重要性;
e)定量定性结合:以定量与定性相结合的方式识别重要数据,并根据具体数据类型、特性不同采定量或定性方法;
f)动态识别复评:随着数据用途、共享方式、重要性等发生变化,动态识别重要数据,并定期复查重要数据识别结果。
具体重要数据目录示例见配套文件。
8)数据重新定级
数据安全定级完成后,出现下列情形之一时,应重新定级:
a)数据内容发生变化,导致原有数据的安全级别不再适用;
b)数据内容未发生变化,但数据时效性、数据规模、数据应用场景、数据加工处理方式等发生变化;
c)多个原始数据直接合并,导致原有的安全级别不再适用合并后的数据;
d)因对不同数据选取部分数据进行合并形成的新数据,导致原有数据的安全级别不再适用合并后的数据;
e)不同数据类型经汇聚融合形成新的数据类别,导致原有的数据级别不再适用于汇聚融合后的数据;
f)因国家或行业主管部门要求,导致原定的数据级别不再适用;
g)需要对数据安全级别进行变更的其他情形。

表2 数据安全级别变化示例表

9)常见数据定级参考因素
领域:是指数据描述的业务范畴,数据领域识别可考虑数据描述的行业领域、业务条线、生产经营活动、上下游环节、内容主题等因素。
群体:是指数据描述的主体或对象集合,数据群体识别可考虑数据描述的特定人群、特定组织、网络和信息系统、资源物资、设备设施等因素。
区域:是指数据涉及的地区范围,数据区域识别可考虑数据描述的行政区划、特定地区、物理场所等。
精度:是指数据的精确或准确程度,数据精度越高表示采集数据和真实数据的误差越小。数据精度识别可考虑数值精度、空间精度、时间精度等因素。
规模:是指数据规模及数据描述的对象范围或能力大小,数据规模识别可考虑数据存储量、群体规模、区域规模、领域规模、生产加工能力等因素。
深度:是指通过数据统计、关联、挖掘或融合等加工处理,对数据描述对象的隐含信息或多维度细节信息的刻画程度。数据深度识别可考虑数据在刻画描述对象的经济运行、发展态势、行踪轨迹、活动记录、对象关系、历史背景、产业供应链等方面的情况。
覆盖度:是指数据对领域、群体、区域、时段等的覆盖分布或疏密程度。数据覆盖度识别可考虑对特定领域、特定群体、特定区域、时间段的覆盖占比、覆盖分布等因素。
重要性:是指数据在经济社会发展中的重要程度。重要性识别可考虑数据在经济建设、社会建设、政治建设、文化建设、生态文明建设等的重要程度。
安全风险:主要识别数据可能遭到泄露、篡改、破坏、非法获取、非法利用、非法共享的风险。
5、数据分类分级流程
数据分类分级流程见图1。

图1 数据分类分级流程

6、数据分级安全保护要求

数据安全保护应依据本导则,根据数据级别采取相应的管理措施和技术手段对数据采集、汇聚、传输、存储、加工、共享、开放、使用等环节进行有针对性的保护,个人信息、敏感数据和重要数据要加强安全管控措施,核心数据应采取更加严格的管控措施。

 
数据安全保护要求分为通用要求、技术要求和管理要求三部分。
通用要求从系统安全、身份认证、授权访问、访问控制、数据标识、安全审计、监测溯源七方面对不同级别的数据规定了概括性、整体性的数据安全保护要求。
技术要求针对数据的全生命周期对不同级别的数据规定了数据处理活动的安全保护技术要求。
管理要求从安全策略、安全机构、安全人员、安全审核、分级管理、检查和考核、安全评估、应急处置、安全监管九方面规定了数据安全相关的组织机构、人员以及活动的安全保护管理要求。
 

杨浦区大数据中心试点优秀案例——《数据分类分级自动化工具—敏感数据发现使用手册》

一、引言

为加快建立健全数据分类分级保护制度及重要数据目录管理机制,促进数据共享应用,2022年7月至12月,市委网信办会同市政府办公厅成立试点工作组,组织开展了数据分类分级、制定重要数据目录试点工作,遴选出一批试点优秀单位和试点优秀案例。

今天分享杨浦区大数据中心试点优秀案例——《数据分类分级自动化工具—敏感数据发现使用手册》。

二、案例概述

本案例根据数据生存周期的各阶段特性,在数据采集、存储阶段进行数据扫描、分析、清洗、标注标识等治理步骤,治理后的数据建立数据分类目录,使用混合分类法创建数据发现规则,分类分级分析对象强化至元数据或数据内容特征级,对初期结果采用人工辅助修正和规则校对。本案例模式可提升分类分级自动化标识的合理性与准确性,大幅降低人工分类处理耗时,并在逻辑执行环节降低错误分类打标的发生率,提升目标数据的识别精度。

三、案例展示
数据分类分级自动化工具—敏感数据发现使用手册
(节选)

1、数据发现

1)发现模板管理

发现模板管理包括工具内置的发现模板和自定义发现模板,本次我单位为匹配实际业务场景新增使用了自定义和内置相结合的发现模板。

2)发现任务管理

汇总已创建的数据发现任务,形成对应任务列表进行统一管理,并可以对任务增删改查。

a)新增任务

新增数据发现任务包括三个功能:设置任务基本信息、选择数据资产和配置任务。

(1)基本信息设置

可通过对任务名称、生效模板、抽样方式等的选项设置基础任务信息。为了提高效率,采用抽样扫描方式而非全量扫描的方式。

(2)选择资产

选择已更新资产作为任务执行范围,支持多选数据资产,可选粒度精确到数据库/schema级别。

(3)执行模式

任务可选手动执行、定时执行、周期执行三种模式。

b)任务维护

对任务进行包括开始、中止、暂停、查看、编辑、删除在内的操作,同时可对选中任务进行批量执行的操作。

3)任务结果查看

从任务信息总览、库表信息、字段信息、统计信息、任务日志等维度的任务结果查看功能,发现任务与不同打标粒度的分类分级任务展示内容有所差异。

a)库表信息

从库表视图对发现任务结果进行展示,包括所属库/资产,分类分级情况,表中敏感字段数统计,表内字段详情查看等。

b)字段详情

从字段的基本信息和匹配结果信息等维度对字段详情进行展示,支持各维度的筛选和匹配结果的修改调整(包括敏感类型和分类标签的修改)。

c)统计信息

统计发现任务结果中各数据特征涉及到字段数量和位置数量。

d)任务日志

以日志形式展示数据扫描发现的进程。

4)任务筛选查询

通过关键字对列表中的任务名称进行搜索,也可通过任务类型、执行模式、任务状态、更新时间等维度对进行筛选查看。

2、分类分级

1)分类分级模板

分类分级模板包括内置和自定义两种定义方式,本次使用的工具支持多个分类分级模板;可设置其中某个分类模板为默认模板,创建分类分级任务系统将自动使用默认模板。

杨浦区大数据中心数据安全运营人员结合本单位实际业务场景,整合制定了适用于本单位的数据分类分级规则模板,以便用于长期运营的自动化分类分级和打标任务。

a)新建/编辑分类分级模板

新建/编辑分类分级模板包括分级设置、重要性设置、分类规则设置和类型映射设置4个步骤。

(1)分级设置

杨浦区大数据中心这里创建了5个级别的分级,工具可自定义分级的名称,最多为5个级别。

(2)重要性设置

创建分类分级模板第二步,首先通过分类分级模板导入分类分级规范;按模板指导规范维护分类分级规范,上传文件后导入;导入成功后,通过层级结构展示分类分级树结构。

点击某个数据分类类型,可设置该类型的重要性。如果不设置,则默认重要性为中。

(3)分类规则设置

创建分类分级模板第三步,通过设置某个分类标签的辅助规则,来应对由于业务系统等保等级变化导致分类分级和是否重要数据发生改变。

当数据资产所在的业务系统等保等级发生变化时,可通过辅助规则来展示不同的数据等级和是否重要数据。

(4)类型映射设置

创建分类分级模板第四步,通过设置映射关系将分类模板中的数据类型和识别规则关联;在系统识别数据资产时自动完成分类打标操作。

通过设置类型命中率来设置识别规则的要求,只有当命中率达到要求时,才认为是对该数据类型识别成功。

b)删除分类分级模板

如果分类分级模板不是默认模板,则可执行删除操作。

2)数据特征

数据特征包括内置和自定义两种定义方式,可以通过增删改对数据特征进行维护和管理,同时可以按数据特征名称和定义方式对数据特征进行检索。

a)新增/编辑数据特征

可以通过设置字段名称、字段注释、数据类型、数据内容、数据长度的匹配规则来定义数据特征,也可以通过引用已有规则来定义数据特征。

可以定义多个规则形成一组规则,并对组内多个规则的关系进行设置。可以通过检验值功能来验证规则设置是否生效。

b)删除数据特征

支持批量删除数据特征操作,执行删除操作前,系统弹确认提示框,用户确认后才会进行删除操作。

c)查看数据特征

添加完数据特征后用户可对设置信息进行查看,但不支持编辑数据特征的设置结果。

3)数据字典

a)添加/编辑关键字字典

添加关键字字典包括字典名称、字典类型和字典描述等字段。编辑包括对关键字字典的增删改查操作。

b)检索关键字字典

支持关键字模糊查询字典名称。

c)批量删除关键字字典

支持一次删除多个关键字操作,在执行删除操作前系统弹确认提示框。

3、工作台

1)数据分类分级

首页的数据分类分级概览展示了数据资产整体的分类分级打标情况,包括是否分类分级和分类分级执行的时间分布情况。

以杨浦区大数据资源平台为例,数据分类分级概览还展示了分类分级任务的执行情况,包括分类分级任务的数据统计信息和分类分级任务的进展情况。

a)创建任务

创建分类分级任务流程第一步,设置任务的基本信息;包括任务名称、参考规范、执行周期、资产类型(默认为数据库资产类型)、任务内容、负责人等。

创建分类分级任务流程第二步,规划执行分类分级打标操作的数据资产。操作员可从已进行任务的全部数据资产选择多个资产进行分类分级打标操作。

创建分类分级任务流程第三步,选择执行方案,即本次任务的分类分级模板。

保存创建的分类分级任务,返回工作台更新我的分类分级任务列表。

b)手动打标

在工作台我的分类任务操作栏点击进入按钮,进入手动打标的标准视图。可通过手动操作对分类分级任务所规划的数据资产进行逐表打标操作。

c)智能打标

可以在手动打标开始前,通过系统智能打标对数据资产进行一轮“预打标”,减少部分人工的工作量。智能打标操作在手动打标开始之后仍可以执行。

4、数据资产

1)手动添加/编辑单条数据资产

通过选择资产类别,逐一完善资产基本信息和分组信息的形式完成单条数据资产的添加。

a)批量导入数据资产

下载excel格式的模板文件,按照模板填写数据资产信息,并上传导入,即可添加完成数据资产。

通过资产导入模板执行批量导入操作,模板包括资产类型、名称、IP地址、端口号、实例名/库名、用户名、schema/文件路径等信息。

b)资产管理

(1)查看资产详情

对更新完成的资产提供详情查看功能,展示内容包括资产基本信息、数据库表信息、用户信息。

(2)连通性测试、更新及删除

依据已提供的基础信息进行连通性测试,验证数据库必要信息的准确性;对列表中资产进行手动更新操作;对列表中单个资产进行删除。

(3)批量操作

通过批量操作按钮,对列表中已选中的资产进行批量更新、批量删除、批量导出的工作。

(4)快速筛选

资产列表提供通过系统/部门/区域分组情况、资产类型分布情况对数据资产进行快速筛选查看,也可以通过资产名称和资产状态对数据资产进行快速搜索。

2)文件资产

展示全部文件资产信息,按文件资产名称关键字模糊查询。

a)资产添加

添加文件数据资产,可添加的类型如下:

HDFS、FTP、SFTP、SMB、CIFS

b)手动添加/编辑单条数据资产

用户于资产列表页,通过选择资产类别,逐一完善资产基本信息和分组信息的形式完成单条数据资产的添加。

c)资产管理

(1)查看资产详情

对更新完成的资产提供详情查看功能,展示内容包括资产基本信息、数据库表信息、用户信息。

(2)资产更新及删除

对列表中资产进行手动更新操作,也可以进行删除。

(3)批量操作

通过批量操作按钮,对列表中已选中的资产进行批量更新、批量删除、批量导出等操作。

(4)快速筛选

资产列表提供通过系统/部门/区域分组情况、资产类型分布情况对数据资产进行快速筛选查看,也可以通过资产名称和资产状态对数据资产进行快速搜索。

3)自动扫描

基于IP段、端口进行数据库扫描,能够准确识别出运行的数据库类型、IP地址和端口号等信息,且可以设定定时、周期扫描任务。可对发现出来的数据库进行认领、忽略,对认领的数据库可配置连接信息。

a)自动扫描任务

初始状态下可通过右上角“添加扫描任务”按钮新增扫描任务,可选择多种执行模式,设置多个扫描IP段。

b)扫描任务维护

具备扫描任务的开始、停止、查看、编辑、删除操作。

c)扫描任务结果查看

具备任务基本信息、数据资产认领情况等信息的展示。

d)认领数据资产

新发现的数据资产可被确认添加,点击“添加”,填写数据库连接信息,确认后即可添加至资产目录列表,同时具备对已选中的多条资产进行批量认领操作。

4)资产清单

列表展示全部资产信息,可以通过关键字模糊查询,也可以按数据库类型、资产归属部门和业务系统进行筛选。支持导出资产信息Excel文档。

5、任务中心

任务中心包括分类分级任务和智能打标任务两种任务类型;分类分级任务是指手动打标,在执行手动打标分类分级任务之前(或过程中)执行了智能打标,会自动生成对应的一个智能打标任务。

1)分类分级任务

在工作台创建的分类分级任务在任务中心/分类分级任务下进行管理,包括终止、编辑、删除和生成报告等操作。

在任务中心/分类分级任务也可以新建分类分级任务。

a)编辑分类分级任务

分类分级任务未开始或执行完成,支持编辑操作。编辑分类分级任务可修任务基本信息、任务管理资产,但无法变更任务使用的分类分级模板。

分类分级任务编辑保存之后,按保存的设置参数重新开始分类分级打标操作。

工作台/我的分类任务列表中移除,停止按钮也变为启动按钮。再次启动分类分级任务后,任务记录再次出现在工作台/我的分类分级任务列表中。

b)生成报告

分类分级任务支持手动生成报告功能,当任务完成后,可手动生成分类分级报告,并在报告中心自动生成报告记录。

c)筛选任务

分类分级任务支持按任务名称关键字模糊检索;支持按任务状态、任务更新时间筛选。

2)智能打标任务

分类分级任务可通过系统自动执行分类分级打标,同时在任务中心自动生成相应的智能打标任务。

a)开始智能打标任务

点击开始后,智能打标任务下发给数据处理器,开始执行智能打标任务;可暂停已经开始的智能打标任务;暂停后可从暂停位置恢复智能打标任务执行。

b)智能打标高级设置

智能打标任务支持高级设置,智能打标任务未开始执行或已执行完成后,可以点击高级设置对智能打标任务的扫描方式以及抽样范围进行设置。

c)查找智能打标任务结果

查看智能打标任务结果包括查看库表信息、字段信息、统计信息和任务日志,还包括智能打标任务的总览信息,包括任务开始/结束时间和表/视图数量等信息。

 
 
 
 
 
 

免责声明:本号所载内容均为原创、投稿、授权转载或网络公开资料搜集整理,仅供读者交流学习使用,版权归原作者所有,且仅代表作者个人观点,与本号立场无关。若所引用的图片、数据、文字等来源标注有误或涉及侵权,烦请及时联系删除。

欢迎扫码关注

 

 

 

首页    政策法规    其他省市政策    上海公布2项数据分类分级、制定重要数据目录试点优秀案例
创建时间:2023-05-14 09:05
浏览量:0