【原】这个“2-3”的数据分类分级方法也许对你很有价值

数据治理精英馆 2021-12-24

展开全文

当前，数据成为企业的生产要素参与分配，数据价值越发显得重要。企业作为参与数字经济活动的主体，更应重视数据价值的体现，如何让数据在企业中按照不同类别可见、可管、可用成为当前众多企业关注的焦点。本文介绍“两个前提、三个阶段”的数据分类分级方法供不同企业参考，使数据分类分级更科学合理，达到摸清企业数据资产、管好企业数据资产、用好企业数据资产的目的。

两个前提是：

（1）全面梳理本企业业务条线；

（2）收集、整理全部数据资产。

三个阶段是：

第一阶段：业务细分；

第二阶段：数据归类；

第三阶段：级别判定。

一、数据分类分级方法概述

1、分类分级的依据

数据分类是按照GB/T10113—2003中的线分类法为基础进行分类。

数据分级是按照GB/T22240—2008中的定级方法为基础进行分类。

在数据分类基础上，对已分类数据按照数据泄露或损坏造成的影响进行分级，形成统一的分类分级方法。

2、主要术语说明

分类分级方法中使用到的主要用语说明如下：

a)业务条线

1)泛指企业内部广义概念的业务，可能包含一系列相关业务内容和业务范围。例如某企业的“采购业务”、“销售业务”等；

2)业务条线在分类分级方法中作为“业务一级子类”。

b)业务管理

1)指业务条线下，根据管理主体、管理范围（或称管理内容）的不同，细分出的不同业务类别。例如“采购计划管理”、“采购执行管理”、“销售计划管理”等。

2)业务管理在分类分级方法中作为“业务二级子类”。

c)管理主体（ManagementSubject；MS）

指对某类具体业务的管理工作负责的组织、部门、岗位、人员等。

d)管理范围（ManagementScope；MS）

指某类具体业务涉及的，与其他业务之间有明显区别的管理内容，例如在企业内部所指的“结算操作”、“结算查询”、“结算文件发布”一般属于“财务管理”的业务范围。

e)管理对象（ManagementObject；MO）

指某类具体业务，其管理范围内涉及的数据。例如“结算管理”涉及“结算参数数据”、“结算文件”、“结算日志”等数据。

3、数据分类分级的前提

数据分类分级要做好两个前提工作：

a)全面梳理本企业业务条线

1)数据一般因业务而产生，供业务需要使用；无业务需求，也无数据的产生和消费；

2)首先需要厘清业务，才能区分业务涉及的具体数据。

b)收集、整理全部数据资产

1)数据资产包含以物理或电子形式记录的数据表、数据项、数据文件等；

2)数据资产梳理方法可根据企业架构中数据架构的方法。

4、数据分类层级

本文谈到的分类分级方法，从业务条线出发，首先对业务细分，其次对数据细分，形成从总到分的树形逻辑体系结构，最后，对分类后的数据确定级别；同时，推荐考虑确定数据形态，见下图。

5、三个基本阶段

（1）总体说明

a)第一阶段：业务细分。解决业务分类问题，同时确定数据的管理主体。数据管理主体的确定是数据分类准确性和定级准确性的基本保证。

b)第二阶段：数据归类。在明确数据管理主体和业务分类的基础上，重点解决数据分类问题。

c)第三阶段：级别判定。在数据分类基础上，进行数据定级。

数据分类后，宜同时明确数据的具体“数据形态”，即所处的系统、存储的媒介、物理位置等。

（2）业务细分阶段

a)目标

对业务条线（业务一级子类）细分后，得到一系列有较清晰界限的业务二级子类（一般可以视为“业务管理”子类）。

b)方法

依据具体业务的管理主体对应管理范围（MS-MS）对业务一级子类细分。

c)过程说明

1)根据企业实际情况，将“业务条线”（业务一级子类）细分为不同的“业务管理”（业务二级子类）；

2)除特殊情况，一般将业务条线仅细分到二级。

（3）数据归类阶段

a)目标

1)确定业务二级子类对应的“单类业务数据总和”；

2)对“单类业务数据总和”细分得到数据一级子类；

3)如有必要，对数据一级子类进行细分。

b)方法

1)依据第一阶段划分的每个业务二级子类的“管理范围”对应的“管理对象”（MS-MO），对数据进行归类，确定对应某业务的“单类业务数据总和”。这是一个过渡性成果。

2)按照数据性质、重要程度、管理需要、使用需要等要素，将“单类业务数据总和”细分为不同的数据一级子类。

3)如有必要，按照细分方法，进一步细分为数据二级子类、三级子类等。

c)过程说明

1)先确定各个业务二级子类下的全部数据（各种数据表、数据项、数据文件等），称为“单类业务数据总和”。这个过程用于确定某类业务下存在的数据。例如先确定“结算管理”业务下的各类数据表、数据项、数据文件等。

2)之后对“单类业务数据总和”按照“细分方法”细分后得到数据一级子类。通常一个“业务管理”子类下，有多个不同的数据一级子类。例如，“结算管理”下的数据一级子类可能有“账户信息”、“持仓信息”等。

3)数据一级子类可根据需要，按照细分方法再细分，得到数据二级子类。

4)数据分类层级过少，不利于定级；过多，不利于管理。一般划分到适合本企业定级需要即可，宜不超过三个层级。

（4）级别判定阶段

a)目标

对已完成分类的数据子类进行定级。

b)方法

采用基于影响的判定方法。由影响对象、影响范围、影响程度三要素进行判定。

c)过程说明

1)将已划分完，可定级的数据子类（一级、二级、三级等），按照“基于影响的判定方法”进行定级；

2)分类后的数据，均应有明确的级别。例如“结算管理”下的数据一级子类有“持仓信息”、“账户信息”。“持仓信息”如不再细分，应定级。“账户信息”如进一步细分为二级子类如“机构账户信息”、“个人账户信息”等，则一级子类、二级子类均应定级。

二、如何进行数据分类

1、数据分类原则

a)系统性原则：数据分类宜基于对机构所有数据的考量，建立一个层层划分、层层隶属的、从总到分的分类体系，每一次划分应有单一、明确的依据。数据类目的排列宜依据数据类目主题之间的内在联系，遵循概念逻辑，遵循最大效用原则，将全部类目系统地组织起来，形成具有隶属和并列关系的分类体系，以揭示出机构数据不同类别之间的联系和区别。

b)规范性原则：所使用的词语或短语能确切表达数据类目的实际内容范围，内涵、外延清楚；在表达相同的概念时，保证用语一致性；在不影响数据类目涵义表达的情况下，保证用语简洁性。在证券期货行业已有统一数据用语的情况下，使用统一数据用语。

c)稳定性原则：宜选择分类对象的最稳定的本质特性作为数据分类的基础和依据。

d)明确性原则：同一层级的数据类目间宜界限分明。当数据类目名称不能明确各自界限时，可以用注释来加以明确。

e)扩展性原则：在数据类目的设置或层级的划分上，宜保留适当余地，利于分类数据增加时的扩展。

2、数据分类方法

（1）第一阶段：业务细分阶段

本阶段，将业务条线作为业务一级子类进行细分，确定业务二级子类(业务管理)，并对其命名。

1）业务细分的原因

a)业务条线一般是逻辑划分，范围广，业务内容涵盖多，无法直接与具体数据对应；

b)业务条线下存在不同管理主体，各自管理的范围、内容不同，对应的数据也有区别；

c)明确不同业务的管理主体，才能确定数据管理的基本责任主体。

2）业务细分步骤

a)步骤一：确定业务一级子类——基本业务条线

1)以企业价值链模型确定的业务条线作为基础；

2)一般划分为销售、采购、生产、安全等。

b)步骤二：确定每个业务条线下所有的业务管理主体(MS)

1)管理主体一般是特定的管理组织、部门、岗位、人员；

2)管理主体需对管理的业务范围负责；

3)管理主体应可决定业务管理范围内涉及的数据的权限；

4)管理主体的确定宜适当，范围过小可能导致对应业务划分颗粒度过细；范围过大可能导致对应业务划分颗粒度过粗，无法区分不同业务。

c)步骤三：确定每个业务管理主体对应的管理范围，明确对应关系(MS-MS)

1)管理范围一般指由业务特点决定的管理内容；

2)业务管理范围之间应相互独立；

3)每个管理主体及其对应的管理范围，形成一一映射关系；

4)一般情况下，一组映射关系即是一个业务二级子类；

5)多个管理主体对应的管理范围相同，应视为一个业务二级子类；

6)一个管理主体对应的不同管理范围，应视为多个映射，即多个业务二级子类。

d)步骤四：命名映射关系——业务二级子类

即对步骤三完成后确定的各类业务“管理主体-管理范围”映射关系进行命名，得到业务二级子类的命名。

3）细分说明

业务细分，一般仅在业务一级子类基础上按照“MS-MS”方法划分一次。过度划分可能导致第二阶段划分后层级过多，不利于管理。如需细分，要在业务二级子类基础上进一步细分，以确保层级体系唯一性。

业务一级子类的两个细分举例如下：

a)业务一级子类——“交易”：细分后，得到业务二级子类包含“交易管理”、“结算管理”、“机构管理”等。

b)业务一级子类——“其他”：细分后，得到业务二级子类包含“技术管理”、“综合管理”等。

（2）第二阶段：数据归类阶段

在第一阶段对业务细分基础上，找到数据与业务二级子类之间对应关系，经归类后，确定数据一级子类。

1）数据归类的原因

a)数据（数据表、数据项、数据文件等）是已存在的或已设计准备使用的；

b)数据（数据表、数据项、数据文件等）是具体业务的“管理对象”；

c)数据表或数据项内容多而庞杂，无法直接定级，且定级的意义不大。

2）数据归类步骤

a)步骤一：明确各个业务二级子类的管理范围（MS）

第一阶段已完成此项工作。

b)步骤二：确定业务二级子类的管理范围对应的管理对象（MS-MO）,即找到业务二级子类下的全部数据。

1)管理对象指特定业务管理范围内对应的数据，由一系列数据表、数据项或数据文件等组成；

2)本步骤即针对每个业务子类，找到其对应的一系列数据总和。这些“数据总和”是全部数据的一个个子集；

3)部分数据表、数据项和数据文件可能出现在多个“数据总和”中；

4)本步骤的结果：得到每个业务子类对应的数据总和，称为“单类业务数据总和”。

c)步骤三：按照数据细分方法对各个“单类业务数据总和”分别细分，得到数据一级子类,见下图。细分规则如下：

1)按照数据性质、重要程度、管理需要、使用需要进行细分；

2)按照数据性质细分，一般指划分后的子类之间，数据性质之间有所差异；

3)按照重要程度细分，一般指划分后的子类之间，重要程度之间有所差异；

4)按照管理需要细分，一般指因不同的管理目的划分不同子类；

5)按照使用需要细分，一般指划分后的子类之间，使用范围之间有所差异。

d)步骤四：命名数据一级子类

对步骤三完成后确定的数据一级子类命名。

3）数据归类说明

在数据归类过程中，需注意以下内容：

a)每个业务二级子类具有一组数据（数据表、数据项、数据文件等）总和；

b)全部数据可以多个不同组合方式分别隶属于不同的业务二级子类；

c)如有数据无法确定对应业务二级子类，说明业务二级子类划分不完全，需对第一阶段工作进行检验；

d)如有业务二级子类下不存在数据，说明可能存在冗余的业务二级子类或数据资产未厘清；

e)根据实际业务需要、管理需要，按照数据细分方法可以对数据一级子类进一步细分。细分层级宜不超过三级。

4）数据一级子类的细分

对已划分明确的数据一级子类进一步细分，细分后产生一个或者多个数据子集，见下图。参照以下规则进行细分：

a)按照数据性质划分：对某数据一级分类进一步细分，细分后的数据二级子类之间数据性质有所区别。

b)按照重要程度划分：对某数据一级分类进一步细分，细分后的数据二级子类之间重要程度有所区别。细分后的数据级别一般会不同。

c)按照管理需要划分：对某数据一级分类进一步细分，细分后的数据二级子类之间需要进行有区别的管理。

d)按照使用需要划分：对某数据一级分类进一步细分，细分后的数据二级子类之间使用范围/目的不同。

三、如何进行数据分级

1、数据分级原则

数据分级宜遵循以下原则：

a)依从性原则：数据级别划分应满足相关法律、法规及监管要求。

b)可执行性原则：宜避免对数据进行过于复杂的分级规划，保证数据分级使用和执行的可行性。

c)时效性原则：数据的分级具有一定的有效期。数据的级别可能因时间变化按照一些预定的安全策略发生改变。

d)自主性原则：企业可根据自身的数据管理需要，例如战略需要、业务需要、对风险的接受程度等，按照数据分类原则进行分类之后，按照数据分级方法自主确定更多的数据层级，并为数据定级，但不宜将高敏感度数据定为低敏感度级别。

e)合理性原则：数据级别宜具有合理性，不能将所有数据集中划分一两个级别中，而另外一些没有数据。级别划定过低可能导致数据不能得到有效保护；级别划定过高可能导致不必要的业务开支。

f)客观性原则：数据的分级规则是客观并可以被校验的，即通过数据自身的属性和分级规则就可以判定其分级，已经分级的数据是可以复核和检查的。

2、数据分级要点

a)对数据泄露或损坏影响宜基于数据完全泄露或损坏来考虑，而不宜基于已有任何技术的防护措施来考虑。

b)网络完全法已明确要对个人信息保护，要高度重视投资者或业务相关的个人信息保护，在数据分级中从高考虑。

c)一般而言，数据体量大，涉及的客户（包含机构或个人投资者）多、涉及客户（包含机构或个人投资者）的资金量大的情况，影响程度宜考虑从高确定。

d)安全属性（完整性、保密性、可用性）是信息安全风险评估中的重要参考属性，针对数据分级，数据安全属性遭到破坏后可能造成的影响，是确定数据级别的重要判断依据，推荐采用。

3、数据分级方法

（1）数据定级要素

1）数据定级的影响三要素

a)影响对象，划分为：行业、企业、客户。

b)影响范围，划分为：多个行业、行业内多机构、本机构。

c)影响程度，一般指数据安全属性（完整性、保密性、可用性）遭到破坏后带来的影响大小。划分为：严重、中等、轻微、无。

2）于影响对象的说明

关于影响对象的说明如下：

a)影响对象为行业的情形：一般指数据的安全属性（完整性、保密性、可用性）遭到破坏后，可能对本行业及其他行业中一个或多个行业的经济活动秩序、生产经营秩序等造成影响。

b)影响对象为机构的情形：一般指数据的安全属性（完整性、保密性、可用性）遭到破坏后，可能对证券期货行业内一家或多家机构的经济活动秩序、生产经营秩序等造成影响。

c)影响对象为客户的情形：一般指数据的安全属性（完整性、保密性、可用性）遭到破坏后，可能对公民、法人、组织的社会权益、经济利益等造成影响。

3）关于影响程度的说明

影响程度，是一个定性的说明方式。在事件没有实际发生并产生影响的情况下，无法以具体量化指标或者参数来衡量。即便在实践中，由各类事件、事故引发的直接和间接后果也难以简单衡量或者量化。

影响程度的判定，宜综合考虑数据类型特征。数据类型根据业务条线划分并确定，不同业务对应不同的数据类型，体现不同的业务特点，因此，结合数据类型分析，有利于更加准确地判断影响程度。例如：交易类业务数据安全属性遭到破坏产生的影响程度通常要高于信息披露类数据；涉及个人信息的数据安全属性（保密性）遭到破坏产生的影响程度通常要高于已公开披露信息；交易、结算类型的数据安全属性遭到破坏产生的影响程度通常要高于非实时的行情信息类数据等。为便于确定“影响程度”，下表中提供影响程度的参考说明，供判定影响程度时参考。