详解数据治理相关的七个术语和名词

来源:罗小江 石秀峰 大数据DT 日期:2021-12-19

一、数据元

1. 名词解释

国标[GB/T 18391.1—2002]对数据元的定义为:“用一组属性描述定义、标识、表示和允许值的数据单元。”

数据元由三部分组成:对象、特性和表示。数据元是组成实体数据的最小单元,或称原子数据。例如个人信息中,手机号为数据元,“135********”为数据元的值;性别为数据元,“男”和“女”为数据元的值。

2. 主要作用

作为最小颗粒度的数据,数据元是对数据进行标准化定义的基础,也是构建统一、集成、稳定的行业数据模型的基础。

在企业数据治理中,数据元是需要标准化的对象,一个数据元对象有且只有一个数据特性,每个数据特性对应一个数据表示。例如:人员的性别中的“男”是一个数据元对象,用数字“1”来表示。

3. 应用举例

数据元早期在金融、医疗等领域应用非常广泛,国家相关单位发布了关于数据元管理的一系列技术标准和行业标准,如《CFDAB/T 0301.3—2014食品药品监管信息基础数据元 第3部分:药品》。图1-1所示为食品药品监管信息基础数据元标准。

▲图1-1 食品药品监管信息基础数据元标准

二、元数据

1. 名词解释

元数据是描述数据的数据或关于数据的结构化数据。

你是不是看了这个定义依然一头雾水?那我们来举个例子。一本书的封面和目录向我们展示了这样的元数据信息:图书名称、作者姓名、出版商和版权细节、图书的提纲、标题、页码等。

2. 主要作用

在数据治理中,元数据是对数据的描述,存储着数据的描述信息。我们可以通过元数据管理和检索我们想要的“书”。可见元数据是用来描述数据的数据,让数据更容易理解、查找、管理和使用。

3. 应用举例

元数据是业界公认的数据治理中的核心要素,做好元数据管理,能够更容易地对数据进行检索、定位、管理和评估。用哲学的思维理解元数据的话,元数据其实解决的是我是谁、我在哪里、我从哪里来、我要到哪里去的问题。

元数据是建设数据仓库的基础,是构建企业数据资源全景视图的基础,清晰的血缘分析、影响分析、差异分析、关联分析、指标一致性分析等是数据资产管理的重要一环。

如果说数据是物料,那么元数据就是仓库里的物料卡片;如果说数据是文件夹,那么元数据就是夹子的标签;如果说数据是书,那么元数据就是图书馆中的图书卡。

三、主数据

1. 名词解释

主数据是企业内需要在多个部门、多个信息系统之间共享的数据,如客户、供应商、组织、人员、项目、物料等。与记录业务活动、波动较大的交易数据相比,主数据(也称“基准数据”)变化较慢。主数据是企业开展业务的基础,只有得到正确维护,才能保证业务系统的参照完整性。

主数据具有3大特性、4个超越。

3大特性:高价值性、高共享性、相对稳定性。

4个超越:超越业务,超越部门,超越系统,超越技术。

2. 主要作用

在数据治理中,主数据用来解决企业异构系统之间核心数据不一致、不正确、不完整等问题。主数据是信息系统建设和大数据分析的基础,被认为是企业数字化转型的基石。

3. 应用举例

不同行业、不同领域的主数据的内容不同。例如:在制造型企业中,核心主数据有物料、BOM、设备、客户、供应商、人员等;在金融行业中,客户、客户关系是主数据管理的核心;在政府各部门,人口、法人、证照等是主要的主数据。

四、业务数据

1. 名词解释

业务数据是业务活动过程或系统自动产生的既定事实的数据,也称交易数据。业务数据来自三个方面。

第一,业务交易过程中产生的数据,例如计划单、销售单、生产单、采购单等,这类数据多数是手动生成的。

第二,系统产生的数据,包括硬件运行状况、软件运行状况、资源消耗状况、应用使用状况、接口调用状况、服务健康状况等。

第三,自动化设备所产生的数据,如各类物联网设备的运行数据、生产采集数据等。

不论源自何处,业务数据的共同特点是:时效性强,数据量大。

2. 主要作用

业务数据主要面向应用,为业务应用提供服务,例如生产、销售、采购、设备管理、系统管理等。

3. 应用举例

表1-1是某企业的产品销售记录,这是一种非常重要的业务数据。

?表1-1 某企业的产品销售记录

    A+
声明:本文转载自其它媒体,转载目的在于传递更多信息,并不代表赞同其观点和对其真实性负责。