跳转到主要内容
Chinese, Simplified

category

数据字典与业务术语表

数据字典记录描述数据集内容的元数据,它本质上是技术性的,而业务术语表是一个公共知识库,有助于定义业务概念。数据字典和业务词汇表都有助于为数据添加上下文和含义,但它们的用途不同。

在进入它们的用例之前,让我们快速了解它们通常是如何定义的。

什么是数据字典?

数据字典描述数据集的内容——可以将其视为数据的README文件——本质上是技术性的。它描述了数据库、电子表格等中的每个表和字段,并可以包括一些更高级的元数据,例如数据类型。技术团队负责创建和维护数据字典。

什么是业务术语表?

业务术语表包含组织内各个团队使用的关键业务术语的定义。可以将其视为一个定义业务概念或术语的集中式知识库。业务团队负责创建和维护组织的业务词汇表。

深入了解这些概念,我们为您介绍了以下信息。

目录

  • 数据字典与业务术语表
  • 数据字典与业务词汇表:应用程序差异
  • 数据字典示例
  • 业务术语表示例
  • 数据目录与数据字典
  • 不同类型的数据字典和业务词汇表
  • 数据字典与业务术语表:入门资源

数据字典与业务词汇表:应用程序差异

如前所述,数据字典本质上是技术性的,而词汇表则促进了企业范围内数据理解和使用的一致性。

例如,太平洋西北部森林清单和分析数据库提供了关于每个表的内容及其相互关系的信息。因此,研究人员可以连接表并运行查询来查找他们需要的信息。

然而,字典没有提供每个表元素的上下文,因此很难回答以下问题:

  • 森林究竟是如何定义的?
  • 幼苗的定义是什么?
  • 什么是情节,还是次要情节?

如果没有这些答案,两名使用森林调查的研究人员可能会以稍微不同的方式理解其中一些术语,从而导致他们对数据的解释不同。

这就是业务术语表的用武之地。它将以清晰、明确的方式定义所有这些术语,以便整个组织的用户以类似的方式理解和解释数据。

数据字典示例

数据字典作为使用数据集的参考指南。让我们看看太平洋西北部森林清查和分析数据库的字典。它包含以下信息:

  • 每个数据表的摘要
  • 每个字段的名称
  • 字段内容的较长形式描述
  • 数据类型(整数、文本和实数)
  • 表之间的关系

当一个字段是分类的时,字典会为每个类别提供描述。例如,在下面所示的POP_ESTN_UNIT(即人口估计单位)表中,STATED(即州代码)值为2表示阿拉斯加,而州代码6表示加利福尼亚。

An example and contents of a data dictionary

 

https://www.fs.fed.us/pnw/rma/fia-topics/documentation/documents/PNW_FI…A data dictionary is a documentation for all the data assets in a database

如果研究人员想使用森林清单,他们会在这个数据字典中找到解释数据库所需的一切。因此,他们可以通过引用相关的表和字段来理解所访问数据的实际值。

了解更多信息→ 数据字典:定义、示例、目的以及为什么需要?

业务术语表示例

业务术语表将不同业务部门的术语标准化。以下是波士顿大学人力资本管理报告中使用的商业术语表示例。每个术语都有丰富的上下文,例如:

  • 更具描述性的名称
  • 术语类型(特征、变量、关键数字)
  • 术语描述
  • 可能的别名

在某些情况下,术语表还包括用于定义术语的特定业务规则。

Example snippet of a business glossary for Human Capital Management terms at Boston University. Each row contains a business term, its type, and a definition.

数据目录与数据字典

人们经常发现自己在思考数据目录和数据字典的用例差异。让我们试着在这里解决这个问题。

数据目录是一种工具,可帮助对企业中多个数据源的数据资产进行索引、盘点和分类。它添加了一个急需的上下文层,重点关注发现、搜索、元数据管理、沿袭、协作和治理。

最好的数据目录工具可以为数据库创建和维护数据字典。他们甚至更进一步,使用字典中的元数据来支持数据发现、信任、使用和治理的用例。

进一步了解数据目录和数据字典之间的区别。

https://youtu.be/J0hx3oguHSA

不同类型的数据字典和业务词汇表

数据字典可以是:

  • 逻辑的
  • 物理的

1.逻辑

从业务使用的角度来看,逻辑数据字典的重点是数据的含义和数据中的关系。逻辑字典与平台无关——即使数据集被移动到不同的数据平台,逻辑数据字典仍然有效。

2.物理

物理数据字典描述特定的表和字段,并与特定于存储平台的命名约定保持一致。它们可以包括诸如字段长度和数据类型之类的低级细节。由于这些字典与存储数据的技术细节有关,因此它们不是平台无关的。因此,如果将数据集移动到不同的数据平台,则物理数据字典将不再适用。

业务术语表可以定义以下方面:

  • 商业术语
  • 度量
  • 项目
  • 技术数据资产

1.商业术语

业务术语表通过让每个人都站在同一个页面上,有助于解决团队协作问题。它可以包括年度报表、评估等术语的定义和使用规则。

A business glossary is a collection of unique business terms and definitions that helps understand the data assets' key characteristics

2.指标

度量术语表将包含ARR、MAU、MTR、NPS等业务度量。该术语表定义了每个度量并解释了如何计算。这确保了度量标准化,并且整个组织的团队领导都遵循相同的方法来计算度量标准。

3.项目

项目术语表是特定于项目的业务术语表。它包含了该项目的相关术语,并将随着项目的发展而增长。特定于项目的词汇表对于项目的新团队成员的入职非常有用。它还有助于保持项目移交的无缝性。

例如,当一个项目准备发货时,项目所有者可能会让营销和销售团队参与进来。项目词汇表将帮助他们准确地向潜在客户描述您的项目,而不会出现沟通错误或混乱。

4.技术数据资产

技术术语表结合了业务术语表和数据字典。这些词汇表从业务角度描述了技术数据资产的内容,如policy_expiration_date、policy_id等。因此,数据团队可以选择正确的数据集来回答业务问题、构建仪表板、快速洞察等等。

数据字典和业务词汇表:入门参考资料

原文地址
https://atlan.com/data-dictionary-vs-business-glossary/
本文地址
Article

微信

知识星球

微信公众号

视频号