跳转到主要内容
Chinese, Simplified

在信息技术中,数据架构由模型、策略、规则或标准组成,这些模型、策略、规则或标准控制着收集哪些数据,以及如何在数据系统和组织中存储、排列、集成和使用这些数据。[1]数据通常是构成企业体系结构或解决方案支柱的几个体系结构域之一架构。[2]

 

概述

数据架构应该[中立性是有争议的]为其所有数据系统设置数据标准,作为这些数据系统之间最终交互的远景或模型。例如,数据集成应该依赖于数据体系结构标准,因为数据集成需要两个或多个数据系统之间的数据交互。数据体系结构在某种程度上描述了企业及其计算机应用软件所使用的数据结构。数据架构处理存储中的数据、使用中的数据和运动中的数据;描述数据存储、数据组和数据项;以及将这些数据构件映射到数据质量、应用程序、位置等。

对于实现目标状态来说,数据架构描述了数据在信息系统中是如何处理、存储和利用的。它为数据处理操作提供了标准,使得设计数据流和控制系统中的数据流成为可能。

数据架构师通常负责定义目标状态,在开发过程中进行调整,然后跟进以确保按照原始蓝图的精神进行增强。

在定义目标状态期间,数据架构将主题分解到原子级别,然后将其构建回所需的形式。数据架构师通过3个传统的架构过程来分解主题:

  • 概念-表示所有业务实体。
  • 逻辑-表示实体如何关联的逻辑。
  • 物理-实现特定类型功能的数据机制。

Zachman企业架构框架的“数据”列-

Layer View Data (What) Stakeholder
1 Scope/Contextual List of things and architectural standards[3] important to the business Planner
2 Business Model/Conceptual Semantic model or Conceptual/Enterprise Data Model Owner
3 System Model/Logical Enterprise/Logical Data Model Designer
4 Technology Model/Physical Physical Data Model Builder
5 Detailed Representations Actual databases Subcontractor

在第二个更广泛的意义上,数据架构包括对组织功能、可用技术和数据类型之间关系的完整分析。

在设计新的数据处理和存储系统的规划阶段,应定义数据架构。应以完整、一致和可理解的方式确定支持企业所需的主要数据类型和来源。这个阶段的主要要求是定义所有相关的数据实体,而不是指定计算机硬件项。数据实体是组织或个人希望存储数据的任何真实或抽象的事物。

物理数据架构

信息系统的物理数据架构是技术计划的一部分。顾名思义,技术计划的重点是在实现数据架构设计时使用的实际有形元素。物理数据架构包括数据库架构。数据库架构是实际数据库技术的一种模式,它将支持所设计的数据架构。

数据架构要素

某些元素必须在数据架构模式的设计阶段定义。例如,必须描述为管理数据资源而建立的管理结构。此外,还必须定义用于存储数据的方法。此外,还必须生成对要使用的数据库技术的描述,以及对将操作数据的进程的描述。设计其他系统与数据的接口,以及支持通用数据操作(即紧急程序、数据导入、数据备份、数据外部传输)的基础设施的设计也很重要。

如果没有正确实现的数据架构设计的指导,公共数据操作可能以不同的方式实现,因此很难理解和控制此类系统中的数据流。由于潜在的成本增加以及相关的数据断开,这种碎片化非常不受欢迎。快速发展的企业以及为不同业务(如保险产品)提供服务的企业可能会遇到这些困难。

正确地执行,信息系统规划的数据架构阶段迫使组织精确地指定和描述内部和外部信息流。这些是组织以前可能没有花时间来概念化的模式。因此,在这一阶段,有可能发现成本高昂的信息短缺、部门之间的断开连接以及组织系统之间的断开连接,这些在数据架构分析之前可能并不明显。[4]

制约和影响

各种约束和影响将对数据体系结构设计产生影响。其中包括企业需求、技术驱动因素、经济、商业政策和数据处理需求。

企业要求

这些因素通常包括经济有效的系统扩展、可接受的性能水平(特别是系统访问速度)、事务可靠性和透明的数据管理。此外,通过数据仓库等功能将交易记录和图像文件等原始数据转换为更有用的信息形式也是一种常见的组织要求,因为这样可以实现管理决策和其他组织过程。体系结构技术之一是在管理事务数据和(主)引用数据之间进行分离。另一个是将数据捕获系统与数据检索系统(如在数据仓库中所做的那样)分离。

技术驱动因素

这些通常是由已完成的数据体系结构和数据库体系结构设计建议的。此外,一些技术驱动因素将来自现有的组织集成框架和标准、组织经济性和现有的站点资源(例如,以前购买的软件许可)。在许多情况下,集成多个遗留系统需要使用数据虚拟化技术。

经济

这些也是数据架构阶段必须考虑的重要因素。有些解决方案虽然原则上是最优的,但由于其成本,可能不是潜在的候选方案。外部因素,如业务周期、利率、市场条件和法律考虑,都可能对与数据体系结构相关的决策产生影响。

商业政策

驱动数据架构设计的业务策略还包括内部组织策略、监管机构规则、专业标准和适用的政府法律,这些法律可能因适用机构而异。这些策略和规则将有助于描述企业希望处理其数据的方式。

数据处理需求

其中包括大量执行的准确和可重复的交易、支持管理信息系统(和潜在数据挖掘)的数据仓库、重复定期报告、特别报告,以及根据需要支持各种组织计划(即年度预算、新产品开发)。

另见

 

原文:https://en.wikipedia.org/wiki/Data_architecture

本文:

讨论:请加入知识星球或者微信圈子【首席架构师圈】

Tags
 
Article
知识星球
 
微信公众号
 
视频号