4.23文创礼盒,买2个减5元 读书月福利
欢迎光临中图网 请 | 注册
> >
数据血缘:理论与业务实践

数据血缘:理论与业务实践

作者:Irina
出版社:电子工业出版社出版时间:2023-07-01
开本: 16开 页数: 248
中 图 价:¥77.4(6.5折) 定价  ¥119.0 登录后可看到会员价
加入购物车 收藏
运费6元,满69元免运费
?快递不能达地区使用邮政小包,运费14元起
云南、广西、海南、新疆、青海、西藏六省,部分地区快递不可达
本类五星书更多>

数据血缘:理论与业务实践 版权信息

  • ISBN:9787121459511
  • 条形码:9787121459511 ; 978-7-121-45951-1
  • 装帧:平装-胶订
  • 册数:暂无
  • 重量:暂无
  • 所属分类:>

数据血缘:理论与业务实践 本书特色

数据血缘在数据治理、数据分析、数据集成、元数据管理等工作中发挥着重要作用。然而,对许多用户来说,数据血缘仍然是一个抽象且未知的概念。数据血缘的实现过程是复杂且耗费资源的。即使实现了,它也未必能如预期一样使用。 本书专门为数据开发人员和数据管理人员打造,书中不仅提供了关于数据血缘的定义和模型,还展示了数据血缘的*佳实践案例,并讨论了数据血缘的主要应用领域。 本书适用于以下不同专业领域的人群: (1)数据管理和数据业务相关专业人员,通过本书可以在数据血缘及其应用领域方面获得启发并拓宽思路。 (2)具有技术背景的专业人员,通过本书可以更好地了解业务需求和数据血缘需求。 (3)项目管理专业人员,通过本书可以熟练掌握数据血缘的*佳实践。

数据血缘:理论与业务实践 内容简介

本书共分为四篇。前三篇分别对应数据血缘的理论、实现和应用:**篇阐明数据血缘的概念,主要介绍有关数据血缘概念的综合知识;第二篇介绍如何实现数据血缘,包括一些关于实现数据血缘的可行性见解和建议;第三篇介绍如何使用数据血缘,利用数据血缘结果实现不同的业务目的。第四篇是关于“构建数据血缘业务案例”的研究,介绍如何将数据血缘落地到业务案例中。 本书主要面向数据开发人员和数据管理人员,用于针对数据血缘及其应用领域拓宽思路。本书也适合具有技术背景的数据业务人员参考阅读,便于更好地理解业务需求和数据血缘需求。

数据血缘:理论与业务实践 目录

引言………………………………………………………… 001
**篇 阐明数据血缘的概念
第1 章 数据血缘的现有观点和方法分析… ……………………… 010
1.1 数据血缘和其他类似的概念 ……………………………………… 010
1.2 数据血缘组件 ……………………………………………………… 016
1.3 数据血缘与数据生命周期的关系 ………………………………… 018
1.4 数据血缘与数据管理能力和企业架构 …………………………… 019
1.5 DAMA-DMBOK2 关于记录数据血缘的建议 ……………………… 024
1.6 本书使用的概念 …………………………………………………… 025
第2 章 记录数据血缘的业务驱动因素… ………………………… 028
2.1 满足法规需求 ……………………………………………………… 028
2.2 业务变更 …………………………………………………………… 033
2.3 数据管理举措 ……………………………………………………… 034
2.4 透明性和审计需求 ………………………………………………… 034
第3 章 元模型的概念… …………………………………………… 036
3.1 数据和信息的概念 ………………………………………………… 036
3.2 元数据语境下的数据血缘 ………………………………………… 040
3.3 元模型的定义 ……………………………………………………… 042
第4 章 数据血缘元模型… ………………………………………… 045
4.1 数据血缘元模型的结构 …………………………………………… 046
4.2 业务层 ……………………………………………………………… 047
4.2.1 业务能力… …………………………………………………… 048
4.2.2 流程… ………………………………………………………… 049
4.2.3 角色… ………………………………………………………… 051
4.2.4 业务主题域(数据)… ………………………………………… 051
4.2.5 IT 资产(工具)… ……………………………………………… 051
4.3 与数据模型相关的挑战 …………………………………………… 053
4.4 概念层 ……………………………………………………………… 055
4.4.1 传统概念模型… ……………………………………………… 055
4.4.2 语义模型… …………………………………………………… 057
4.4.3 本书使用的概念层模型… …………………………………… 058
4.5 逻辑层 ……………………………………………………………… 059
4.5.1 传统逻辑模型… ……………………………………………… 059
4.5.2 解决方案模型… ……………………………………………… 061
4.5.3 本书使用的逻辑层模型… …………………………………… 061
4.6 物理层 ……………………………………………………………… 063
4.7 业务规则 …………………………………………………………… 064
4.8 数据血缘元模型的图形化表示 …………………………………… 066
第5 章 数据血缘类型… …………………………………………… 073
5.1 元数据血缘和数据值血缘 ………………………………………… 074
5.2 不同记录层级的数据血缘 ………………………………………… 075
5.3 横向和纵向数据血缘 ……………………………………………… 076
5.4 描述型和自动型数据血缘 ………………………………………… 076
5.5 各种数据血缘之间的相关性 ……………………………………… 077
第二篇 实现数据血缘
第6 章 使用九步方法论构建数据血缘案例… …………………… 085
第7 章 明确数据血缘工作的范围… ……………………………… 091
7.1 “企业”的范围 ……………………………………………………… 092
7.2 数据血缘的“长度” ………………………………………………… 092
7.3 数据血缘的“深度” ………………………………………………… 094
7.4 关键数据集 ………………………………………………………… 094
7.5 数据血缘组件的数量 ……………………………………………… 094
第8 章 定义数据血缘相关的角色… ……………………………… 096
8.1 影响角色设计的主要因素 ………………………………………… 096
8.1.1 数据专员类型… ……………………………………………… 098
8.1.2 业务能力维度… ……………………………………………… 100
8.1.3 数据链上的角色位置… ……………………………………… 101
8.1.4 数据管理子能力… …………………………………………… 102
8.1.5 数据架构风格… ……………………………………………… 104
8.1.6 IT 解决方案的设计方法… …………………………………… 106
8.1.7 业务域定义… ………………………………………………… 106
8.1.8 “企业”的规模… ……………………………………………… 107
8.2 记录数据血缘涉及的数据管理角色 ……………………………… 107
第9 章 定义数据血缘需求… ……………………………………… 110
9.1 需求类型 …………………………………………………………… 111
9.2 元数据血缘需求 …………………………………………………… 112
9.2.1 通用需求… …………………………………………………… 112
9.2.2 横向数据血缘需求… ………………………………………… 113
9.2.3 纵向数据血缘需求… ………………………………………… 115
9.3 数据值血缘需求 …………………………………………………… 116
第10 章 确定数据血缘实施方案…………………………………… 118
10.1 影响方案选择的因素 ……………………………………………… 119
10.2 沟通数据血缘的范围和方案 ……………………………………… 126
第11 章 选择合适的数据血缘解决方案…………………………… 129
11.1 软件解决方案相关的术语 ………………………………………… 130
11.2 记录数据血缘的软件解决方案类型 ……………………………… 131
11.3 数据血缘解决方案的主要来源 …………………………………… 133
11.4 记录数据血缘的解决方案 ………………………………………… 138
11.4.1 业务流程建模解决方案… …………………………………… 139
11.4.2 企业架构解决方案… ………………………………………… 140
11.4.3 数据建模解决方案… ………………………………………… 142
11.4.4 元数据、数据治理和数据血缘解决方案… ………………… 143
11.4.5 数据质量和知识图谱解决方案… …………………………… 147
11.4.6 数据血缘解决方案的高阶功能概述… ……………………… 147
第12 章 数据血缘的记录和构建分析……………………………… 152
12.1 描述型和自动型数据血缘记录方法的主要组件 ………………… 153
12.2 数据血缘记录的主要步骤 ………………………………………… 154
12.3 使用描述型方法记录数据血缘 …………………………………… 155
12.4 使用自动型方法记录数据血缘 …………………………………… 161
12.5 描述型和自动型数据血缘组件的集成 …………………………… 165
12.6 数据值血缘管理 …………………………………………………… 165
第13 章 数据血缘业务案例的风险因素和成功因素……………… 169
13.1 风险因素 …………………………………………………………… 169
13.2 成功因素 …………………………………………………………… 170
第三篇 使用数据血缘
第14 章 关键数据…………………………………………………… 177
14.1 关键数据的使用场景 ……………………………………………… 177
14.2 关键数据(元素)的定义 ………………………………………… 178
14.3 “关键数据”概念的应用领域 …………………………………… 180
14.4 “关键数据”概念的实施 ………………………………………… 182
第15 章 数据质量…………………………………………………… 190
15.1 设定数据质量需求 ………………………………………………… 190
15.2 设计和构建数据质量检查和控制机制 …………………………… 191
第16 章 影响分析和根因分析……………………………………… 194
第17 章 业务驱动因素建模………………………………………… 199
第18 章 建立数据管理框架………………………………………… 202
18.1 数据管理的“橙色”模型 ………………………………………… 202
18.2 建立数据管理框架与记录数据血缘 ……………………………… 204
第四篇 案例研究:构建数据血缘业务案例
步骤1:确定业务驱动因素 ……………………………………………… 211
步骤2:主要利益相关者的预算支持和参与 …………………………… 212
步骤3:数据血缘工作的范围 …………………………………………… 212
步骤4:定义角色和职责 ………………………………………………… 218
步骤5:准备数据血缘需求 ……………………………………………… 218
步骤6:选择记录数据血缘的方式和方法 ……………………………… 221
步骤7:选择合适的数据血缘解决方案 ………………………………… 222
附录…………………………………………………………………… 226
模板1 数据血缘需求 …………………………………………………… 227
模板2 数据血缘工作的范围和进展 …………………………………… 229 概述 数据血缘解决方案 ………………………………………………… 231 模板3 比较数据血缘解决方案 ………………………………………… 233
展开全部

数据血缘:理论与业务实践 相关资料

译者序 在数据量不断增长、数据生态系统复杂的时代,追踪数据从源头到目的地,及其经过的各种流程和系统的信息,对确保数据质量、合规性和决策来说至关重要。这些信息被称为数据血缘。 数据血缘既能回答“这些数据从哪里来,到哪里去”这样的哲学问题,也能回答“数据是如何进行加工转换的”这样的技术问题,帮助我们深入了解数据资产的可靠性、可信度。 数据血缘的重要性超出了传统的数据治理和合规性。它在智能数据分析、数据集成、数据质量管理和数据驱动决策方面发挥着至关重要的作用。了解数据血缘,能够使组织识别数据异常、解决问题、跟踪数据转换,并确保遵守 GDPR、CCPA 等法规。 数据血缘是企业最重要的数据资产之一,而且未来它将充当更加重要的角色。一方面,完整的数据血缘信息可以有效跟踪敏感数据的全链路生命周期,实现数据安全合规。例如:源端系统中的PII(个人身份识别信息)在数仓、大数据平台、数据湖中是否得到有效的脱敏?哪些数据服务可能泄露机密?哪些数据可能被消费者获取?另一方面,数据血缘可以进行变更影响分析,即分析数据的变更对相关业务的影响。例如:当源端业务系统的数据结构发生变化时,要及时分析其对后端数据应用的影响,以便在源业务系统升级前给出合适的应对措施,保障后端应用的连续性。这种影响就如同在制造业中,上游原材料的价格波动对下游产品成本的影响。 数据血缘是元数据管理的重要手段之一。在建设数据仓库、数据集市、商业智能及大数据系统的过程中,国内许多组织对配套元数据模块进行了多年探索,研发了许多数据血缘处理技术,试图构建一套准确、完整、实用的数据血缘图,以满足业务需要。让用户在“管理数据、使用数据”的工作中,能够了解数据的来龙去脉,做到心中有“数”。然而在实践过程中,即使经过长期的持续建设,配套元数据模块的实际效果仍会大打折扣,不尽如人意。 Irina Steenbeek博士基于多年的研究和实践经验编著的《数据血缘:理论与业务实践》(Data Lineage: from a Business Perspective)一书,填补了数据血缘领域的空白。本书在辨析数据血缘及其相关概念、类型的理论基础上,详细介绍了作者提炼总结的“构建数据血缘的九步方法论”,并通过一个实际案例展示了如何使用数据血缘,最后在附录中给出了方法论中的工作模板。在翻译本书的过程中,书中的许多观点(如数据血缘项目的“企业”范围、数据血缘的层级、横向和纵向数据血缘、描述型和自动型数据血缘等)帮助译者打消了多年来对数据血缘的疑虑和困惑。希望本书能够为国内从事数据管理工作的同仁带来同样的收益,为提高数据血缘项目的实施效果和用户满意度提供助力。 最后,感谢原著作者Irina Steenbeek博士为我们带来这本好书,并授权我们将本书翻译为中文版本。同样感谢电子工业出版社能够引进本书的中文版权,感谢张爽老师担任责任编辑,她的辛勤工作是本书能够在第一时间与各位读者见面的关键。

数据血缘:理论与业务实践 作者简介

Irina Steenbeek 博士是一位拥有超过 11 年经验的数据管理从业者。她擅长的主要领域是数据管理成熟度评估、数据管理框架的实施和数据血缘。Irina 在 ERP 和 DWH/BI、管理咨询、财务和业务控制及数据科学等软件实施方面具有丰富的实践经验。多年来,她曾服务于全球机构及不同领域的大中型组织,包括金融机构、专业服务和 IT 公司。2016年,她创立了Data Crossroads——一家数据管理培训和辅导服务企业。 Data Crossroads 专注于通过建立适合公司业务目标和资源的有效数据管理框架来帮助客户改进决策。 本书译者: 王琤,Datablau(北京数语科技有限公司)创始人兼CEO,信通院数据资产专家委员会成员,数据资产管理实践白皮书主要撰写人之一,国资委数据要素专家组成员,复旦大学、北京航空航天大学客座讲师,曾任CA ERwin全球研发负责人。 车春雷,高级工程师、信息系统分析师,在科技和数据领域有30余年工作经历,先后从事企业自动化、软件研发、网络设计、商业智能与企业级数据仓库、数据标准、数据质量、数据建模等工作,积累了丰富的数据管理经验。

商品评论(0条)
暂无评论……
书友推荐
本类畅销
编辑推荐
返回顶部
中图网
在线客服