本章节选自《数据集成蓝图和建模》一书,读者将了解到通用组件转换数据集成模型和关于开发数据集成模型的数据集成工具。读者还能得到关于组织是否需要逻辑数据集成模型和物理数据集成模型的答案。此外,在本章结尾处,你还可以测验你的数据集成建模知识。 接上文:通用组件转换数据集成模型 开发数据集成模型的工具 关于数据集成建模的首要问题之一就是:“你将用什么工具构建模型?”尽管可以采用像微软公司的Visio,甚至是微软公司的PowerPoint这类图表工具,但是我们仍然主张使用某一款商业数据集成包来设计和构建数据集成模型。
像Visio……
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号

TechTarget
官方微博

TechTarget中国
本章节选自《数据集成蓝图和建模》一书,读者将了解到通用组件转换数据集成模型和关于开发数据集成模型的数据集成工具。读者还能得到关于组织是否需要逻辑数据集成模型和物理数据集成模型的答案。此外,在本章结尾处,你还可以测验你的数据集成建模知识。
接上文:通用组件转换数据集成模型
开发数据集成模型的工具
关于数据集成建模的首要问题之一就是:“你将用什么工具构建模型?”尽管可以采用像微软公司的Visio,甚至是微软公司的PowerPoint这类图表工具,但是我们仍然主张使用某一款商业数据集成包来设计和构建数据集成模型。
像Visio这类绘制图表的工具需要手工创建和维护,才能确保它们与源代码和Excel电子表格保持同步。维护方面的代价常常会超过手工创建模型的益处。通过利用数据集成包,现存数据集成设计(比如:提取数据集成模型)可以被审查是否在其它数据模型中有重用的可能性,何时利用,对实际数据集成工作的维护也在模型更新时被执行。另外,通过使用像Ab Initio,IBM Data Stage或者Informatica这类数据集成包来创建数据集成模型,组织将能进一步利用到它所做的技术投资。
图3.16提供了用Ab Initio,IBM Data Stage和Informatica构建的高层次逻辑数据集成模型示例。
图3.16 几个数据集成模型。(点击放大)
在使用数据集成包进行数据集成建模方面的经验表明,数据集成项目和经验中心已经看到了增加提取,转换和本地代码标准化、以及质量的益处。利用数据集成包的关键益处有以下几点:
端对端通信。利用数据集成包有利于更快速地从数据集成设计人员到数据集成开发人员之间传递需求,它们利用相同通用的数据集成元数据。在相同的包中利用相同的元数据从逻辑设计到物理设计转移,加速了传递过程,减少了传输问题和错误。例如,源到目标的数据定义和映射规则不是必须在技术之间传递,因而降低了映射错误。在从逻辑数据模型向物理数据模型转换的数据建模工具中也能发现类似益处。
重点利用企业模型开发。把数据集成需求捕捉为逻辑数据集成模型和物理数据集成模型给组织提供了把这些数据集成模型整合到企业数据集成模型的机会,进一步使信息管理环境变得成熟,增加了整体可复用度。它还提供了重用源提取,目标数据加载和在数据集成软件包元数据引擎中的通用转换的能力。这些物理数据集成任务被保存在相同的元数据引擎中,彼此可以相互链接。他们还可以被链接到其它现存的元数据对象,比如逻辑数据模型和业务功能。
在流程中更早地捕获导航元数据。通过在数据集成软件包中存储逻辑数据集成模型和物理数据集成模型,组织拥有了对单个源或目标任务执行更彻底影响分析的能力。在流程中更早地利用转换需求对源到目标映射元数据的捕获,还增加了在单元测试和系统测试中捕捉映射错误的可能性。此外,由于元数据是被自动捕获的,所以也就更容易捕获和管理。
基于行业的数据集成模型
为了降低风险,加快数据仓库项目的设计工作,为数据仓库预构建的数据模型已经由IBM公司,甲骨文公司,微软公司和Teradata公司开发出来了。
随着数据集成建模概念的成熟,预构建数据集成模型正在那些业界数据仓库数据模型的支持下进行开发。
预构建数据集成模型把行业数据仓库模型用作目标和知名商业源系统进行提取。有了基于行业的源系统和目标,很容易利用预构建的源到目标映射开发数据集成模型。例如,在银行系统中,就有通用的源系统,比如下面这几种:
- 商业和零售贷款制度。
- 活期存款系统。
- 企业资源系统(比如SAP和Oracle)。
这些已知的应用可以被重新映射到基于行业的数据仓库数据模型。基于实际的项目经验,对基于行业数据集成模型的利用可以极大地削减数据集成项目的时间和成本。图3.17展示了基于行业数据集成模型的一个示例。
图3.17 基于行业的数据集成模型示例。(点击放大)
在前面的例子中,行业数据集成模型提供如下内容:
- 预构建提取来自客户、零售贷款和商业贷款系统的流程。
- 在目标数据模型中基于已知数据质量需求预构建数据质量流程。
- 基于目标数据模型主题领域预构建加载流程。
- 基于已知数据集成架构、源系统以及目标数据模型从现存设计开始,提供加速数据集成应用开发的框架。
总结
数据建模是对数据的一种图形化设计技术。在数据集成工作中,数据集成建模是针对数据集成参考架构利用图形化流程建模技术设计数据集成流程的一种技术。
本系列文章详细介绍了数据集成模型的类型,包括概念建模,逻辑建模和物理建模,还介绍了基于数据集成参考架构流程层细分模型的方法。本章还提供了每种不同逻辑和物理数据集成模型类型的示例。
它涵盖了从逻辑数据集成模型到物理数据集成模型的转换,最恰当的表述可能是如何从“做什么”转向了“怎么做”。
翻译
TechTarget特邀编辑。2003年入软件行业,熟悉软件过程所有环节,对机构信息化的各方面有深入理解和实践经验。现就职于某互联网创业公司,目前关注互联网分布式系统架构和机器学习。喜欢传统文化社科哲学(尤喜《周易》、《老子》),喜健身喜抓举(具备抱人引体向上的能力),喜欢中国象棋(具备盲棋1对2的能力)。
相关推荐
-
控制合约 不再畏惧Oracle
许多公司都与Oracle有无限制授权协议,他们害怕离开这个协议,所以就证明他们在使用Oracle的软件,即使因为需求单独购买部分授权许可也可能总体是省钱的。
-
如何应对Oracle EBS实施中的六个挑战?
在18个月的时间里,Vitamix启动运行了Oracle电子商务套件(E-Business Suite,EBS),而且Vitamix还对诸如Oracle ATG Web Commerce等所有页面属性进行了重新整理,并实现了全球数据中心。
-
Oracle的云产品“砸了自己脚”?
Sparc和Solaris都是Oracle云计划的一部分,但是硬件和支持人员的减少意味着本地Solaris和Sparc将变得更加稀少。
-
2017年3月数据库流行度排行榜 Oracle卫冕之路困难重重
时隔一个月,数据库市场经过一轮“洗牌”,旧的市场格局是否会被打破,曾经占巨大市场份额的企业是否可能失去优势?