逻辑数据编织技术白皮书.docx
《逻辑数据编织技术白皮书.docx》由会员分享,可在线阅读,更多相关《逻辑数据编织技术白皮书.docx(15页珍藏版)》请在优知文库上搜索。
1、目录I目录2I摘要3I引言4I实施数据编织的不同方法7I逻辑数据编织的核心组件8数据虚拟化:连接、整合和发布层。8执行和数据集成:执行引擎和优化器9增强版数据目录9主动元数据管理10基于Al的建议10具有扩展元数据的语义层11DATAoPS及多云配置12I逻辑数据编织的主要优势13客户实例:DNB14计划14应用场景15移动银行业务15机器学习及高级分析15风险分析16GDPR16Bl报告16关键功能16产生的价值I结语117自助*务敷改图1:逻辑数据编织的系统结构图领先的行业分析机构Gartner将数据编织定义为:一种架构模式,可以提供关于数据对象的设计、集成和部署的信息并使上述操作自动化,
2、不受部署平台和架构方法的限制。它利用对所有元数据资产的持续分析和AI/ML(T智能/机耕学习),提供有关数据管理以及集成设计和部署模式的可行见解和建议。这将使数据访问和共享更快、更明智,甚至完全自动化(在某些情况下。”因此,数据编织的最终目标是:实现更加敏捷、无缝的数据访问和数据集成,并在许多应用场景中实现自动化。数据编织应具备足够的复杂性以实现高级分析,同时提供一个友好的界面,让业务用户可以与该界面交互。成熟的数据编织应该能够同时支持分析和运行场景。从更具战术性的角度来看,Gartner表示:“问题的核心在于,使可信数据能够通过一个公共层从所有相关数据源传送给所有相关数据使用者,从而能以高效
3、的方式整合许多不同的数据源。wDemystifyingtheDataFabric(数据编织揭秘),JacobOriipLund,2020年9月。接下来的问题是,如何将这些概念转化为现实的数据架构。我们看到,构建功能性数据编织,需要具备六个关键组件:1 .数据虚拟化引擎:提取数据,并允许将应用程序/数据使用与数据源分离,以提供通用的访问层。-该引擎的一个关键组件是智能查询优化器,此优化器有助于降低处理成本,优化速度。2 .增强版数据目录:促进数据探索和发现,加强协作和数据治理。3 .主动元数据:支持审核和历史分析,并作为AI流程的基础。4 .具有扩展无数据的语义层:使用业务术语、标签、状态或文档
4、丰富传统技术信息,大力改善所有数据资产的自助服务、安全性和治理。5 .基于Al的建议:在整个平台上都很有用,可以从使用中学习,并简化数据管理实践的开发、运营和性能调整等整个生命周期。6 .BataOPS和9云配置:降低管理和运营成本,并使系统不受云供应商影响。G 运置控度控 和监调本式三不衰煦图2:逻辑数据编织的功能图数据虚拟化的核心层提取底层数据源,可集中进行访问和数据集成,并确保数据安全。主动元数据、Al引擎、数据目录等功能扩展了数据虚拟化的功能,进而奠定了数据编织策略的基础。此外从图中也能看出,数据虚拟化还可为生态系统中其他的常见元素提供连接点,例如版本控制、治理和日志管理等。要了解更多
5、有关数据编织的信息、,请参阅行业分析论文,例如Gartner的数据编织揭秘(DemystifyingtheDataFabric,2020年9月,JacobOrupLund)以及Forrester的企也数据编织WaVe报告EnterpriseDataFabricWave),另请参阅Gartner的博客文章数据编织架构是实现数据管理和集成现代化的关键(DataFabricArchitectureisKeytoModernizingDataManagementandIntegration)以及福布斯杂志的文章大数据迎来数据编织和多云(BigDataMeetsDataFabricandMulti-Cl
6、oud)o在接下来的部分中,我们将更深入地分析实现数据编织所需的组件和功能。数据编织与组织的哪些人 员密切相关?数据编织与组织中访问或 处理数据的所有人密切相 关。组织内的任何用户, 只要他们需要报告数据、 处理数据或仅是查看数 据,就会接触数据编织。以前,这些用户包括业务 分析师、数据科学家、 线员工以及IT人员等后 台职能员工。现在,用户 群体有增无减,首席信息 安全宜或首席信息官等数 据治理专业人员也都包括 在内。最后重要一点是,DBA、 架构师和数据集成专家等 IT专业人员也都将帮助运 行和发展数据编织。实施数据编织有哪些不同的方法?数据编织是当前数据环境中的热门话题,多家供应商因而从
7、不同角度对布局编织进行了探讨。数据编织的一个关键原则是灵活的数据集成方法,进而实现分布式生态系统中的数据管理。也就是说,根据应用场景的性质及其要求,任何用户(或编织本身,在基于Al的决策中)都应该能够使用最佳的集成策略和最适合该工作负我的数据系统。这包括使用提取、转换和加载(ETL)流程,提取、加载和转换(ELT)流程,实时联合,以及数据湖、企业数据仓库(EDW)、操作系统等的组合。许多供应商,尤其是数据湖和ETL.领域的供应商,都忽略了这些前提。他们实现数据编织的方法侧重于将数据物理复制到单一的中央存储库,并围绕这些管道实现自动化。然而,这些方法存在严重的弊端: 解决方案锁定:编织依赖于锁定
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 逻辑 数据 编织 技术 白皮书
