解析分布式数据库的技术框架.docx
《解析分布式数据库的技术框架.docx》由会员分享,可在线阅读,更多相关《解析分布式数据库的技术框架.docx(22页珍藏版)》请在优知文库上搜索。
1、04,一、刖百早期银行业务系统处理的主要是交易型数据,数据量较少,传统关系型数据库(如SQ1.Server、Orace1.DB2等)已足够应对.随着互联网金融业务的快速发展,业务系统需要处理的数据呈爆炸式增长,传统数据库因其扩展能力有限,已无法满足业务系统越来越高的数据处理能力要求.于是,新型的分布式数据库系统应运而生.本文拟先对数据库进行分类,了解各类数据库的特点,参考人行的分布式数据稀技术架构规范,并结合业界主流分布式数据库的技术实现,试图梳理出通用技术框架,并根据各功能模块的主要技术特点,结合业务场景,提出分布式数据库系统在金融领域的应用规划,供大家参考。二、数据库的分类为了更高效地了解
2、不同厂商分布式数据库的产品特点,我们需要对数据库产品进行分类.业界对数据鹰的分类尚未形成统一的标准,但都大同小异,本文数据座分类参考了45:1.GroUP分析报告中的数据库行业全景图.数据库根据其数据模型,可分为关系型数据库(RDBMS)和非关系型数据库(NoSQ1.).其中,关系型数据库根据其技术特性,分为传统关系型数据库和NewSQ1.数据库;根据业务负载特征,可分为O1.TP数据库和OlAP数据库。根据部署架构,可分为集中式数据阵和分布式数据由.其中NoSQ1.数据席与NewSQ1.数据库均为分布式数据库.各类数据库的特性描述如下:1、关系型数据库与非关系型数据库关系型数据庵(RDBMS
3、)即SQ1.数据库,支持SQ1.操作,具备ACID属性,用于处理存储结构化数据,包括传统关系型数据库与NewSQ1.数据库。非关系型数据库,通甫为NoSQ1.数据库.NoSQ1.(NOtOnIySQ1.)即不仅仅是SQ1.,提倡运用非关系型的、分布式的数据存储系统,通常以牺牲复杂SQ1.、ACID事务支持和数据的一致性为代价,以此换取弹性扩展能力.常用的NoSQ1.数据库有基于键值(Key-Value)的,如IeVeIDB、RocksDB.redis等;基于列存储的,如:Bigtable.HBASE等;基于文档的,如:MangoDB;其他如基于图的Neo4j,基于时间序列数据的InfIuxDB
4、等.2、传统关系型数据库与NewSQ1.数据库传统关系型数据库与NeWSQ1.数据库均属于关系型数据库.早期使用的关系型数据库是传统关系型数据库,扩展能力有限,如商业软件OraCaDB2,开源软件MySQ1.、PostgreSQ1.等。NewSQ1.数据席为应对爆炸式增长的数据需求而生.采用分布式技术,支持SQ1.操作,满足AClD属性,同时具备良好的扩展能力,如CockroachDB.GoogleSPanner/F1、TiDBxOCeanBaSe等.3、O1.TP数据库与O1.AP数据库O1.TP(On-lineTransactionProcessing联机事务处理)数据库,适用于事务管理型
5、系统,该类系统处理的是高并发且数据Sl级不大的交易,如INSERT,UPDATE.DE1.ETE等.O1.TP是传统关系型数据库的主要应用。O1.AP(On-lineAnalyticalProcessing联机分析处理)数据鹰,适用于直询频率较低,但通常会涉及到非常复杂的聚合计算的系疣.该类系统需要进行复杂的分析操作,侧电决策支持,并且提供亘观易债的直询结果。如数据仓库,风睑预警等.4、能中式数据库与分布式数据库集中式数据库将数据在物理空间上集中存储和处理,是一种较为经典、传统的架构模式;分布式数据库是物理上分散而逻辑上集中的数据库系统,利用分布式事务处理、数据自动分片、数据多副本存储等技术,
6、将分散在计算机网络的多个逻辑相关节点连接起来,共同对外提供服务.NewSQI.数据库与NoSQ1.数据库采用分布式部署,均为分布式数据库。5、数据库分类示意图:三、分布式数据库的技术框架就分布式数据库的技术框架而言,可分为计算模块、存储模块和管理模块.各模块的技术框架介绍如下:(一)计算模块计算模块包括接口层、解析层和计算层.1、接口层接口层负责接口调用,是分布式数据库对外提供服务的统一接口,可提供包括SQ1.接口、JDBC/ODBC以及其他驱动等方式的接入.2、解析层解析层包括解析器、优化器,负责解析数据库收到的指令,(包括SQ1.语句和其他指令),同时对解析结果进行优化,生成执行计划,并将
7、指令与计划自动分配到各计第节点并行执行。在解析层中,我们需要关注产品对SQ1.的兼容性,以及对存储过程的支持情况3、计算层计算屋负责资源管理,确定计算框架,采用合适的通讯协议,通过分布式事务处理等技术确保数据正确性,借助并发控制、动态资源分配等技术提升分布式数据库在复杂业务场景的计算效率,同时保证整体系统的可靠性.各模块功能如下:-资源管理主要负责计凭资源的管理,包括CPU、内存的调度,跟盘I/O管理、动态资源分配等.合理的资源管理设计,能最大程度发挥计箕资源的效率,提升分布式数据库在基杂业务场景的计算效率.计算框架分布式数据库通常采用MPP计算框架,实现并行计算的能力。MPP(MaSSiVe
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 解析 分布式 数据库 技术 框架
