基于分布式数据仓库的监管报送系统建设实践.docx
《基于分布式数据仓库的监管报送系统建设实践.docx》由会员分享,可在线阅读,更多相关《基于分布式数据仓库的监管报送系统建设实践.docx(9页珍藏版)》请在优知文库上搜索。
1、近年来,随着银行业应用场景的持续创新,金融监管数据报送模式也随之不断变化,且银行数据不仅规模庞大、类型复杂,数据量更是呈几何级数增长。然而,传统的银行监管报送系统在海量数据提取、加工、上报等方面均面临诸多问题,如数据异构、数据量大、耦合度高、时效性差等,己愈发难以适应报送模式变化,也无法满足银行业务快速发展的需求。对此,邯郸银行基于分布式数据仓库建设,创新搭建了统一监管报送系统,以期能更好地应对大数据背景下面临的各类监管数据报送挑战。一、分布式数据仓库建设思路针对银行业数据处理能力和数据标准问题,邯郸银行适时展开数据仓库建设,以进一步统一全行数据标准,提高数据治理能力与数据质量;同时,通过引入
2、分布式技术,采用分布式计算框架,将数据分层处理,高效解决了计算复杂度和数据存储难题,为促进业务稳健发展提供了有力支撑。1.基础平台建设在平台建设方面,邯郸银行运用HadooP分布式大数据技术,在X86服务器上搭建了基础硬件平台,不仅有效降低了软硬件成本,还为海量数据处理夯实了资源基础。此外,为解决数据整合度不高、数据标准不统一、数据应用难等问题,邯郸银行整合客户信息、交易信息等多个应用场景数据,实现了数据合理有序存储与快速使用。总体而言,基础硬件平台主要包括运行层、设施层、平台层、任务调度控制台、用户网关层与客户应用层。其中,运行层负责为基础软件提供运行环境;设施层负责为平台层提供系统命名、文
3、件信息管理等服务,包括ZoOkeePer和HadooP软件。平台层主要为用户网关层提供应用服务,由HBaSe、任务调度控制台、HiVe组件组成。任务调度控制台作为任务执行调度中心,负责根据业务数据优先级安排任务处理顺序,并由客户端反馈执行结果。用户网关层负责对用户进行身份认证,以及提供用户与数据平台的调用接口,实现硬件平台与数据平台的交互。客户应用层负责根据应用程序的差异化功能,高效支撑客户服务。2 .数据治理体系随着银行业务的快速发展,商业银行的业务系统越来越多且各系统间相互独立,同时各系统在数据库、存储方式、数据分发接口等方面也不尽相同,由于缺乏统一的数据标准,各系统间无法实现数据共享。针
4、对上述问题,银行机构通过建设数据仓库集中管理全局数据,执行统一调度、关联共享,有助于构建高效的数据治理体系。在数据标准方面,为统一全行数据标准,邯郸银行从源系统层面即制定数据交换标准,包括标准化数据分发接口、数据文件、数据存储、数据接收接口等,并建立了统一的数据交换平台。同时,在数据仓库的开发过程中,进一步制定了基础数据标准,包括表命名标准、字段命名标准、类型标准、值域映射标准、数据存储标准、数据清洗标准、数据ETL代码标准等,且一旦发现有不满足标准的数据,就会展开分析、记录,并推送至相关业务系统进行改进。此外,在数据应用方面,数据仓库中还制定了业务口径标准、基础指标定义标准等,并支持可扩展、
5、可修改等功能,显著提升了数据仓库支持业务发展的能力。在数据质量方面,邯郸银行在建设数据仓库的每一个环节都严格执行数据质量监控,全方位覆盖了以下层级:一是文件级,检查文件个数、命名规范、完整性、文件大小;二是表级,检查表命名规范、记录唯一性、索引定义、主键定义;三是字段级,检查数据类型、字段长度、格式、值域、代码规范;四是业务级,检查业务口径与数据标准是否一致,检查业务数据是否满足主键校验。最终,通过严格落地数据标准、监控数据质量,邯郸银行不仅实现了数据共享,大幅提高了数据可用性,还能够及时发现并解决问题。3 .数据仓库模型实践中,数据仓库中整合了众多的源系统数据,且涉及大量的数据表。对此,邯郸
6、银行结合银行操作性业务系统的特性,在数据仓库中采用面向主题的方法,按照第三范式规则进行设计,将其划分为八大主题,即当事人、内部机构、资产、产品、协议、事件、渠道、财务,从而实现了对业务数据的有效整合。分布式数据仓库数据模型如图1所示。当事人事件图/分布式数据仓库数据模型二、监管报送系统架构与功能设计针对监管数据报送系统面临的数据耦合性、时效性等问题,邯郸银行选择建设监管数据集市来降低数据冗余、提升数据利用率;同时,通过定制化设计监管数据模型来提升数据管控效能,从而在高效匹配银行业务全面发展需求的基础上,解决了数据的耦合性问题。此外,通过整合监管报送上层应用系统,邯郸银行搭建了面向监管部门的统一
7、报送平台,覆盖监管部门所需的各种监管报表,并支持快速修改或增加报送模块,以切实响应监管数据报送的新变化和新要求,解决了监管报送的时效性问题。1 .监管数据集市作为监管报送系统的核心模块,监管数据集市负责为报送应用提供数据支持,集中管理监管数据需求。对此,邯郸银行基于分布式数据仓库建设,以监管统计为出发点,全新构建了架构清晰、多层次化的监管数据模型,并搭建统一的监管信息视图,对报送数据进行规划整合,实现了对数据的一致性理解,且数据来源共享、报送口径统一。具体而言,监管数据集市主要由接口数据层、历史数据层、汇总数据层、模型数据层、报送数据层构成,其总体架构如图2所示。图2监管数据集市总体架构Had
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 分布式 数据仓库 监管 报送 系统 建设 实践