数据仓库概述.docx
《数据仓库概述.docx》由会员分享,可在线阅读,更多相关《数据仓库概述.docx(23页珍藏版)》请在优知文库上搜索。
1、数据仓库概述(1)数据仓库概述随着计算机技术的飞速进展与企业界不断提出新的需求,数据仓库技术应运而生。传统的数据库技术是单一的数据资源,即数据库为中心,进行从事事务处理、批处理到决策分析等各类类型的数据处理工作。近年来,随着计算机应用,网络计算,开始向两个不一致的方向拓展,一是广度计算,一是深度计算,广度计算的含义是把计算机的应用范围尽量扩大,同时实现广泛的数据交流,互联网就是广度计算的特征,另一方面就是人们对以往计算机的简单数据操作,提出了更高的要求,希望计算机能够更多的参与数据分析与决策的制定等领域。特别是数据库处理能够大致地划分为两大类:操作型处理与分析型处理(或者信息型处理)。这种分离
2、,划清了数据处理的分析型环境与操作型环境之间的界限,从而由原先的以单一数据库为中心的数据环境进展为一种新环境:体系化环境。数据库系统作为数据管理手段,从它的诞生开始,就要紧用于事务处理。通过数十年的进展,在这些数据库中已经储存了大量的日常业务数据。传统的业务系统通常是直接建立在这种事务处理环境上的。随着技术的进步,人们试图让计算机担任更多的工作,而数据库技术也一直力图使自己能胜任从事务处理、批处理到分析处理的各类类型的信息处理任务。后来人们逐步认识到,在目前的计算机处理能力上,根本无法实现这种功能,而且,另一方面,事物处理与分析处理具有极不相同的性质,直接使用事务处理环境来支持决策是行不通的。
3、事务处理环境不适宜DSS应用的原因要紧有下列五条:(1)事务处理与分析处理的性能特性不一致。在事务处理环境中,用户的行为特点是数据的存取操作频率高而每次操作处理的时间短;在分析处理环境中,用户的行为模式与此完全不一致,某个DSS应用程序可能需要连续几个小时,从而消耗大量的系统资源。将具有如此不一致处理性能的两种应用放在同一个环境中运行显然是不适当的。(2)数据集成问题。DSS需要集成的数据。全面而正确的数据是有效的分析与决策的首要前提,有关数据收集得月完整,得到的结果就越可靠。当前绝大多数企业内数据的真正状况是分散而非集成的。造成这种分散的原因有多种,要紧有事务处理应用分散、“蜘蛛网”问题、数
4、据不一致问题、外部数据与非结构化数据。(3)数据动态集成问题。静态集成的最大缺点在于,假如在数据集成后数据源中数据发生了变化,这些变化将不能反映给决策者,导致决策者使用的是过时的数据。集成数据务必以一定的周期(比如24小时)进行刷新,我们称其为动态集成。显然,事务处理系统不具备动态集成的能力。(4)历史数据问题。事务处理通常只需要当前数据,在数据库中通常也是存储短期数据,切不一致数据的储存期限也不一样,即使有一些历史数据储存下来了,也被束之高阁,未得到充分利用。但关于决策分析而言,历史数据是相当重要的,许多分析方法务必一大量的历史数据为依托。没有历史数据的全面分析,是难以把握企业的进展趋势的。
5、DSS对数据在空间与时间的广度上都有了更高的要求,而事务处理环境难以满足这些要求。(5)数据的综合问题。在事务处理系统中积存了大量的细节数据,通常而言,DSS并不对这些细节数据进行分析。在分析前,往往需要对细节数据进行不一致程度的综合。而事务处理系统不具备这种综合能力,根据规范化理论,这种综合还往往由因此一种数据冗余而加以限制。要提高分析与决策的效率与有效性,分析型处理及其数据务必与操作型处理及其数据相分离。务必把分析型数据从事务处理环境中提取出来,按照DSS处理的需要进行重新组织,建立单独的分析处理环境,数据仓库正是为了构建这种新的分析处理环境而出现的一种数据存储与组织技术。数据仓库应用概述
6、当今世界充满了剧烈竞争,正确及时的决策是企业生存与进展的最重要环节。现在,愈来愈多的企业认识到,企业要想在竞争中取胜,获得更大的收益,至关重要的是,务必利用计算机与网络技术、数据仓库技术,深层次地挖掘、分析当前与历史的生产业务数据,与有关环境的有关数据,自动快速获取其中有用的决策信息,为企业提供快速、准确与方便的决策支持。通过对企业生产与计划的完成情况及有关环境数据进行多角度多层次的分析,以使企业的决策者及时掌握企业的运行情况与进展趋势,并对制定生产计划与长远规划提供理论指导,提高企业的管理水平与竞争优势。下列就对数据仓库的应用、技术、市场、前景等几方面进行简述。第一篇数据仓库技术在各行业的应
7、用与实例一.在证券业的应用关键字:数据仓库、证券数据仓库技术在证券业的应用十分广泛,它可处理客户分析、帐户分析、证券交易数据分析、非资金交易分析等多个业界关心的主题,这是证券业扩大经营、防范风险的预警行动。证券公司利用客户行为分析系统数据仓库技术将所有客户的操作记录进行归类与整理,并结合行情走势、上市公司资料、宏观微观经济数据等,在掌握大量数据的情况下,对客户的行为与市场各因素的关联、客户的操作习惯、客户的持仓情况、客户的盈亏情况、公司的利润分布等进行统计与分析。从而获得以往一直想获得但却无法获取的关于客户在本公司的行为、盈亏、习惯等关键信息。证券商在获得这些信息后,就有能力为客户提供针对其个
8、人习惯、投资组合的投资建议,从而真正作到对客户的贴心服务。实例:深圳国信证券建立数据仓库1999年4月,深圳国信证券的数据仓库系统(由Sybase公司提供解决方案)一期工程完成,该项首期投资近200万元数据仓库系统建设的出发点是为当前公司的决策者提供快速有效的各类报表与分析方式,提高公司的市场反应速度与竞争力水平。更有效地发挥OLTP系统的效益,在此基础上“多快好省”地建设DataWarehouse/DSSo同时,考虑到公司业务系统的不断完善与决策支持的更高要求,对不断增长的企业数据具有无限的可扩展性并提供可控的快速查询响应时间。该系统包含了客户分析、账户分析、证券汇总分析、资金交易分析、非资
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据仓库 概述
