“大数据”的认识与思考22.docx
《“大数据”的认识与思考22.docx》由会员分享,可在线阅读,更多相关《“大数据”的认识与思考22.docx(18页珍藏版)》请在优知文库上搜索。
1、)Nn三iM1三1.三-三11m三三SS1.iSIORAGERk)IpiBJN三JU三SDW-VWP“大数据”的认识与思考刘姝祎目录1 “大数据”的时代背毋41.1 “大数据”的概念41.2 “大数据”产生的背景41.3 “大数据”的特征51.4 “大数据”的开展阶段51.5 “大数据”带来的机遇62 “大数据”的关键技术82.1 1“大数据”的采集和预处理82.2 “大数据*存储技术92.3 “大数据”分析技术92.4 “大数据”与云计算103大数据产业的应用113.1 大数据产业113.2 “大数据”在典型领域中的应用123.3 智慧城市:立体的大数据生态系统133. 3.1智款城市的产生
2、134. 3.2全球智慧城市的实践133.3.3.中国智慧城市144问题与挑战164. 1数据质量164. 2数据平安164. 3用户隐私与便利性的冲突164. 4庞大能耗164. 5数据分析与管理人才紧缺164. 6跟风现象较为严重175. 7缺少技术创新水平较高的互联网公司175对大数据产业开展的建议186. I政府方面187. 2企业方面19195.3公众方面1 “大数据.的时代背景1.1 “大数据”的概念纽约时报在2012年宣布“大数据时代”已经降临,“大数据”成为了时下最炽热的词汇。顾名思义,大数据是“无法任意时间内用常规软件工具对其内容进行抓取、管理和处理的大量而笈杂的数据集合.G
3、artner认为大数据是“需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产”。大数据”的要义是尽可能地收集众多可以相互叠加补充的信息,据以完成对“未来的预测。这些数据可能有些混乱,甚至会出现批漏,但数据量的“多”和时间的“即刻”可以弥补数据质量的瑕疵,“大数据”将以最快的速度“预测”出最可能”的答案,指引人们迅速采取行动。1.2 “大数据”产生的背景大数据的应用和技术是在互联网快速开展中诞生的,起点可追溯到2000年前后。当时互联网网页爆发式增长,每天新增约700万个网页,到2000年底全球网页数到达40亿,用户检索信息越来越不方便。谷歌等公司率先
4、建立广覆盖数十亿阿页的索引库,开始提供较为精确的搜索效劳,大大提升了人们使用无联网的效率,这是大数据应用的起点。当时搜索引擎要存储和处理的数据,不仅数量之大前所未仃,而且以非结构化数据为主,传统技术无法应对。为此,谷歌提出了套以分布式为特征的全新技术体系,即后来砧续公开的分布式文件系统(GFS,Goog1.e),分布式并行计算(VaPRedUCe)和分布式数据库(BigTabIe)等技术,以较低的本钱实现了之前技术无法到达的规模.这些技术奠定/当前大数据技术的基础,可以认为是大数据技术的源头。伴随着互联网产业的崛起,这种创新的海域数据处理技术在电子商务、定向广告、智能推荐、社交网络等方面得到应
5、用,取得巨大的商业成功。这启发全社会开始重新审视数据的巨大价值,于是金融、电信等拥有大量数据的行业开始尝试这种新的理念和技术,取得初步成效.与此同时,业界也在不断对谷歌提出的技术体系进行扩展,使之能在更多的场景卜使用。2011年,麦肯锡、世界经济论坛等知名机构对这种数据驱动的创新进行了研究总结,随即在全世界兴起了股大数据热潮。2012年3月,美国政府发布大数据研究和开展方案3,同时组建大数据高级指导小组,以协调政府在数据领域的两亿多美元投资.根据这一方案,美国希里利用大数据技术再多个领域实现突破,包括科研教学、环境保护、国土平安等,此举标志若,美国把应对大数据技术革命带来的机遇和挑战,提高到国
6、家战略层面,形成了全体发动格局。随后,英国、法国、日本等各国都相继将大数据方案作为国家战略型方案提上日程。值得一提的是,由中国各级政府主导的大数据方案也已经全面展开,“大数据”已成为推动我国经济和科技开展的重要力量。1.3 “大数据.的特征“大数据”具有州的特点:是数据容量巨大(Vo1.ume)。国际数据公司(IDC)的研究报告称,2011年全球被创立和被复制的数据总量为1.8ZB(2的70次方),并预测到2020年,全球将拥有35ZB的数据量。二是数据类型众多(Variety).相对于过往以文本形式为主的结构化数据,大数据时代的数据类型涵盖/图片、音频、视频、网络H志和地理位巴信息等种类繁多
7、的半结构化和非结构化数据。三是数据价值密度低(Va1.uo)e举例而言,在个连续监控三个小时的视嫉中,能够提供有效信息帮助刑侦人员破案的画面可能只有三五秒.四是处理数据的速度要求非常快(Ve1.ocity),一方面,面对如此巨大的数据量,处理效率至关重要,另一方面,越来越多的处理需要在瞬间完成以便做出及时的反应。在此基础上,阿里巴巴延伸至3个维度一可实时性、可解释性、数据准确性程定性,这三个维度是决定数据是否有价值的关键。1.4 “大数据”的开展阶段每种技术都有自己的生命周期,GartnCr曾经指出新技术生命周期的5个阶段,即技术萌芽期(techno1.ogyIrigger)、期望膨胀期(Pe
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 认识 思考 22
