大数据基础走进大数据第一章数据时代从我开始.ppt
《大数据基础走进大数据第一章数据时代从我开始.ppt》由会员分享,可在线阅读,更多相关《大数据基础走进大数据第一章数据时代从我开始.ppt(16页珍藏版)》请在优知文库上搜索。
1、第一章 数据时代,从我开始第一篇第一篇 数据引领时代,初识大数据数据引领时代,初识大数据1.1 从韩信点兵说起从韩信点兵说起相传汉高祖刘邦问大将军韩信统御兵士多少,韩信答说,每3人一列余2人、5人一列余3人、7人一列余2人、13人一列余6人刘邦茫然而不知其数。举例:假设兵士不满一万,每5人一列、9人一列、13人一列、17人一列都剩3人,则兵士有多少?首先,求出5、9、13、17之最小公倍数为9945(注:因为5、9、13、17为两两互质的整数,故其最小公倍数为这些数的积),然后再加3,得9948人。大数据到底有多大?大数据到底有多大?常见的数据单位有bit(比特)、Byte(字节)、KB(千字
2、节)、MB(兆字节)、GB(吉字节)。那GB以上还有什么?GB以上还有TB、PB、EB、ZB、YB、DB、NB。1Byte=8bit1KB=1024Bytes1MB=1024KB1GB=1024MB1TB=1024GB1PB=1024TB1EB=1024PB1ZB=1024EB1YB=1024ZB1DB=1024YB1NB=1024DB1NB =1267650600228229401496703205376 Bytes1NB =1267650600228229401496703205376 Bytes1.1 从韩信点兵说起从韩信点兵说起大数据又称为海量数据,是指所涉及的数据量规模巨大到无法通过
3、人工或者计算机,在合理时间内达到截取、管理、处理、并整理成为人类所能解读的形式的信息。大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。维基百科Gartner麦肯锡全球研究所大数据的定义大数据的定义1.1 从韩信点兵说起从韩信点兵说起大数据的发展大数据的发展2005年年Hadoop项目项目诞生诞
4、生2009年印度政府建立年印度政府建立了用于身份识别管理了用于身份识别管理的生物识别数据库的生物识别数据库2011年年2月,月,IBM的沃森的沃森超级计算机每秒可扫描超级计算机每秒可扫描并分析并分析4TB(约(约2亿页文亿页文字量)的数据量字量)的数据量2012年年大大数据,大影响数据,大影响(Big DataBig Data,Big Impact)宣称)宣称20172017年全球的数据总量为年全球的数据总量为21.6ZB(1个个ZB等于十万亿亿字等于十万亿亿字节)节)大数据的特征大数据的特征4V特征体量大价值密度低多样化速度快1.1 从韩信点兵说起从韩信点兵说起1.2 大数据从哪里来大数据从
5、哪里来根据数据来源不同,大数据可以分为三类:(1)人类活动,人在使用互联网(包括移动互联网)过程中所产生的各类数据;(2)计算机及各种计算机信息系统产生的数据,多以文件、数据库、多媒体等形式存在;(3)物理世界,各类数字设备所采集的数据,如气象系统采集设备所收集的海量气象数据、视频监控系统产生的海量视频数据等。现代社会大数据产生的标志现代社会大数据产生的标志1、科学研究科学研究产生大数据产生大数据2、物联网物联网技术产生大数据技术产生大数据3、网络化网络化产生大数据。产生大数据。1.2 大数据从哪里来大数据从哪里来阿里指数阿里指数1.3 大数据能做什么大数据能做什么 朋友圈的广告推荐功能朋友圈
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 基础 走进 第一章 时代 开始
