数据分析与可视化习题答案张涛.docx
《数据分析与可视化习题答案张涛.docx》由会员分享,可在线阅读,更多相关《数据分析与可视化习题答案张涛.docx(23页珍藏版)》请在优知文库上搜索。
1、课后习题答案项目1使用NUmPy分析空气质量状况-S选择题1 .D2,B3.A4.C5.C他可能是it64jt32)二、简答题12341 .已知ndarray数组MM=B*二2。根据以下要求写出对应代码。JLUJLJLJLX.13141516(1)获取前三条数据。(2)获取最后两列数据。(3)获取最后一列数据(两种方法)。(4)获取第23行,第23列数据。(5)求每一列的均值,最大值和最小值。(6)求每一行的均值,最大值和最小值。(7)将M中的每一个元素扩大为原来的两倍。importnumpyasnpM=np.arage(l,17)M=M.reshape(4,4)# (1)获取前三条数据fir
2、st_three_elements=M:3# (2)获取最后两列数据last_two_columns=ML-2:# (3)获取最后一列数据(两种方法)# 方法一:IasLcoIumn=M:,-1# 方法二:IasLcoIumn=M13# (4)获取第23行,第23列数据sub_matrix=Ml:3,1:3# (5)求每一列的均值,最大值和最小值mean,values=np.mea(M,axis=0)max_values=p.max(M1ais=O)min_values=p.min(M1axis=O)# (6)求每一行的均值,最大值和最小值mean,values=p.mean(M,axis=l
3、)max_values=np.max(Mlaxis=l)min_values=p.mi(M1axis=l)# (7)将M中的每一个元素扩大为原来的两倍doubled_M=M*22 .已知有两个ndaray数组M和N,求出M*N的值。1M= 3 .51 211 4 t N= 31 6 Is246.答案:141826343850三、编程题1.使用NumPy的random模块,生成一个符合标准正态分布的100*5的ndarray数组,计算每列的最大值、最小值和均值,最后将该数组保存到data.csv文件中。importnumpyasnp# 使用numpy的random模块生成一个100x5的ndar
4、ray数组,数组元素符合标准正态分布data=p.random.randn(100,5)# 计算每列的最大值、最小值和均值max_values=data.max(axis=0)min_values=data.mi(ais=O)mean_values=data.mean(ais=O)# 打印每列的最大值、最小值和均值Print(每列的最大值:,max_values)Print(每列的最小值:,min_values)Print(每列的均值:,mean_values)# 将结果保存到data.csv文件中p.savetxt(data.csv,data,delimiter=,)2.现有一个关于二手房的
5、数据集house.csv,部分数据如表18所示,请根据要求,编写一个预测房价的程序。(1)去除“脏数据”,即删除“编号”歹J,删除重复行和列。(2)统计数据集中总面积在080,80120以及120各自的数量是多少。(3)预测房价的公式为:PriCe=I8%+03x2-04x3-08%4+25+20m60(注意:这个公式有误,最后的+20%6)不需要,直接删掉。(4)将预测的结果持久化到txt文件中。importnumpyasnp# 读取数据集data=p.loadtxt(house.csv,delimiter=,skiprows=l,encoding=utf-8)# 去除脏数据data=p.d
6、elete(data10,ais=l)#删除编号列data=np.unique(data,axis=0)#删除重复行和列# 统计总面积的数量totaLarea=data:,0count_0_80=np.sum(totaLarea=0)&(totaLarea=80)&(totaLarea=120)# 预测房价price=1.8*data:,0+0.3*data:,1-0.4*data:,2-0.8*data:,3+2.5*data:,4# 将预测结果持久化到txt文件中np.savetxt(,prediction.tt,price,fmt=,%.2f)Print(总面积在080的数量:,coun
7、t_0_80)Print(总面积在80-120的数量:,count_80_120)Print(总面积大于120的数量:,count_120)项目2使用MatPIOtIib实现空气数据可视化一、选择题1.C2.A3.D4.C5.D6,A二、编程题1 .读取葡萄牙某公园火灾的数据集,数据集下载地址:https:archive.ics.ucidu/ml/datasets/Forest+FireSo要求完成以下图形的绘制。(1)绘制温度、湿度、风速和下雨量这四个特征与烧毁面积之间关系的散点图。(2)统计每个月平均烧毁面积,并绘制出对应的饼图。importnumpyasnp#导入numpy库,用于数值计
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 分析 可视化 习题 答案