用样本估计整体.docx
《用样本估计整体.docx》由会员分享,可在线阅读,更多相关《用样本估计整体.docx(11页珍藏版)》请在优知文库上搜索。
1、这就是说。各个小长方形的面积等于相应各组的频率。显然。所有张方形面积之和等于1.为了了解全部产品中优等品所占比例。可以统计出内径尺寸在区间25.325到25.475内的个体数载样本容量中所占的比例、也就是他的频率。从表中容易看出,这个频率值等于012+0.18+025+0.16+013=0.84,于是可以估计出所有生产的钢管中有84%的优等品、工厂可以根据质量标准。看看是否到达优等品率的要求,如果没有到达。就需要进一步分析原因。解决问题。当然。用样本的频率分布估计总体的分布时。要使样本能够很好的反响总体的特征。必须随机抽取样本。由于抽样的随机性,可以想到(参考本届练习A第三题),如果随机抽取另
2、外-个容量为100的样本,所形成的样本频率分布一般会与请按一个样本频率分布有所不同。但是。他们都可以近似的看做总体的分布。从频率分布直方图可以清楚的看出数据分布的总体态势,但是从直方图本身得不出原式的数据内容。所以,把数据表示成直方图后,原有的具体数据信息就被抹掉了。把频率分布直方图各个张方形上边的中点用线段连接起来,就得到频率分布折线图,为了方便看图。一般习惯于吧频率分布折线图化成与横轴相连。所以横轴上的左右两端点没有实际的意义。图中各个小长方形的面积,说明了所抽取的100件产品中内径尺寸落在各个小组内的产品个数与100的比值大小。如果样本容量越大,所分组数越多。图中表示的频率分布就越接近于
3、总体在各个小组内取值的个数与总数比值的大小。设想如果样本容量不断增大,分组的组距不断缩小,那么频率分布直方图实际上越来越接近于总体的分布,他可以用仪表光滑取消Y=f(X)来描绘。这条光滑曲线就叫做总体密度曲线。总体密度曲线精确地反映了一个总体在各个区域内取值的规律。产品尺寸落在(a,b)内的百分率就是图中带斜线局部的面积,对本例来说,总体密度曲线呈中间高两边低的“钟”形分布,总体的数据大致呈对称分布,并且大局部数据都集中在靠近中间的区间内。抽样后的样本数据汇总。号可以借助计算机来准确、快速的作出,图就是运用前面所讲到的画直方图的步骤,在工作表中对样本数据汇总得出的结果。茎叶图:某赛季甲乙两名篮
4、球运发动每场比赛的得分情况如下:甲的得分:12,15,24,25,31,31,36,36,37,39,44,49,50.乙的得分:8,13,14,16,23,26,28,33,38,39,51.上面的发数据可以用图来表示。他的中间局部像一棵植物的茎,两边局部像这个植物茎上生长出来的叶子。用中间的数字表示两位运发动得分的十位数,两边的数字分别表示两个人各场比赛得分个位数。例如。用3389就表示了33,38,39这三个数据,通常把这样的图焦作茎叶图,根据上图可以对两名运发动的成绩进行比拟。从上面的茎叶图可以看出,甲运发动的得分情况是大致对称的。中位数是36,:乙运发动的得分情况除一个特殊得分外。也
5、大致对称。中位数是26.用茎叶图表示数据有两个突出的优点。一是从统计图上没有原始信息的损失,所有的数据信息都可以从茎叶图中得到。二是茎叶图可以在比赛时随时记录。方便记录与表示。用样本的数字特征估计总体的数字特征在日常生活的很多情况下,我们往往并不需要了解总体的分布形态,而是更关心总体的某一数字特征。比方购置灯泡时,消费者希望知道的是这批灯泡的平均使用寿命,我们怎样来了解这批灯泡的平均使用寿命呢?当然不可能把所有的灯泡逐一测试,因为测试后灯泡就报废了。于是,需要通过随机抽样。把这批灯泡的寿命看做整体,从中随机抽取出假设干个个体作为样本,算出样本的数字特征,用样本的数字特征(如平均数等)来估计总体
6、的数字特征。1用样本的平均数估计总体平均数我们在初中学过,平均数描述了数据的平均水平,定量的反响了数据的集中趋势所处的水平,那么,怎样用样本的平均数估计总体的平均数呢?例1:从某大型企业全体员工某月的月工资中随机抽取50名员工的月工资资料如下(单位:元)试计算这50员工的月工资平均数,并估计这个企业的员工平均工资。解月平均工资-800+800+2逆7划元怛月干刁灾5。由此可以估计这家企业的员工月平均工资为1320元。假设你去这家公司应聘职位,月平均工资水平是你考虑的重要因素。一般来讲,月平均工资的水平可以与同类公司待遇进行比拟。同样,再随机抽取50名公司职员的工资。计算说得的样本的平均数般会与
7、例1中的样本平均数不同,所以。用样本平均数估计总体平均数时。样本的平均数只是总体平均数的近似。-x1+x2+xn我们知道,N个样本xl,x2,Xn的平均数,那么有X=X+/+%。也就是把每个(=12J)都用X代替后,数据总和保持不变,所以平均数X对数据有“取齐”的作用,代表了一组数据的数值平均水平。在例1中,可能有人会猜想,应用50%的员工工资超过平均数,而50%低于平均数。我们用前面学习的方法画出例1中月工资的频率分布直方图。并标出样本平均数,又数据可以得出,只有30%的员工月平均工资超过平均数,其余70%的在平均数以下,想一想什么原因导致了这个结果。数据的离散程度可以用极差、方差或标准差来
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 样本 估计 整体
