中科大概率论与数理统计讲义04数理统计的基本概念及抽样分布.docx
《中科大概率论与数理统计讲义04数理统计的基本概念及抽样分布.docx》由会员分享,可在线阅读,更多相关《中科大概率论与数理统计讲义04数理统计的基本概念及抽样分布.docx(20页珍藏版)》请在优知文库上搜索。
1、第四章 数理统计的基本概念及抽样分布教学目的:1)使学生对什么叫数理统计及其发展史有一个初步的了解。2)使学生掌握数理统计的若干基本概念,如总体、样本、简单样本、统计模型等。3)使学生掌握统计量2、卜F、正态总体样本均值和样本方差的分布及其简单性质.?4.1引言什么叫数理统计学本课程的前四章介绍了概率论的基本内容,为数理统计学建立了重要的数学基础.从 本章起,我们转入本课程的第二部分一数理统计学.下面我们首先说明什么是数理统计 学.统计学的任务是研究怎样有效地收集、整理和分析带有随机性影响的数据,从而对 所考虑的问题作出一定结论的方法和理论.它是一门实用性很强的学科,在人类活动的 各个领域有着
2、广泛的应用.研究统计学方法的理论基础问题的那一部分构成数理统计 学”的内容.一般地可以认为数理统计是数学的一个分支,它是研究如何有效地收集和有效地使用带有随机性影 响的数据的一门学科.下面通过例子对此加以说明.1 .有效地收集数据收集数据的方法有:全面观察(或普查)、抽样调查和安排试验等方式.例4.1.1.人口普查和抽样调查.我国在2000年进行了第五次人口普查.如果普查的数 据是准确无误的,无随机性可言,不需用数理统计方法.由于人口普查,调查项目很多, 我国有13亿人口,普查工作量极大,而训练有素的工作人员缺乏.因此虽是全面调查,但 数据并不可靠,农村超计划生育瞒报、漏报人口的情况时有发生.
3、针对普查数据不可靠, 国家统计局在人口普查的同时还派出专业人员对全国人口进行抽样调查,根据抽样调 查的结果,对人口普查的数字进行适当的修正.抽样调查在普查不可靠时是一种补充办 法.如何安排抽样调查,这是有效收集数据的重要问题,这构成数理统计学的一个重要 分支一抽样调查方法.例4.12考察某地区IOooO农户的经济状况.从中挑选10。户做抽样调查.若该地区分成 平原和山区两部分,平原地区较富,占该地区农户的7。,山区的3。农户较穷.我们的 抽样方案规定在抽取的100户中,从平原地区抽7。户,山区抽3。户,在各自范围内用随机 化方法抽取.在本例中有效收集数据是通过合理地设计抽样方案来实现的.在通过
4、试验收集数 据的情形如何做到有效收集数据,请看下例:例4.1.3.某化工产品的得率与温度、压力和原料配方有关.为提高得率,通过试验寻找 最佳生产条件.试验因素和水平如下样品因素/1234期8100012001400压力10203040配方ABCD3个因素,每个因素4个水平共要做43 = 64次试验.做这么多试验人力、物力、财力都不 可能.因此,如何通过尽可能少的试验获得尽可能多的信息?比如来用正交表安排试验 就是一种有效的方法.如何安排试验方案和分析试验结果,这构成数理统计的另一分支一试验的设计和 分析.在本例中有效收集数据是通过科学安排试验的方法来实现的.在有效收集数据中一个重要问题是:数据
5、必须具有随机性.2 .有效的使用数据获取数据后,需要用有效的方法,去集中和提取数据中的有关信息、,以对所研究的 问题作出一定的结论,在统计上称为“推断”.为了有效的使用数据进行统计推断,需要对数据建立一个统计模型,并给定某些准 则去评判不同统计推断方法的优劣.例4.1.4.为估计一个物体的重量a才巴它在天平上称5次获得数据Xi , X2, X X X , 5,它们都 受到随机性因素的影响(天平的精度反映了影响的大小).估计a的大小有下列三种不同 方法:(1)用5个数的算术平均值J = 1(1 + XXX + X5)去(古计a;(2)将Xi , X2 , X X X , 5按大 小排列为X(1)
6、 2 X(2) 2 X X X 2 X,取中间一个值X去估计a;(3)用W = YX+ x(5) 去估计a你可能认为7优于x(3),而x(3)优于W.这是不是对的?为什么是这样?在什 么条件下才对?事实上,对这些问题的研究正是数理统计学的任务.要回答这些问题我们需要对数据建立一个统计模型和制定评判不同统计推断方法 的准则.本例中在适当的假定下,可认为数据服从正态模型.下面我们举一个例子说明采用合适的统计方法也是有效使用数据的一个重要方面.例4.15某农村有100户农户,要调查此村农民是否脱贫.脱贫的标准是每户年均收入 超过1万元.经调查此村90户农户年收入5000元,10户农户年收入10万元,
7、问此村农民是 否脱贫?(1)用算术平均值计算该村农户年均收入如下:f = (90 0.5 + 10 10)/100 = IAS(Jj)按此方法得出结论:该村农民已脱贫.但90%的农户年均收入只有5000元,事实上并未脱 贫.(2)用样本中位数计算该村农户年均收入:即将100户的年收入记为H , x2, XXX, 1OO ,将其按大小排列为X(1) 2 X(2) 2 X X X 2 X(IOO).样本中位数定义为排在最中间两户的 平均值,即(50) + X(51)2 = 0.5(万)按此方法得出结论:该村农民尚未脱贫.这与实际情况相符.3 .数理统计方法的归纳性质数理统计是数学的一个分支,但是它
8、的推理方法是不一样的.统计方法的本质是归 纳式的,而数学则是演绎式的.统计方法的归纳性质,源于它在作结论时,是根据所观察 到的大量的“个别情况,归纳”起来所得.而不是从一些假设、命题或已知事实出发按 一定的逻辑推理得出来的(这后者称为演绎推理).举一例子说明:统计学家通过大量的 观察资料发现,吸烟与某种呼吸系统的疾病有关.他得出这一结论的根据是:从观察到 的大量例子,看到吸烟者中患此种疾病的比例远高于不吸烟者.他不可能用逻辑推理的 方法证明这一点.试拿统计学与几何学进行比较就可以清楚地看出二者方法的差别所 在.在几何学中要证明”等腰三角形两底角相等,只需从等腰这个前提出发,运用几何 公理,一步
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 中科大 概率论 数理统计 讲义 04 基本概念 抽样 分布
