第4章抽样误差与假设检验ppt课件名师编辑PPT课件.ppt
《第4章抽样误差与假设检验ppt课件名师编辑PPT课件.ppt》由会员分享,可在线阅读,更多相关《第4章抽样误差与假设检验ppt课件名师编辑PPT课件.ppt(23页珍藏版)》请在优知文库上搜索。
1、 第四章第四章 抽样误差与假设检验抽样误差与假设检验 (Sampling Sampling E Error and rror and H Hypothesis ypothesis T Testest)第一节第一节 均数的抽样误差与标准误均数的抽样误差与标准误 一、均数的抽样误差一、均数的抽样误差 在医学研究中,绝大多数情况是由样本信息研在医学研究中,绝大多数情况是由样本信息研究总体。由于个体存在差异,因此通过样本推论究总体。由于个体存在差异,因此通过样本推论总体时会存在一定的误差,如样本均数总体时会存在一定的误差,如样本均数 往往不往往不等于总体均数等于总体均数 ,这种由抽样造成的样本均数与总
2、,这种由抽样造成的样本均数与总体均数的差异称为抽样误差体均数的差异称为抽样误差。对于抽样研究,抽。对于抽样研究,抽样误差不可避免。样误差不可避免。X 二、抽样误差的分布二、抽样误差的分布 理论上可以证明:若从正态总体理论上可以证明:若从正态总体 中,反中,反复多次随机抽取样本含量固定为复多次随机抽取样本含量固定为n 的样本,那么的样本,那么这些样本均数这些样本均数 也服从正态分布,即也服从正态分布,即 的总体均的总体均数仍为数仍为 ,样本均数的标准差为,样本均数的标准差为 。2N(,)XX/n抽样分布抽样分布 抽样分布示意图抽样分布示意图 中心极限定理中心极限定理:当样本含量很大的情况下,无论
3、原始测量变量服当样本含量很大的情况下,无论原始测量变量服从什么分布,从什么分布,的抽样分布的抽样分布均均近似正态。近似正态。X抽样分布抽样分布 抽样分布示意图抽样分布示意图 三、标准误(三、标准误(Standard ErrorStandard Error)样本均数的标准差称为标准误。样本均数的标准差称为标准误。样本均数的样本均数的变异越小说明估计越精确,变异越小说明估计越精确,因此可以用标准误表因此可以用标准误表示抽样误差的大小:示抽样误差的大小:实际中总体标准差实际中总体标准差 往往未知,故只能求往往未知,故只能求得样本均数标准误的估计值得样本均数标准误的估计值 :nXXSnSSX 例例4.
4、1 在某地随机抽查成年男子在某地随机抽查成年男子140人,计算得红人,计算得红细胞均数细胞均数4.771012/L,标准差,标准差0.38 1012/L,试计,试计算均数的标准误。算均数的标准误。标准误是抽样分布的重要特征之一,可用于衡标准误是抽样分布的重要特征之一,可用于衡量抽样误差的大小,更重要的是可以用于参数的区量抽样误差的大小,更重要的是可以用于参数的区间估计和对不同组之间的参数进行比较。间估计和对不同组之间的参数进行比较。120.380.032(10/L)140XSSn 第二节第二节 总体均数的估计总体均数的估计 一、可信区间的概念一、可信区间的概念(Confidence Inter
5、val(Confidence Interval)区间估计:区间估计:指按预先给定的概率,计算出一个区间,指按预先给定的概率,计算出一个区间,使它能够包含未知的总体均数。事先给定的概率使它能够包含未知的总体均数。事先给定的概率 称为可信度,通常取称为可信度,通常取 。参数估计参数估计点估计:不考虑抽样误差,如点估计:不考虑抽样误差,如区间估计:考虑抽样误差区间估计:考虑抽样误差195.01X二、可信区间的计算二、可信区间的计算(一)(一)已知已知nXu/95.096.1/96.1nXP95.096.196.1nXnXP)96.1,96.1(XXXX),(2/2/XXuXuX一般情况一般情况其中其
6、中 为标准正态分布的双侧界值。为标准正态分布的双侧界值。2/u 可信区间:可信区间:v 5v 1v()f t标准正态分布(二)(二)未知未知 通常未知,这时可以用其估计量通常未知,这时可以用其估计量S 代替,但代替,但 已不再服从标准正态分布,而是服已不再服从标准正态分布,而是服从著名的从著名的 t 分布。分布。)/()(nSX 图图4-2 4-2 不同自由度的不同自由度的 t 分布图分布图 可信区间的计算可信区间的计算:计算可信区间的原理与前完全相同,仅仅是两计算可信区间的原理与前完全相同,仅仅是两侧概率的界值有些差别。即侧概率的界值有些差别。即1)/()(2/)(2/tnSXtP).()(
7、2/)(2/XXStXStX,可信区间:可信区间:需要注意:在小样本情况下,应用这一公式的需要注意:在小样本情况下,应用这一公式的条件是原始变量服从正态分布。在大样本情况下条件是原始变量服从正态分布。在大样本情况下(如(如n100),100),也可以用也可以用 替换替换 近似计算。近似计算。2/u2/t 例例4.2 4.2 某医生测得某医生测得2525名动脉粥样硬化患者血浆名动脉粥样硬化患者血浆纤维蛋白原含量的均数为纤维蛋白原含量的均数为3.32 g/L3.32 g/L,标准差为,标准差为0.57 0.57 g/Lg/L,试计算该种病人血浆纤维蛋白原含量总体均,试计算该种病人血浆纤维蛋白原含量
8、总体均数的数的95%95%可信区间。可信区间。下限:下限:上限:上限:(g/L)09.325/57.0064.232.3.)(2/XStX(g/L)56.325/57.0064.232.3.)(2/XStX 例例4.3 4.3 试计算例试计算例4.14.1中该地成年男子红细胞总体中该地成年男子红细胞总体均数的均数的95%95%可信区间。可信区间。本例属于大样本,可采用正态近似的方法计算本例属于大样本,可采用正态近似的方法计算可信区间。因为可信区间。因为 ,则,则95%95%可可信区间为:信区间为:14038.077.4n,)L/10(71.4140/38.096.177.4.122/XSuX)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样误差 假设检验 ppt 课件 名师 编辑