生物统计学十四.ppt
《生物统计学十四.ppt》由会员分享,可在线阅读,更多相关《生物统计学十四.ppt(59页珍藏版)》请在优知文库上搜索。
1、l因果关系:回归分析l平行关系:相关分析四、直线回归的区间估计四、直线回归的区间估计l当直线回归关系显著之后,既可用样本统计数a、b来估计总体参数、,又可利用回归方程去估计某一x值对应y总体的平均数和预测单个y值所在的区间。l(一)回归截距和回归系数的置信区间)1(22/2xxyaSSxnssxxyaSSxnss2/1asatastaL1astaL2bstbL1bstbL2回归截距a的方差为:回归截距a的标准误 和t值为:as总体回归截距a的置信区间为:总体回归系数的置信区间为:P141 例7.5(二) 的置信区间和单个y的预测区间 l由 ,故 的标准误为:条件总体平均数 的95%置信区间为:
2、 L1= -t 0.05 ,L2= +t0.05 xy /)(xxbyyy xxyxxyxybyySSxxnsxxSSsnsxxsss2/22/2/222)(1)()(xy /y y ysys ysys2/22/2/2/222xyxxyxyxybyysxxSSsnssxxsss)()(xxySSxxns2/)(11单个y值的标准误为:保证概率为0.95的y 的预测区间为: L1= -t0.05 ,L2= +t0.05 y y P142例7.6l(三) 和单个y观测值置信区间图示 l首先取若干个等距的x 值(x 取值愈密,作图愈准确),算得与其相应的 、 、 和 、 的值;然后再由 和 算得各x
3、上的L1和L2,并标于图上;最后将各个L1和L2分别连成曲线即可。 y ysysyst 0.05yst 0.05ysty 0.05ysty 0.05xy/试制作例1资料的y估计值包括和y在内有95%可靠度的置信区间图。表2 例1资料的置信区间和y y的预测区间的计算y XY /ysyst 0.05ysyst 0.051L2L (2)(3)(4)(6)(7)(8),(1)x的95置信区间计算y的95预测区间计算(5)L1,L23032343637384042444615.613.411.29.07.96.84.62.40.2-2.02.211.751.371.131.091.121.351.72
4、2.172.665.24.13.22.72.62.63.24.15.16.310.4,9.3,8.0,6.3,5.3,4.2,1.4,-1.7,-4.9,-8.3,20.817.514.411.710.59.47.86.55.34.33.952.723.533.463.433.463.533.693.924.219.38.88.38.28.18.28.38.79.39.96.3,4.6,2.9,0.8,-0.2,-1.4,-3.7,-6.3,-9.1,-11.9,24.922.219.517.216.015.012.911.19.57.9 一代三化螟盛发期估计及其 95%置信限 l画出 的图像
5、,依次标出l(x,L1)和(x,L2)坐标点,l再连接各(x,L1)得 线,l连接各(x,L2)得 线。连l接各(x,L2)得 线。 和 l 所夹的区间即包括 l在内有95可靠度的置信区间。 l称(x, )的连线 ,(x, )l的连线 。其所夹的区间即l为y的95的预测区间或预测带。 3月下至4月中旬平均温度累积值 例1资料的y y 估计值及其95%置信带y CDABABCDXY /1LGH2LEFAB-15-10-5051015202528303234363840424446五、直线回归的应用及注意问题五、直线回归的应用及注意问题l(一)直线回归的应用l(二)应用直线回归时的注意问题第三节第
6、三节 直线相关直线相关l一、相关系数和决定系数l二、相关系数的假设测验l三、相关系数的区间估计l四、应用直线相关的注意事项一、相关系数和决定系数一、相关系数和决定系数l(一)相关系数l(X,Y )总体没有相关,则落在象限、的点是均匀分散的,因而正负相消, = 0。 Nyxyx1)(l当(X,Y )总体呈正相关时,落在象限、的点一定比落在象限、的多,故 一定为正;同时落在象限、的点所占的比率愈大,此正值也愈大。 Nyxyx1)()(l当(X,Y )总体呈负相关时,则落在象限、的点一定比落在象限、的为多,故 一定为负;且落在象限、的点所占的比率愈大,此负值的绝对值也愈大。 Nyxyx1)(l 的值
7、可用来度量两个变数直线相关的相关程度和性质。但是,x和y 的变异程度、所取单位及N的大小都会影响其大小。l这些因素的影响是可以消去的。方法就是将离均差转换成以各自的标准差为单位,使成为标准化离差,再以N 除之。Nyxyx1)(l可定义双变数总体的相关系数为:l l上式中的已与两个变数的变异程度、单位和N大小都没有关系,是一个不带单位的纯数,因而可用来比较不同双变数总体的相关程度和性质。 l相关系数是两个变数标准化离差的乘积之和的平均数。 NyyxxyxN1122)()()(yyxyxxyxl样本的相关系数 r l因为: 在回归分析时分成了两个部分:一部分是离回归平方和Q ,另一部分是回归平方和
8、U =(SP)2/SSx。l因此,又可有定义: yxSSSSSPyyxxyyxxr22)()()(2)(yySSy2) (yy2)(yyyxyxySSSSSPSSSSSPyyyySSUr/)()()(222lr 的取值区间是-1,1。双变数的相关程度决定于 |r|,|r|越接近于1,相关越密切;越接近于0,越可能无相关。 lr 的显著与否还和自由度有关,df越大,受抽样误差的影响越小,r 达到显著水平的值就较小。正的r 值表示正相关,负的r 值表示负相关。而相关系数r的正或负和回归系数b是保持一致。 决定系数决定系数 l决定系数(determination coefficient)定义为由x不
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 统计学 十四
