欢迎来到优知文库! | 帮助中心 分享价值,成长自我!
优知文库
全部分类
  • 幼儿/小学教育>
  • 中学教育>
  • 高等教育>
  • 研究生考试>
  • 外语学习>
  • 资格/认证考试>
  • 论文>
  • IT计算机>
  • 法律/法学>
  • 建筑/环境>
  • 通信/电子>
  • 医学/心理学>
  • ImageVerifierCode 换一换
    首页 优知文库 > 资源分类 > DOCX文档下载
    分享到微信 分享到微博 分享到QQ空间

    第八章回归分析方法.docx

    • 资源ID:1321033       资源大小:99.59KB        全文页数:15页
    • 资源格式: DOCX        下载积分:5金币
    快捷下载 游客一键下载
    账号登录下载
    微信登录下载
    三方登录下载: QQ登录
    二维码
    扫码关注公众号登录
    下载资源需要5金币
    邮箱/手机:
    温馨提示:
    快捷下载时,如果您不填写信息,系统将为您自动创建临时账号,适用于临时下载。
    如果您填写信息,用户名和密码都是您填写的【邮箱或者手机号】(系统自动生成),方便查询和重复下载。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP,免费下载
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    第八章回归分析方法.docx

    第八章回归分析方法当人们对研究对象的内在特性和各因素间的关系有比较充分的认识时,一般用机理分析方法建立数学模型。如果由于客观事物内部规律的更杂性及人们认识程度的限制,无法分析实际对象内在的因果关系,建立合乎机理规律的数学模型,那么通常的办法是搜集大量数据,基于对数据的统计分析去建立模型。本章讨论其中用途非常广泛的一类模型一一统计回归模型。回归模型常用来解决预测、控制、生产工艺优化等问题。变量之间的关系可以分为两类:一类叫确定性关系,也叫函数关系,其特征是:一个变量随着其它变量的确定而确定。另一类关系叫相关关系,变量之间的关系很难用一种精确的方法表示出来。例如,通常人的年龄越大血压越高,但人的年龄和血压之间没有确定的数量关系,人的年龄和血压之间的关系就是相关关系。回归分析就是处理变量之间的相关关系的一种数学方法0其解决问题的大致方法、步骤如下:(1)收集一组包含因变量和自变量的数据;(2)选定因变量和自变量之间的模型,即一个数学式子,利用数据按照最小二乘准则计算模型中的系数;(3)利用统计分析方法对不同的模型进行比较,找出与数据拟合得最好的模型;(4)判断得到的模型是否适合于这组数据;(5)利用模型对因变量作出预测或解释。应用统计分析特别是多元统计分析方法一般都要处理大量数据,工作量非常大,所以在计算机普及以前,这些方法大都是停留在理论研究上。运用一般计算语言编程也要占用大量时间,而对于经济管理及社会学等对高级编程语言了解不深的人来说要应用这些统计方法更是不可能。MAT1.AB等软件的开发和普及大大减少了对计算机编程的要求,使数据分析方法的广泛应用成为可能。MAT1.AB统计工具箱几乎包括了数理统计方面主要的概念、理论、方法和算法。运用MAT1.AB统计工具箱,我们可以十分方便地在计算机上进行计算,从而进一步加深理解,同时,其强大的图形功能使得概念、过程和结果可以直观地展现在我们面前。本章内容通常先介绍有关回归分析的数学原理,主要说明建模过程中要做的工作及理由,如模型的假设检验、参数估计等,为了把主要精力集中在应用上,我们略去详细而繁杂的理论。在此基础上再介绍在建模过程中如何有效地使用MAT1.AB软件。没有学过这部分数学知识的读者可以不深究其数学原理,只要知道回归分析的目的,按照相应方法通过软件显示的图形或计算所得结果表示什么意思,那么,仍然可以学到用回归模型解决实际问题的基本方法。包括:一元线性回归、多元线性回归、非线性回归、逐步回归等方法以及如何利用MAT1.AB软件建立初步的数学模型,如何透过输出结果对模型进行分析和改进,回归模型的应用等。8.1 一元线性回归分析回归模型可分为线性回归模型和非线性回归模型。非线性回归模型是回归函数关于未知参数具有非线性结构的回归模型。某些非线性回归模型可以化为线性回归模型处理;如果知道函数形式只是要确定其中的参数则是拟合问题,可以使用MAT1.AB软件的Curvefit命令或nlinfit命令拟合得到参数的估计并进行统计分析。本节主要考察线性回归模型。8.1.1 一元线性回归模型的建立及其MAT1.AB实现y=°+X+E£N(O,2)其中夕,才是待定系数,对于不同的用y是相互独立的随机变量。假设对于X的n个值七,得到y的n个相应的值丹,确定四,4的方法是根据最小二乘准则,要使Q(o,)=t-(+Ax/)2i=l1=1取最小值。利用极值必要条件令坐=(),丝=(),求%4的估计值氐,自,从而得到明)明回归直线y=A+Rx.只不过这个过程可以由软件通过直线拟合完成,而无须进行繁杂的运算。(1)参数的区间估计由于我们所计算出的氐,R仍然是随机变量,因此要对A,8取值的区间进行估计,如果区间估计值是一个较短的区间表示模型精度较高。(2)对误差方差的估计设自为回归函数的值,%为测量值,残差平方和Q=(yl-yi)2i=l剩余方差/=旦n-2(3)线性相关性的检验由于我们采用的是一元线性回归,因此,如果模型可用的话,应该具有较好的线性关系。反映模型是否具有良好线性关系可通过相关系数R的值及F值观察(后面的例子说明)。(4)一元线性回归的MAT1.AB实现MAT1.AB工具箱中用命令regress实现,其用法是:b=regress(y,x)b,bi11t,r,rint,s=regress(y,X,alpha)输入y(因变量,列向量)、X(1与自变量组成的矩阵,见下例),alpha是显著性水平(缺省时默认0.05)输出b=(A,R),注意:b中元素顺序与拟合命令PoIyfiI的输出不同,bint是人,用的置信区间,r是残差(列向量),rint是残差的置信区间,s包含4个统计量:决定系数R?(相关系数为R);F值;F(l,n-2)分布大于F值的概率p;剩余方差/的值(MAT1.AB7.0以后版本)。S2也可由程序SUm(r.2)(n-2)计算。其意义和用法如下:R?的值越接近1,变量的线性相关性越强,说明模型有效;如果满足6f(1,一2)/,则认为变量y与X显著地有线性关系,其中GY(1,一2)的值可查F分布表,或直接用MAT1.AB命令finv(l-,l,n-2)计算得到;如果表示线性模型可用。这三个值可以相互印证。S?的值主要用来比较模型是否有改进,其值越小说明模型精度越高。8.1.2身高与腿长例1测得16名成年女子身高y与腿长X所得数据如下:表8-116名女子身高(Cm)腿长(Cm)数据X8885889192939395969897969899100102y143145146147149150153154155156157158159160162164首先利用命令plot(x,y,产)画出散点图,从图形可以看出,这些点大致分布在一条直线的左右,因此,可以考虑一元线性回归。可编制程序如下:y=143145146147149150153154155156157158159160162164;x=8885889192939395969897969899100102;n=16;X=ones(n,l),x,;b,bint,r,rint,s=regress(y',X,0.05);b,bint,s,rcoplot(r,rint)运行后得到b=31.77131.2903bint=12.319651.22291.08461.4960s=0.9282180.95310.00003.1277/?2=0.9282,finv(0.95,1,14)=4.6001,即耳F(1.-2)=4.6001<F=180.9531,p<0.0001,可以通过残差图发现,第二个数据为奇异数据,去掉该数据后运行后得到b=17.65491.4363bint=-0.598635.90831.24451.6281s=0.9527261.63890.00001.9313/?2=0.9527,finv(0.95,1,13)=4.6672,SP-2)=4.6672<F=261.6389,p<0.0001,说明模型有效且有改进,因此我们得到身高与腿长的关系y=17.6549+1.4363%。当然,也可以利用直线拟合得到同一方程。只不过不能得到参数置信区间和对模型进行检验。拟合程序如下:y=143145146147149150153154155156157158159160162164;x=8885889192939395969897969899100102;a=poiyfit(x,y,l)temp=polyval(a,x);plot(x,y,r*',x,temp)注意:函数相同,但输出一次函数参数顺序与回归分析(升基排列)中不同。另一个差别是拟合不能发现奇异数据。8.2多元线性回归分析8.2.1 多元线性回归模型的建模步骤及其MAT1.AB实现如果根据经验和有关知识认为与因变量有关联的自变量不止一个,那么就应该考虑用最小二乘准则建立多元线性回归模型。设影响因变量y的主要因素(自变量)有m个,记X=(X,-,xm),假设它们有如下的线性关系式:y=o+0%+&/+£,gN(0,2)如果对变量y与自变量玉,,七同时作n次观察(n>m)得n组观察值,采用最小二乘估计求得回归方程y=+3÷+建立回归模型是一个相当复杂的过程,概括起来主要有以下几个方面工作(1)根据研究目的收集数据和预分析;(2)根据散点图是否具有线性关系建立基本回归模型;(3)模型的精细分析;(4)模型的确认与应用等。收集数据的一个经验准则是收集的数据量(样本容量)至少应为可能的自变量数目的610倍。在建模过程中首先要根据所研究问题的目的设置因变量,然后再选取与该因变量有统计关系的一些变量作为自变量。我们当然希望选择与问题关系密切的变量,同时这些变量之间相关性不太强,这可以在得到初步的模型后利用MAT1.AB软件进行相关性检验。下面通过一个案例探讨MAT1.AB软件在回归分析建模各个环节中如何应用.多元线性回归的MAT1.AB实现仍然用命令regress(y,X),只是要注意矩阵X的形式,将通过如下例子说明其用法。8.2.2 某类研究学者的年薪1 .问题例2工薪阶层关心年薪与哪些因素有关,以此可制定出它们自己的奋斗目标。某科学基金会希望估计从事某研究的学者的年薪Y与他们的研究成果(论文、著作等)的质量指标XI、从事研究工作的时间X2、能成功获得资助的指标X3之间的关系,为此按一定的实验设计方法调查了24位研究学者,得到如下数据(i为学者序号):表8-2从事某种研究的学者的相关指标数据i1234567891011123.55.35.15.84.26.06.85.53.17.24.54.9Xi29201833311325305472511xi36.16.47.46.77.55.96.04.05.88.35.06.4yi33.240.338.746.841.437.539.040.730.152.938.231.8i1314151617181920212223248.06.56.63.76.27.04.04.55.95.64.83.9%233539217403523332734157.67.05.04.45.57.06.03.54.94.38.05.843.344.142.533.634.248.038.035.940.436.845.235.1试建立Y与X,X2,X3之间关系的数学模型,并得出有关结论和作统计分析。2 .作出因变量Y与各自变量的样本散点图作散点图的目的主要是观察因变量Y与各自变量间是否有比较好的线性关系,以便选择恰当的数学模型形式。下图分别为年薪Y与成果质量指标研究工作时间X2、获得资助的指标A之间的散点图,subplot(1,3,1)

    注意事项

    本文(第八章回归分析方法.docx)为本站会员(王**)主动上传,优知文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知优知文库(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2008-2023 yzwku网站版权所有

    经营许可证编号:宁ICP备2022001189号-2

    本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。优知文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知优知文库网,我们立即给予删除!

    收起
    展开