02一元线性回归模型.docx
《02一元线性回归模型.docx》由会员分享,可在线阅读,更多相关《02一元线性回归模型.docx(19页珍藏版)》请在优知文库上搜索。
1、一元线性回来模型1.一元线性回来模型有一元线性回来模型(统计模型)如下,yl=fii+xl+U1上式表示变量M和为之间的真实关系。其中M称被说明变量(因变量),汨称说明变量(自变量),出称随机误差项,图称常数项,加称回来系数(通常未知)。上模型可以分为两部分。(1)回来函数部分,E=向+用必(2)随机部分,Ui图2.1真实的回来直线这种模型可以给予各种实际意义,收入与支出的关系;如脉搏与血压的关系;商品价格与供应量的关系;文件容量与保存时间的关系;林区木材采伐量与木材剩余物的关系;身高与体重的关系等。以收入与支出的关系为例。假设固定对一个家庭进行视察,随着收入水平的不同,与支出呈线性函数关系。
2、但事实上数据来自各个家庭,来自各个不同收入水平,使其他条件不变成为不行能,所以由数据得到的散点图不在一条直线上(不呈函数关系),而是散在直线四周,听从统计关系。随机误差项,中可能包括家庭人口数不同,消费习惯不同,不同地域的消费指数不同,不同家庭的外来收入不同等因素。所以在经济问题上“限制其他因素不变”是不行能的。回来模型的随机误差项中一般包括如下几项内容,(1)非重要说明变量的省略,(2)人的随机行为,(3)数学模型形式欠妥,(4)归并误差(粮食的归并)(5)测量误差等。回来模型存在两个特点。(1)建立在某些假定条件不变前提卜抽象出来的回来函数不能百分之百地再现所探讨的经济过程。(2)也正是由
3、于这些假定与抽象,才使我们能够透过困难的经济现象,深刻相识到该经济过程的本质。通常线性回来函数E(M)=向+因为是视察不到的,利用样本得到的只是对E(y,)=A)+4的的估计,即对向和向的估计。在对回来函数进行估计之前应当对随机误差项场做出如下假定。(1),是一个随机变量,,的取值听从概率分布,E(%)=0。(3) D(m,)=Eut-E(U1)2=E(Mr)2=Cr2。称出具有同方差性。(4) %为正态分布(依据中心极限定理)。以上四个假定可作如下表达。%N(0,2)o(5) Cov(mi,Uj)=E(ui-E(Ui)(M7-E(wz)=E(wf,uj)=0,(Jj)。含义是不同观测值所对应
4、的随机项相互独立。称为出的非自相关性。(6) H是非随机的。(7) Cov(w,Xi)=E(m,-E(wr)(Xi-E(Xf)=Ewf(xi-E(xl)=Ew1X1.ME(M)=E(wfH)=0.如与Xi相互独立。否则,分不清是谁对M的贡献.(8)对于多元线性回来模型,说明变量之间不能完全相关或高度相关(非多重共线性)。在假定(1),(2)成立条件下有E(M)=E(y%+用为+%)=为+xt2.最小二乘估计(O1.S)对于所探讨的经济问题,通常真实的回来直线是观测不到的。收集样本的目的就是要对这条真实的回来直线做出估计。怎样估计这条直线呢?明显综合起来看,这条直线处于样本数据的中心位置最合理。
5、怎样用数学语言描述“处于样本数据的中心位置”?设估计的直线用yl=o+A为表示。其中必称M的拟合值(fittedvalue),瓦和A分别是为和用的估计量。观测值到这条直线的纵向距离用力表示,称为残差。yt=yt+ul=o+fixt+ut称为估计的模型。假定样本容量为兀(1)用“残差和最小”确定直线位置是一个途径。但很快发觉计算“残差和”存在相互抵消的问题。(2)用“残差肯定值和最小”确定直线位置也是一个途径。但肯定值的计算比较麻烦。(3)最小二乘法的原则是以“残差平方和最小”确定直线位置。用最小二乘法除了计算比较便利外,得到的估计量还具有优良特性。(这种方法对异样值特别敏感)设残差平方和用Q表
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 02 一元 线性 回归 模型
