第4章一元线性回归模型.ppt
《第4章一元线性回归模型.ppt》由会员分享,可在线阅读,更多相关《第4章一元线性回归模型.ppt(51页珍藏版)》请在优知文库上搜索。
1、第四章第四章 一元线性回归一元线性回归模型模型第1节 引言p回归分析起源于生物学研究,是由英国生物学家兼统计学家高尔登(Francis Galton 1822-1911)在19世纪末叶研究遗传学特性时首先提出来的。p高尔登在1889年发表的著作自然的遗传中,提出了回归分析方法以后,很快就应用到经济领域中来,而且这一名词也一直为生物学和统计学所沿用。p回归的现代涵义与过去大不相同。一般说来,回归是研究因变量随自变量变化的关系形式的分析方法。其目的在于根据已知自变量来估计和预测因变量的总平均值。(Francis Galton 1822-1911)一、回归分析和相关分析一、回归分析和相关分析(1 1
2、)函数关系。)函数关系。函数关系反映客观事物之间存在着严格的依存关系。在这种关系中,当一个或几个变量取值一定时,另一个变量有确定的值与之相对应,并且这种关系可以用一个确定的数学表达式反映出来。一般把作为影响因素的变量称为自变量,把发生对应变化的变量称为因变量。(2 2)相关关系。)相关关系。相关关系反映的是客观事物之间的非严格、不确定的线性依存关系。这种线性依存关系有两个显著的特点:客观事物之间在数量上确实存在一定的内在联系。表现在一个变量发生数量上的变化,要影响另一个变量也相应地发生数量上的变化。客观事物之间的数量依存关系不是确定的,具有一定的随机性。表现在当一个或几个相互联系的变量取一定数
3、值时,与之对应的另一个变量可以取若干个不同的数值。这种关系虽然不确定,但因变量总是遵循一定规律围绕这些数值的平均数上下波动。p相关关系与函数关系又有十分密切的联系。在实际中,由于观测和观测误差等原因,函数关系往往是通过相关关系表现出来的;而在研究相关关系中,又常常是用函数关系作为工具,以相应的函数关系的数学表达式来表现相关关系的一般数量联系。回归分析与相关分析的联系p它们是研究客观事物之间p相互依存关系的两个不可分割的方面p在实际工作中,一般先进行相关分析,由相关系数的大小决定是否需要进行回归分析。在相关分析的基础上建立回归模型,以便进行推算、预测,同时相关系数还是检验回归分析效果的标准。相关
4、分析需要回归分析来表明客观事物数量关系的具体形式,而回归分析则应建立在相关分析的基础上。p 相关分析是以相关关系为相关分析是以相关关系为对象,研究两个或两个以上对象,研究两个或两个以上随机变量之间线性依存关系随机变量之间线性依存关系的紧密程度。通常用相关系的紧密程度。通常用相关系数表示,多元相关时用复相数表示,多元相关时用复相关系数表示。关系数表示。回归分析回归分析p 回归分析是对具有相关关系的变量之间的回归分析是对具有相关关系的变量之间的数量变化规律进行测定,研究某一随机变量数量变化规律进行测定,研究某一随机变量(因变量)与其他一个或几个普通变量(自变(因变量)与其他一个或几个普通变量(自变
5、量)之间的数量变动关系,并据此对因变量进量)之间的数量变动关系,并据此对因变量进行估计和预测的分析方法。由回归分析求出的行估计和预测的分析方法。由回归分析求出的关系式,称为回归模型。关系式,称为回归模型。二、回归模型的种类二、回归模型的种类根据自变量的多少,回归模型可以分为一元回归模型和多元回归模型。根据回归模型的形式线性与否,回归模型可以分为线性回归模型和非线性回归模型。根据回归模型所含的变量是否有虚拟变量,回归模型可以分为普通回归模型和带虚拟变量的回归模型。此外,根据回归模型是否用滞后的因变量作自变量,回归模型又可分为无自回归现象的回归模型和自回归模型。第2节 一元线性回归模型及其假设条件
6、 数学期望p早在17世纪,有一个赌徒向法国著名数学家帕斯卡挑战,给他出了一道题目:甲乙两个人赌博,他们两人获胜的机率相等,比赛规则是先胜三局者为赢家,赢家可以获得100法郎的奖励。录比赛进行到第三局的时候,甲胜了两局,乙胜了一局,这时由于某些原因中止了比赛,那么如何分配这100法郎才比较公平?p用概率论的知识,不难得知,甲获胜的概率为1/2+(1/2)*(1/2)=3/4,或者分析乙获胜的概率为(1/2)*(1/2)=1/4。因此由此引出了甲的期望所得值为100*3/4=75法郎,乙的期望所得值为25法郎。这个故事里出现了“期望”这个词,数学期望由此而来。引例引例:测量测量 50 50 个圆柱
7、形零件直径个圆柱形零件直径(见下表见下表)则这则这 50 50 个零件的平均直径个零件的平均直径为为cm14.10501012101115107988尺寸尺寸(cm)8 9 10 11 12数量数量(个)(个)8 7 15 10 10 50p甲仪器测量结果:p p乙仪器测量结果:p p两台仪器的测量结果的均值都是 a。但是用上述结果评价一下两台仪器的优劣,很明显,我们会认为乙仪器的性能更好,因为乙仪器的测量结果集中在均值附近。pE(X-EX)2 这一数字特征就是方差。p一般在计算式用下面公式进行计算 pD(X)=E(X2)-E(X)2协方差和相关系数协方差和相关系数问题问题 对于二维随机变量对
8、于二维随机变量(X,Y):已知联合分布已知联合分布边缘分布边缘分布 这说明对于二维随机变量,这说明对于二维随机变量,除了每个随机除了每个随机变量各自的概率特性以外,相互之间可能还有变量各自的概率特性以外,相互之间可能还有某种联系某种联系.问题是用一个什么样的数去反映这种联系问题是用一个什么样的数去反映这种联系.)()(YEYXEXE数数反映了随机变量反映了随机变量X,Y 之间的某种关系之间的某种关系.A.协方差和相关系数协方差和相关系数定义定义 称称)()(YEYXEXE为为X,Y X,Y 的的协方差协方差.记为记为)()(),cov(YEYXEXEYX可以证明协方差矩阵为半正定矩阵可以证明协
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 一元 线性 回归 模型