岭回归理论知识.docx
《岭回归理论知识.docx》由会员分享,可在线阅读,更多相关《岭回归理论知识.docx(3页珍藏版)》请在优知文库上搜索。
1、一、普通最小二乘估计带来的问题当自变量间存在多重共线性时,回归系数估计的方差就很大,估计值就很不稳定。此时模型或数据的微小变化有可能造成系数估计的较大变化,对预测值产生较大影响。下面进一步用一个模拟的例子来说明这一点。例1假设勺,与y的关系服从线性回归模型y=10+2xl3x2+给定占,的io个值,如下表:表1.现在我们假设回归系数与误率是未知的,用普通最小二乘法求回归系数的估计值得0=ll.292,1=ll.307,2=-6,591而原模型的绒BCFl0,Bl=2,Bj3看来相差太大。计算X1,X2的样本相关系数得rm.986,表明XI与2之间高度相关。二.、岭回归提出的背景岭回归是1970
2、年由Hoerl和Kennard提出的,它是一种有偏估计,是对最小二乘估计的改良。设有多重线性回归模型y=由+,参数夕的最小二乘估计为6=(W1zy那么(|/-耶=2tr(ZT)-1当自变量出现多重共线性时,普通最小二乘估计明显变坏。当MrlnO时,J就会变得很大,这时,尽管6是夕的无偏估计,但力很不稳定,在具体取值上与真值有较大的偏差,甚至会出现与实际意义不符的正负号。设想给无T加上一个正常数矩阵A/(k0,那么X*+A/接近奇异的程度就会变小。先对数据作标准化,标准化后的设计阵仍用X表示。称沙岭砌出eo速躲加A成为岭参数。当A=0时的岭回归估计就是普通的最小二乘估计。因为岭参数力不是唯一确定
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 回归 理论知识
