COX回归分析.ppt
《COX回归分析.ppt》由会员分享,可在线阅读,更多相关《COX回归分析.ppt(45页珍藏版)》请在优知文库上搜索。
1、生存分析与Cox回归分析一、基本概念一、基本概念 生存时间(survival time):疾病治疗的预后情况,一方面看结局好坏,另一方面还要看出现这种结局所经历的时间长短。所经历的时间称为生存时间。完全与不完全数据 一部分研究对象可观察到死亡,从而得到准确的生存时间,所提供的信息是完全的,称为完全数据;另一部分病人由于失访、意外事故、或到观察结束时仍存活等原因,无法知道确切的生存时间,它提供了不完全的信息,称为不完全数据(截尾数据、删失数据:censor datacensor data)。始点终点 始点终点 生存分析(survival analysis):生存时间一般是通过随访收集。不完全数据
2、提供了部分信息。须要用专门的方法进行统计处理,这类统计方法起源于对寿命资料的统计分析,故称为生存分析。研究生存时间的分布特点,估计生存研究生存时间的分布特点,估计生存率,生存曲线;率,生存曲线;对两组或多组生存率进行比较;对两组或多组生存率进行比较;了解影响生存过程的主要因素为改善了解影响生存过程的主要因素为改善预后提供指导预后提供指导。例在对资料进行描述时:5名癌症患者存活时间(月)6 10 14 20 206 10 14 20 20 n=5 n=5 平均生存时间平均生存时间,mean=18mean=18,median=7 8+25 35+50 当有截尾数据时,?KaplanmeierKap
3、lanmeier生存率曲线图生存率曲线图三、Cox回归分析(Cox regression)影响影响生存时间的长短不仅与治疗措施有关,还可能与病人的体质,年龄,病情的轻重等多种因素有关。如何找出它们之间的关系呢?对生存资料不能用多元线性回归分析。1972年英国统计学家Cox DR.提出了一种能处理多因素生存分析数据的比例危险模型(Coxs proportional harzard(Coxs proportional harzard model)model)。表表 多元线性回归分析的数据结构多元线性回归分析的数据结构实验对象实验对象 y Xy X1 1 X X2 2 X X3 3 .X.XP P
4、1 y1 y1 1 a a1111 a a1212 a a1313 a a1p1p 2 y 2 y2 2 a a2121 a a2222 a a2323 a a2p2p 3 y 3 y3 3 a a3131 a a3232 a a3333 a a3p3p n y n yn n a an1n1 a an2n2 a an3n3 a anpnp 其中:其中:y y取值是服从正态分布取值是服从正态分布多元线性回归模型多元线性回归模型 通过实验测得含有通过实验测得含有p p个自变量个自变量x1,x2,x3,x1,x2,x3,xp,xp及一个因变量及一个因变量y y的的n n个观察对象值个观察对象值,利用
5、最小二乘法利用最小二乘法原理原理,建立多元线性回归模型建立多元线性回归模型:其中其中b b0 0为截距为截距,b1,b2,b1,b2 bpbp称为偏回归系数称为偏回归系数.bibi表示当将其它表示当将其它p-1p-1个变量的作用加以固定后个变量的作用加以固定后,Xi,Xi改变改变1 1个单位时个单位时Y Y将改变将改变bibi个单位个单位.ppxbxbxbby 22110SPSS实现逐步回归方法:操作过程:操作过程:Analyze-Regression-Analyze-Regression-Linear-yLinear-y选入选入Dependent-x1Dependent-x1、x2x2、X3
6、X3选选入入Independent-Stepwise-options-okIndependent-Stepwise-options-ok 表表2 Logistic2 Logistic回归模型的数据结构回归模型的数据结构实验对象实验对象 y y X X1 1 X X2 2 X X3 3 .X.XP P 1 y1 y1 1 a a1111 a a1212 a a1313 a a1p1p 2 y 2 y2 2 a a2121 a a2222 a a2323 a a2p2p 3 y 3 y3 3 a a3131 a a3232 a a3333 a a3p3p n y n yn n a an1n1 a
7、an2n2 a an3n3 a anpnp 其中:其中:y y取值是二值或多项分类取值是二值或多项分类定义:为Logistic变换,即:)1/(ln)(logpppitppXXpLogit 110)(SPSS操作步骤:Analyze-Regression-Binary Logistic-Dependent框(y)-Covariates框(x1,x2,)-ok 设含有p个变量x1,x2,xp及时间T和结局C的 n个观察对象.其数据结构见表3。表3 COX模型数据结构实验对象 t C X1 X2 X3 .XP 1 t1 1 a11 a12 a13 a1p 2 t2 0 a21 a22 a23 a2
8、p 3 t3 0 a31 a32 a33 a3p n tn 1 an1 an2 an3 anp1、数据结构、数据结构(1)风险率(hazard rate):患者在患者在t t时刻仍存活,在时间时刻仍存活,在时间t t后的瞬间后的瞬间死亡率,以死亡率,以h(t)h(t)表示。表示。tttttth时刻尚存的病人数在的病人数死于区间),()(3、COX回归模型(Cox regression model)(2)COX回归模型的构造 多元线性回归模型:pipiiixbxbxbby 22110 设不存在因素不存在因素X1、X2、Xp的影响下,病人病人t t 时刻死亡的风险率为时刻死亡的风险率为h0(t),
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- COX 回归 分析