生存分析统计学.ppt
《生存分析统计学.ppt》由会员分享,可在线阅读,更多相关《生存分析统计学.ppt(78页珍藏版)》请在优知文库上搜索。
1、复复 习习 LogisticLogistic回归模型是一种概率模型,适合于病例对照研究、随访研究和横断面研究,且结果发生的变量取值必须是二分的或多项分类的。 可用影响结果变量发生的因素为自变量与因变量建立回归方程。复复 习习 1. Logistic回归分析的数据结构 2. Logistic回归分析的模型 3. 筛选变量的常用方法 4. Logistic回归分析的结果解释目的:目的:作出以多个自变量(影响因素)估计应变量(结果变量)的logistic回归方程资料:资料:1. 应变量为反映某现象发生与不发生的二值变量;2. 自变量(影响因素)可能是二值数据或等级资料或计量资料。分类变量要数量化用途
2、:用途:研究某种疾病或现象发生和多个危险因素(或保护因子)的数量关系1. Logistic1. Logistic回归模型的数据结构 设资料中有一个因变量Y、p个自变量X1, X2,Xp,对每个实验对象共有n次观测结果,可将原始资料列成表1形式。 表1. LogisticLogistic回归模型的数据结构实验对象 Y X1 X2 X3 . XP 1 Y1 a11 a12 a13 a1p 2 Y2 a21 a22 a23 a2p 3 Y3 a31 a32 a33 a3p n Yn an1 an2 an3 anp 其中:Y取值是二值或多项分类5 表2. 肺癌与危险因素的调查分析例号 是否患病 性别
3、吸烟 年龄 地区 1 0 1 0 30 0 2 0 0 1 46 1 3 1 0 0 35 1 30 1 0 0 26 1 是否患病:1代表否, 0代表是 性 别:1代表男, 0代表女 吸 烟:1代表吸烟,0代表不吸烟 地 区:1代表农村,0代表城市 表3. 配对资料(1:1)对子号 病例 对照 X1 X2 X3 X1 X2 X3 1 1 3 0 1 0 1 2 0 3 1 1 3 0 3 0 1 2 0 2 0 10 2 2 2 0 0 0注:X1蛋白质摄入量,取值:0,1,2,3 X2不良饮食习惯,取值:0,1,2,3 X3 精 神 状 况,取值:0,1,2 2 2、 LogisticLo
4、gistic回归模型回归模型 令: Y=1 发病(阳性、死亡、治愈等) Y=0 未发病(阴性、生存、未治愈等) 将发病(Y=1)的概率记为P,它与自变量x1, x2,xp之间的Logistic回归模型为: )exp(1)exp(110110ppppXXXXP ppXXPP 110)1/(ln定义:为Logistic变换,即: )1/(ln)(PPPLogitppXXPLogit 110)(2.Logistic2.Logistic回归的模型回归的模型3.3.筛选变量的常用方法筛选变量的常用方法 向前法(forward selection) 后退法(backward selection) 逐步回归
5、法(stepwise selection)Variables in the Equation.143.0479.3881.0021.1541.0531.265-6.0431.9669.4481.002.0023.0211.3754.8301.02820.5051.386303.296.149.0547.7201.0051.1611.0451.289-7.4032.5228.6151.003.001X3ConstantStep1aX2X3ConstantStep2bBS.E.WalddfSig.Exp(B)LowerUpper95.0% C.I.for EXP(B)Variable(s) ent
6、ered on step 1: X3.a. Variable(s) entered on step 2: X2.b. 4.Logistic4.Logistic回归的结果解释回归的结果解释4.Logistic4.Logistic回归的结果解释回归的结果解释 设第i个因素的回归系数为bi,表示当有多个自变量存在时,其它自变量固定不变的情况下,自变量Xi每增加一个单位时,所得到的优势比的自然对数。也就是其它自变量固定不变的情况下,自变量Xi每增加一个单位时,影响因变量Y=0发生的倍数 设第i个因素的回归系数为bi 当bi0时,对应的优势比ORi=exp(bi)1,说明该因素是危险因素; 当bi0时,
7、对应的优势比ORi=exp(bi)4)=P1=32/35=0.914286第二行的生存率S(T5)=P1P2=32/3530/32=0.8571437.计算各生存率的标准误。说明抽样误差的大小,式中n为样本含量,i为秩次, 编秩编秩(1)生 存 月生 存 月数数(2)期 初 病期 初 病例数例数(3)死 亡 例死 亡 例数数(4)死 亡 概死 亡 概率率(5)生 存 概生 存 概率率(6)生 存 率生 存 率(7)生存率标生存率标准误准误(8)1-343533/3532/350.9142860.0473184-553222/3230/320.059149683011/3029/300.8285
8、710.0637057-992933/2926/290.7428570.07387610102611/2625/260.7142860.07636011112511/2524/250.6857140.07846912-14122433/2421/240.6000000.0828081512+2100/2121/210.6000000.08280816132011/2019/200.5700000.08392617141911/1918/190.5400000.08470118-19161822/1816/180.4800000.08525620171611/1615/160.4500000.0
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生存 分析 统计学
