SPSS教程中文完整版.docx
图2.11选择个体数据来源的文件图2.12选择变量(4)增加变效的数据合并(【合并文件】【添加变图2.15假如子对话框四、备择试脸某航空公司38名职员性别和工资状况的调查数据,如表2.3所示,试在SPSS中进行如下操作:(1)将数据输入到SPSS的数据编辑窗口中,将gender定义为字符型变员,将Salary定义为数值型变量,并保存数据文件,命名为“试验l-l.sa,0(2)插入一个变量income,定义为数值型变量。<3)将数据文件按性别分组(4)查找工资大于40000美元的职工(5)当工资大于4000。美元时,职工的奖金是工资的2。;当工资小于40000美元时,职工的奖金是工资的10%,假设实际收入=工费+奖金,计算全部职工的实际收入,并添加到income变量中。询问是否输出频数分布表图2.1Frequencies对话框确定所要分析的变量,例如年龄在变量选择确定之后,在同一窗口匕点击“Statistics”按钮,打开统计量对话据,如下图2.2所示,选择统计输出选项。GcndcrNValidMissing4740表2.4中给出了总样本地(N),其中变故Gender的有效个数(Valid)为474个、跳失值(missing)为0。表2.5Gender频数分布表FrequencyPercentValidPercentCumulativePercentValidFemale21645.645.645.6Male25854.454.4100.0Total474100.0100.0表2.5中,FreqUenCy是频数,PerCent是按总样本必为分母计算的百分比,VaIidPerCent是以有效样本量为分母计算的百分比,CumulativePercent是累计百分比。图2.5变盘Gender的条形图,图2.6变玷Gender的饼图。GenderFr300-<1250-U2-nc150-yloo一50-Oj11.Male的条形图FemaleFemaJeGenderGender图2.5变量genderSavestandardizedvaluesasvariables,对所选择的每个变t进行标准化处理,产生相应的Z分值,作为新变量保存在数据窗口中。共变最名为相应变出名前加前缀z。标准化计算公式:Xi-XZi=单击【选项】按钮,如图2.8所示,选择须要计算的描述统计员。各描述统计址同Frequencies吩咐中的Statistics子对话框中大部分相同,这里不再重史。图2.8选项子对话框在主对话框中单击ok执行操作。结果输出与分析在结果输出你口中给出了所选变量的相应描述统计,如表2.6所示。从表中可以看到,我国上市公司前两大股东持股比例之比平均高达102.9,说结果的输出与说明<1)CaseProcessingSummary表CasePiocessiriqSiuninaiyGenderCasesValidMissingTotalNPercentNPercentNPercentCurrentSalaiyFemale216100.0%0.0%2161000%Male258100.0%0.0%2581000%在CaseProcessingSummary表中可以看出female有216个个体,MaIe258个个体,均无缺失值。<2)Descriptive表29*32o17.002.888888999999999997.003.00011118.003.222333338.003.444445555.003.667772.003.8811.00Extremes(>=40800)Stemwidth:10000Eachleaf:1case(三)<5)箱图S140.000-$120000-cu3,oootx,rrentSa产80-arySfio.ooo-$40,000-$20.000-SO-Gender图中灰色区域的方箱为箱图的主体,上中产3条线分别表示变盘值的第75、50、25百分位数,因此变址的50%视察值落在这一区域中。方箱中的中心粗线为中位数。箱图中的触须线是中间的纵向直线,上端截至线为变成的大值,下端截至线为变量的小值,四、备择试验完成卜列试验内容,并按试验(1)所附试验报告的格式撰写报告。1 .表2.7为某班级16位学生的身高数据,对其进行频数分析,并对试股报告作出说明。表2.7某班16位学生的身高数据学号性别身高(cm)学号性别身高(cm)1M1709M1502F17310M1573F16911F1774M15512M1605F17413F1696F17814M1547V15615F1728F17116F1802.测量18台电脑第记重燧,见表2.8,对其进行描述统计量分析,并对试验结果作出说明。表2.818台笔记本电腼垂出表序号12345678995%ConfidenceIntervalforMean1.owerBoundUpperBound6.25296.81715%Trimmed6.5167Mean6.4500MedianVariance.363Std.60287DeviationMinimum5.60Maximum7.80Range2.20Interquartile.95RangeSkewness.295.512Kurtosis-.612.992如上表显示。从上表u95%ConfidenceIntervalforMean”中可以得出,每晚8:30起先的半小时内广告所占时间区间估计(置信度为95%)为:(6.2529,6.8171),其中IOWerBound表示置信区间的F限,UpperBound表示置信区间的上限。点估计是:6.5350o2 .两个总体均值之差的区间估计3.3独立样本T检验对话框定义分组单.击定义组按钮,打开DefineGrOUPS对话根。在GroUPl中输入1,在GrOUP2中输入2(1表示非工会会员,2表示工会会员)。完成后单击“接着”按钮Pl到主窗口。3.4definegroups设置面口计算结果单击上图中“OK”按钮,输出结果如下图所示。<1)GroupStatistics(分组统计量)表分别给出不同总体下的样本容显、均值、标准差和平均标准误。从该表中可以数sI<2)aOne-SampleTest"(单个样本的检验)表表中的t表示所计算的T检验统计用的数值,本例中为-0.705。表中的“df”,表示H由度,本例中为9。表中的''Sigw(双尾T检验),表示统计Q的P-值,并与双尾T检脸的显著性的大小进行比较:Sig.=0.498>0.05,说明这批样本的平均产量与120无显著差异。表中的“MeanDifference",表示均值差,即样本均值与检验值120之差,本例中为一1.1000cu95%ConfidenceInternaloftheDifferencew,样本均值与检险值偏差的95%置信区间为(-4.628,2.428),置信区间包括数值0,说明样本数址与120无显著差异,符合要求。表3.5单样本T检验结果One-SampleTest4两独立样本的假设检验(两独立样本T检险)在这个例子里,考虑家庭年收入对住房支出的影响,建立的模型如下:js-+'+/其中,yi是住房支出,Xi是年收入线性回来分析的基本步骤和结果分析:(1)绘制散点图打开数据文件,选择【图形】【旧对话框】-【散点/点状】,如图5.2所示。5.2 散点图对话框选择简洁分布,刺击定义,打开了对话框,选择X变量和Y变量,如图5.3 所示。单击。k提交系统运行,结果见图5.4所示。表5.2住房支出与年收入相关系数表Correlations住房支出(千美元)年收入(千美元)住房支出(千美Pearson元)CorrelationSig.(2-tailed)N年收入(千美Pearson元)CorrelationSig.(2-tailed)N120.966(*).00020.966(*).00020120*Correlationissignificantatthe0.01level(2-tailed).从表中可得到两变量之间的皮尔逊相关系数为0966,双尾检验概率p值尾0.000<0.05,故变量之间显著相关。依据住房支出与年收入之间的散点图与相关分析显示,住房支出与年收入之间存在显著的正相关关系。在此前提F进一步进行网来分析,建立一元线性Pl来方程。(3)线性回来分析步骤1:选择菜单"【分析】>【回来】【线性】",打开1.inearRegression对话框将变该住房支出y移入Dependent列表框中,将年收入X移入Independents列表框中。在Method根中选择Enter选项,表示所选自变H全部进入回来模型.5.6Statistics子对话框 估计:输出有关回来系数的统计量,包括回来系数、回来系数的标准差、标准化的回来系数、t统计量和其对应的P值等。 置信区间:输出每个回来系数的95%的置信度估计区间。 协方差矩阵:输出说明变址的相关系数矩阵和协差阵。 模型拟合度:输出可决系数、调整的可决系数、网来方程的标准误差、网来方程F检验的方差分析。步骤3:单击绘制按钮,在PIotS子对话框中的标准化残差图选项栏中选中正态概率图复选框,以便对残差的正态性进行分析。IQOOExpeo.8-ctedCUO6-mProb04-02-00'0204060.810ObservedCumProb图5.9标准化残差的P-P图四、备择试验现有1987-2003年湖南省全社会固定资产投资总额NINV和GDP两个指标的年度数据,见卜表C试探讨全社会固定资产投资总额和GDP的数砧关系,并建立全社会固定资产投资总额和GDP之间的线性回来方程。湖南省全社会固定资产投资和GDP年度数据年份GDP(亿NINV(亿年份GDP(亿NINV(亿元)元)元)元)1987509.44120.3819952195.75231988614.07144.7119962647.16684.14管理统计学导学资料六