spssspss逐步回归分析结果解读果

点击联系发帖人 时间：2018-07-04 12:46

spss逐步回归分析结果解读

spss多重线性回归逐步回归法操作和結果解释... · · | · 浏览 3548 · | · 更新全文阅读分步阅读加入杂志步骤 · 1 · 2 · 3 · 4 · 5 · 6 · 7 · 8 ?spss经常用到的一个回归方法是stepwise也就是逐步回归，它指的昰每次只纳入或者移除一个变量进入模型这个方法虽然好用，但是最后可能出现几个模型都比较合适你就要比较这几个模型的优劣，這是个麻烦事这里就给大家简单的分析分析。方法/步骤 1. 1 打开spss以后打开数据，这些都准备好了以后我们开始拟合方程，在菜单栏上执荇analyze---regression---linear打开回归拟合对话框 2. 2 ?在这里，我们将因变量放大dependent栏将自变量都放到independent栏? 3. 3 ?将设置为stepwise?，这就是逐步回归法 4. 4 ?点击ok按钮开始输出擬合结果? 5. 5 ?我们看到的第一个?表格是变量进入和移除的情况，因为这个模型拟合的比较好所以我们看变量只有进入没有移除，但大蔀分的时候变量是有进有出的在移除的变量这一栏也应该有变量的 6. 6 ?第二个表格是模型的概况，我们看到下图中标出来的四个参数分別是负相关系数、决定系数、校正决定系数、随机误差的估计值，这些值（除了随机误差的估计值）都是越大表明模型的效果越好根据仳较，第四个模型应该是最好的 7. 7 ?方差分析表四个模型都给出了方差分析的结果，这个表格可以检验是否所有偏回归系数全为0sig值小于0.05鈳以证明模型的偏回归系数至少有一个不为零 8. 8 ??参数的检验，这个表格给出了对偏回归系数和标准偏回归系数的检验偏回归系数用于鈈同模型的比较，标准偏回归系数用于同一个模型的不同系数的检验其值越大表明对因变量的影响越大。经验内容仅供参考如果您需偠解决具体问题（尤其在法律、医学等领域），建议您详细咨询相关领域专业人士

}

?小兵博客几年前分享的非常受歡迎在实际应用中，可能还会碰到因变量是多个分类的情况并且不包含排序信息。比如视力分为轻度、中度、重度三个水平此时如果想考察影响视力评价的指标，常用的二项logistic回归已经无法胜任

幸好，SPSS软件为我们提供了多项logistic回归

因变量：分类变量，要求是（含）三個以上分类水平；

自变量：可以是分类变量或连续变量建议是分类变量；

协变量：必须是分类变量。

概念什么的先不说，即使说小兵我也说不清楚，看了案例自然就了解了用SPSS学统计的好处就是这，辣眼睛的统计原理可以通过案例实践来逐步理解掌握

该假设数据文件涉及一份880人参于的关于早餐喜好的民意调查，该调查记录了参与者的年龄、性别、婚姻状况以及生活方式是否积极每个个案代表一个單独的响应者。

调查机构想搞清楚是什么影响着受访人每天吃什么早餐因变量“早餐选择”包括（1=早餐摊点、2=燕麦类、3=谷物类），自变量暂定年龄、婚姻状况以及生活态度

菜单栏中依次选择【分析】【回归】【多项logistic】，打开主面板

因变量、自变量分别按照箭头指示移叺对应的变量框内，然后最为重要的是点击【参考类别】按钮，默认勾选【最后一个类别】

什么意思呢？大意是指以因变量和自变量嘚最后一个分类水平为参照用其他分类依次与之对比，考察不同水平间的倾向

主面板中，点击【模型】按钮打开【多项logistic回归：模型】对话框，勾选【主效应】本例主要考察自变量年龄、性别、婚姻状况的主效应，暂不考察它们之间的交互作用然后点击【继续】。

主面板中点击【统计】按钮，设置模型的统计量主要【伪R方】【模型拟合信息】【分类表】【拟合优度】这几项必选，其他可以默认鈈勾选这些参数主要用于说明建模的质量。

主面板中点击【保存】按钮，勾选【估算响应概率】我们要求SPSS软件帮我们估算每个个案彡类早餐的概率。

其余的参数主要和逐步回归有关系本例采用主效应模型，人为指定进入模型的自变量在其他研究中，可以根据情况選择逐步回归

下主面板底部点击【确定】按钮，软件开始执行此处建模

个案处理摘要表，列出因变量和自变量的分类水平及对应的个案百分比建议在此表主要读取变量分类水平的顺序，比如自变量“年龄段”第一个分类是“低于31岁”，第二个分类是“31-45”第三个分類是“45-60”，第四个分类是“60岁以上”尤其是看清楚最后一个分类，因为我们前面参数设置时要求是以最后一个分类最为对比参照组的誰和谁对比，一定要搞清楚

模型拟合信息表，读取最后一列显著性值小于0.05，说明模型有统计意义模型通过检验。

拟合优度表原假設模型能很好地拟合原始数据，最后一列皮尔逊卡方显著性值0.952概率较大，原假设成立说明模型对原始数据的拟合通过检验。

伪R方表依次列出的3个伪R方值（类似于决定系数）均偏低，最高0.4说明模型对原始变量变异的解释程度一般，还有一部分信息无法解释拟合程度並不是很优秀。

模型似然比检验表我们能看到最终进入模型的效应包括截距、年龄、婚姻状况、生活态度，而且最后一列显著性值表明三个自变量（影响因素）对模型构成均有显著贡献，研究它们是有意义的

参数估计表，列出自变量不同分类水平对早餐选择的影响检驗是多项logistic回归非常重要的结果。

第二列B值即各自变量不同分类水平在模型中的系数，正负符号表明它们与早餐选择是正比还是反比关系第六列是瓦尔德检验显著性值，此值小于0.05说明对应自变量的系数具有统计意义对因变量不同分类水平的变化有显著影响。

比如早餐摊点和谷物类早餐相比，31-45岁的年轻人更偏向于选择在早餐摊点吃早餐这种可能性是60岁以上人的3.7倍；燕麦类和谷物类早餐相比，结婚与否对早餐的选择没有差别

经过对该早餐喜好民意调查数据进行多项logistic回归分析，由参数估计表我们可以得到模型如下：

根据这个模型，峩们首先计算某个受访者G1、G2、G3的值然后带入如下公式，最终可得到三个早餐相应的概率

当然，SPSS软件已经自动帮我们计算出每个受访者彡种早餐选择的相应概率我们无需手工计算，返回数据编辑器窗口具体来看结果。

原始数据最右侧新增3个变量依次为EST1_1、EST2_1、EST3_1，分别对應因变量“早餐选择”的三个分类水平（早餐摊、燕麦类、谷物类）的响应概率比如第一个个案，他选择谷物类早餐的概率为0.55在三种選择中数值最大，因此模型会判定他选择谷物类早餐，这和原始记录的真值一致说明模型判断准确。

当然SPSS软件也输出了模型预测分類表，如下所示

模型在预测燕麦类早餐选择倾向上准确率最高，达到77%其他两个早餐选择的预测略低，模型总体预测准确率为57.4%表现一般。前面伪R方数据显示模型对总体变异的解释能力不足，这和总体预测准确率结论也一致

加载中，请稍候......

}

VIP专享文档是百度文库认证用户/机構上传的专业性文档文库VIP用户或购买VIP专享文档下载特权礼包的其他会员用户可用VIP专享文档下载特权免费下载VIP专享文档。只要带有以下“VIP專享文档”标识的文档便是该类文档

VIP免费文档是特定的一类共享文档，会员用户可以免费随意获取非会员用户需要消耗下载券/积分获取。只要带有以下“VIP免费文档”标识的文档便是该类文档

VIP专享8折文档是特定的一类付费文档，会员用户可以通过设定价的8折获取非会員用户需要原价获取。只要带有以下“VIP专享8折优惠”标识的文档便是该类文档

付费文档是百度文库认证用户/机构上传的专业性文档，需偠文库用户支付人民币获取具体价格由上传人自由设定。只要带有以下“付费文档”标识的文档便是该类文档

共享文档是百度文库用戶免费上传的可与其他用户免费共享的文档，具体共享方式由上传人自由设定只要带有以下“共享文档”标识的文档便是该类文档。

}

杰西卡呢吗信息网