六 SPSSSPSS之回归分析衍生方法(图文+数据集)

SPSS(六)SPSS之回归分析衍生方法(图文+数据集)
我们知道线性回归是有适用条件的
假如不满足以上的条件,还能做回归分析吗?其实有一大类针对此相关的方法
曲线拟合过程 针对问题:自变量、因变量无线性趋势
有明确的公式:利用变量变换将曲线直线化,然后加以拟合
关系不明:基于图形观察,拟合可能的曲线,从中挑选出最为合适的一个
高次方曲线:一、二、三次方曲线
指数、对数、幂曲线
特殊类型曲线:S形曲线、生长曲线等
简单来说分两种情况
案例:通风时间和毒物浓度的曲线方程(第一种情况)
根据文献资料,随着通风时间的增加,密闭空间内污染物的浓度应当呈指数方程下降 。现考察某通风设备的换气效果,在室内放置了某种挥发性物质(模拟毒物),待其充分分散到室内空气中后开始通风,每一分钟测量一次室内空气中的毒物浓度,请建立时间与空气中毒物浓度的指数方程 。
(已有明确的方程
,按此拟合即可 。等价于先进行变量变换,然后拟合直线方程)
数据集如下
1 2.12502 1.74203 1.23604 1.12705 .73106 .46907 .40008 .38109 .284010 .276011 .062012 .061013 .040814 .042815 .0305
首先进行变量变化(转换----计算变量)
建一个新变量,对原始的y进行ln运算,使之ln(y)与x成线性关系
建模
结果查看,一般我们只关注和几个地方
R方:决定系数,衡量模型可用性及模型信息量的表达,越接近1越好
Anova:里面的Sig.表示lny与x解决问题使用线性回归模型是否可行的
系数a:Sig.这个因变量纳入这个模型有没有意义
还有一个比较快的方法,不用计算出新的变量(分析----回归----曲线估计)
结果和刚才线性回归查看方法差不多
不过有图形展现出来
线性回归想保存预测值方法 保存--预测值将模型信息输出到XML文件
加权最小二乘法
加权最小二乘法是对原模型进行加权,使之成为一个新的不存在异方差性的模型,然后采用普通最小二乘法估计其参数的一种数学优化技术 。
针对问题:方差齐性不齐
一般我们如何发现线性回归的方差齐性不齐的呢,一般是在做残差分析的时候,假如我们遇到的标准化残差图如下(残差随着自变量的变大而增大或者随着自变量的变大而减小,就证明有问题)
1.以地区为观察单位调查某种事物的发生率
2.研究通货膨胀和失业率对股票价格的影响
高价股票的波动一般都会大于低价股票
针对这种问题解决办法
需要人为调控各案例在回归中的重要性,根据用户提供的可能预测因变量变异大小的指标,在拟合时对变异较小(即测量更精确)的测量值赋予较大的权重(现实生活中也会有反过来的情况)
为了解决上述数据分析的问题,SPSS专门提供了加权最小二乘法,它可根据用户提供的权重变量的大小为不同的数据不同权重 。需要指出的是,加权最小二乘法是一种带有倾向性的数据拟合方法,如果因变量方差实际并无波动,或选择了错误的变量用于权重,那么它的拟合结果不如普通最小二乘法准确 。
案例:不等量样品数据的回归方程
实验中收集得15对数据,每对数据都是将n份样品混合后测得的平均结果,但各对数据的n大小不等,试求出X对Y的直线回归方程
2 188 4.903 195 4.5811 207 4.4016 217 4.1818 224 3.9019 236 3.8520 246 3.7722 255 3.5418 266 3.4715 275 3.3412 285 3.195 295 3.085 312 2.944 320 2.791 329 2.49
分析----回归----权重估计
结果如下