六 SPSSSPSS之回归分析衍生方法(图文+数据集)( 三 )


针对问题:当自变量为有序/无序的变量
解决办法:根据数据情况进行迭代搜索,找到适当的变换方法对原始分类变量进行转换,将原始变量一律转换为连续性评分,然后再进行方程拟合,分类变量越多优势越明显,从实用的角度出发,该方法可以被作为一种探索性方法使用
案例:生育子女数的回归模型
现收集了一批妇女的曾生子女数、年龄、居住地类别(1:城市,2:农村)、受教育程度(1~5分别代表文盲半文盲、小学、初中、高中、大学及以上),请建立后三个变量对曾生子女数的回归模型
红框是教育程度的哑变量编码,我们可以直接利用与age、area、四个哑变量进行线性回归建模(分析--回归--线性),但是我们现在利用系统把edu变量转换成连续性
1 20 1 3 0 1 0 01 22 2 4 0 0 1 02 24 2 3 0 1 0 01 25 1 5 0 0 0 11 28 1 5 0 0 0 12 30 2 4 0 0 1 02 32 1 5 0 0 0 12 34 2 5 0 0 0 12 36 1 4 0 0 1 03 38 2 2 1 0 0 02 40 1 3 0 1 0 03 42 2 3 0 1 0 03 44 2 2 1 0 0 03 45 1 2 1 0 0 04 48 1 1 0 0 0 05 50 2 1 0 0 0 0
建模(分析--回归--最佳尺度)
定义变量度量
结果如下
R2用来衡量模型的可用性
系数里面有回归的系数
主要看相关性和容差,重要性其实有点类似标化回归系数
回到数据视图,可以看到,各变量经过最佳尺度变换,对分类或有序变量进行了数值量化后的数据列,各数据轨迹列由左往右,首列为因变量,其他列与自变量的顺序一致 。
【六SPSSSPSS之回归分析衍生方法(图文+数据集)】结合查看“转换图”,我们查看图知道文盲半文盲和小学间差了0.25,文化程度回归系数为-0.446,所以小学比文盲半文盲平均少生0.25*0.446约等于1个小孩