多重线性回归( 二 )


多重线性回归

文章插图
;备择假设
多重线性回归

文章插图

多重线性回归

文章插图
不全为0 。检验统计量为F,计算公式为:
多重线性回归

文章插图
其中:
多重线性回归

文章插图
表示S回;
多重线性回归

文章插图
表示S残 。2.自变数的假设检验 。(1) 偏回归平方和检验 。回归方程中某一自变数
多重线性回归

文章插图
的偏回归平方和(sum of squaresfor partial regression),表示从模型中剔除
多重线性回归

文章插图
后引起的回归平方和的减少量 。偏回归平方和用SS回归
多重线性回归

文章插图
表示,其大小说明相应自变数的重要性 。检验统计量F的计算公式为:
多重线性回归

文章插图
(2) 偏回归係数的
多重线性回归

文章插图
检验 。偏回归係数的t检验是在回归方程具有统计学意义的情况下,检验某个总体偏回归係数是否等于0的假设检验,以判断相应的自变数是否对因变数y的变异确有贡献 。
多重线性回归

文章插图
检验统计量t的计算公式为:
多重线性回归

文章插图
式中,
多重线性回归

文章插图
为第
多重线性回归

文章插图
偏回归係数的标準误 。自变数的选择在许多多重线性回归中,模型中包含的自变数没有办法事先确定,如果把一些不重要的或者对因变数影响很弱的变数引人模型,则会降低模型的精度 。所以自变数的选择是必要的,其基本思路是: 儘可能将对因变数影响大的自变数选入回归方程中,并儘可能将对因变数影响小的自变数排除在外,即建立所谓的“最优”方程 。1.筛选标準与原则 。对于自变数各种不同组合建立的回归模型,使用全局择优法选择“最优”的回归模型 。(1) 残差平方和缩小与决定係数增大 。如果引人一个自变数后模型的残差平方和减少很多,那幺说明该自变数对因变数y贡献大,将其引入模型;反之,说明该自变数对因变数y贡献小,不应将其引入模型 。另一方面,如果某一变数剔除后模型的残差平方和增加很多,则说明该自变数对因变数y贡献大,不应被剔除;反之,说明该自变数对因变数y贡献小,应被剔除 。决定係数增大与残差平方和缩小完全等价 。(2) 残差均方缩小与调整决定係数增大 。残差均方缩小的準则是在残差平方和缩小準则基础上增加了
多重线性回归

文章插图
因子,它随模型中自变数p的增加而增加,体现出对模型中自变数个数增加所实施的惩罚 。调整决定係数增大与残差均方缩小完全等价 。(3)
多重线性回归

文章插图
统计量 。由C.L.Mallows提出,其定义为:
多重线性回归