多重线性回归


多重线性回归

文章插图
多重线性回归【多重线性回归】多重线性回归(multiple linear regression) 是简单直线回归的推广,研究一个因变数与多个自变数之间的数量依存关係 。多重线性回归用回归方程描述一个因变数与多个自变数的依存关係,简称多重回归 。
基本介绍中文名:多重线性回归
外文名:multiple linear regression
简称:多重回归
所属学科:数学
相关概念:偏回归係数,残差,多重共线性等
基本信息多重线性回归的数学模型为:
多重线性回归

文章插图
式中,
多重线性回归

文章插图
为因变数,是随机定量的观察值;
多重线性回归

文章插图

多重线性回归

文章插图
个自变数;
多重线性回归

文章插图
为常数项,
多重线性回归

文章插图
称为偏回归係数(partial regression cofficient)。
多重线性回归

文章插图
表示在其他自变数固定不变的情况下,自变数
多重线性回归

文章插图
每改变一个单位时,其单独引起因变数y的平均改变数 。
多重线性回归

文章插图
为随机误差,又称为残差(residual),它是y的变化中不能用自变数解释的部分,服从
多重线性回归

文章插图
分布 。由样本估计的多重线性回归方程为:
多重线性回归

文章插图
式中,
多重线性回归

文章插图
为在各x取一组定值时,因变数y的平均估计值或平均预测值 。
多重线性回归

文章插图

多重线性回归

文章插图
的样本估计值 。不能直接用各自变数的普通偏回归係数的数值大小来比较方程中它们对因变数y的贡献大小,因为p个自变数的计量单位及变异度不同 。可将原始数据进行标準化,即
多重线性回归

文章插图
然后用标準化的数据进行回归模型拟合,此时获得的回归係数记为
多重线性回归

文章插图
,称为标準化偏回归係数(standardized partial regression coefficient ),又称为通径係数(pathcoefficient) 。标準化偏回归係数
多重线性回归

文章插图
绝对值较大的自变数对因变数y的贡献大 。参数估计多重线性回归分析中回归係数的估计也是通过最小二乘法(method of least square),即寻找适宜的係数
多重线性回归

文章插图
使得因变数残差平方和达到最小 。其基本原理是: 利用观察或收集到的因变数和自变数的一组数据建立一个线性函式模型,使得这个模型的理论值与观察值之间的离均差平方和最小 。假设检验建立的回归方程是否符合资料特点,以及能否恰当地反映因变数y与p个自变数的数量依存关係,就必须对该模型进行检验 。1.回归方程的检验与评价 。无效假设