SWEBOK软件工程知识体系 - 15.工程基础( 三 )


估计的类型[2*,c7s3,c8s1],有两种类型的估计:即点估计和区间估计 。当我们用统计量的值来估计总体参数时,我们得到一个点估计 。顾名思义,点估计给出被估计参数的点值 。
虽然经常使用点估计,但它们为许多问题留下了空间 。例如,我们没有被告知任何关于误差的可能大小或点估计的统计特性 。因此,我们可能需要用样本量和估计方差来补充点估计 。或者,我们可以使用区间估计 。区间估计是一个随机区间,区间的上下限是样本观测值和样本量的函数 。限值的计算基于一些关于限值所基于的点估计的抽样分布的假设 。
估计量的性质 。估计量的各种统计性质被用来决定估计量在给定情况下的适当性 。最重要的性质是估计量是无偏的,有效的,并且与总体一致 。
假设检验[2*,c9s1] 。假设是关于参数可能值的陈述 。例如,假设有人声称一种新的软件开发方法可以减少缺陷的发生 。在这种情况下,假设缺陷的发生率降低了 。在假设检验中,我们根据样本观察来决定是否接受或拒绝提出的假设 。
为了检验假设,形成了无效假设和替代假设 。零假设是不变的假设,表示为H0 。另一种假设写成H1 。值得注意的是,替代假设可能是片面的,也可能是双面的 。例如,如果我们有一个零假设,即总体平均值不小于某个给定值,则另一个假设是总体平均值小于该值,我们将进行单侧检验 。然而,如果我们假设总体平均值等于某个给定值,则另一种假设是总体平均值不等于某个给定值,我们将进行双边检验(因为真实值可能小于或大于给定值) 。
为了检验一些假设,我们首先计算一些统计量 。随着统计量的计算,定义了一个区域,使得在统计量的计算值落在该区域的情况下,无效假设被拒绝 。这个区域称为临界区域(也称为置信区间) 。在假设检验中,我们需要根据所获得的证据来接受或拒绝无效假设 。我们注意到,一般来说,替代假设是兴趣假设 。如果统计量的计算值不在临界区域内,那么我们就不能拒绝零假设 。这表明没有足够的证据相信替代假设是正确的 。
由于决策是在抽样观察的基础上作出的,因此可能出现错误;下表概述了此类错误的类型 。
在假设检验中,我们的目标是最大化检验的力量(1-b的值),同时确保I型错误的概率(a的值)保持在一个特定的值内——通常为5% 。
应注意,假设检验的构造包括识别统计量以估计参数,以及定义临界区域,使得如果统计量的计算值落在临界区域中,则拒绝零假设 。
2.2. 相关和回归的概念
许多统计调查的一个主要目标是建立关系,使人们能够根据其他变量预测一个或多个变量 。虽然用另一个量精确地预测一个量是可取的,但这几乎是不可能的,而且在许多情况下,我们必须对估计平均值或期望值感到满意 。
用相关和回归的方法研究了两个变量之间的关系 。这两个概念将在下面的段落中简要解释 。
相关性 。两个变量之间的线性关系强度用相关系数来衡量 。在计算两个变量之间的相关系数时,我们假设这些变量度量同一实体的两个不同属性 。相关系数取-1到+1之间的值 。值-1和+1表示变量之间的关联完美的情况,即给定一个变量的值,可以无误差地估计另一个变量 。正相关系数表示正相关关系,即如果一个变量增加,另一个变量也会增加 。另一方面,当变量负相关时,一个变量的增加导致另一个变量的减少 。

SWEBOK软件工程知识体系 - 15.工程基础

文章插图
重要的是要记住,相关性并不意味着因果关系 。因此,如果两个变量是相关的,我们不能得出结论,一个导致另一个 。