什么是自由度?在统计中自由度是什么?

【什么是自由度?在统计中自由度是什么?】什么是自由度(统计学中的自由度是什么?)一位读者问我是否可以尝试解释自由度在统计学中的含义 。从那以后 , 我一直在想 , 因为这个请求是如此谨慎 , 就像某种野兽一样 , 我不确定我是否能安全地将它击倒在地 。自由度不容易解释 , 它们出现在许多不同的情况下 , 其中一些在统计上是高级和复杂的 。在数学上 , 它们在技术上被定义为随机向量场的维数 。

什么是自由度?在统计中自由度是什么?

文章插图
但我们不会对此进行讨论 , 因为自由度通常不是您进行统计分析所需要知道的 , 除非您是研究统计学家或研究统计理论的人 。仍然想知道 , 为了冒险和好奇 , 这里有一些例子可以提供统计的基本要点 。不同的自由度首先忘记统计 , 想象你是一个喜欢戴帽子的有趣的人 , 你不在乎自由度是多少 , 你相信多样性是生活的调味品 。不幸的是 , 您有限制 , 您只有 7 顶帽子 。但是 , 您想每天戴不同的帽子 。
在第一天 , 您可以戴上 7 顶帽子中的任何一个 。第二天可以从剩下的 6 顶帽子中选择 , 第三天可以从剩下的 5 顶帽子中选择 , 以此类推 。在第 6 天 , 您可以从本周未戴的帽子中再选择 2 顶帽子 。但是在你选好帽子 6 天后 , 在 7 天内你就没有帽子可供选择了 。你必须戴上剩下的最后一顶帽子 。您有 7 - 1 = 6 天的“帽子”免费帽子可以更换!这是统计学中的自由度思想 。自由度通常被广义地定义为在估计统计参数时数据可以自由变化的“观察”(信息片段)的数量 。自由度:单样本 t 检验 现在想象一下 , 您没有戴帽子 , 开始进行数据分析 。你有一个包含 10 个值的数据集 , 如果你不估计 , 每个值都可以取任意数字 , 对吗?每个值都可以完全自由变化 。但是 , 如果您想用 1 个样本的 t 检验来检验 10 个样本的总体均值 , 那么您现在对均值有一个约束估计 。这个约束到底是什么?根据定义 , 必须满足以下关系:数据中所有值的总和必须等于 nx 的均值 , 其中 n 是数据集中值的个数 。如果一个数据集有 10 个值 , 则 10 个值之和必须等于均值 x 10 。如果 10 个值的均值是 3.5(可以选择任意数字) , 此约束要求10 个值的总和必须等于 10 x 3.5 = 35 。有了这个约束 , 数据集的第一个值可以自由变化 。所有 10 个数值和 35 的任何值仍然是可能的 。
第二个值也可以自由变化 , 因为无论您选择什么值 , 它仍然允许总共 35 种可能性 。其实前9个值可以是任何值 , 包括这2个例子:34, -8.3, -37, -92, -1, 0, 1, -22, 99 0. 1、0.2、0.3、0.4、0.5、0.6、0.7、0.8 , 0.9 但只有当所有 10 个值的总和为 35 且平均值为 3.5 时 , 第十个值不能更改 。必须是特定数字:34, -8.3, -37, -92, -1, 0, 1, -22, 99 -----> 10TH 值必须是 61.@ > 3 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9 ----> 10TH 值必须是 30.5 所以你有 10 - 1 = 9 个自由度 , 无论你使用什么样本大小或你的在使用样本均值时 , 最后一个值不能随意变化 , 最终得到 n-1 个自由度 , 其中 n 是样本大小 。或者 , 自由度的数量等于“观察”的数量减去观察之间的期望关系(例如 , 参数估计的数量) 。对于单样本 t 检验 , 一个自由度估计平均值 , 其余 n-1 个自由度估计变异性 。自由度定义了具体的t分布 , 用于计算t检验p值和t值 。