Bootstrap 方法2025年6月4日 | 阅读 15 分钟 引言Bootstrap 方法是一种高度可靠的统计程序,广泛应用于数学领域,用于估计从获取的数据集中进行有放回抽样后统计量的分布。 该系统涉及使用从原始数据生成的样本的估计值来评估估计量的特性,例如方差或偏差。Bootstrap 方法由 Bradley Efron 于 1979 年开发,这种重采样方法在统计推断领域得到了广泛应用。当统计量的理论抽样分布未知或难以通过分析计算时,它特别有帮助。 Bootstrap 方法或 Bootstrapping 是什么意思?Bootstrap 方法,也称为 Bootstrapping,是一种统计抽样技术,通过该技术,给定数据集会被多次抽取以创建更多的人工样本。正如统计学家 Jim Frost 所述,此过程用于计算标准误差和置信区间,并进行假设检验。事实上,bootstrapping 是一种重采样过程,即在包含来自具有放回的总体的数据集的文件上进行多次抽样。它可用于计算汇总统计量,包括均值和方差,并广泛用于机器学习中对未见过数据的模型性能进行评估。 此方法有用,可作为其他方法(如假设检验)的替代方案,因为它易于实现,同时又具有其他传统技术的一些优点。 在统计推断中,常用做法涉及抽样分布以及感兴趣的特征的标准误差。在传统的或大样本策略中,从总体中选择一个大小为 n 的样本,然后估计总体的参数,并通过从该样本推断来得出结论。然而,在实践中,只有样本数据可用,因此 bootstrapping 是一种对可用数据进行推断的可行方法。 Bootstrapping 统计量是如何工作的?bootstrap 方法涉及抽取特定大小的数据样本。从总体中获得 n,初始获得的样本称为 S。因此,而不是像在均值估计的情况下那样基于所有可能的输出建立理论分布,而是通过从 S 中进行 m 次有放回抽样来创建抽样分布。每个重采样集包含 n 个观测值。如果组成了一个代表性样本总体;因此,通过对 S 进行 m 次重采样,它复制了从研究的原始总体中抽取 m 个样本的机会。从这些重采样集中获得的估计值接近使用其他传统方法计算出的真实分布。 因此,增加重复样本的数量会增加测量精度,从而减小数据中的散布。当然,当 m 改进了抽样分布的估计时,这是一个好处,但它并没有在数据中增加更多固有的信息。这是因为每个样本大小的信息含量本质上在于抽样的目标,而这对于研究总体 n 的所有重复样本来说是恒定的。因此,例如,将原始数据集重采样 100,000 次的策略比重采样 1,000 次所提供的更多信息要少。第一个是,有了更多的重复样本,抽样分布估计的精度会显着提高。 Bootstrap 方法由 Frederick Mosteller 和 John Tukey 于 1968 年提出,Bootstrapping 或 Bootstrap 方法是通过样本估计总体参数的过程。 Bootstrap 方法,或 Bootstrapping,是一种统计技术,用于通过使用较小数字的比例比来估计总体参数。这些是较小的样本,它们是通过 successive occasions 从大型数据集中进行抽样得出的,每次在抽取下一个样本之前,都会将抽样的观测值放回数据集中。这种类型的抽样称为简单随机抽样(有放回),因为任何选定的观测值都可以在最终的较小样本中出现一次以上。 创建 bootstrap 样本的过程可以总结如下
Bootstrapping 在估计总体参数时很有用,例如丰度,其中对大型总体进行多次抽样以形成大量小型样本,然后计算每个样本的统计量,最后将计算出的统计量取平均值。 bootstrapping 程序可概述如下
Bootstrap 方法在评估结果的稳定性和可靠性方面也非常有效。Bootstrap 在尝试估计许多问题的真实置信区间时非常有用,但实际上,它还渐进地优于基于样本方差和正态性假设的常规区间。 使用 bootstrap 方法创建的样本示例现在,让我们看看如何获取 bootstrap 样本,然后利用它们来估计感兴趣的统计量。 示例 假设我们有一个包含 6 个观测值的小型数据集 原始数据:2、4、6、8、10、12 步骤 1:首先,需要使用 Bootstrap 和有放回方法创建样本。 所以,我们将通过从我们拥有的原始数据中进行简单随机抽样来生成三个大小为六的 bootstrap 样本。 在这种情况下,每个 bootstrap 样本将包含与初始数据集相同数量的数据点。 Bootstrap 样本 1:6、8、2、10、12、8 Bootstrap 样本 2:4、6、4、2、10、12 Bootstrap 样本 3:12、2、8、8、6、2 步骤 2:这涉及计算感兴趣的统计量,这里是每个 bootstrap 样本的均值。 Bootstrap 样本 1 均值:将数字 6 + 8 + 2 + 10 + 12 + 8 相加,求其均值,我们除以加数的数量,等于 (6 + 8 + 2 + 10 + 12 + 8)/6 = 7. 67 Bootstrap 样本 2 均值:所有数字的和是 (4 + 6 + 4 + 2 + 10 + 12)/6 = 6. 33 Bootstrap 样本 3 均值:(12 + 2 + 8 + 8 + 6 + 2) / 6 = 6. 33 步骤 3:大量执行步骤 1 和 2(例如,一万次)。 因此,如果重复创建 bootstrap 样本的过程并依次计算每个样本的均值,则可以构建均值的经验抽样分布。 步骤 4:计算 s 或使用经验抽样分布构建置信区间或进行假设检验 例如,在需要建立均值的 95% 置信区间的情况下,会遇到均值经验抽样分布的第 2.5 个和第 97.5 个百分位数。 假设第 2.5 个百分位数是 5.5,第 97.5 个百分位数是 8.0。 因此,均值的近似 95% 置信区间也将是 5.5 和 8.0。 总结 对于 bootstrapping,生成的每个数据样本都与原始样本进行比较,并为每个 bootstrap 样本计算均值。如果这个过程以随机样本的形式重复进行多次,您将获得均值的“经验”抽样分布,可用于构建置信区间,甚至使用样本数据进行假设检验,而无需总体分布具有特定的数学形状。 在计算置信区间时使用 Bootstrapping 的示例场景 假设我们有一个小型数据集,代表 8 个个体的体重(磅) 体重 = 150.2, 152.5, 155.8, 160.3, 162.7, 165.1, 168.9, 172.4 研究旨在应用 bootstrapping 技术来找出估计总体平均体重的 95% 置信区间。 步骤 1:计算样本均值:在第一步中,从原始数据中找出样本均值 样本均值 = Σ xi / n = (150. 2+152. 5+155. 8+160. 3+162. 7+165. 1+168. 9+172. 4) / 8 = 150. 98 磅 步骤 2:生成 Bootstrap 样本:使用原始大量数据,通过有放回抽样获得大量 bootstrap 样本。例如,我们 bootstrap 5,000 个样本,每次获得 8 个体重数据。 步骤 3:计算每个 Bootstrap 样本的均值:同样,对于 5,000 个 bootstrap 样本中的每一个,使用以下说明计算平均体重。 步骤 4:确定 95% 置信区间:计算完所有 bootstrap 样本的均值后,您将拥有一个经验 bootstrap 抽样分布的均值。为了获得 95% 置信区间,确定该分布的第 2.5 个和第 97.5 个百分位数。 假设第 2.5 个百分位数是 157. 4 磅,第 97.5 个百分位数是 164. 6 磅。 结论 此 bootstrap 置信区间意味着,如果我们使用样本量为 8 的样本进行多次抽样并构建 bootstrap 置信区间,那么这些区间中的 95% 将包含真实的总体平均体重。在此处进行 bootstrapping 的好处是,不对总体体重作为“真实”分布做任何假设——只使用实际样本数据。 Bootstrap 方法与传统假设检验的比较
置信区间置信区间是包含未知总体参数(例如,均值、比例和回归系数)的值的范围。它基于样本,设计方式是包含真实总体参数的概率已知。 置信水平(最常以百分比形式给出)与显著性水平配对,显著性水平反映了导致置信区间不包含真实总体参数的抽样误差的概率。例如,95% 置信区间意味着,如果使用来自同一总体的不同样本重复计算该区间,则 95% 的此类区间将包含真实参数。 置信区间的宽度表示样本估计值的精度程度或涉及的误差量。与 y 的重叠很少的真实值范围 φ 表示较高的精度结果,而与 y 重叠明显的值范围 φ 表明不确定性较高。我们这样做是因为,最后,我们将剩余的 10% 百分比分成两半,以便覆盖所有 bootstrap 样本均值的中间 90%。 Bootstrap 方法的优点
Bootstrapping 方法的局限性
Bootstrap 方法的一些用途
Bootstrap 方法在各个领域的应用经济学
医学
融资
环境科学
社会科学
市场营销和商业分析
在这些领域应用 Bootstrap 方法时,研究人员/分析师可以更确定地处理他们的数据,尤其是在其他参数方法无法使用或不适用时。 结论Bootstrap 方法是一种通用的统计程序,用于定义统计量的抽样分布,当难以或不可能找到发生率的数学概率时。它可用于通过从实际观察到的数据集中进行有放回的重采样来估计参数、置信区间和假设。因此,当无法满足传统参数假设或未知时,此方法特别有用,并且对于数据配置具有通用性。由于其计算性质和潜在的偏差(由于其非参数功能),Bootstrap 方法在统计学、机器学习和时间序列分析等复杂的科学领域同样有用。 它通过能够对模型进行内部验证并适应不同类型的数据来提高实用性;当我们需要在没有严格模型假设的情况下进行可靠的统计推断时,它非常方便。至于缺点,该方法由于其所需的计算次数可能被认为相当耗时;然而,通过提高所提供估计值的准确性和精度,与许多传统解决方案相比,该方法确实是一种更有效的方法,这些传统解决方案在可以从现有数据集中提取的数据洞察量方面存在相当多的限制。 |
我们请求您订阅我们的新闻通讯以获取最新更新。