McNemar 检验17 Mar 2025 | 6 分钟阅读 麦克尼马尔检验是一种统计检验,用于确定 2x2 列联表中两个相关分类变量的边际频率(计数)是否存在显著差异。它通常用于配对分类数据,例如在前后实验中,或比较同一数据集上的两种不同分类器时。 检验统计量具有一个自由度的卡方分布。要获得 p 值,请将估计值与具有一个自由度的卡方分布中的关键值进行比较。 如果 p 值小于您指定的显著性水平(例如 0.05),则拒绝原假设。如果 p 值超过您指定的显著性水平,则无法拒绝原假设。 代码 现在我们将实现麦克尼马尔检验,并将其与其他近似统计检验进行比较。 导入库读取数据集输出 ![]() 模型现在我们将构建我们的模型。 我们将生成所构建的估计器模型的 HTML 表示。 输出 ![]() 输出 ![]() 训练我们将使用分层 K 折交叉验证来训练模型,这有助于获得更可靠的模型性能估计并降低过拟合的风险 输出 ![]() 麦克尼马尔检验麦克尼马尔检验旨在主要关注两个分类器之间的差异,因此也关注它们以不同方式预测的案例。所以我们首先需要做的是计算以下值。
原假设:n01 = n10,表明 A 和 B 具有相同的错误率。 要获得麦克尼马尔检验的 X² 值,该值类似于配对卡方检验,请使用以下公式。 ![]() 在双尾检验中,如果 X² > X²(p),则拒绝原假设。其中 p 是显著性水平。 输出 ![]() ![]() 与其他检验的比较现在我们将麦克尼马尔检验与其他近似统计检验进行比较。我们将比较
导入库定义方法在这里,我们将创建每个近似统计检验的函数。 加载数据集定义分类器现在我们将执行各种统计检验,以比较两种机器学习模型(随机森林和 KNN)的性能。 输出 ![]() 输出 ![]() 虽然比例 Z 检验发现两种模型之间的比例没有显著差异,但麦克尼马尔检验和所有三个 t 检验(重采样配对 t 检验、交叉验证配对 t 检验和 5x2 交叉验证配对 t 检验)均显示模型平均性能得分存在显著差异。 下一主题随机优化 |
随着 2025 年的到来,机器学习仍在以史无前例的速度发展,取得了突破性发现,正在改变整个行业并解决具有挑战性的实际问题。机器学习研究的最新进展集中在扩展 AI 的能力、提高模型效率以及...
7 分钟阅读
简介:Pandas 是一个强大的 Python 统计分析和操作工具,但有效地处理大型数据集可能会很困难。在处理数百万或数亿数据时,性能问题(包括处理速度慢、内存利用率高和计算时间长)成为主要障碍……
阅读 6 分钟
? 随着低延迟、高容量和更快数据速率的承诺,5G 技术开启了通信的新时代。尽管许多行业将受益于 5G,但物联网 (IoT) 是其影响最显着的一个领域。凭借其无与伦比的能力……
阅读 4 分钟
机器学习中的回归与分类回归和分类算法都是监督学习算法。这两种算法都用于机器学习中的预测,并且都使用标记数据集。但它们之间的区别在于如何用于不同的机器学习问题。主要区别在于……
阅读 3 分钟
类别不平衡数据集是机器学习中的一个常见问题,尤其是在分类任务中。当一个类别中的实例数量显著超过其他类别中的实例数量时,就会出现这些数据集。例如,在欺诈检测中,欺诈交易通常比...
阅读9分钟
数千年来,科学家们一直对地球的地磁场着迷。它对各种地质和环境过程有着重大影响,从导航系统到气候模式。随着机器学习技术的突破,研究人员现在可以探索和理解地球复杂性...
阅读 10 分钟
元学习通常被称为“学习如何学习”,是计算机科学中一类机器学习。它通过根据实验结果修改学习算法的特定组件来用于提高学习算法的结果和性能。元学习使研究人员能够...
阅读 6 分钟
机器学习每天都变得越来越重要和相关。传统的微处理器在处理它时效率低下,无论是训练还是神经网络处理。GPU 的并行架构允许快速图形处理,事实证明比 CPU 更高效,但仍然……
阅读 2 分钟
什么是s?RNNs的一个子类是s(ESNs),它构成了储备池计算框架的一部分。与传统的RNNs不同,ESNs处理时间序列和序列数据,但使用不同的结构和训练方法。还假设输入到储备池的权重(W_in)和...
5 分钟阅读
随机优化是一种强大的方法,通过使用随机选择的训练数据子集迭代更新模型参数来确定模型的最佳参数。与每次迭代都考虑完整数据集的标准优化方法相比,随机优化算法只使用少量...
阅读9分钟
我们请求您订阅我们的新闻通讯以获取最新更新。
我们提供所有技术(如 Java 教程、Android、Java 框架)的教程和面试问题
G-13, 2nd Floor, Sec-3, Noida, UP, 201301, India