关联规则学习17 Mar 2025 | 4 分钟阅读 关联规则学习是一种无监督学习技术,它检查一个数据项与其他数据项的依赖性,并进行相应的映射,以便更有利可图。它试图发现数据集中变量之间的一些有趣的关系或关联。它基于不同的规则来发现数据库中变量之间的有趣关系。 关联规则学习是机器学习中一个非常重要的概念,它被应用于市场篮子分析、Web 使用挖掘、连续生产等。其中,市场篮子分析是各种大型零售商用来发现物品之间关联性的技术。我们可以通过超市的例子来理解它,因为在超市里,所有一起购买的产品都会被放在一起。 例如,如果顾客买了面包,他很可能也会买黄油、鸡蛋或牛奶,所以这些产品会放在同一个货架上或附近。请看下图 ![]() 关联规则学习可以分为三种算法
我们将在后面的章节中介绍这些算法。 关联规则学习是如何工作的?关联规则学习基于“如果...那么...”语句的概念,例如“如果 A 那么 B”。 ![]() 这里的“如果”部分称为前提(antecedent),“那么”部分称为结论(Consequent)。这种可以找到两个项目之间关联或关系的关系被称为单基数(single cardinality)。它与创建规则有关,如果项目数量增加,基数也会相应增加。因此,为了衡量成千上万个数据项之间的关联,有几种指标。这些指标如下所示
让我们逐一了解它们 支持支持度(Support)是 A 的频率,或者一个项目在数据集中出现的频率。它定义为包含项集 X 的事务 T 的分数。如果存在 X 个数据集,那么对于事务 T,可以写成 ![]() 信心置信度(Confidence)表示规则被发现为真的频率。或者在 X 已经出现的情况下,X 和 Y 一起出现在数据集中的频率。它是包含 X 和 Y 的事务数与包含 X 的记录数的比率。 ![]() 升降机它是任何规则的强度,可以用下面的公式定义 ![]() 它是观察到的支持度与 X 和 Y 相互独立时的预期支持度的比率。它有三个可能的值
关联规则学习的类型关联规则学习可以分为三种算法 Apriori 算法该算法使用频繁项集来生成关联规则。它被设计用于包含事务的数据库。该算法使用广度优先搜索和哈希树来有效地计算项集。 它主要用于市场篮子分析,并有助于理解可以一起购买的产品。它也可以用于医疗保健领域,以查找患者的药物反应。 Eclat 算法Eclat 算法代表等价类转换(Equivalence Class Transformation)。该算法使用深度优先搜索技术在事务数据库中查找频繁项集。它的执行速度比 Apriori 算法快。 F-P Growth 算法F-P Growth 算法代表频繁模式(Frequent Pattern),它是 Apriori 算法的改进版本。它将数据库表示为一种称为频繁模式或树的树形结构。这种频繁树的目的是提取最频繁的模式。 关联规则学习的应用它在机器学习和数据挖掘中有多种应用。以下是关联规则学习的一些流行应用
下一个主题机器学习中的混淆矩阵 |
转置卷积也称为反卷积或上采样卷积。它在计算机视觉中有特定应用,主要涉及图像生成和分割以及超分辨率应用。与“展平”输入数据空间维度并对其进行下采样的标准卷积不同,转置...
5 分钟阅读
简介 多类逻辑回归是用于预测涉及多个类别的分类任务的关键机器学习方法。与仅处理两个类别的二元逻辑回归方法相比,多类逻辑回归将此策略扩展到涵盖多个类别。在多类逻辑回归中创建模型...
阅读 4 分钟
简介:在本教程中,我们将学习关于 . V 代表虚拟网络。回顾 V-Net。临床实践中最常见的临床数据包括 3D 体积,例如显示前列腺的 MRI 体积。然而,大多数方法只能生成 2D 图像。医学体积注释是……
阅读 6 分钟
引言:统计标准化是一种预处理方法,用于将数值数据缩放到一致的范围。在数据分析和机器学习中,确保特征对模型做出同等贡献至关重要,以避免由于尺度差异而引入的偏差。具有较大值的变量……
5 分钟阅读
作物产量预测是农业的重要方面,有助于农民就其作物做出明智的决定。它涉及根据土壤类型、天气条件和作物管理等各种因素估算给定区域内将生产的作物数量……
阅读9分钟
机器学习是一个通过从数据中发现模式和进行预测而蓬勃发展的领域;从这个意义上说,它通常以更经验的方式进行。虽然大多数机器学习技术严重依赖数值方法和近似来解决复杂问题,但确实……
阅读 15 分钟
是一个研究领域,探索了量子计算和系统学习的思想的相互作用。例如,我们想找出量子计算机是否可以加快训练或比较系统学习所需的时间……
阅读 6 分钟
层次聚类是另一种无监督机器学习算法,用于将未标记的数据集分组到簇中,也称为层次聚类分析或 HCA。在此算法中,我们在树状图中开发簇的层次结构,这种树状结构...
阅读 8 分钟
“自由度”(DOF) 的概念是物理学、力学、机器人学、热力学和统计学等各个科学和工程学科的基础。自由度是定义系统完整状态或行为的独立参数的数量。通过了解...
阅读 4 分钟
? 数据集的变量以多种方式相互关联。这些关系在数据分析和建模中可能非常重要。变量通常会相互导致或直接相互依赖;其他时候,两个变量之间仅存在松散的关联...
阅读 6 分钟
我们请求您订阅我们的新闻通讯以获取最新更新。
我们提供所有技术(如 Java 教程、Android、Java 框架)的教程和面试问题
G-13, 2nd Floor, Sec-3, Noida, UP, 201301, India