数据挖掘中的市场购物篮分析

17 Mar 2025 | 6 分钟阅读

购物篮分析 (Market Basket Analysis) 是一种数据挖掘技术,零售商通过更好地理解客户购买模式来增加销售额。它涉及分析大量数据集,例如购买历史,以揭示产品组合和可能一起购买的产品。

电子销售点 (POS) 系统的出现促进了购物篮分析的采用。与店主保留的手写记录相比,POS 系统生成的数字记录使应用程序更容易处理和分析大量购买数据。

实施购物篮分析需要统计学和数据科学背景以及一些算法编程技能。对于缺乏必要技术技能的人来说,市面上有现成的商业工具。

一个例子是 Microsoft Excel 中的“购物篮分析”工具,该工具分析电子表格中包含的交易数据并执行购物篮分析。交易 ID 必须与要分析的项目相关。然后,“购物篮分析”工具会创建两个工作表

  • “购物篮商品组”工作表,列出了经常一起购买的商品,
  • “购物篮规则”工作表显示了商品之间的关系(例如,购买 A 商品的顾客很可能也会购买 B 商品)。

购物篮分析如何工作?

购物篮分析基于关联规则挖掘进行建模,即 IF {} THEN {} 结构。例如,如果顾客买了面包,那么他也很可能买黄油。

关联规则通常表示为:{面包} -> {黄油}

以下是一些与购物篮分析相关的术语:

  • 前项 (Antecedent):数据中发现的商品或“项集”是前项。简单来说,它是 IF 部分,写在左边。在上面的例子中,面包是前项。
  • 后项 (Consequent):后项是与前项组合中发现的商品或一组商品。它是 THEN 部分,写在右边。在上面的例子中,黄油是后项。

购物篮分析的类型

购物篮分析技术可以根据可用数据的利用方式进行分类。以下是数据挖掘中购物篮分析的几种类型:

Market Basket Analysis in Data Mining
  1. 描述性购物篮分析:这种类型仅从过去的数据中提取见解,是最常用的方法。这里的分析不进行任何预测,而是使用统计技术对产品之间的关联进行评分。对于熟悉数据分析基础知识的人来说,这种类型的建模称为无监督学习。
  2. 预测性购物篮分析:这种类型使用监督学习模型,如分类和回归。它本质上旨在模拟市场,分析什么导致什么发生。本质上,它考虑按顺序购买的商品以确定交叉销售。例如,购买延长保修期更可能是在购买 iPhone 之后。虽然它不像描述性 MBA 那样广泛使用,但它仍然是营销人员非常有价值的工具。
  3. 差异性购物篮分析:这种类型的分析对竞争对手分析很有好处。它比较商店之间、季节之间、两个时间段之间、一周中的不同日期之间的购买历史,以发现消费者行为中的有趣模式。例如,它可以帮助确定为什么一些用户更喜欢在 Amazon 与 Flipkart 上以相同的价格购买同一产品。答案可能是 Amazon 经销商拥有更多仓库,可以更快地交付,或者可能是更深层次的原因,如用户体验。

与购物篮分析相关的算法

在购物篮分析中,使用关联规则来预测产品一起购买的可能性。关联规则计算一起出现的商品的频率,力求找到比预期出现频率高得多的关联。

使用关联规则的算法包括 AIS、SETM 和 Apriori。Apriori 算法在数据科学家关于购物篮分析的研究文章中经常被引用。它识别数据库中的频繁项,然后随着数据集扩展到更大的尺寸来评估它们的频率。

R 的 rules 包是一个使用 R 编程语言进行关联挖掘的开源工具包。该包支持 Apriori 算法和其他挖掘算法,包括 arulesNBMiner、opusminer、RKEEL 和 RSarules。

借助 Apriori 算法,我们可以进一步对消费者经常购买的项集进行分类和简化。APRIORI 算法包含三个组成部分:

  • 支持度 (SUPPORT)
  • 置信度 (CONFIDENCE)
  • 提升度 (LIFT)

例如,假设一个流行的电子商务网站进行了 5000 次交易。现在他们想计算两件商品的支持度、置信度和提升度。例如,假设我们考虑钢笔和笔记本,在 5000 次交易中,有 500 次交易购买了钢笔,700 次交易购买了笔记本,1000 次交易同时购买了两者。

支持度 (SUPPORT)

计算方法是交易次数除以总交易次数,

support(pen) = 与钢笔相关的交易次数/总交易次数

即 support -> 500/5000 = 10%

置信度 (CONFIDENCE)

计算的是产品是单独销售受欢迎还是组合销售受欢迎。它是通过组合交易次数/单独交易次数计算的。

Confidence = 组合交易次数/单独交易次数

即 confidence -> 1000/500 = 20%

提升度 (LIFT)

提升度的计算是为了了解销售的比率。

Lift -> 20/10 = 2

当提升度值低于 1 时,这种组合的商品组合不会受到消费者的青睐。但在本例中,与单独销售的商品交易相比,一起购买这两种商品的概率很高。

购物篮分析的例子

以下是一些*通过市场细分探索购物篮分析的例子*:

Market Basket Analysis in Data Mining
  • 零售业:最著名的 MBA 案例研究是 Amazon.com。每当您在 Amazon 上查看某件商品时,产品页面都会自动推荐“经常一起购买的商品”。这可能是 MBA 交叉销售技术中最简单、最清晰的例子。
    除了电子商务形式,BA 也广泛应用于实体零售业。杂货店会根据产品位置和货架优化来精心摆放商品。例如,在杂货店里,洗发水和护发素几乎总是放在非常近的地方。沃尔玛著名的啤酒和尿布关联轶事也是购物篮分析的一个例子。
  • 电信业:随着电信行业竞争日益激烈,公司们正密切关注客户的服务。例如,电信公司现在开始捆绑电视和互联网套餐,以及其他打折的在线服务,以减少客户流失。
  • IBFS(金融服务):追踪信用卡历史对于 IBFS (金融服务) 组织来说是一个极具优势的 MBA 机会。例如,花旗银行经常在大型购物中心雇佣销售人员,通过即时提供的有吸引力的折扣来吸引潜在客户。他们还与 Swiggy 和 Zomato 等应用程序合作,向客户展示通过信用卡购买可以获得的许多优惠。IBFS 组织还使用购物篮分析来确定欺诈性索赔。
  • 医学:在医学领域,购物篮分析用于确定合并症和症状分析。它还可以帮助识别哪些基因或特征是遗传的,哪些与局部环境效应有关。

购物篮分析的好处

购物篮分析数据挖掘技术具有以下优点:

Market Basket Analysis in Data Mining
  • 提高市场份额:一旦公司达到增长高峰,就难以确定增加市场份额的新方法。购物篮分析可用于整合人口统计和城市化数据,以确定新店的位置或进行地理定位广告。
  • 行为分析:理解客户行为模式是营销基础中的基石。MBA 可用于从简单的目录设计到 UI/UX 的任何地方。
  • 优化店内运营:MBA 不仅有助于确定货架上的商品,还有助于确定商店背后的运营。地理模式在确定某些产品的受欢迎程度或强度方面起着关键作用,因此 MBA 已越来越多地用于优化每个商店或仓库的库存。
  • 营销活动和促销:MBA 不仅用于确定哪些产品组合在一起,还用于确定哪些产品是其产品线中的关键产品。
  • 推荐:Netflix 和 Amazon Prime 等 OTT 平台通过了解人们倾向于频繁观看哪些类型的电影来从 MBA 中受益。