啤酒与尿布---神奇的购物篮分析

老高与购物篮分析

公告

“啤酒与尿布”是一个真实的故事,发生在1990年代的沃尔玛大卖场,代表卖场的购物篮商品之间存在着某种特定的关联关系,挖掘并利用这种关联关系,可以使得实体零售门店充分;了解顾客的购物场景,为选品与品类管理、定价与调价、促销策略及评估、关联陈列、顾客行为聚类等提供了有效的数据依据。

我在2008年撰写了《啤酒与尿布-神奇的购物篮分析》(清华大学出版),开辟本专栏,是为了与大家探讨实体门店购物篮管理的理念、计算方法及案例,以及能够与相关软件企业合作,开发相关应用软件产品

MP:13901022781 微信同号

统计

今日访问:110

总访问量:105729

关联分析的核心算法--Apriori算法的指标体系及实例

2023年08月21日

评论数(0)
Apriori算法生成的关联规则包含三个指标:支持度(Support)、置信度(Confidemce)、提升度(Lift),一般使用支持度-置信度二个指标判断事务之间关联关系的强弱,因此也被称为支持度-置信度框架(Support-Confidence Framework)。
如何判断一个购物篮数据集合中,那些商品之间是强关联、那些是弱关联,Apriori算法方法是,对于支持度和置信度都设置一个最小值,即设置一个筛选条件(阈值),以此判断事务之间关联关系的强弱,对于上面的5个购物篮,可以设置支持度最小值为30%,置信度的最小值为50%,那么{苹果、牛奶}的关联关系就是强,其他的都是弱,可以予以忽略。
Apriori算法指标案例:
Apriori算法产生后,不断有国外零售企业尝试使用,对卖场中的关联关系进行描述,下面就是几个实际案例。
案例1:某超市的熟食、面包、肉类三种商品品类之间关联关系表;
表3-1为某超市使用的熟食、面包、肉类的关联关系表,这个报表中采取了标准的Apriori算法指标,即支持度(Support)、置信度(Confidence)及提高度(Lift)3个指标,表格中的“—〉”符号指明了商品之间关联关系的方向,即从表格左侧到右侧的方向,左侧代表主分析的商品,右侧代表被关联的商品。
在这个报表中重点指标是提高度(Lift),该超市认为,如果这个数字大于20%,就可以认为这两个商品之间的关联关系是比较强的。

商品类品
被关联商品品类
支持度Support
置信度Confidence
提高度Lift(%)
1.熟食
—〉面包
2.00
50.00
8.33
2.面包
—〉熟食
2.00
33.33
33.33
3.熟食
—〉肉类
1.60
40.00
20.00
4.肉类
—〉熟食
1.60
80.00
20.00
5.肉类
—〉面包
0.04
2.20
0.37
6.面包
—〉肉类
0.04
0.73
0.37
7.熟食和肉类
—〉面包
0.04
2.50
0.42
8.熟食和面包
—〉肉类
0.04
2.00
1.00
9.肉类和面包
—〉熟食
0.04
90.91
22.73
10.熟食
—〉肉类和面包
0.04
1.00
22.73
11.肉食
—〉熟食和面包
0.04
2.00
1.00
12.面包
—〉熟食和肉类
0.04
0.67
.042

表3-1:某超市商品品类关联关系分析表
以第一行数据为例,表示顾客购买熟食时,有8.33%的客户会同时购买面包,这个比例很少,因此可以认为买熟食的客户只有很少的比例会购买面包。
第二行数据表示在顾客购买面包时,会有33%的顾客同时购买熟食,这里的提升度指标也很高,达到了33%,因此可以认为这条关联关系具有商业价值,熟食与面包的关联关系方向性很强,这是代表了不同的消费行为。
第三行数据显示有40%的顾客在购买熟食后,会去买肉类商品。
表格中的第九行数据指示肉类和面包,与熟食的关联关系较强。
案例2:为什么超市中的青椒、黄椒和红椒要分开陈列?
国外某超市对青椒、红椒、黄椒三个蔬菜与香蕉的商品关联关系进行了分析,分析结果见表3-2,该报表运用了三个指标,用以表示青椒、红椒、黄椒与香蕉的商品关联关系。

商品之间的关联关系
Support(支持度)
Confidence(置信度)
Lift(提升度)
青椒  IMPLIES  香蕉
3.37
85.96%
137%
红椒  IMPLIES  香蕉
8.57
89.47%
143%
黄椒  IMPLIES  香蕉
22.12
73.09%
117%
注:IMPLIES代表从左侧商品到右侧商品具有相关性



表3-2:关联关系三项指标分析示例
表3-2中的三种椒类与香蕉的关联指标表明,青椒、红椒、黄椒与香蕉的置信度分布为85.96%、89.47%,73.09%,说明这三个商品与香蕉出现在同一个购物篮的概率非常高,而三个商品与香蕉的提高度分别为137%、143%、117%,,这三个提升度数据均大于100%,代表这三个商品与香蕉之间具有很强的关联关系,除了黄椒有些偏低外,其他指标基本相近,而且很平均,说明三种椒类商品与香蕉的关联关系基本一致,购买青椒、红椒、黄椒的客户中大多数都购买了香蕉,因此香蕉是主要的被关联商品,从这个意义上讲,对于该超市来说香蕉是一个非常关键的商品,在任何时候都不得缺货,否则会造成青椒、黄椒、红椒的关联销售损失。
青椒是本地产品,价格比较便宜,因此面向的是一些低收入客户群体,而红椒、黄椒是进口的,因此红椒、黄椒比较贵,面向的是一些高收入客户群体。
高收入客户、低收入客户都需要香蕉,这是两类客户群体需求相同的地方,不同的地方在于他们需要的椒类档次不同,如果把这些商品摆放在同一个摊位上,我们可以想象一下,高收入阶层与低收入阶层的客户在同时一个摊位挑选青椒、红椒、黄椒和香蕉,会出现什么情况?如同羊群中闯入了骆驼,估计会谁看谁也不顺眼,搞不好会形成客户群体之间的冲突,这时高收入客户群体会加速购物、或者放弃购物。
因此该超市可以重新摆放位置,按照国内商品区域放置青椒、进口食品区域摆放红椒、黄椒,香蕉可以单独摆放、也可以同时在两边摆放香蕉,这样把2个客户群体分开购物,使这两个客户群体各自轻松选择自己需要的商品,互相不影响。


文章为作者独立观点,不代表联商专栏立场。

联商专栏原创文章由作者授权发表,转载须经作者同意,并同时注明来源:联商专栏+老高与购物篮分析。