啤酒与尿布---神奇的购物篮分析

老高与购物篮分析

公告

“啤酒与尿布”是一个真实的故事,发生在1990年代的沃尔玛大卖场,代表卖场的购物篮商品之间存在着某种特定的关联关系,挖掘并利用这种关联关系,可以使得实体零售门店充分;了解顾客的购物场景,为选品与品类管理、定价与调价、促销策略及评估、关联陈列、顾客行为聚类等提供了有效的数据依据。

我在2008年撰写了《啤酒与尿布-神奇的购物篮分析》(清华大学出版),开辟本专栏,是为了与大家探讨实体门店购物篮管理的理念、计算方法及案例,以及能够与相关软件企业合作,开发相关应用软件产品

MP:13901022781 微信同号

统计

今日访问:253

总访问量:204282

购物篮分析为什么在零售业无法普及?--Apriori算法的困境(二)

2023年09月13日

评论数(0)

我们以Groceries数据集为例,表3-3为Groceries数据集的关联分析表,我们以此为例,说明支持度-置信度-提升度指标的量化困境。

表格中lhs 代表关联规则的左侧、rhs代表关联规则的右侧,按照购物篮分析的定义,lhs(左侧)代表主分析商品,rhs(右侧)代表被关联商品。

第一行代表盆栽植物(pot plants)与全脂牛奶(whole milk)的支持度(support)为6.9%,置信度(confidence)为40%,提升度(lift)为1.56.

第二行代表意大利面(pasta)与全脂牛奶(whole milk)的支付度为6%,置信度为40%,提升度为1.58。

其他数据以此类推;

          lhs                     rhs           support       confidence     lift

1 {pot plants} => {whole milk} 0.006914082 0.4000000 1.565460

2 {pasta} => {whole milk} 0.006100661 0.4054054 1.586614

3 {herbs} => {root vegetables} 0.007015760 0.4312500 3.956477

4 {herbs => {other vegetables} 0.007727504 0.4750000 2.454874

5 {herb => {whole milk} 0.007727504 0.4750000 1.858983

表3-3 Groceries数据集商品的支持度-置信度-提升度三项指标表现

我们看到上述五条商品之间的关联规则都呈现很强的正关联规则,是一种理想状态,但这些评分高低并不能作为商业价值的标准。

单纯从提升度出发,香草与根茎类蔬菜的提升度为3.95,远高于盆栽植物与全脂牛奶之间的提升度1.56,是不是可以说,对于超市经营者来说,应该更加鼓励香草与根茎类蔬菜之间的关联关系?

香草作为调味料,与根茎类蔬菜、其他类蔬菜具有很强的关联关系,是烹调菜单构成的必然关联,如果将香草与各类蔬菜具有很强的关联关系作为重大发现,郑重告知超市经营者,会被哈哈大笑地耻笑一番的。

香草与根茎类蔬菜之间关联规则的指标高于盆栽植物与全脂牛奶的相关指标,那么与之对应高出多少销售额?却没有人告知超市经营者。

商品之间的支持度-置信度-提升度三个指标,如果没有对应销售额、销售数量、毛利额、购物篮金额等指标,再高的关联强度也是没有意义的。

如果说,香草与根茎类蔬菜的相关性,带来了每日300元的相关销售额,而盆栽植物与全脂牛奶的相关性,带来了每日500元的销售额,二种主商品(香草、盆栽植物)的关联关系带来的销售额相差200元,即使是香草与根茎类蔬菜的提升度高达3.95,比盆栽植物与全脂牛奶的提升度1.56高出一倍多,但是对于超市经营者来说,诚然香草与根茎类蔬菜的关联关系很重要,但是盆栽植物与全脂牛奶的关联关系更加有意义,因为关联销售额更高。

我们再以一个现实中的超市购物篮为例进行说明。

下面的表3-4是某超市的实际购物篮数据,购物篮中的商品都有销售价格、销售数量、销售金额小计,为了便于说明问题,表格中直接计算并添加了购物篮金额。

我们可以看到,不同购物篮的商品价格、销量、销售金额小计、购物篮金额都不一致,每个购物篮的价值都不一样,而这就是超市经营者最关注的。

假定东北大米与土鸡蛋之间具有关联关系,同样红糖与土猪手之间也具有关联关系,如果从购物篮总金额的角度出发,那么东北大米与土鸡蛋之间的关联关系更值得关注、鼓励。

假定莴苣与鸡毛菜之间即使具有很强的关联关系,不管从任何角度,也不如其他商品之间的关联关系更有意义,因为这些商品本身就是陈列在一起,而且季节性很强、可重复性差。

购物篮商品名称商品单价销售数量金额小计
1号购物篮金秋小农粘米15.3115.3
1号购物篮白糖5.6211.2
1号购物篮香菇7.817.8


合计434.4





2号购物篮东北大米32.2132.2
2号购物篮黄冰糖5.6111.2
2号购物篮土鸡蛋15.2115.2


合计358.6





3号购物篮八宝粥4.529
3号购物篮散装鸡蛋5.615.6
3号购物篮前排12.2112.2


合计426.8





4号购物篮猪前腿18.7118.7
4号购物篮莲藕313
4号购物篮白萝卜212


合计323.7





5号购物篮红糖3.413.4
5号购物篮土猪手12.5112.5
5号购物篮莴苣313
5号购物篮鸡毛菜212


合计420.9

表3-4 某超市购物篮数据列表


文章为作者独立观点,不代表联商专栏立场。

联商专栏原创文章由作者授权发表,转载须经作者同意,并同时注明来源:联商专栏+老高与购物篮分析。