啤酒与尿布---神奇的购物篮分析

老高与购物篮分析

公告

“啤酒与尿布”是一个真实的故事,发生在1990年代的沃尔玛大卖场,代表卖场的购物篮商品之间存在着某种特定的关联关系,挖掘并利用这种关联关系,可以使得实体零售门店充分;了解顾客的购物场景,为选品与品类管理、定价与调价、促销策略及评估、关联陈列、顾客行为聚类等提供了有效的数据依据。

我在2008年撰写了《啤酒与尿布-神奇的购物篮分析》(清华大学出版),开辟本专栏,是为了与大家探讨实体门店购物篮管理的理念、计算方法及案例,以及能够与相关软件企业合作,开发相关应用软件产品

MP:13901022781 微信同号

统计

今日访问:253

总访问量:204282

缩小范围:基于约束条件的关联规则挖掘(二)

2023年11月17日

评论数(0)
三、约束条件与特定用途的业务宽表:
由于零售门店中购物篮数据极其庞大,而购物篮分析往往具有特定的分析对象,因此可以按照购物篮分析的目的,将购物篮数据库简化为特定的中间数据库,这种中间数据库按照业务分析的目的,也可以被称为业务宽表,业务宽表按照业务用途对中间数据集进行命名,每个业务宽表只会针对特定的业务分析需求,因此业务宽表都是临时性数据库。
业务宽表有事务型业务宽表,周期性快照业务宽表、累计快照业务宽表几种类型。
事务型业务宽表是按照业务事实提取数据库,比如某次促销活动的业务宽表,周期性快照业务宽表指的是按照某种周期性要求建立的简约数据集,比如某个周期性节假日的购物篮数据集,而累计快照业务宽表是按照特定的时间段或其他分析需要建立的全程购物篮简约数据集。
建立业务宽表的常见业务场景:
按照时间维度:购物篮中商品关联关系具有很强的时间属性,比如“啤酒与尿布”故事的时间窗口很短,只出现在周五晚上的美国棒球大联盟比赛日,过了这一特定时段,“啤酒与尿布”的关联规则就不存在。
按照购物篮的时间维度组建购业务宽表,会聚焦并发现很多有商业价值的关联关系,销售时段的业务宽表会聚焦到特定的消费行为,比如早上8:30-10:30的购物篮数据集合,就直接面对了俗称“大妈大爷”的购买人群及其购买行为。
如果没有限定时间维度的业务宽表,很多商品关联特征会被淹没,从这个意义上讲,时间维度也是一种非常重要的约束条件。
量化购物篮指标的业务宽表:将购物篮金额、商品销售价格、购物篮系数等量化指标设置为阈值(比如客单价大于35元、购物篮中品种数大于3个),以此建立分析用业务宽表,对购物篮的量化分析是购物篮分析的空白点、也是零售业者最关注的分析方法。
促销活动业务宽表:在组织促销时,会选择一些商品作为促销品,建立这些促销商品的业务宽表,以此分析促销商品以往的购物篮状况、关联表现形式、同品类与跨品类的购物篮表现等等,就可以根据这个业务宽表进行促销预测。
按照隐形或虚拟属性建立业务宽表:
在零售业中,很多商品的隐性属性也是大家最关注的。
常见的是按照某个品牌要求,建立该品牌的购物篮业务宽表,以此对该品牌的商品购物篮状况进行分析。
南方超市会关注,清明节热销的青团品牌与口味,哪个因素对于销量影响更重要?
对于服装,尺寸、风格、款式、设计师哪个因素更重要?
对于饮料,口味、包装、还是含糖量更重要?
上述因素都可以作为建立业务宽表的依据。
当使用“无糖饮料”时,可以将“无糖可乐、无糖雪碧、无糖元气森林”作为从购物篮分析的前提条件,建立统一的“无糖饮料”这一特定商品品类的业务宽表,从而找出这类商品的关联规则体系。
也可以使用商品的包装属性建立购物篮业务宽表,以此分析小包装生鲜品都是白领购买吗?什么时间购买?购物篮中会有那些同时购买的商品?


文章为作者独立观点,不代表联商专栏立场。

联商专栏原创文章由作者授权发表,转载须经作者同意,并同时注明来源:联商专栏+老高与购物篮分析。