由于零售门店中购物篮数据极其庞大,而购物篮分析往往具有特定的分析对象,因此可以按照购物篮分析的目的,将购物篮数据库简化为特定的中间数据库,这种中间数据库按照业务分析的目的,也可以被称为业务宽表,业务宽表按照业务用途对中间数据集进行命名,每个业务宽表只会针对特定的业务分析需求,因此业务宽表都是临时性数据库。
业务宽表有事务型业务宽表,周期性快照业务宽表、累计快照业务宽表几种类型。
事务型业务宽表是按照业务事实提取数据库,比如某次促销活动的业务宽表,周期性快照业务宽表指的是按照某种周期性要求建立的简约数据集,比如某个周期性节假日的购物篮数据集,而累计快照业务宽表是按照特定的时间段或其他分析需要建立的全程购物篮简约数据集。
按照时间维度:购物篮中商品关联关系具有很强的时间属性,比如“啤酒与尿布”故事的时间窗口很短,只出现在周五晚上的美国棒球大联盟比赛日,过了这一特定时段,“啤酒与尿布”的关联规则就不存在。
按照购物篮的时间维度组建购业务宽表,会聚焦并发现很多有商业价值的关联关系,销售时段的业务宽表会聚焦到特定的消费行为,比如早上8:30-10:30的购物篮数据集合,就直接面对了俗称“大妈大爷”的购买人群及其购买行为。
如果没有限定时间维度的业务宽表,很多商品关联特征会被淹没,从这个意义上讲,时间维度也是一种非常重要的约束条件。
量化购物篮指标的业务宽表:将购物篮金额、商品销售价格、购物篮系数等量化指标设置为阈值(比如客单价大于35元、购物篮中品种数大于3个),以此建立分析用业务宽表,对购物篮的量化分析是购物篮分析的空白点、也是零售业者最关注的分析方法。
促销活动业务宽表:在组织促销时,会选择一些商品作为促销品,建立这些促销商品的业务宽表,以此分析促销商品以往的购物篮状况、关联表现形式、同品类与跨品类的购物篮表现等等,就可以根据这个业务宽表进行促销预测。
常见的是按照某个品牌要求,建立该品牌的购物篮业务宽表,以此对该品牌的商品购物篮状况进行分析。
南方超市会关注,清明节热销的青团品牌与口味,哪个因素对于销量影响更重要?
对于服装,尺寸、风格、款式、设计师哪个因素更重要?
当使用“无糖饮料”时,可以将“无糖可乐、无糖雪碧、无糖元气森林”作为从购物篮分析的前提条件,建立统一的“无糖饮料”这一特定商品品类的业务宽表,从而找出这类商品的关联规则体系。
也可以使用商品的包装属性建立购物篮业务宽表,以此分析小包装生鲜品都是白领购买吗?什么时间购买?购物篮中会有那些同时购买的商品?