零售序列关联分析的数据源依然是购物篮数据,在进行序列关联分析时,需要对购物篮数据进行如下处理:
1、简单序列的购物篮数据处理:一般认为购物篮中商品排列顺序就是简单序列,而Apriori算法中的购物篮数据是有着严格的前后顺序,即所谓“前件(antecedent)”、“后件(consequent)”之分,这是因为关联关系具有方向性,比如购物篮{全脂牛奶、面包},将商品顺序颠倒过来,关联关系也会发生变化。
在进行购物篮分析时,需要明确商品的前后顺序,那么,可以按照销售小票中的商品顺序作为商品的序列吗?
答案是不能!购物篮分析的商品序列不能来自于POS产生的销售小票,即使销售小票中商品数据有前后时间戳也不行,因为交易小票的商品顺序来自于收银员拿起商品、进行条码扫描的顺序,这个顺序完全是随意的。
比如有一个购物篮数据,其商品序列为{啤酒,熟食,牛奶,厨房用品},这样的商品顺序完全是随机的,不能作为前件、后件区分的依据。
此时可以试试这种方法,即根据卖场的动线设计,比如卖场出入口、主通道、货架的区域分布,重新组织购物篮的序列数据。
该卖场区域动线设计思路是,从大门口进来,经过主通道来的不同货架区域、最终到收银台,其动线设计思路顺序为:厨房用品->熟食->啤酒->牛奶;
经过重新组合的购物篮数据具有了简单序列模式,对应了顾客购物行为的序列模式,此时就可以采取Apriori进行序列关联规则数据挖掘。
2、严格时间序列的购物篮数据处理:当交易数据可以定位到单体顾客时,可以将顾客的购物篮数据转化为购买行为序列数据,购买行为数据具有时间属性,时间属性来自于订单形成时间,订单的时间属性可以直接继承给购物篮中的商品数据。
零售简单关联序列分析方法,与传统的购物篮分析基本一致,首先需要组织商品的购物篮序列数据,在给定的购物篮序列数据集合中,根据用户指定的最小阈值,找出大于或等于阈值的所有序列,以此挖掘商品序列关联模式。
比如下面的三个购物篮中,找出大于60%支持度的频繁模式:
我们可以看到,熟食=>啤酒、熟食=>牛奶的支持度都满足这个条件。
在当今数据分析界,对于时间序列关联数据挖掘方法,基本思路依然是基于Apriori算法,即使交易数据具有时间属性,时间属性也只是用来对交易数据的前后排序,比如上述表4-5的顾客购买序列数据,寻找支持度在40%以上的序列模式,有如下的序列关联关系存在:(A),(H),(E,G);
零售业存在着消费者的周期性购买行为(Purchasing Cycles),这种周期性行为是由商品品类的购买周期决定,每个品类的购买周期都不同,生鲜食品购买周期最短、其次是母婴用品、日用品、服装、家电商品等。
商品购买周期越短,对应的顾客复购率越高,反之顾客的复购率越低。
某超市研究发现,对于生鲜品类的购买频次,每个家庭每周大约是5.02次,但购买频次跟住户家的距离远近有关系,例如到稍微远一点的社区店购买频次,平均每周是3.61次。
零售业有个共识,要选择复购率低的商品加大品类布局、选择高复购率的商品进行促销。
商品的购买周期会体现为一种典型的时间序列模式,通过对顾客群体的购物篮商品序列进行分析,可以甄别消费者行为周期、找出消费者的复购规律,适时对顾客群体进行促销,从而达到提升复购率的目的。
对于特定顾客群体的购买行为序列分析,不能局限于单次购物,必须放在一个较长的周期内。
每个商品都会有相对稳定的购买周期,会表现为一定天数的时间间隔,对顾客手中购物篮进行较长周期的购买行为序列挖掘,可以找出这些商品的购买周期,根据这些购买周期,可以提前布局、在周期临近时组织商品促销。
即使是同一个商品,不同的包装规格会导致复购的周期不同,将商品的大包装改为小包装也是改变消费周期的方法,日本人早就发现,大包装的商品由于使用周期长、会导致复购率下降,而小包装商品会加速商品的复购周期,而小包装商品更容易形成关联购买。
在对消费者的购买时间序列进行分析时,会发现有不同购买周期的商品,这些商品在顾客的购物篮中存在着关联关系,对于具有关联关系的不同购买周期的商品,如何组织促销?
这个问题涉及了商品组合的购买周期,此时会选择短周期的商品作为促销品,这样可以提高顾客的复购率。
根据某些商品的购买周期,可以制定合适的促销策略,在欧美超市对食品类商品(比如鸡蛋、面包等),提前一周发放促销优惠卷,激励消费者到期购买此类商品,周期促销手段获得了很好的效果。
在零售门店中,果蔬类、肉类、水产、禽蛋是短周期商品,而调料、食用油的购买周期会稍长,而这些商品之间都存在着关联关系,常规做法是以短周期商品为引流产品、促使与长周期商品形成较高质量的购物篮。
在复购周期快到的时候,促销选品应该从关联商品(互补商品)中选择一个进行促销,如鸡蛋和蒸蛋器、啤酒和下酒菜,对于超期未复购的客户,通过精准营销系统(比如发放DM单等促销信息)进行复购引导;
组织促销时,可以结合商品关联表,对于具有相同购买周期的关联商品,可以选择其中的一个商品组织促销,比如,椰黄包与三全水饺的关联度很高,当三全水饺有活动时,则通知购买了椰黄包30天左右的顾客。
新品上市的时候,可以推荐处于类似商品复购周期的客户体验购买。
商品的购买周期从顾客购买之日起算,至顾客下一次购买的时间差,对于特定顾客群体会按照平均值计算,表4-7为某超市的商品复购分析。