在关联分析中,有一种关联现象是被大量的有意无意进行忽略的,即零关联及负关联。
我们依然以零售场所的关联现象、即购物篮分析为例进行讲解。
零售门店中存在着大量只有一个商品的购物篮,就是所谓的单商品购物篮(Single-selling),几乎所有数据分析书籍都会建议,在进行购物篮分析时,将这些单商品购物篮的数据清除,因为这些购物篮中不会包含任何关联规则。
这是一种错误的做法,单商品购物篮中隐含了大量的缺失机会(Missing Opportunity),如果不对单购物篮现象进行研究、找出丢失的购物篮商品,长此以往,门店就要关门了。
单商品购物篮是关联规则中的零事务关系,零事务关系中可能蕴含着门店提升业绩的巨大空间,需要将这种零事务购物篮单独提取出来,专题分析研究、找出隐藏的商品关联规则,并逐渐在门店的商品选品、陈列、促销过程中改善购物篮中商品的数量,从而提升门店的销售业绩及顾客满意度。
门店中单商品购物篮的存在会体现为一种概率模式,比如某门店有60%的单商品购物篮,其余购物篮会出现多购物篮系数的分布,如20%购物篮是2件商品等。
单商品购物篮的商品在某些购物篮中呈现单购物篮系数,但是也会在某些购物篮中形成与其他商品的关联关系,这些看似稀少的商品关联关系代表了某些购买行为,这些购买行为提示了存在着提升购物篮系数的空间。
? 首先提取这些单商品购物篮的数据集合,作为预选数据库;
? 提取单商品购物篮的商品数据,作为主分析商品列表;
? 将提取的主分析商品列表,在门店的交易数据库中寻找与其有关联关系的购物篮,形成购物篮中间数据库。
? 对于上述购物篮中间数据库进行挖掘关联规则,方法按照Apriori算法的指标强弱进行筛选。
? 对于形成的商品关联规则进行研究,找出其中蕴含的购买行为,以此找出商品优化、定价及陈列等方面的策略,并在门店中进行改进、测试,从而达到提高客单价和交叉关联销售额的目的。
商品在购物篮中无法形成关联关系,也有可能商品存在着长尾现象(long tail ),即无人问津的商品,实体店中的长尾商品一般是没有经过营销推广、直接上架销售的新品,这种情况下需要组织新品的推广介绍、关联陈列等手段。
基于Apriori算法的购物篮中的商品属性是布尔型,进行购物篮分析时会将购物篮中商品进行品类层级升级,升级后的购物篮中同一个品类的商品会进行品类合并,使得这些多商品的购物篮,变成了单品类购物篮。
比如水果品类,下属细分品类有苹果、梨、柑橘、香蕉等,而苹果下属细分品类有国产苹果、进口苹果等品类。
当顾客购买了苹果、柑橘、香蕉等商品后,购物篮中的商品列表可能只能表示为{水果}。
因此,单品类购物篮与单商品购物篮的意义不一样,单商品购物篮一定要想办法提升购物篮中的商品品种数,而单品类购物篮(比如只有蔬菜、水果)是否具有价值,取决于门店的业态特征及购物篮对应的客单价,有些门店的业态特征是品类细化,即在单一品类深度耕耘(如果蔬店),此时门店可以进一步细化这些品类,使得这些单品类购物篮客单价达到最佳。
对于品类较多的大中型门店,单品类购物篮肯定是不够的,顾客只购买某种品类的商品,其他品类的商品无法共同出现在购物篮中,也是预示存在着购物篮提升空间。
沃尔玛就非常重视购物篮中形成的跨品类关联关系,因为同品类之间的关联关系比较容易形成(即单品类购物篮),但是跨品类的关联关系预示着更大的商业价值。
对于较大门店来说,购物篮中只有一个品类是不行的,生鲜店中只有蔬菜品类的购物篮中,需要将肉类、水产品等品类一起放进购物篮,为了将单品类购物篮变成多品类购物篮,必须在选品、陈列、促销等层面下功夫。