在进行购物篮分析时,有一种有效地判断关联规则价值的方法,就是观察商品的关联规则是发生在同品类、还是跨品类。
比如同时发现了百威啤酒与嘉士伯啤酒、百威啤酒与帮宝适尿布之间的关联规则,哪一组的关联规则价值更高?
在零售领域,跨品类商品关联规则的商业价值一定大于同品类商品之间的关联规则。
比如百威啤酒与帮宝适尿布之间关联规则的商业价值会大于百威啤酒与嘉士伯啤酒之间的关联规则。
这是因为,跨品类的商品之间相互独立(product interdependence)、陈列空间不相近、动线较远、即使有促销等因素,顾客放入购物篮中形成交叉销售并不是一件容易的事情。
跨品类的交叉销售可能预示着特定的消费行为,一旦确定是具有商业价值的关联规则,就需要进行大力撮合,比如将陈列空间临近,促使形成更多的跨品类交叉销售。
同品类的商品由于功能相似或互补、商品相互依赖、相互替代、相近陈列,本品类的交叉销售比较容易实现,很多在卖场中确定存在的关联关系,基本都是发生在同品类的商品之间,比如超市中的酱油与醋、调料之间、不同口味饮料之间。
因此在某些时候,同品类之间的商品关联关系可以忽略。
该案例来自某个论坛,有人对南方某小型超市的月度交易数据进行了购物篮分析,过程如下:
1、数据概述:购物篮数据共有31878次交易,时间周期为一个月,其中销售额较高的主要是香烟品类,低价的烤肠销售额也比较高。
2、数据处理过程:在得到数据后,去除了塑料袋、积点印花等商品项目,在31878笔交易中,有18936次购买是单一商品购买(即单商品购物篮),分析者认为单商品购物篮没有意义(其中没有关联规则的存在),因此对单商品购物篮的数据予以了删除。
3、分析过程:完成了数据清理后,按照Apriori算法的指标阈值设置法,设置最小支持度为0.001,置信度为0.3。
4、关联规则生成:共生成了22条关联规则,下面列出来一部分:
{ 立顿奶茶饮料} => { 立顿英式奶茶} 0.001035774 0.433333333 181.2922
{ 立顿英式奶茶} => { 立顿奶茶饮料} 0.001035774 0.433333333 181.2922
{ 奶香巧克力} => { 牛奶巧克力} 0.001354474 0.566666667 151.3241
{ 牛奶巧克力} => { 奶香巧克力} 0.001354474 0.361702128 151.3241
{香菇牛肉面)} => { 白菜味辛拉面} 0.001354474 0.395348837 95.42352
{白菜味辛拉面} => {香菇牛肉面)} 0.001354474 0.326923077 95.42352
{双汇香肠} => { 双汇火腿肠} 0.001274799 0.307692308 56.79186
{ 甜不辣} => { 烤肠} 0.012110589 0.413043478 3.721542
{ 鱼丸} => { 烤肠} 0.001354474 0.369565217 3.329801
本次购物篮分析的问题在于,入手分析购物篮数据时,不要直接选取购物篮中的商品单品,这样分析结果会被大大稀释,此时建议对购物篮中的商品进行品类层级升级,比如将购物篮中的商品升级到“饮料、巧克力、方便面等”品类。
上述生成的关联规则结果,是按照Apriori的标准算法计算的三项关联指标,如果以指标强弱进行解读,第一行、第二行的“立顿英式奶茶”与“立顿奶茶饮料”的关联规则指标较强。
但是上述商品关联规则都是发生在同品类商品之间,在零售门店中,这种同品类的关联关系大量存在,属于商业常识,因此这些关联关系没有实际意义。
上述关联规则中,出现了几个商品(比如奶茶与饮料)二个方向的指标完全一致,说明购物篮中的数据前件、后件直接照搬了购物篮中的数据顺序,其实这个购物篮商品顺序是随意的、没有意义的。
某超市在组织促销后,对促销商品的购物篮表现进行了分析,以此判断促销商品的选择是否合理。
我们以第一行为例,促销商品A在促销期间购物篮金额为30元,平时购物篮金额为28元,因此促销品对应的关联属性为向上销售。
第二行的促销商品B平时购物篮金额为20元,促销的购物篮金额有所提高,属于交叉销售。
第三行的促销商品促销期间购物篮金额有所下降,促销发生了向下销售。