Apriori算法生成的关联规则包含三个指标:支持度(Support)、置信度(Confidemce)、提升度(Lift),一般使用支持度-置信度二个指标判断事务之间关联关系的强弱,因此也被称为支持度-置信度框架(Support-Confidence Framework)。
如何判断一个购物篮数据集合中,那些商品之间是强关联、那些是弱关联,Apriori算法方法是,对于支持度和置信度都设置一个最小值,即设置一个筛选条件(阈值),以此判断事务之间关联关系的强弱,对于上面的5个购物篮,可以设置支持度最小值为30%,置信度的最小值为50%,那么{苹果、牛奶}的关联关系就是强,其他的都是弱,可以予以忽略。
Apriori算法产生后,不断有国外零售企业尝试使用,对卖场中的关联关系进行描述,下面就是几个实际案例。
案例1:某超市的熟食、面包、肉类三种商品品类之间关联关系表;
表3-1为某超市使用的熟食、面包、肉类的关联关系表,这个报表中采取了标准的Apriori算法指标,即支持度(Support)、置信度(Confidence)及提高度(Lift)3个指标,表格中的“—〉”符号指明了商品之间关联关系的方向,即从表格左侧到右侧的方向,左侧代表主分析的商品,右侧代表被关联的商品。
在这个报表中重点指标是提高度(Lift),该超市认为,如果这个数字大于20%,就可以认为这两个商品之间的关联关系是比较强的。
以第一行数据为例,表示顾客购买熟食时,有8.33%的客户会同时购买面包,这个比例很少,因此可以认为买熟食的客户只有很少的比例会购买面包。
第二行数据表示在顾客购买面包时,会有33%的顾客同时购买熟食,这里的提升度指标也很高,达到了33%,因此可以认为这条关联关系具有商业价值,熟食与面包的关联关系方向性很强,这是代表了不同的消费行为。
第三行数据显示有40%的顾客在购买熟食后,会去买肉类商品。
表格中的第九行数据指示肉类和面包,与熟食的关联关系较强。
案例2:为什么超市中的青椒、黄椒和红椒要分开陈列?
国外某超市对青椒、红椒、黄椒三个蔬菜与香蕉的商品关联关系进行了分析,分析结果见表3-2,该报表运用了三个指标,用以表示青椒、红椒、黄椒与香蕉的商品关联关系。
表3-2中的三种椒类与香蕉的关联指标表明,青椒、红椒、黄椒与香蕉的置信度分布为85.96%、89.47%,73.09%,说明这三个商品与香蕉出现在同一个购物篮的概率非常高,而三个商品与香蕉的提高度分别为137%、143%、117%,,这三个提升度数据均大于100%,代表这三个商品与香蕉之间具有很强的关联关系,除了黄椒有些偏低外,其他指标基本相近,而且很平均,说明三种椒类商品与香蕉的关联关系基本一致,购买青椒、红椒、黄椒的客户中大多数都购买了香蕉,因此香蕉是主要的被关联商品,从这个意义上讲,对于该超市来说香蕉是一个非常关键的商品,在任何时候都不得缺货,否则会造成青椒、黄椒、红椒的关联销售损失。
青椒是本地产品,价格比较便宜,因此面向的是一些低收入客户群体,而红椒、黄椒是进口的,因此红椒、黄椒比较贵,面向的是一些高收入客户群体。
高收入客户、低收入客户都需要香蕉,这是两类客户群体需求相同的地方,不同的地方在于他们需要的椒类档次不同,如果把这些商品摆放在同一个摊位上,我们可以想象一下,高收入阶层与低收入阶层的客户在同时一个摊位挑选青椒、红椒、黄椒和香蕉,会出现什么情况?如同羊群中闯入了骆驼,估计会谁看谁也不顺眼,搞不好会形成客户群体之间的冲突,这时高收入客户群体会加速购物、或者放弃购物。
因此该超市可以重新摆放位置,按照国内商品区域放置青椒、进口食品区域摆放红椒、黄椒,香蕉可以单独摆放、也可以同时在两边摆放香蕉,这样把2个客户群体分开购物,使这两个客户群体各自轻松选择自己需要的商品,互相不影响。