啤酒与尿布---神奇的购物篮分析

老高的购物篮分析

公告

“啤酒与尿布”是一个真实的故事,发生在1990年代的沃尔玛大卖场,代表卖场的购物篮商品之间存在着某种特定的关联关系,挖掘并利用这种关联关系,可以使得实体零售门店充分;了解顾客的购物场景,为选品与品类管理、定价与调价、促销策略及评估、关联陈列、顾客行为聚类等提供了有效的数据依据。

我在2008年撰写了《啤酒与尿布-神奇的购物篮分析》(清华大学出版),开辟本专栏,是为了与大家探讨实体门店购物篮管理的理念、计算方法及案例,以及能够与相关软件企业合作,开发相关应用软件产品

MP:13901022781 微信同号

统计

今日访问:187

总访问量:306072

2023年08月07日

1、购物篮分析时的对象层级:直接选择购物篮中SKU级别、即最底层的商品(lowestlevelofdetail)作为分析对象,一般用于特定单品的购物篮分析,比如促销选品、价格分析、新品评估、替代分析等。大多数情况下,都需要会对购物篮中的商品进行品类升级,这样可以使得商品之间的关联关系得以聚焦,同时也是一个很好的减少数据冗余的办法。零售业的购物篮分析时,会有如下商品品类层级选择方法:SKU对SKU(最底层对最底层):将购物篮中的商品直接作为分析对象,这种层级分不适用于对某一个卖场中所有的购物篮进行关联规则挖掘,这是因为卖场中的购..

2023年08月04日

购物篮分析的商品品类层级选择:零售业的购物篮数据维度是最小零售单位(productlevel),即所谓的SKU级别,如果将这种最底层的商品单品直接进行购物篮分析,可能会出现数据颗粒度过于细小,商品之间的关联关系会被稀释,难以发现有意义的关联规则。因此有时需要对购物篮中的商品进行品类层级提升,使得关联关系可以聚焦,提升品类层级的依据可以来自于门店的品类表或分类表。商品分类在零售领域称为商品分层(ProductHierarchical)、或商品分类(Producttaxonomy),对应的就是门店的商品品类目录(ProductCategories)。每家零售企业的..

2023年07月28日

购物篮交易数据的格式、异常值及适应对象:购物篮数据来自于POS机,POS机于1990年代开始在零售业普及,其间恰好是关系型数据库的商业化应用阶段,因此大多数购物篮数据都是基于关系型数据库的架构构建及存储,属于典型的结构化数据。因此就会有这种现象存在,即将一个购物篮数据分别存储在2个数据表单中:订单主表(Master)和订单明细表(Detail),二个表之间采取订单号(order_id)作为外键(foreignkey)进行关联,形成一个完整的购物篮数据,一个购物篮数据对应了一个顾客的消费行为。近年来由于Java语言及云端数据库的普及,有些POS..

2023年07月26日

购物篮数据的外部属性与隐性属性;POS机交易时形成的订单数据,是经过简化的商品交易数据集,对于商业关联分析来说,这些数据集是不够的,要想进行详尽的购物篮分析,还需要补充交易数据的外部属性及隐性数据。购物篮分析需要补充的外部属性数据:1、商品基本属性信息(Product-leveldata):购物篮中的商品数据是精简数据,进行分析时需要补充商品基本属性信息,包括商品的全称名称、规格、品牌、供应商等。2、商品分类数据(Producthierarchy)或品类表(ProductCatalog):此部分数据用于对商品的品类归属及品类关联关系分析。3、货架陈..

2023年07月21日

一、零售关联分析的数据源零售业是一个数据密集的行业(Retailisadata-intensiveindustry),用于关联分析的数据是POS机(Point-Of-Sales)产生的交易数据。POS机产生的交易数据,也被称为Ticketsdata(交易票据数据)或CustomerTransactiondataset(顾客交易数据集)。POS机交易数据以销售小票为单位,一张销售小票对应一个顾客单次购买行为,也就是对应一个购物篮,如一家超市一天有1000个顾客买单,就会形成1000个购物篮。每个零售业态都会有自己的购物篮形成规律,日本7-11便利店平日购物篮数量为800-1000个,节假日为1000-1200个,国..

2023年07月18日

Pl值(PurchaseIndex:商品购买指数):PI值指的是商品千人购买指数,也称为商品购物篮渗透率、商品人气度、或者是商品的聚客指数,简单地说就是“某商品的顾客人气度”,由于在零售门店中“人”对应的是“购物篮”,PI值也被称为商品购物篮渗透率,在国外零售书籍中,PI值被称为Shopperpenetration(顾客渗透率)。PI值的计算方法:商品在单位时间内购物篮中出现的次数PI值=-------------------------------------------------------×1000单位时间内所有的购物篮数量PI值计算的是商品在购物篮中出现的次数,不是商品的销售数量。比如在一..

2023年07月13日

购物篮品类交叉系数,也称为商品交叉系数(affinity/cross-sellIndex):指的是购物篮中某商品与其他商品形成关联的次数,被称为商品购物篮交叉系数,国外零售业也称为商品关联强度(affinitystrength),如某商品经常与其他商品形成二次关联,则该商品交叉系数为2。商品交叉系数用于评估某个商品在购物篮中的关联表现,商品交叉系数可以发现那些商品会是单购物篮表现,而哪些商品会是形成多个商品的关联表现。这个指标有什么实际意义?国外零售业者发现,当购物篮中有软饮料时,有60%的购物篮中会同时有2个或2个以上的其他商品,因此可以..

2023年07月03日

购物篮系数(basketsize):购物篮系数指的是购物篮中商品的品种个数,不是购物篮中的商品销售数量,比如某购物篮中有2个商品,商品的销售数量分别为1个、10个,该购物篮系数为2,而不是1+10=11,因此购物篮系数是一个布尔型的数值。购物篮系数也被称为购物篮大小、尺寸、或购物篮长度(basketlength),由于经常按照特定时段的平均值计算,因此也被称为购物篮平均商品数(itemperbasket)。我们以R开发包中的Groceries数据集为例,从中提取三条购物篮交易数据,看如何定义购物篮的购物篮系数。下面有三个Groceries数据包的购物篮数据:1号购物..

2023年06月29日

当今零售企业基本以商品维度建立分析体系,商品维度的分析体系可以体现商品在门店的各种状况,是品牌商、供应商最喜欢的报表体系,而作为门店只掌握商品维度的分析体系,就会陷入瞎子摸象的境地。要想了解顾客需求,更好地提供顾客需要的商品,就要建立购物篮为基准的分析体系。通过购物篮分析体系,可以通过商品关联关系找出门店的顾客群体、消费场景及消费行为、顾客忠诚度、核心商品分布。门店可以根据购物篮分析的结果,对卖场布局、商品选品、陈列、价格、促销、获利能力等提供更加全面的数据评估依据。那么,基于购物篮的分析体系由..

2023年06月26日

一、购物篮中商品关联关系的场景描述:对于上述八种购物篮商品关联关系可以进行如下的商业场景描述:假定某天想在家与朋友小酌,需要购买啤酒、下酒菜酒菜应景,产生的场景描述如下:孤单商品:原计划买啤酒与下酒菜,但是门店的卤菜柜台菜品看上去不新鲜,只购买了啤酒。交叉销售:或者在门店=购买了啤酒,同时也购买了熟食等下酒菜,啤酒与卤菜形成交叉购买行为。向上销售:计划购买啤酒,由于门店的酒类陈列、促销等原因,最终购买了葡萄酒,形成了向上销售的购物篮。向下销售:原计划购买某知名卤菜,到店发现该卤菜的感觉不佳,于是..

2023年06月20日

五、互斥商品关系(ExclusiveEvent):互斥商品关系,指的是一种商品出现、则另一种商品必然不出现的购物篮销售现象,商品之间的向上销售、向下销售也是互斥商品的一种表现形式,代表了商品之间的替代关系,互斥商品呈现了商品的负关联关系。替代商品一定是互斥关系,但是互斥关系不一定是替代关系。商品互斥的范围要远大于商品替代,很多互斥商品代表了商品之间的冲突、排斥关系。零售业有一句话,互斥商品代表了“同行是冤家”,互斥商品大多出现在同品类的商品之间。互斥商品之间会发生商品销量的争夺,会对购物篮质量产生影响。当互斥..

2023年06月12日

购物篮中商品关联关系的八种表现形式:按照商务事件之间关联关系的定义,购物篮中商品之间的关联关系,应该具有如下条件:1、购物篮中的商品组合必须发生在同一个门店,即具有相同的商业空间特性。2、购物篮中的商品进入购物篮具有前后序列模式、或放入的时间临近。对应商务事件之间的基本关联关系类型,零售业的购物篮中,商品之间的关联关系会出现以下八种关联表现形式:一、孤单的商品(Standalone):这种商品也被戏称为性格孤僻的商品,这类商品一般不会与其他商品形成购物篮中的商品组合,与其他商品的关联关系是无关关系,国外零售..

2023年06月08日

在购物篮中,商品组合会呈现不同形式的关联形式,关联形式对应了商业事件之间的关联关系,那么,什么是商业事件之间的关联关系?商业事件之间的关联关系,指的是商业事件之间存在着某些频繁出现的规律或模式。在商业分析领域,具有关联关系的商业事件必须满足以下二个条件:Ø商业事件必须共同处于临近的商业空间内,即产生关联关系的事件之间必须具有相同的商业空间属性,比如购物篮中的商品组合必须发生在同一家店铺中,否则这种关联关系没有商业意义。Ø事件的发生必须是时间相近、或者是前后顺序模式,即发生关联的商业事件之间具有相..

2023年06月05日

今年的4月19日-4月21日,几乎沉寂了三年的CHINASHOP在重庆开幕,作为行业最具影响力的零售技术展会,今年的CHINASHOP备受期待,我也特地与朋友前去重庆参观了一天。展会上除了常见的厂商外,可以看到又冒出来很多新的硬件厂家,尤其是AI智能称重设备、智能主板等厂商,相比之下,软件厂商显得寂寞了很多。众多厂商最喜欢炒作的是门店数字化解决方案,此次某厂商联合ChinaShop推出了《零售及餐饮行业数字化发展白皮书》,在此借助此《白皮书》,了解一下厂商对于实体门店数字化的理解程度。《白皮书》中认为,门店的数字化是由数字化设备组..

2023年05月31日

前面讲述了日本生鲜店的“饮食规划师”的案例,在国内的生鲜零售业态,也有人在思考单品思维向菜单思维的转变(本文根据网上的讲课文稿有感改编)。几年前,盒马生鲜率先对某些生鲜品进行大力促销、大幅降价,以爆款达到引流效果,获得了很好的成效,也成为了后来众多生鲜店的学习榜样。但最近一段时间,尤其是疫情之后,很多生鲜店遭遇客流严重下降、客单价停滞不前的困境,传说中的“生鲜引流”并没有发生。表面上看,在发力生鲜品的引流上,零售商似乎已经使出了全身解数,比如加大生鲜品类的比重、增加生鲜经营面积;建立直采能力,引..

2023年05月28日

现今的零售业者,基本都是出于单品思维,最典型的就是大家都在追求“爆款”,考核指标都是围绕单品的销售业绩,无论是门店选品、上架、陈列、促销等等基础运营,出发点都是单品。进入新零售时代,以商品为中心的管理模式会是一种过时的管理模式。新零售并不是只有新信息技术手段,管理理念不能转变,新技术的堆积不能构成新零售。以商品为管理中心的经营模式在国外称为modelasaproduct-orientedbusiness(面向商品的生意模式)。以商品为中心的零售企业,其组织机构、人员分配都会依照按照商品的属性(品类)进行划分,不同的商品品类对应..

2023年05月26日

购物篮分析,英文名称为MarketBasketAnalysis(简称MBA),或者ShoppingCartAnalysis(购物车分析)。在网上没有查询到关于购物篮分析的权威定义,大多是引用是我于2008年清华大学出版社出版的《啤酒与尿布---神奇的购物篮分析》一书中的定义,具体内容如下下:“购物篮分析,指的是将单个消费者的一次购物行为中购买的商品集合,称为一个购物篮,通过对购物篮中商品组合进行数据分析,发现商品之间的关联关系(Relationship、MerchandiseMixModeling),进而挖掘出消费者行为或商品组合规律,这种分析手段最早应用于超市的购物篮商品分析..

2023年05月24日

商品交叉价格弹性指的是价格变动引起的商品之间销量的变化。

2023年05月22日

在零售门店中,会出现某些商品之间的交叉影响现象,英文称为CrossEffects,比如一个商品的销量上升、而另一个商品的销量应声下降,或者商品之间的销量呈现同升同降的现象,当这种相互影响的形式呈现某种弹性关系时,这种关系就被称为交叉弹性(CrossElasticity),商品之间的交叉弹性也是商品关联关系的一种形式。在商品交叉弹性中,商品之间的交叉价格弹性是其中最重要的一种。交叉价格弹性(Cross-PriceElasticity),表示在一定时期内一种商品的价格变化所引起另一种商品销售量的变化。简单理解,如果A商品的价格变动引起了B商品的销量..

2023年05月19日

我们现在讲零售运营中(P&P)的第二个P,即Promtion(促销)。促销对于零售业意义重大,促销是日常主要工作内容,很多业态没有促销就没有客流。我在日本考察零售时,日本零售业者告诉我,日本超市的促销频率大致为年平均104次,即每周二次,每周三一次小促、周六一次大促。国内超市促销没有日本这么频繁,但是2周一次的大促(大型促销活动)也是常态。促销的目的是达到吸引顾客到店,对于实体店来说,只要顾客到店就是引流成功,到店顾客多多少少会购买一些商品。促销方式很多,而降价促销(PricePromotion)依然是一种最简单粗暴、也..