①前项支持度:包含前项的流水号占总流水号的百分比; ②后项支持度:包含后项的流水号占总流水号的百分比; ③规则支持度:包含前项和后项的流水号占总流水号的百分比; ④置信度:规则支持度与前项支持度的比值; ⑤提升度:置信度与后项支持度的比值。
在实操中,很多人只是用了excel的转置来做组合,大概就像99乘法表的生成办法。
把两种商品的组合穷举出来,然后再去统计。
算法的话,所有人都提到所谓的Apriori算法,看下图就很清楚了。
关于商品连带率的很有意思的一个练习:https://zhuanlan.zhihu.com/p/27279412
使用相同数据进行分析的一个练习:https://zhuanlan.zhihu.com/p/25318236