数据挖掘是从大量数据中提取有用信息和知识的过程,其中关联规则挖掘是重要分支。关联规则挖掘关注在大型事务数据库中寻找变量间的有趣关系,即“关联规则”。这些规则揭示不同商品、事件或现象间的潜在联系,对商业决策、市场分析及个性化推荐至关重要。关联规则挖掘最早源于超市交易数据分析,如顾客购买商品A时通常也购买商品B。这种洞察力可优化商品布局、提升销售效率,协助广告商精准定位目标受众,提高广告效果。数学上,关联规则挖掘定义为:设商品集合I={a1,a2,...,am},交易数据库DB={T1,T2,...,Tn},X→Y(X,Y是I的子集,X、Y不相交)是一条规则,顾客购买X同时购买Y。支持度(Support)反映规则普遍性,置信度(Confidence)反映规则可靠性。挖掘包括识别满足支持度的频繁模式及生成关联规则,常用算法有Apriori、Partition等。