以关联规则 A  C 为例,深入解读其支持度和置信度:

  • 支持度 (Support): 衡量规则 A  C 在所有交易中出现的频率。
    • 计算公式:support(A  C) = support({A, C}) = 50%
    • 解读:意味着在所有交易中,同时包含 A 和 C 的交易占 50%。
  • 置信度 (Confidence): 衡量在包含 A 的交易中,也包含 C 的交易的比例。
    • 计算公式:confidence(A  C) = support({A, C}) / support({A}) = 66.6%
    • 解读:意味着在所有包含 A 的交易中,有 66.6% 的交易也包含 C。

Apriori 算法原理:

Apriori 算法基于一个关键思想:如果一个项集是频繁的,那么它的所有子集也一定是频繁的。

示例应用:

  • 最小支持度: 50%
  • 最小置信度: 50%