ID3算法的决策树学习过程目的是减少不确定性。如果选择属性A作为测试属性,它有性质a1,a2,a3,...,ai,当A=ai时属于第i类的实例数量为Cij。P(Xi;A=aj)表示测试属性A取值为aj时属于第i类的概率。Yj为A=aj时的实例集,则决策树对分类的不确定程度为训练实例集对属性A的条件熵:

(3)

(4)