决策树是一种类似流程图的树形结构,每个内部节点代表在某一属性上的测试,每个分支表示一个测试输出,每个叶节点表示类或类分布。决策树的生成包括两个阶段:决策树构建和树剪枝。在构建过程中,从根节点开始,递归地根据选定的属性划分样本(必须是离散值)。树剪枝的目的在于检测并剪去训练数据中的噪声和孤立点反映的多余分枝。决策树通过将样本的属性值与树结构进行比较,对未知样本进行分类。