涉及到的概念t训练样本t用于构造分类模型的集合t测试样本t用于测试分类模型的集合t分类t首先从数据中选出已经分好类的训练集,在该训练集上运用数据挖掘的分类技术,建立分类模型,对于没有分类的数据进行归类的过程。 t决策树t是一棵有向、无环的树。 t决策树技术t从一组无次序、无规则的事例中推理出决策树表示形式的分类规则。采用自顶向下的递归方式,在决策树的内部节点进行属性值的比较并根据不同属性判断从该节点向下的分支,然后进行剪枝。 t连续属性t当一属性的值域为连续域时,该属性称为连续属性(后文的Age属性) t离散属性t当一属性的值域为非连续域时,该属性称为离散属性(后文的Car Type属性)