分类的实现
构建模型:
1. 预设分类类别:在开始之前需要设定分类的类别,以便后续数据标记。
2. 类别标记:为每个样本进行类别标记,形成训练集。
3. 分类模型训练:通过训练集生成分类模型,该模型可以表现为分类规则、决策树或数学公式。
使用模型:
- 利用构建的模型来识别未知对象的所属类别,预测对象的类别归属。
模型正确性评价:
- 测试集与训练集分离:为避免过拟合现象,将测试集与训练集严格分离。
- 正确率:通过已标记分类的测试样本与模型的实际分类结果对比,计算正确率,即正确分类样本数与测试样本总数的百分比。