WEKA数据挖掘:分类与回归详解

在WEKA平台中,分类和回归功能都被整合在“Classify”选项卡下。

核心概念:

  • Class属性: 作为预测目标的属性,其类型决定了任务是分类还是回归。
    • 若Class属性为分类型,则任务为分类
    • 若Class属性为数值型,则任务为回归
  • 训练集: 包含已知输入输出数据的数据集,用于模型训练。

操作流程:

  1. 数据预处理: 对原始数据进行清洗、转换等操作,以适应算法需求。
  2. 模型建立: 选择合适的分类或回归算法,并使用训练集进行模型训练。
  3. 模型评估: 通常采用10折交叉验证等方法评估模型性能。
  4. 模型应用: 使用训练好的模型对新的、未知输出的数据集进行预测。