在SPSS与数据挖掘中,为了建立模型,通常需要将资料切割成训练组和测试组,特别是在不同区域或时间段内进行模型分析时。当资料量过大时,可以先抽样分析,以便初步了解资料情况和测试适合的模型。介绍了使用CRISP-DM过程实践中的资料平衡合并、变量转换和新变量导出等技术。