SASchampion2017介绍了基于航空公司数据的损失预警模型,包括损失概率模型和客户画像。以58,954条经过数据预处理的航空客户数据为例,利用分类和聚类技术进行客户损失预测和价值细分。先进行了客户损失预测,使用了决策树、随机森林和梯度提升树进行训练和评估,并比较了它们的分类性能。结果显示,基于Boosting算法的分类器表现更佳,错误率更低。对变量的使用分析表明,最后一次飞行至观察窗口结束时间、第二年总机票价格和最大飞行间隔对预测客户流失具有重要贡献。随后,采用k-medoids聚类对非损失和损失客户进行了分组。