研究显示,社交互动和饮酒会导致特定的行为模式,近期研究建议区分焦虑和抑郁情绪的特定应对方式。数据挖掘技术被用来预测中学生的饮酒动机。然而,现有预处理系统的数据挖掘模型未能有效识别出对预测中学生酒精消费强度有益的相关属性。为了克服这一挑战,我们提出了一种名为多阶段预处理(MSP)的系统,利用离散化和特征选择阶段,从中学生的行为中提取最相关的属性。该系统不仅能够预测学生的酒精消费强度,还能识别酒精成瘾的风险。我们进行了综合实验,使用了基于相关性的特征选择方法如CFS、IG、CS和Relief-F。实验结果显示,这些特征选择方法显著提高了分类性能,在准确度、灵敏度、精度、F-measure和ROC-area等指标上表现出色。