数据挖掘模块基于监督分类中的正类问题,训练集中的样本稀缺。此外,许多属性在不同实例中具有多种取值,因此特征选择的应用显得尤为方便。过滤器包括异常值处理、重新采样、离散化以及SMOTE模型。分类器采用SVM,通过参数扫描来优化。另外,随机森林和LibSVM评估模型的表现通过10FCV进行预测。