CCDM 2014数据挖掘竞赛专注于医学诊断数据,提出了普遍存在的多类标问题和多类分类问题。针对类别不平衡和训练样本稀缺的挑战,为优化数据挖掘任务,引入了二次集成学习的新框架。该框架首先利用首次集成学习获得高置信度样本,加入原始训练集,再次进行训练,以获得更高泛化性能的分类器。竞赛结果显示,与传统集成学习相比,二次集成学习在两个问题上均表现出色。