医疗数据挖掘中的二次集成学习创新应用(2014)

数据挖掘 34

413.36KB 2024-08-15

#数据挖掘 # 二次集成学习 # 医疗数据 # CCDM 2014

CCDM 2014数据挖掘竞赛专注于医学诊断数据，提出了普遍存在的多类标问题和多类分类问题。针对类别不平衡和训练样本稀缺的挑战，为优化数据挖掘任务，引入了二次集成学习的新框架。该框架首先利用首次集成学习获得高置信度样本，加入原始训练集，再次进行训练，以获得更高泛化性能的分类器。竞赛结果显示，与传统集成学习相比，二次集成学习在两个问题上均表现出色。