近年来,患者信息和医学数据急剧增长。传统的诊断测试虽然成本低廉,但其诊断准确性不足以应对增长中的血液疾病患者数量。为了有效识别出血液数据中的关键疾病模式,医疗专业人员迫切需要可靠的预测方法。数据挖掘技术提供了一种有效的手段,通过分析和分类多维度数据,揭示出它们之间的关联。分类算法在此过程中显得尤为重要,其应用范围广泛且深具潜力。评估怀卡托知识分析环境下多种分类算法的效果,发现随机森林表现最为突出,其准确性高达96.47%,模型构建时间仅为0.16秒,显著优于其他竞争算法,如多层感知器分类器的最低精度仅为75.29%,模型构建时间长达1.92秒。