第一代数据挖掘系统直接将需要挖掘的数据一次性调入内存,成功与团队和数据质量的组织策略密切相关。对于大数据量和频繁变化的情况,需采用数据库或数据仓库技术进行有效管理,进而推动第二代数据挖掘系统的发展。当前的数据仓库设计主要用于OLAP操作,而非数据挖掘应用,因此真正的第二代数据挖掘系统需结合专门的数据管理系统,以弥补现有系统的不足。标准策略包括生成PMML或类似的开放格式,以便挖掘结果与操作系统集成。