离散化将连续数据划分区间,用区间标号取代实际值;概念分层用高层概念替代低层属性值,概化数据。通过概念分层,数据细节虽有所损失,但概化后的数据更具意义和可解释性,同时节省存储空间和I/O开销。