取样是一种普遍有效的近似技术,利用取样技术处理近似聚集查询在决策支持系统和数据挖掘中广泛采用。正确有效地产生近似查询结果并最小化误差是处理近似查询的关键目标。提出了Outlier-DivideConquer算法,结合误差确界,只需单次扫描数据集,特别适用于高方差分布的聚集属性,克服了随机均匀取样的局限性,显著降低近似查询误差,且比同类算法执行效率更高。实验验证显示,该算法与传统均匀取样算法相比具有显著优势。