ETL即数据抽取(Extract)、转换(Transform)、装载(Load)的过程,在数据仓库建置过程中,资料整合转换(ETL)是最花费时间、人力的,约占整个项目的60%-70%左右。一家企业除了在不同的成长阶段所留下来历史资料,还包括使用者所产生的大量资料,及对外部所取得的资料,这些信息可能来自不同的数据库平台,或一些特定的档案格式。而ETL就是要将各个不同的数据文件或数据库所撷取的资料,根据企业之需求及数据仓库Model的设计,转换成正确的信息,清除重复不需要的资料,转至统一的数据库中,保留在企业内以利后续使用。