为了有效处理非结构化数据,我们分析了数据整合的现状和业务需求,探讨了公共仓库元模型(CWM)在ETL实现中的重要作用。我们详细比较了结构化数据和非结构化数据的特点,并提出了属性提取和数据打包的创新方法,为非结构化数据的ETI设计提供了标准化解决方案。