随着数据技术的进步,现有数据呈现出分散、非整合、难以访问的特点,来自多种数据源和平台,数据质量参差不齐,存在冗余且难以解析。数据量巨大,涵盖了VSAM、IDMS、IMS、CICS、COBOL等传统应用、多媒体文档、ERP系统、协作软件数据库以及Web运营活动。