数据仓库区别于传统数据库,具备以下显著特征:

1. 面向主题:

数据仓库聚焦于特定的主题领域,例如客户、产品、交易或财务等,而非具体的业务流程。

2. 数据集成:

数据仓库整合来自多个异构数据源的信息,经过提取、清洗、转换和加载(ETL)过程,消除数据冗余和不一致性,形成高质量的数据集合。

3. 非易失性:

数据仓库的数据通常以批量方式加载,并以历史快照的形式保存,不会像操作型系统那样频繁更新。

4. 时效性:

数据仓库涵盖较长的时间跨度,通常为5到10年,用于支持长期趋势分析和决策。

5. 时间维度:

时间是数据仓库的关键维度,数据以时间序列的形式存储,便于进行时间点或时间段的查询分析,揭示数据随时间推移的变化规律。