与完全独立的数据仓库模式不同,大多数企业内部的部门之间存在一定程度的集成。很少有企业像图6-20所示那样完全自主运作。更常见的是,多个数据仓库项目以图6-21所示的形式开发。

逻辑上属于同一个数据仓库

在图6-21中,一家公司在世界各地设有不同的分支机构(站点),例如美国、加拿大、南美、远东和非洲等地。每个分支机构都拥有自己特有的数据,机构之间不存在数据重叠,特别是对于详细的事务数据。

当第一个体系结构环境建立后,公司期望为每个分公司创建一个数据仓库。不同分支机构之间存在一定程度的业务集成,同时也假定在不同的区域,业务运作具有当地特色。这种企业组织模式在许多公司中很常见。

许多企业在构建数据仓库时,首先是在每个位于不同地域的部门内创建一个局部数据仓库。图6-22展示了一个局部数据仓库的构造情况。每个分部根据自己的需要创建具有本地特色的自主数据仓库。值得注意的是,至少就事务数据而言,在不同的区域之间不存在冗余的细节数据。换句话说,反映非洲事务的数据单元不可能出现在欧洲的局部数据仓库中。

局部数据仓库的优缺点

使用这种方法创建分布式全局数据仓库有几个优缺点。

优点:

  • 快速完成:每个局部小组控制局部数据仓库的资源和设计,并乐于拥有这样的自主权和控制权。
  • 立竿见影:这种方式开发的数据仓库的优点能够在整个企业内实时地表现出来。局部数据仓库可以在6个月内建成、运行并使局部层分公司受益。

缺点:

  • 无法识别或合理处理部门间数据结构(非内容)的共同性。