数据仓库中的外部数据/非结构化数据

外部数据和非结构化数据在数据仓库中存在一些问题,例如:

  • 访问频率:外部数据没有固定的呈现模式,难以确保数据捕获的准确性。
  • 数据形式:外部数据的形式不规则,需要重新格式化才能满足数据仓库要求。
  • 不可预测性:外部数据的来源多样且不可预测,难以一致获取。

除了来自文章和报告的外部数据,非结构化数据也是外部数据的重要来源,可以存储在数据仓库中,包括图像、声音等。