数据仓库与知识发现在信息技术领域具有重要地位,尤其在大数据分析和商业智能中。南京大学的课程深入探讨了数据仓库的集中式存储系统,用于整合来自多源数据以支持企业决策。课程涵盖了数据仓库设计原则如星型、雪花型和星座模型,以及维度和事实表构建方法。此外,课程还介绍了数据挖掘的核心目标——从大数据中提取有用信息和知识,包括预处理、模式发现(分类、聚类、关联规则)、模式评估等阶段。学生通过使用工具如R语言、Python库(Pandas、NumPy、Scikit-learn)和SPSS Modeler等,学习如何应用数据挖掘技术解决实际问题。