潘鹏老师提供的山东大学数据仓库数据挖掘复习题资料涵盖数据分析、数据挖掘和数据仓库等多个方面的知识点。复习内容包括数据分析的六大步骤:明确目的和思路、数据收集、数据处理、数据分析、数据展现和报告撰写。此外,还涵盖了大数据的4V理论、集中趋势和离散度量方法、数据对象的相似性方法、数据属性的相关性方法、数据预处理的主要任务等。详细解释了脏数据的类型和主要原因、缺失值的处理方法、噪音数据的检测和处理方法,以及数据集成的定义和主要问题。