数据科学涵盖统计分析、机器学习和计算机科学等多个领域。本课程将系统、深入浅出地讲解数据科学的精髓,带领学生掌握 scikit-learn、statsmodels、TensorFlow、Pyspark 等开源工具。
课程共分为四个部分,18个章节:
第一部分:入门 (3 章)
聚焦数据科学解决的问题、Python 工具运用以及数学基础。
第二部分:数据模型 (4-7 章)
涵盖统计学中的线性回归和逻辑回归模型、模型工程实现基础——随机梯度下降法,以及计量经济学中的特征提取方法和模型稳定性。
第三部分:算法模型 (8-15 章)
深入探讨机器学习领域的经典模型,包括监督式学习、生成式模型和非监督式学习。
第四部分:前沿领域 (16-18 章)
探索数据科学的两个前沿领域——大数据和人工智能,第11章将介绍大数据相关内容。