这个存储库包含了edX中UC San DiegoX的Data Science MicroMasters计划的资源材料,引入分析数据和进行数据科学所需的开源工具集。数据科学是一个跨学科领域,利用数据挖掘等技术从各种结构化或非结构化数据中提取知识和见解。课程涵盖了Python软件包的使用,如Jupyter笔记本、NumPy、Matplotlib、Pandas、NLTK和Sci-Kit,以及在Kaggle上公开的著名数据集。