本地数据预处理

3.1 数据集简介

本实验使用小数据集 small_user.csv,共包含 30 万条记录,从大规模数据集 raw_user.csv 中提取。

3.2 数据预处理

  • 删除数据头第一行的记录(字段名称):sed -i '1d' small_user.csv