-- 编码:utf-8 -- 从pandas导入pd 从sklearn导入预处理 导入pickle 导入时间 导入时间的当前时间 计算时间() '''打印当前时间格式:return:返回当前时间的字符串''' 返回时间.strftime('%Y-%m-%d %X',时间.localtime()) class DataPre: '''数据预处理器初始化需要清洗好的数据。它提供了唯一的外部接口:load_data()。它返回处理好的数据。如果数据存在,则返回它。否则将执行一系列预处理操作并返回处理好的数据。 ''' 首先打开(self,train_data,test_data) self.train_datas=pd.read_csv(train_data,index_col=['SK_ID_CURR']) self.trainlables=self.train_datas['TARGET'] #删除唯一值.self.train_datas.drop(['TARGET'],轴=1,在地方=真实) self.test_datas=pd.read_csv(test_data,index_col=['SK_ID_CURR']) self.test_datas.drop(['Unnamed: 0'],轴=1,在地方=真实) self.train_datas.drop(['Unnamed: 0'],轴=1,在地方=真实) self.test_datas.drop(['previousSCOFR'],轴=1,在地方=真实) #这两个功能全是NAN self.train_datas.drop(['previousSCOFR'],轴=1,在地方=真实) self.test_datas.drop(['previousHomewares'],轴=1,在地方=真实) self.train_datas.dropna(轴=0,如何='全部',在地方=真实) self.train_dat