模型方案解析

本次竞赛主要目标是预测广告点击率。方案构建了两个模型:LGB单模型和NFM残差模型。

LGB单模型

  • 特征:使用了特征工程后的特征,包括广告、媒体、用户、上下文等方面的信息。
  • 模型训练:最初包含时序特征,使用全部训练集进行训练;后期去除时序特征后,采用5折交叉验证的方式进行模型训练。

NFM残差模型

  • 基础模型:NFM模型,代码源于渣大的github项目
  • 特征:对原始数据集特征进行OneHot编码,并添加用户标签矩阵作为特征。
  • 模型目标:学习LGB模型的残差,进一步提升预测精度。