挑战任务
本次比赛要求参赛者基于讯飞开放平台提供的移动设备用户数据,准确预测用户的年龄和性别。
数据集描述
- 数据集包含训练集和测试集,共涵盖超过2万个设备的用户数据。
- 每个设备由唯一的
device_id
标识,并包含设备信息、APP信息和事件信息。 - 目标字段包括:
gender
: 用户性别age
: 用户年龄
- 数据集中部分字段信息已脱敏处理,以保护用户隐私。
数据集构成
- 训练集:包含2万条设备数据,用于模型训练。
- 测试集:包含3千多条设备数据,用于模型评估。
本次比赛要求参赛者基于讯飞开放平台提供的移动设备用户数据,准确预测用户的年龄和性别。
device_id
标识,并包含设备信息、APP信息和事件信息。gender
: 用户性别age
: 用户年龄