挑战任务

本次比赛要求参赛者基于讯飞开放平台提供的移动设备用户数据,准确预测用户的年龄和性别。

数据集描述

  • 数据集包含训练集和测试集,共涵盖超过2万个设备的用户数据。
  • 每个设备由唯一的 device_id 标识,并包含设备信息、APP信息和事件信息。
  • 目标字段包括:
    • gender: 用户性别
    • age: 用户年龄
  • 数据集中部分字段信息已脱敏处理,以保护用户隐私。

数据集构成

  • 训练集:包含2万条设备数据,用于模型训练。
  • 测试集:包含3千多条设备数据,用于模型评估。