1.2国内外发展现状1.2.1用户画像的发展与应用Alan Cooper在1983年提出了Persona(用户画像)这一概念(穆德,2007),他认为Persona是通过从用户真实数据抽象出来的用户模型。对目标不同维度例如用户的年龄、性别、行为特征抽象出用户典型特征,然后将这些典型特征标签化再进行组合,这样便形成了一个用户原型。另外一种对用户画像的定义是对现实生活中的用户行为进行数学建模。通过对用户的人口属性,社会交往,行为偏好等主要信息建模分析,从而抽象出一个用户的信息全貌,为进一步分析用户的行为习惯等重要信息,提供坚实的基础。通过以上两种定义可以得知,用户画像从具象和抽象的角度来说,是对用户信息抽象出的一个标签集合。因此,对于用户画像系统的发展和应用我们可以从用户的自然属性和用户的行为属性角度分别进行详细的阐述。 1.2.1.1用户的自然属性指的是用户的基本信息研究。最基本的自然属性包含用户的年龄,性别,职业、学历,受教育程度等静态信息。用户的社会属性包括婚姻状况,家庭构成,信息渠道等。赖茂生、屈鹏(2008)通过以用户的自然属性、社会属性为切入点,以用户在搜索中使用的查询语言做为研究对象,通过网络调查问卷的方式以及对搜索引擎日志分析方式,在用户的性别、年龄、学历等不同维度来判断用户自然属性对其语言行为的影响。 1.2.2.2用户的行为属性用户画像中对用户的行为进行研究,利用现在的数据挖掘的相关技术来实现,是用户画像的真正价值所在。由于互联网数据的复杂性以及实时性,其研究过程体现用户的行为特征以及兴趣爱好,既可以用过个体层面来发现用户属于什么群体分布,也可以从用户聚集的人群中发现不同个体之间的联系,对于不同的人群给以不用的用户价值,并对不同的用户提供个性的服务,及用不同的营销策略。张慷(2014)基于Hadoop平台,对移动用户的DPI日志处理与分析,从而提