超详介绍用户画像 用户画像算法有哪些

导读:互联网进入大数据时代后,用户行为给企业的产品和服务带来了一系列的改变和重塑 。最大的变化是所有的用户行为都可以在企业面前追溯和分析 。企业中存储着大量的原始数据和各种业务数据,是企业经营活动的真实记录 。如何更有效地利用这些数据进行分析和评估,成为了基于大数据背景下的企业所面临的问题 。
随着大数据技术的深入研究和应用,企业越来越关注如何利用大数据服务于精细化运营和精准营销 。做精细化运营,首先要建立我们企业的用户画像 。
01 用户画像是什么 用户画像,即用户信息标签化,通过收集用户的社交属性、消费习惯偏好特征
▲图1标记用户
用户画像可以看作是企业应用大数据的基础,是定向广告和个性化推荐的前提条件,为数据驱动运营奠定了基础 。由此看来,如何从海量数据中挖掘有价值的信息变得越来越重要 。
大数据已经兴起很多年了,它已经成为互联网公司应用不可或缺的重要组成部分,就像人们生活的水、电空气一样 。从基础设施建设到应用层面,主要有数据平台建设与运营管理、数据仓库开发、上层应用统计分析、报表生成与可视化、用户画像建模、个性化推荐、精准营销等应用方向 。
很多公司在大数据基础设施上投入了很多,做了很多报表,但是业务部门觉得大数据和传统报表没什么区别,体会不到大数据对业务的帮助和价值 。原因是“数据还在数据仓库里,是死的” 。
用户画像可以帮助大数据“走出”数据仓库,为用户提供个性化推荐、精准营销、个性化服务等多元化服务,是大数据落地应用的重要方向 。数据应用系统的层次划分如图2所示 。
▲图2数据应用系统的层次划分
02 用户画像的3种标签类型 用户画像建模其实就是“标记用户” 。从标记用户的方式来看,一般分为三种:①统计标记;②规则类标签;③机器学习挖掘类标签 。
我们介绍这三种标签的区别如下:
1 。统计标签
这种标签是最基本、最常见的标签类型 。例如,对于某个用户,其性别、年龄、城市、星座、最近7天活跃时长、最近7天活跃天数、最近7天活跃次数等字段都可以从用户注册数据、用户访问和消费数据中统计出来 。这种标签构成了用户画像的基础 。
2 。规则类标签
这种标签是基于用户行为和一定的规则产生的 。比如平台上“活跃消费者”用户的定义是“最近30天交易次数≥2” 。在开发画像的实际过程中,由于运营人员更熟悉业务,数据人员更熟悉数据的结构、分布和特征,因此规则标签的规则由运营人员和数据人员协商确定 。
3 。机器学习挖掘类标签
这个类标签是机器学习挖掘产生的,用来预测和判断用户的一些属性或行为 。比如根据用户的行为习惯来判断用户是男是女,根据用户的消费习惯来判断他对某种商品的偏好 。这个类标签需要通过算法挖掘生成 。
在项目工程实践中,通用统计和规则的标签能够满足应用需求,在开发中占有很大比重 。机器学习挖掘标签多用于场景预测,如判断用户性别、用户购买商品偏好、用户流失意向等 。一般来说,机器学习标签的开发周期长,开发成本高,所以其开发的比例小 。
03 用户画像8大系统模块及解决方案 作为一个整体,需要考虑八大模块的构建来构建一个用户画像方案,如图3所示 。
▲图3用户画像主要涵盖模块
用户画像基础:需要了解、明确用户画像是什么,包含哪些模块,数据仓库架构是什么样子,开发流程,表结构设计,ETL设计等 。这些都是框架,大方向的规划,只有明确了方向后续才能做好项目的排期和人员投入预算 。这对于评估每个开发阶段重要指标和关键产出非常重要 。数据指标体系:根据业务线梳理,包括用户属性、用户行为、用户消费、风险控制等维度的指标体系 。标签数据存储:标签相关数据可存储在Hive、MySQL、HBase、Elasticsearch等数据库中,不同存储方式适用于不同的应用场景 。标签数据开发:用户画像工程化的重点模块,包含统计类、规则类、挖掘类、流式计算类标签的开发,以及人群计算功能的开发,打通画像数据和各业务系统之间的通路,提供接口服务等开发内容 。开发性能调优:标签加工、人群计算等脚本上线调度后,为了缩短调度时间、保障数据的稳定性等,需要对开发的脚本进行迭代重构、调优 。作业流程调度:标签加工、人群计算、同步数据到业务系统、数据监控预警等脚本开发完成后,需要调度工具把整套流程调度起来 。用户画像产品化:为了能让用户数据更好地服务于业务方,需要以产品化的形态应用在业务上 。产品化的模块主要包括标签视图、用户标签查询、用户分群、透视分析等 。用户画像应用:画像的应用场景包括用户特征分析、短信、邮件、站内信、Push消息的精准推送、客服针对用户的不同话术、针对高价值用户的极速退货退款等VIP服务应用 。04 一款用户画像产品是什么样的? 开发出画像后的标签数据,如果只是“躺”在数据仓库里,无法发挥更大的商业价值 。只有图像数据商业化后,才能更方便商务方使用 。这里简单介绍一下用户画像商业化后可能覆盖的主要功能模块,以及这些功能模块的应用场景 。


推荐阅读