用户画像,最简单理解为一堆用户特征或者标签的组合。 关于“用户特征” 特征,是指对于同一个指标,在某个维度上的表现特别与众不同。并且这种与众不同在营销上也具备较强的知道意义。所以,用户画像中的维度并不是什么阿猫阿狗都能纳入的。正因如此用户画像才能理解为“一堆用户特征或标签的组合”。 有时候,我们也把用户画像叫做:营销工具。 用户标签是对数据的再加工。本质上来讲,标签就是对用户特征的描述,如男/女,偏好,状态等,很多时候也是作为用户分层/分群的规则之一。 标签包括用户的属性数据、行为数据、偏好数据等,在标签属性上又可以分为静态标签和动态标签,这些数据构成了建立用户画像模型的基础。 关于“标签” 标签,也是营销工具,并且标签可以嵌入到业务流程中的各个系统中实现运营策略的自动化。例如流程中中断的用户,会被打上标签,然后在一定周期内触发各种策略(推送等)。同时我们常说的“千人千面”也是根据用户标签来实现的。 这里也补充我在课程中关于静态标签、动态标签的示意图: 那为什么要做用户画像呢?企业在发展壮大时期,很重要的一点是对用户的认知和了解。 用户画像是了解用户及产品健康度的有效工具,如核心用户属性是否变化,平台用户构成等,也可以更多维度的对用户行为属性变化做深层的分析对比。 关于“对用户的认知和了解” 事实上,营销或者业务层面对于了解用户认知用户的方式方法非常多,但最终都是都会落地为用户画像。 通过对用户标签特征进行分析、统计以及挖掘潜在价值信息,从而抽象出一个用户的信息全貌。用户画像也可以看做是企业应用大数据的根基,是定向广告投放与个性化推荐的前置条件,以及数据驱动运营的基础。 上面我们说到,用户画像建模过程其实就是为用户打标签。对于标签的产生,在来源上一般分为三种: 1)统计类标签:这类标签是最为基础的标签类型,例如:用户属性标签,性别、城市等,用户行为标签,如APP使用时长、活跃天数、累计消费金额等,是可从用户相关明细表/数据中统计得出。 该标签构成了用户画像的基础,是用户画像最常应用的分类规则。 关于“统计类标签” 这个确实是最常用的,因为可以根据非常简单的统计方法即可生成。但是涉及到行为类的统计标签,通常还会和下面的规则类标签一并使用。 2)基于规则的标签:该类标签基于用户行为及确定的规则产生,如最近30天活跃天数大于15天,为“活跃用户”的标签规则。 关于“规则类标签” 规则类标签是典型的人工标签,即人为基于对业务的理解而制定的标签。这类标签和业务联系极为紧密,通常是有了明确的业务目标后才开发此标签。规则类标签不太灵活,例如上面的“活跃用户”标签的定义是“最近30天活跃天数大于15天”,如果业务目标改为“最近10天活跃天数大于5天”的话,要么重新开发新标签,要么将规则类标签进行参数化处理以适应不同业务的需求。 3)基于挖掘的标签:该类标签多用于预测,需要通过算法挖掘产生。例如:根据一个用户的行为习惯判断是男性还是女性,根据一个用户的行为判断其对某商品的偏好程度等。 数据源的梳理和基础规则的应用是应用挖掘类标签的前提。挖掘类的标签是个循序渐进的过程,在实际使用过程中可做不断调优。 需要注意的是,在着手搭建用户画像体系之初,要从业务实际需求出发,用户画像是为了驱动业务、实现增长,而不是为了有标签画像而做标签画像,不能本末倒置。 很多传统企业做用户画像有一个误区,即用户画像就是一份高大上的用户分析报告,画像标签多以用户基本属性和静态标签为主,但实际跟业务系统并没有打通,也没有真正对业务产生价值,沦为了形式主义。 因此做用户标签画像应以终为始,明确业务场景和需求解决的问题。标签画像 “有了”和“用上了”,以及“做了”跟“做好”,中间存在着很大的鸿沟。 应用场景1:精细化用户运营,提升用户生命周期价值此类应用场景是用户画像最基础且应用最为广泛的场景,即根据用户行为标签特征进行用户分群,制定用户生命周期管理模型。通过监控用户阶段(标签)的变化,根据用户的实时状态、行为与标签的迁移进行运营干预,达到预防流失、召回的目的。 关于“精细化用户运营” 这个场景的典型使用流程是: 业务目标 -> 用户画像 -> 专家解读 -> 开发标签 -> 制定策略 -> 分析效果。 所以,在营销中的标签,通常为上篇讲到的规则类标签,即人工制定规则。 例如对预流失标签+某产品类型的偏好用户群体做及时的个性化内容触达,达到预防流失的目的等; 关于“流失召回” 存量时代新增枯竭,流量运营的大方向就是两个:提升留存和流失召回。流失召回也是一项很考验运营能力的工作,详情请参阅本站原创文章: 《深入探讨用户的沉默和流失》 《沉默用户预警体系的搭建与运营》 《【续】沉默用户预警体系的搭建与运营》 《【完结】沉默用户预警体系的搭建与运营》 同时,通过用户价值标签对高价值用户投入更多的成本做差异化运营,提升投入产出比。我们熟知的RFM模型,就是最常见的一种用户画像应用之一。举个例子:目标是提升理财交易额,把转化高价值潜客用户作为其中一个策略,并定义为投资意向价值用户转化营销。这时人群策略就呼之欲出了,投放人群策略描述为有理财意向的非理财潜在高价值用户,便可以从各种各样维度选取相应标签,并通过标签快捷筛选获取名单,然后实施精准触达用户,最后再评估营销效果。这整个流程是分群营销中常见的一种思路。最后,通过测试优化形成自动化触达机制。 关于上图 上图中应用的标签非常多,所以在实际营销过程中还会涉及一个重要问题:标签的交叉。在业务系统的标签应用中,常会出现标签的逻辑运算,如下所示: ((男性 & 高价值) | (女性 & 低价值)) & (高活跃) 应用场景2:广告优化在获客成本持续走高的今天,企业通过对平台目标用户画像特征分析/挖掘,建立全景目标用户画像,在投放上精准触达目标用户群里,达到提高转化率降低获客成本的目的,即知道用户是谁,从哪里来。 用户标签数据的来源除了企业本身的数据外,很多企业也会与第三方数据平台合作,通过ID-Mapping的方式补充丰富用户画像特征。 包括用户安装/使用最多的app,浏览/购买偏好、用户搜索词等行为数据,通过用户唯一标识进行匹配,进一步完善用户全景画像。 关于“第三方数据平台” 因为企业自有的数据始终是局限和有限的。处于商业和营销的角度,企业确实需要了解用户在企业外的特征,所以需要借助第三方数据公司来提供更完善的用户画像。例如下图是某第三方数据公司可以提供的用户画像维度和量级: 关于“联邦建模” 但是企业内外部进行数据交换会涉及用户隐私,所以 2017 年谷歌提出了联邦建模的概念,在保证企业内部用户隐私不外流的情况下进行内外部数据的标签匹配: 投放优化通常会通过触达渠道优化、触达地域、性别年龄、偏好特征等,将广告信息精准曝光给目标用户客群。此应用场景较多应用在有特定用户群体的产品推广中,在互联网金融领域也有较多应用,例如线上借贷平台希望通过投放优化提升审核通过率,通过对平台按期用户与逾期用户的特征对比,找到两类用户特征差异,做定向触达优化等。此应用场景也较多在互联网金融行业使用,例如对平台按期还款用户与预期用户的特征对比,找到目标用户特征差异,做定向触达等。 应用场景3:交叉营销交叉营销一般有两种场景,一是对已完成转化的用户进行不同品类的交叉推荐。例如很多电商平台有类似'买过此类商品的用户还喜欢’的推荐栏目,就是应用标签画像的交叉营销场景;如果企业已积累大量的用户购买数据,可以应用数据挖掘,包括链路分析、网络分析的方法,确定商品间的相关程度,从而确定交叉销售的商品/对象。第二种场景是筛选更有可能购买某类产品的潜客进行营销推荐。这种场景可以直接应用分类模型,对于已经完成某类产品转化的人群的属性信息及交易行为等信息进行特征分析,在未完成此类产品转化的用户中找到更有可能购买的目标用户群做潜客营销, 以提升购买率。 关于“交叉营销” 交叉营销是平台型产品的重要营销工具,常用于提升留存和营收。交叉营销一般是指跨业务场景、或跨业务形态的场景相互引流,核心逻辑是满足用户的多样性需求。 有兴趣的同学可以参详本站原创文章: 《深入探讨交叉营销(一)》 《(续)交叉营销中的峰终定律》 《(续二)交叉营销中的数据模型》 应用场景4:个性化推荐个性化推荐强调'千人千面’,基于算法模型的建立和调优,对比上面三种应用场景,整体的投入成本也更高。个性化推荐实际解决海量的信息内容与用户的匹配问题,为用户推荐其感兴趣的内容、商品或服务。通常在内容分发平台及电商平台有广泛的应用。 关于“个性化推荐” 个性化推荐是非常复杂的标签应用场景,也是将标签特性发挥的淋漓尽致的场景。在个性化推荐中,通常包括应用框架级别和内容级别两种,前者是在应用的UI架构上实现功能、服务的个性化推荐,也叫“千人千面”,这是重要的营销能力,可以将很多二三级页面直接推到一级曝光位上来获得流量;后者就是大家熟知的推荐策略了,更详细的内容可以参详本站原创文章: 《【7000字】为什么我说你并不懂标签体系》 应用场景5:产品应用/分析洞察最后一个场景是产品化应用,可以理解为数据中台营销服务的一个功能。标签是很多数据产品的基础,诸如广告系统、个性化推荐系统、CRM 基础搭建等,目前市面上有很多成熟的标签搭建和管理的产品。如果选择自建自动化运营平台,本质上对底层的要求就是标签体系。自建平台可以更灵活的满足企业的个性化需求,以及实现更多维度的对用户行为属性变化做深层的分析对比。 用户画像的构建是个系统性的工作,需要区分不同的场景及不同的应用模式。 如何根据业务实际搭建用户标签画像体系?具体从搭建到应用总体需要以下几个步骤: STEP 1:理解业务需求,明确标签画像需要解决的问题 上面我们讲了用户画像的常见应用场景,在搭建用户标签画像之初,首先应明确公司/业务需求及目的。 每个公司对标签体系建立的目的可能都是非常不一样的,体系的搭建始终围绕核心问题,一开始不要求大而全, 而是是实际业务出发,逐步进行完善。 关于“明确需求” 跑一次用户画像需要很多的资源,所以在看画像前务必明确业务需求和目标。并且不要试图先跑画像再去分析,这样什么也分析不出来。 STEP 2:从业务场景出发梳理标签层级分类 梳理用户标签体系是搭建用户画像过程中最基础,也是最重要的工作,后续的完善及应用都依赖于标签体系的搭建。 根据业务场景从不同维度对标签进行分类和组织,方便使用者在不同业务场景对标签进行检索使用。 关于“分类和组织” 标签是典型的数据产品,需要被高效和有效的管理。所以通常在企业内有一套标签管理平台来集中管理,主要包括标签的:分类体系、业务体系、口径管理、应用管理等,还有几个更重要的功能:近似标签的识别和去重,标签的废弃管理。 1)用户属性标签 又分为人口属性及平台属性,主要为静态标签。 人口属性如性别、年龄、地域等,平台属性如注册渠道,关键词来源等; 因不涉及规则逻辑计算,梳理及开发都相对简单,重点是需要数据运营同学了解标签数据获得形式,数据准确性、覆盖率、实用性等,明确应用场景及业务含义; 2)用户行为标签 基于统计数据的用户行为标签,以业务事实数据为数据源。此类标签又分为数值型及分类型。 数值型标签为事实行为标签,方便运营同学从更细粒度对单个用户进行分析探查,以及可作为后期数据挖掘的基础数据,如用户累计交易金额,交易次数、活跃天数等。 分类型标签为事实标签的聚合标签,方便对行为相似的用户群体做分组/分群的运营策略或触达操作。如将累计交易金额大于某数值的用户,定义标签为'交易高价值用户’等。 目前很多数据产品都支持自定义标签的功能,方便在运营初期对标签规则的灵活调整需求。 3)用户偏好及预测标签 在用户行为标签的基础上,根据业务规则设定用户各类行为的权重,以及标签的权重,通过数据挖掘对用户行为标签数据的再加工产生。通常有多个输入字段,如对于用户偏好标签,收藏行为的权重大于浏览行为,此外,由于用户偏好及需求会随着时间发生改变,还应考虑时间衰减系数。 预测类标签生成逻辑与偏好标签类似,都是通过多个影响因素对用户进行倾向预判,如根据行为发生时间、行为次数、行为类型偏好等数据,做进一步的数据处理,形成分类或聚类规则。如流失倾向预测标签。可通过模型提前识别要流失的用户,有针对性的对这批用户进行挽留。 关于“用户偏好和预测标签” 这类标签统称:用户兴趣标签。一般分为主兴趣、即时兴趣、短期兴趣和长期兴趣。每种兴趣对应了用户对于不同事物关注的深度和强度,同时每种兴趣都有对应的场景和营销策略。 用户的兴趣标签一般会有“衰减”,常见的衰减算法有:时间衰减、指数衰减(如下图)、牛顿冷却模型等。 4)群体属性画像 群体属性画像关注重点是群体,是从用户个人相关标签的基础上加工而来。 标签的加工逻辑是对用户群体进行聚类,分析每类人群的行为特征/偏好,形成用户群体标签。例如,某电商平台通过对'女性白领’用户群体的偏好特征进行分析,为符合此类人群的新用户做产品推荐以提升转化率。 这类标签的梳理重点有两个,一是关键业务流程节点及所代表的业务含义,二是应用场景的明确。 上图是一个相对通用的标签体系架构,在梳理标签和画像时,这是一个很好的参考框架,通过这个框架梳理业务场景和目标,再反向设计标签。标签的设计与应用一定要基于对业务和架构的理解。 STEP 3:明确标签规则口径 确定了标签的分类体系,下一步就是确定规则和挖掘类标签口径,包括调整优化模型及相关权重配置; 对于标签规则的确定,在业务发展初期时,通常以业务性质(如高频/低频)、结合数据分布形态以及运营人员的业务经验为判断依据。 在业务发展到有一定的用户规模时,通常需要结合数据挖掘的形式以优化调整标签规则/逻辑。 需要注意的是,标签的搭建也需要考虑“ROI”,即投入的人力开发等成本与本身业务可带来的直接收益。 标签体系的搭建其实跟做产品一样,业务发展初期,可以通过上线'最小可用性’的标签规则1.0,就能带来很好的效果,能使用规则的标签优先使用规则标签。 一开始就去做大而全的挖掘类标签实用性就没有那么强了。 很容易理解,用户体量1000万时2%转化率的提升价值,和用户量1000的2%的转化率价值是有很大差异的。 所以,搭建用户标签画像应随着业务体量的增大,不断丰富标签画像体系。 关于“不断丰富” 因为标签是数据产品,需要持续迭代和优化,所以要用产品的思维来看待标签。 推荐体系需根据用户历史行为推测用户偏好,因此用户行为数据的积累是推荐系统的前置条件。 对于有历史行为数据的用户,需要明确偏好标签的规则,即标签权重。 关于“标签权重” 因为营销资源是有限的,且并不是用户的需求都需要满足,事实上,能够满足用户20%的核心需求就已经OK了。所以需要将用户画像的特征标签打上权重,才能有轻重缓急的去针对性营销。 用户在平台上的不同行为,对应到用户标签层面有着不同的行为权重。该权重影响着对用户属性的归类。属性归类不准确,后续基于画像对用户进行推荐、营销的准确性也就无从谈起。 具体到产品层面需要用户画像建模人员与运营人员充分沟通,结合业务场景给不同的行为类型定权重,下面主要介绍通用的综合权重计算方法。 标签权重计算公式主要由以下几个参数构成: 行为类型权重:用户浏览、搜索、收藏、关注、下单等不同行为对应这不同的用户倾向权重,一般而言,操作复杂程度越高的行为权重越大,该权重值一般有运营人员根据业务经验判断。 时间衰减系数:用户的偏好并非固定不变,因此需考虑时效因素。用户某些行为受时间影响不断减弱,即行为时间距离现在越远,该行为权重越低。 用户行为次数:周期内用户与该标签产生的行为次数越多,该标签的权重越大。 TF-IDF计算标签权重:TF-IDF的统计方法是用于评估用户与标签之前的权重关系,具体来说,是指每个标签对用户的重要性及该标签在全体标签中的重要性的乘积,得出每个标签的客观权重值。对于每个用户来说,其身上同一个标签出现的次数越多,该标签对这个用户来说权重越高。该标签在全部用户的多有标签产生的标签集中出现的次数越多,改标签的重要性越低。 最终用户标签权重公式为:行为类型权重 x 时间衰减 x 用户行为次数 x TF-IDF 计算标签权重。 关于“用户标签权重公式” 这里是业务化的表述方式。在工程中,由于各个标签会相互产生交叉影响,所以常用算法模型来处理,让标签映射为向量,然后计算权重、影响和特征。 记得之前我分享过我们团队做的用户偏好模型,从用户访问的场景数量、深度、粘性等来判断用户的综合偏好,有兴趣的欢迎交流。 对于群体偏好标签的搭建,一般分为三步: 1、根据用户属性将用户分组(不同的应用场景有不同的划分方式); 2、应用TF-IDF算法计算用户标签中每类人群各标签的权重值,对标签按权重值大小排序; 3、取出每类用户群体中的TopN标签,即得到目标用户群体的偏好标签。 对于在平台上行为很少或初入平台的新用户来说,如何针对其设计个性化推荐内容是冷启动阶段面临的主要问题。 当新用户浏览首次登陆时,由于没有历史数据,只能给用户推荐综合热门内容。但如果我们知道这名用户是青年男性,那么可以给他推荐这个用户群喜欢的内容。虽然这种推荐的粒度很粗,但是相对于不区分用户群体的方式,这种精度已经大大提高了,这也正是建立用户群体画像的作用。 关于“新用户浏览首次登录” 统称:用户冷启动。用户冷启动非常重要,主要服务于以下几个场景:新用户首次落地、沉默用户首次召回。目的是在用户冷启动的过程中降低流失,提高留存。但由于用户冷启动时我们缺乏用户画像的标签,难以准确理解和洞察用户。 另外一种冷启动即是:内容冷启动。 上图为在精细化运营中标签画像落地应用通用模板,通过对业务流程、业务目标及策略的梳理,帮助完善标签画像应用策略。 关于上图 上图左边就是用户生命全周期,也是3A3R模型的全流程,也是做用户营销的重要框架。很简单,但不简约,每个模块都是一块很重的业务。 根据既定业务场景及目标对不同用户群体定制、推送更适合他们的产品或内容,从而更好的提升用户转化率、用户活跃及用户价值,并通过测试优化确定自动化触达机制。
目前很多数据产品支持用户画像分群分析,数据运营人员可以直观的了解到不同群体用户在app里的行为、路径、以及属性分析情况,也可通过标签来圈定人群,从而了解该群体的使用特征、分布特征。如分析不同价值等级的用户行为特征等。以上案例策略均可通过AB test测试调优并最终形成人群模板,设置触达周期、触达方式、以及自动化文案。需要强调的是,用户画像是需求驱动型项目,以需求为导向来驱动画像的建设工作,从应用的角度来说,标签的个数不是越多越好,单纯为追求标签的个数而建立成百上千维度的标签会为后期的管理和维护带来不便,使用者也不知道应使用哪些标签作为应用重点。最后,画像标签数据的质量管理也是需要重点关注的,所谓'垃圾进,垃圾出’,基础数据的质量如果无法得到保证,后续的推荐、分析等工作将可能是徒劳,甚至得出错误的分析结论。因此,对于画像数据需要建立一套完整有效的管理方式,可以通过设定各类画像标签的数据监控范围,当数据有异常变动时,及时通过标签排查发现并解决。(文章来源:磊叔的数据增长实验室) |
|