ministep / SQL_DataAnalysis

SQL数据分析
9 stars 0 forks source link

干货 | 数据分析之用户画像方法 #65

Open kemistep opened 4 years ago

kemistep commented 4 years ago

如今伴随着流量红利的结束、获客成本的不断提高,我们进入了一个用户精细化运营阶段。在这个阶段中,我们不得不使用一个工具——用户 “画像” 标签体系。

今天我们就来说说用户画像。本文重点:1. 用户画像在数据分析中的应用;2. 如何构建用户画像。

一、 什么是用户画像

用户画像(User Persona)的概念最早由交互设计之父 Alan Cooper 提出,是建立在一系列属性数据之上的目标用户模型。一般是产品设计、运营人员从用户群体中抽象出来的典型用户,本质是一个用以描述用户需求的工具。

Personas are a concrete representation of target users.

真实用户的虚拟代表

——交互设计之父 Alan Cooper

但随着互联网的发展,现在我们说的用户画像(User Profile)又包含了新的内涵:根据用户人口学特征、网络浏览内容、网络社交活动和消费行为等信息而抽象出的一个标签化的用户模型。

它的核心工作主要是利用存储在服务器上的海量日志和数据库里的大量数据进行分析和挖掘,给用户贴 “标签”,而“标签” 是能表示用户某一维度特征的标识,主要用于业务的运营和数据分析。

二、为什么需要用户画像

用户在企业发展的过程中有举足轻重的作用,主要的应用有:

1、精准营销:这是运营最熟悉的玩法,在从粗放式到精细化运营过程中,将用户群体切割成更细的粒度,辅以短信、推送、邮件、活动等手段,驱以关怀、挽回、激励等策略。

2、用户分析:用户画像也是了解用户的必要补充。产品早期,产品经理们通过用户调研和访谈的形式了解用户。在产品用户量扩大后,调研的效用降低,这时候就可以辅以用户画像配合研究。方向包括新增的用户有什么特征,核心用户的属性是否变化等等。

3、数据应用:用户画像是很多数据产品的基础,诸如耳熟能详的推荐系统广告系统,广告基于一系列人口统计相关的标签,性别、年龄、学历、兴趣偏好、手机等等来进行投放的。

4、数据分析:用户画像可以理解为业务层面的数据仓库,各类标签是多维分析的天然要素。数据查询平台会和这些数据打通,最后辅助业务决策。

三、用户画像的主要内容

用户画像一般按业务属性划分多个类别模块。除了常见的人口统计,社会属性外,还有用户消费画像、用户行为画像,用户兴趣画像等。

人口属性和行为特征是大部分互联网公司做用户画像时会包含的:人口属性主要指用户的年龄、性别、所在的省份和城市、教育程度、婚姻情况、生育情况、工作所在的行业和职业等。行为特征主要包含活跃度、忠诚度等指标。

除了以上较通用的特征,用户画像包含的内容并不完全固定,根据行业和产品的不同所关注的特征也有不同。

①以内容为主的媒体或阅读类网站、搜索引擎,或通用导航类网站,往往会提取用户对浏览内容的兴趣特征,比如体育类、娱乐类、美食类、理财类、旅游类、房产类、汽车类等等。

②社交网站的用户画像,也会提取用户的社交网络,从中可以发现关系紧密的用户群和在社群中起到意见领袖作用的明星节点。

③电商购物网站的用户画像,一般会提取用户的网购兴趣和消费能力等指标。网购兴趣主要指用户在网购时的类目偏好,比如服饰类、箱包类、居家类、母婴类、洗护类、饮食类等。消费能力指用户的购买力,如果做得足够细致,可以把用户的实际消费水平和在每个类目的心理消费水平区分开,分别建立特征纬度。

④像金融领域,还会有风险画像,包括征信、违约、洗钱、还款能力、保险黑名单等。

另外还可以加上用户的环境属性,比如当前时间、访问地点 LBS 特征、当地天气、节假日情况等。当然,对于特定的网站或 App,肯定又有特殊关注的用户维度,就需要把这些维度做到更加细化,从而能给用户提供更精准的个性化服务和内容。

四、如何构建用户画像

业内有很多关于创建用户画像的方法,比如 Alen Cooper 的 “七步人物角色法”,Lene Nielsen 的“十步人物角色法” 等,这些都是非常好并且非常专业的用户画像方法,值得我们借鉴和学习。

事实上,当我们了解了这些方法之后,就会发现这些方法从流程上可以分为 3 个步骤:获取和研究用户信息、细分用户群、建立和丰富用户画像。在这 3 大步骤中,最主要的区别在于对用户信息的获取和分析,从这个维度上讲主要有以下三种方法:

简单来说,定性就是去了解和分析,而定量则是去验证。一般而言,定量分析的成本较高、相对更加专业,而定性研究则相对节省成本。因此创建用户画像的方法并不是固定的,而是需要根据实际项目的需求和时间以及成本而定。创建用户画像的方法,并没有严格意义的最专业和最科学,但是有最适合团队和项目需求的。

好的用户画像是理解用户的决策,考虑业务场景和业务形态的。这里我们介绍一种简单的构建用户画像方法。

1、数据采集

构建用户画像是为了还原用户信息,因此数据来源于所有用户相关的数据。用户数据划分为静态数据、动态数据两大类。

静态数据:用户的人口属性、商业属性、消费特征、生活形态、CRM 五大维度,其获取方式存在多种,数据挖掘是最为常见也是较为精准的一种方式,如果数据有限,则需要定性与定量结合补充。

定性方法如小组座谈会、用户深访、日志法、Laddering 阶梯法、透射法等,主要是通过开放性的问题潜入用户真实的心理需求,具象用户特征;定量更多是通过定量问卷调研的方式进行,关键在于后期定量数据的建模与分析,目的是通过封闭性问题一方面对定性假设进行验证,另一方面获取市场的用户分布规律。

动态数据:用户不断变化的行为信息,一个用户打开网页,买了一个杯子;与该用户傍晚溜了趟狗,白天取了一次钱,打了一个哈欠等等一样都是用户行为。随着互联网的发展,各种动态的行为数据都可以被记录下来。

2、目标分析

用户画像的目标是通过分析用户行为,最终为每个用户打上标签,以及该标签的权重。标签,表征了内容,用户对该内容有兴趣、偏好、需求等等。权重,表征了指数,用户的兴趣、偏好指数,也可能表征用户的需求度,可以简单的理解为可信度,概率。

3、数据建模

一个事件模型包括:时间、地点、人物三个要素。每一次用户行为本质上是一次随机事件,可以详细描述为:什么用户,在什么时间,什么地点,做了什么事。

①用户:关键在于对用户的标识,用户标识的目的是为了区分用户、单点定位。

②时间:时间包括两个重要信息,时间戳和时间长度。时间戳,为了标识用户行为的时间点;时间长度,为了标识用户在某一页面的停留时间。

③地点:用户接触点,Touch Point。对于每个用户接触点。潜在包含了两层信息:网址和内容。网址:每一个链接(页面 / 屏幕),即定位了一个互联网页面地址,或者某个产品的特定页面。可以是 PC 上某电商网站的页面,也可以是手机上的微博,微信等应用某个功能页面,某款产品应用的特定画面。如,长城红酒单品页,微信订阅号页面,某游戏的过关页。

④内容:每个网址(页面 / 屏幕)中的内容。可以是单品的相关信息:类别、品牌、描述、属性、网站信息等等。如,红酒,长城,干红,对于每个互联网接触点,其中网址决定了权重;内容决定了标签。

⑤事情:用户行为类型,对于电商有如下典型行为:浏览、添加购物车、搜索、评论、购买、点击赞、收藏 等等。

综合上述分析,用户画像的数据模型,可以概括为下面的公式:用户标识 + 时间 + 行为类型 + 接触点(网址 + 内容),某用户因为在什么时间、地点、做了什么事。所以会打上标签。

用户标签的权重可能随时间的增加而衰减,因此定义时间为衰减因子 r,行为类型、网址决定了权重,内容决定了标签,进一步转换为公式:标签权重 = 衰减因子 × 行为权重 × 网址子权重。

五、注意事项

1、不要把典型用户当作用户画像

不能把典型用户当作用户画像。每年的微信生活白皮书中,微信官方都会公布典型用户的一天:工作日每天 7 点起床刷朋友圈、7:45 出门路上读文章…… 很多用户看了表示这完全就是自己啊!不过也有不少人吐槽:我也是微信重度用户,但这个典型的一天的跟我怎么完全不符合?

为什么会出现如此截然相反的反馈呢?原来是这些人把「典型用户」跟「用户画像」的概念搞混了。因为以上描述典型用户这些特点,只是把用户特征抽象出来,组合在一起,事实上典型用户是虚构的,并不真实存在。而用户画像是把用户以标签的形式表现出来,每一个真实存在的用户都有对应的用户画像。

2、不要把用户画像简单理解成由用户标签构成

这也是 50% 以上的人都可能存在的错误认知,即把用户画像简单理解成由用户标签构成。用户标签是用来概括用户特征的,比如说姓名、性别、职业、收入、养猫、喜欢美剧等等。这些标签表面上看没有什么问题,但是实际上组成用户画像的标签要跟业务 / 产品结合。

举个夸张的例子,海底捞要做用户画像,最后列出来小明是一个大学生、高富帅、独生子、四川人,爱玩游戏、爱看动漫等用户标签。而事实上,对于海底捞而言,用户帅不帅、是否爱玩游戏真的没有关系。

3、没有建立真正有效的用户画像标签

如果你能够建立真正有效的用户画像标签,才算正确理解从而提升运营效果。这就涉及到构建用户画像最大的难点了。

比如某知识付费团队要卖课,那么建立用户画像最核心的诉求就是:提高课程购买数量。如果能通过用户画像了解用户购买课程的意愿,然后采取相应的运营策略,效率便会大幅度提高。而这个购买课程意愿度,就是我们最需要放在用户画像里的标签。

比如我们建立用户画像之后,计算出来甲购买课程的意愿是 40%,乙购买课程的意愿是 90%。为了进一步提高购买量,我们会对购买意愿在 40% 的用户(甲)发放优惠券。如果没有建立这样一个用户画像标签,我们就会对甲和乙发放同样的优惠券。而乙类用户原本是不需要用优惠券进行激励的,这么一发,便会增加很多成本。这也就是电商利用用户画像标签实现的大数据杀熟。

六、小结

1. 我们进入了一个用户精细化运营阶段。在这个阶段中,我们不得不使用一个工具——用户 “画像” 标签体系;

2. 用户画像是根据用户人口学特征、网络浏览内容、网络社交活动和消费行为等信息而抽象出的一个标签化的用户模型;

3. 用户在企业发展的过程中有举足轻重的作用,主要应用有:精准营销、用户分析、数据应用、数据分析;

4. 用户画像包含的内容并不完全固定,根据行业和产品的不同所关注的特征也有不同;

5. 好的用户画像是理解用户的决策,考虑业务场景和业务形态的。

End.

作者:罗志恒

来源:数猎天下 DataHunter

学习数据分析必看的热门文章:

困惑?学了那么多工具,还是不会数据分析...

15 组 Excel 函数,解决数据分析中 80% 的难题!


http://www.itongji.cn/detail?type=1339