分类目录归档:运营

问答标签因素

1、地理位置:越近,则权重越大;

2、标签权重:出现次数越多,权重越多,反之,权重越小;

3、时间因素:越早的,权重就越大,越晚的,权重就越小;

4、行为因为:提问(1)> 搜索(0.8)

标签获取方式:用户提问,用户搜索,用户位置。

基本标签权重公式 = 当前标签/所有标签 + 行为权重(行为所占/所有行为) + (标签更新时间/当前时间)

如何构建互联网产品的用户画像

互联网推广无处不在,如何打造有针对性的互联网用户实际是一门学问,更是一门技术。打个比方,如果你在网站注册并购买过该网站的产品,特殊的日子(会员日、生日)经常会收到产品网站发来的通知(祝福)短信或者邮件。

其实这一切都是精准化营销的常见套路。

在互联网大数据时代,得用户者得天下。以庞大的用户数据为依托,构建出一整套完善的用户画像,借助其标签化、信息化、可视化的属性,是企业实现个性化推荐、精准营销强有力的前提基础。

可见,深入了解用户画像的含义,掌握用户画像的搭建方法,显得尤其十分重要。

什么是用户画像?

关于“用户画像是什么”的问题,最早给出明确定义的是交互设计之父Alan Cooper,他认为:Persona(用户画像)是真实用户的虚拟代表,是建立在一系列真实数据之上的目标用户模型。

三个重要的内容:真实用户、真实数据、虚拟模型。

如果把真实的用户和虚拟的模型比作隔江相望的两个平行点,数据就是搭建在大江之上,连接起彼此的桥梁。

企业利用寻找到的目标用户群,挖掘每一个用户的人口属性、行为属性、社交网络、心理特征、兴趣爱好等数据,经过不断叠加、更新,抽象出完整的信息标签,组合并搭建出一个立体的用户虚拟模型,即用户画像。

给用户“打标签”是用户画像最核心的部分。所谓“标签”,就是浓缩精炼的、带有特定含义的一系列词语,用于描述真实的用户自身带有的属性特征,方便企业做数据的统计分析。

出于不同的受众群体、不同的企业、不同的目的,给用户打的标签往往各有侧重点,应该具体问题具体看待。

但是,有些标签适用于所有情况,应该加以理解和掌握。我把常见的标签分成两大类别:相对静止的用户标签以及变化中的用户标签。

相对应的,由静态标签搭建形成的画像就是2D用户画像;由静态标签+动态标签构建出来的即是3D用户画像。

1、静态的用户信息标签以及2D用户画像

人口属性标签是用户最基础的信息要素,通常自成标签,不需要企业过多建模,它构成用户画像的基本框架。

人口属性包括人的自然属性和社会属性特征:姓名、性别、年龄、身高、体重、职业、地域、受教育程度、婚姻、星座、血型……。自然属性具有先天性,一经形成将一直保持着稳定不变的状态,比如性别、地域、血型;社会属性则是后天形成的,处于相对稳定的状态,比如职业、婚姻。

心理现象包括心理和个性两大类别,同样具有先天性和后天性。对于企业来说,研究用户的心理现象,特别是需求、动机、价值观三大方面,可以窥探用户注册、使用、购买产品的深层动机;了解用户对产品的功能、服务需求是什么;认清目标用户带有怎样的价值观标签,是一类什么样的群体。

因为人口属性和心理现象都带有先天的性质,整体处于稳定状态,共同组成用户画像最表面以及最内里的信息素,由此形成稳定的2D用户画像。

2、动态的用户信息标签以及3D用户画像

网站行为属性,这里我们主要讨论的是用户在网站内外进行的一系列操作行为。常见的行为包括:搜索、浏览、注册、评论、点赞、收藏、打分、加入购物车、购买、使用优惠券……。

在不同的时间,不同的场景,这些行为不断发生着变化,它们都属于动态的信息。企业通过捕捉用户的行为数据(浏览次数、是否进行深度评论),可以对用户进行深浅度归类,区分活跃/不活跃用户。

社交网络行为,是指发生在虚拟的社交软件平台(微博、微信、论坛、社群、贴吧、twitter、Instagram)上面一系列用户行为,包括基本的访问行为(搜索、注册、登陆等)、社交行为(邀请/添加/取关好友、加入群、新建群等)、信息发布行为(添加、发布、删除、留言、分享、收藏等)。

给用户打上不同的行为标签,可以获取到大量的网络行为数据、网站行为数据、用户内容偏好数据、用户交易数据。这些数据进一步填充了用户信息,与静态的标签一起构成完整的立体用户画像,就是所说的3D用户画像。

用户画像的价值

企业必须在开发和营销中解决好用户需求问题,明确回答“用户是谁——用户需要/喜欢什么——哪些渠道可以接触到用户——哪些是企业的种子用户”。

更了解你,是为了更好的服务你!可以说,正是企业对用户认知的渴求促生了用户画像。

用户画像是真实用户的缩影,能够为企业带来不少好处。

1、指导产品研发以及优化用户体验

在过去较为传统的生产模式中,企业始终奉行着“生产什么就卖什么给用户”的原则。这种闭门造车的产品开发模式,常常会产生“做出来的东西用户完全不买账”的情况。

如今,“用户需要什么企业就生产什么”成为主流,众多企业把用户真实的需求摆在了最重要的位置。

在用户需求为导向的产品研发中,企业通过获取到的大量目标用户数据,进行分析、处理、组合,初步搭建用户画像,做出用户喜好、功能需求统计,从而设计制造更加符合核心需要的新产品,为用户提供更加良好的体验和服务。

2、实现精准化营销

精准化营销具有极强的针对性,是企业和用户之间点对点的交互。它不但可以让营销变得更加高效,也能为企业节约成本。

以做活动为例:商家在做活动时,放弃自有的用户资源转而选择外部渠道,换而言之,就是舍弃自家精准的种子用户而选择了对其品牌一无所知的活动对象,结果以超出预算好几倍的成本获取到新用户。

这就是不精准所带来的资源浪费。

包括我前面所提到的,网购后的商品推荐以及品牌商定时定点的节日营销,都是精准营销的成功示范。

要做到精准营销,数据是最不可缺的存在。以数据为基础,建立用户画像,利用标签,让系统进行智能分组,获得不同类型的目标用户群,针对每一个群体策划并推送针对性的营销。

3、可以做相关的分类统计

简单来说,借助用户画像的信息标签,可以计算出诸如“喜欢某类东西的人有多少”、“处在25到30岁年龄段的女性用户占多少”等等。

4、便于做相关的数据挖掘

在用户画像数据的基础上,通过关联规则计算,可以由A可以联想到B。

沃尔玛“啤酒和尿布”的故事就是用户画像关联规则分析的典型例子。

我们认识到用户画像具有的极高价值,下面就来看看该如何搭建用户画像。

如何构建用户画像

用户画像准备阶段——数据的挖掘和收集

对网站、活动页面进行SDK埋点。即预先设定好想要获取的“事件”,让程序员在前/后端模块使用 Java/Python/PHP/Ruby 语言开发,撰写代码把“事件”埋到相应的页面上,用于追踪和记录的用户的行为,并把实时数据传送到后台数据库或者客户端。

所谓“事件”,就是指用户作用于产品、网站页面的一系列行为,由数据收集方(产品经理、运营人员)加以描述,使之成为一个个特定的字段标签。

我们以“网站购物”为例,为了抓取用户的人口属性和行为轨迹,做SDK埋点之前,先预设用户购物时的可能行为,包括:访问首页、注册登录、搜索商品、浏览商品、价格对比、加入购物车、收藏商品、提交订单、支付订单、使用优惠券、查看订单详情、取消订单、商品评价等。

把这些行为用程序语言进行描述,嵌入网页或者商品页的相应位置,形成触点,让用户在点击时直接产生网络行为数据(登陆次数、访问时长、激活率、外部触点、社交数据)以及服务内行为数据(浏览路径、页面停留时间、访问深度、唯一页面浏览次数等等)。

数据反馈到服务器,被存放于后台或者客户端,就是我们所要获取到的用户基础数据。

然而,在大多数时候,利用埋点获取的基础数据范围较广,用户信息不够精确,无法做更加细化的分类的情况。比如说,只知道用户是个男性,而不知道他是哪个年龄段的男性。

在这种情况下,为了得到更加详细的,具有区分度的数据,我们可以利用A/B test。

A/B test就是指把两个或者多个不同的产品/活动/奖品等推送给同一个/批人,然后根据用户作出的选择,获取到进一步的信息数据。

为了知道男性用户是哪个年龄层的,借助A/B test,我们利用抽奖活动,在奖品页面进行SDK埋点后,分别选了适合20~30岁和30~40岁两种不同年龄段使用的礼品,最后用户选择了前者,于是我们能够得出:这是一位年龄在20~30岁的男性用户。

以上就是数据的获取方法。有了相关的用户数据,我们下一步就是做数据分析处理——数据建模。

用户画像成型阶段——数据建模

1、定性与定量相结合的研究方法

定性化研究方法就是确定事物的性质,是描述性的;定量化研究方法就是确定对象数量特征、数量关系和数量变化,是可量化的。

一般来说,定性的方法,在用户画像中,表现为对产品、行为、用户个体的性质和特征作出概括,形成对应的产品标签、行为标签、用户标签。

定量的方法,则是在定性的基础上,给每一个标签打上特定的权重,最后通过数学公式计算得出总的标签权重,从而形成完整的用户模型。

所以说,用户画像的数据建模是定性与定量的结合。

2、数据建模——给标签加上权重

给用户的行为标签赋予权重。

用户的行为,我们可以用4w表示: WHO(谁);WHEN(什么时候);WHERE(在哪里);WHAT(做了什么),具体分析如下:

WHO(谁):定义用户,明确我们的研究对象。主要是用于做用户分类,划分用户群体。网络上的用户识别,包括但不仅限于用户注册的ID、昵称、手机号、邮箱、身份证、微信微博号等等。

WHEN(时间):这里的时间包含了时间跨度和时间长度两个方面。“时间跨度”是以天为单位计算的时长,指某行为发生到现在间隔了多长时间;“时间长度”则为了标识用户在某一页面的停留时间长短。

越早发生的行为标签权重越小,越近期权重越大,这就是所谓的“时间衰减因子”。

WHERE(在哪里):就是指用户发生行为的接触点,里面包含有内容+网址。内容是指用户作用于的对象标签,比如小米手机;网址则指用户行为发生的具体地点,比如小米官方网站。权重是加在网址标签上的,比如买小米手机,在小米官网买权重计为1,,在京东买计为0.8,在淘宝买计为0.7。

WHAT(做了什么):就是指的用户发生了怎样的行为,根据行为的深入程度添加权重。比如,用户购买了权重计为1,用户收藏了计为0.85,用户仅仅是浏览了计为0.7。

当上面的单个标签权重确定下来后,就可以利用标签权重公式计算总的用户标签权重:

标签权重=时间衰减因子×行为权重×网址权重

举个栗子:A用户今天在小米官网购买了小米手机;B用户七天前在京东浏览了小米手机。

由此得出单个用户的标签权重,打上“是否忠诚”的标签。

通过这种方式对多个用户进行数据建模,就能够更广的覆盖目标用户群,为他们都打上标签,然后按照标签分类:总权重达到0.9以上的被归为忠实用户,ta们都购买了该产品……。这样的一来,企业和商家就能够根据相关信息进行更加精准的营销推广、个性化推荐。

有关用户画像的介绍到此就告一段落了,鉴于自身能力有限,很多地方表达的不到位或者没有提及,有啥意见或者建议欢迎留言!

基于用户行为的兴趣标签模型

随着网站规模的扩大,内容也相应的与日俱增,涵盖的频道也越来越繁杂,在如此海量的信息平台下,如何更好的服务用户成了各门户网站的首要任务。从用户需求的角度考虑,对内容的判断标准无疑是用户对此内容是否感兴趣。“千人千面”算法在互联网行业已经不是个新鲜的词汇,但如何做到对用户兴趣的精准匹配仍是难点,特别是对图片、视频等非文本内容来说,因为本身缺乏描述性文本,因此兴趣标签成为一种非常重要的语义素材。本文主要介绍根据优酷用户历史行为构建的兴趣标签模型,模型能够及时捕捉用户兴趣的变化,调整个性化兴趣标签的排序,从而达到提高精准推荐和个性化推荐的效果。

1.模型数据流程

模型从用户行为出发,最终定位用户的兴趣标签,根据行为权重、时间衰减等因素,计算标签权重并排序。流程如下所示:
数据流程

在用户行为的选取上,登录用户考虑的用户行为包括观看、搜索、收藏、评论、顶踩和上传,未登录用户考虑的用户行为则只有观看和搜索。

1.1 用户行为数据采集

在本项目中,我们选取了最近180天内的用户行为,每天将新的行为数据和历史数据进行累加计算。
用户行为

1.2 视频Tag信息

视频都有一些特定的分词标签描述,一般是通过视频标题和描述分词提取出来的,可以单独使用这些分词,也可以用机器学习算法给标签打上不同的权重,来标识标签不同的重要性。
视频tag

1.3 用户兴趣标签

用户兴趣标签体系是一个分层级表示用户兴趣的结构,目的是为了从不同的粒度定位用户的兴趣。从视频分词标签到用户兴趣标签有一个映射关系,目前视频分词标签量级为百万,用户兴趣标签有8万左右。我们给用户打上下一层级标签的同时也会打上上一层级的标签。
兴趣标签

2. 用户兴趣标签权重计算规则

2.1 用户行为打分规则(每日)

我们对用户不同的行为类型设置了不同的权重。如此设定行为权重带有一定的主观性,但设定值符合大多数用户的行为特点,也可以快速推进项目的进行。在下一版的改进计划中,拟先对用户进行一次聚类,然后对每个聚类群体利用回归算法迭代出一组最优权重值,从而使权重的设定更具有针对性。下面主要介绍下观看行为打分规则。
主要考虑因素如下:
1、 视频观看比例,用户一天内的观看比例有可能多倍于视频长度。
2、 降低短视频的打分值。
3、 考虑视频播放次数的因素。
4、 限定打分范围。

2.2 用户视频Tag打分规则

将用户行为融合,并转化成对视频标签的打分。在生成用户Tag打分数据时,我们考虑以下几个因素:
1、 时间衰减系数。用户行为距当前时间越近的影响越大,因此从用户标签上可以反应该用户最近的兴趣点。
2、 每天Tag数量衰减系数。考虑到用户某一天内对某一标签的集中行为有可能会拉偏此用户的兴趣点,因此添加了tag数量的衰减。
行为融合

2.3 用户兴趣标签打分规则

这一步只是简单的将视频标签映射到用户兴趣标签分级体系,累加得到兴趣标签分值并按由高到低进行排序。结果数据形式如下,Weight为该兴趣标签分值占总标签分值的百分比,Support为该兴趣标签的累加分值。
打分结果展示

小结:

虽然目前的兴趣标签模型还存在一些不足之处有待进一步改进,但引入用户兴趣模型确实可以在一定程度上更精确的定位用户的兴趣,进而提高个性化推荐的质量。此外,如何优化兴趣标签的提取也会直接影响着模型的精度。

Centos 7 firewalld常用命令

firewalld是centos7的一大特性,最大的好处有两个:支持动态更新,不用重启服务;第二个就是加入了防火墙的“zone”概念。

  • 永久打开一个端口: firewall-cmd --permanent --add-port=8080/tcp
  • 永久关闭一个端口: firewall-cmd --permanent --remove-port=8080/tcp
  • 永久打开某项服务: firewall-cmd --permanent --add-service=http
  • 永久关闭某项服务: firewall-cmd --permanent --remove-service=http
  • 进行端口转发:firewall-cmd --permanent --add-forward-port=port=80:proto=tcp:toport=8080:toaddr=192.0.2.55
  • 允许转发到其他地址: firewall-cmd --permanent --add-masquerade
  • 重新加载防火墙: firewall-cmd --reload

运行、停止、禁用firewalld

  • 启动:# systemctl start firewalld
  • 查看状态:# systemctl status firewalld 或者 firewall-cmd –state
  • 停止:# systemctl disable firewalld
  • 禁用:# systemctl stop firewalld

配置firewalld

  • 查看版本:$ firewall-cmd –version
  • 查看帮助:$ firewall-cmd –help
  • 查看设置:
    • 显示状态:$ firewall-cmd –state
    • 查看区域信息: $ firewall-cmd –get-active-zones
    • 查看指定接口所属区域:$ firewall-cmd –get-zone-of-interface=eth0
  • 拒绝所有包:# firewall-cmd –panic-on
  • 取消拒绝状态:# firewall-cmd –panic-off
  • 查看是否拒绝:$ firewall-cmd –query-panic