index是什么意思啊 index是什么意思 index翻译成中文( 四 )


index是什么意思啊 index是什么意思 index翻译成中文

文章插图
item_tag是文章类型 , 游戏、娱乐、科技这类 。有些用户可能各种各样的类型都喜欢 , 有些用户的口味偏好则比较集中 , 产品上可以拿用户偏好来代称 , 这里专指兴趣的集中度 。
现在取所有用户的浏览数据 , 算它们在不同类型tag下的浏览分布(上文提供的行为数据就可以计算 , cate_id便是内容类型) 。比如王二狗可能90%的浏览都是游戏 , 10%是其他 , 那么就可以认为王二狗的兴趣集中度高 。
这里有一个很简易的公式 , 1-sum(p^2) , 将所有内容类别的浏览占比平方后相加 , 最终拿1减去 , 就算出了用户兴趣的集中程度了 。我们拿案例简单看下 。
index是什么意思啊 index是什么意思 index翻译成中文

文章插图
上图的李二狗 , 他的兴趣90%集中在游戏 , 所以兴趣集中度= 1 – (0.9*0.9+0.1*0.1)=0.18,李三妞的兴趣稍微平均点 , 所以1-(0.5*0.5+0.5*0.5)=0.5 , 兴趣集中度比王二狗高 。
赵四有三个兴趣点 , 所以比李三妞稍微高一些 , 王五是均衡的 , 所以是四人中最高的 。可能有同学疑问 , 兴趣程度为什么不用标准差算呢?它也是算波动偏离的呀 , 这是一个思考题 , 大家可以新加一个tag类别再算一下 。
1-sum(p^2)是趋近于1的 , 有四个类别 , 一位均衡的用户(四个都是0.25)是0.75的集中度 , 当有十个类型 , 一位均衡的用户(四个都是0.1)是0.9的集中度 。这种公式的好处就是兴趣类别越多 , 集中度的上限越接近1 , 这是标准差比不了的 。
这里并没有涉及太高深的数学模型 , 只是用了加减乘除 , 就能快速的计算出兴趣的集中程度了 。通过行为数据算出用户兴趣集中度 , 便能在分析场景中发挥自己的用武之地了 , 它是用户画像的基础 , 以后有机会再深入讲解 。
四、外部数据外部数据可以分为两个部分 , 一个是行业市场调研类的 , 一个是爬虫抓取的 , 它们也能作为数据源分析 , 比如站外热点内容和站内热点内容、竞品对手商家表现和自己产品的商家 , 大家有机会应用的不多 , 就不多讲了 , 我也不怎么熟 。
到这里为止 , 文章主要讲了用户行为层面的数据是怎么来的 , 更多是基础概念的讲解 。不过 , 因为数据来源于网上 , 数据的丰富程度还是欠缺了不少 , 说白了 , 业务场景比较弱 , 希望大家自己在工作中多思考 。
专栏作家秦路 , 微信公众号ID:tracykanc , 人人都是产品经理专栏作家 。
【index是什么意思啊 index是什么意思 index翻译成中文】本文原创发布于人人都是产品经理 。未经许可 , 禁止转载 。