互联网大厂面试官:推荐系统最经典的 排序模型 有哪些?你了解多少?( 二 )


【33】一文看懂推荐系统:排序14:PNN模型(-based),和FNN一个作者,干掉FM,加上LR+
【34】一文看懂推荐系统:排序15:模型(-),可不是对的改编哦,而是对DCN的改编
【36】一文看懂推荐系统:经典双塔模型:微软DSSM模型(Deep),无特征交互,后来美团改进了
【37】一文看懂推荐系统:Gate网络(一):新浪微博,就是想用的方法去搞,和SENet一样,都是张俊林的杰作
【38】一文看懂推荐系统:Gate网络2:百度GemNN(- Multi-Task)
提示:文章目录
文章目录
今天开始,咱们就针对互联网大厂的面试官在面试中提出的问题来写
比如,美团推荐系统面试官常问的问题:
推荐系统最经典的 排序模型 有哪些?你了解多少?
这就要求你熟悉绝大部分经典的排序模型了
从传统经典方法到DL方法,到最新的进展,包括部署上线要考虑的问题

互联网大厂面试官:推荐系统最经典的 排序模型 有哪些?你了解多少?

文章插图
推荐系统整体概览
其实上面我就说过一次了
【1】一文看懂推荐系统:概要01:推荐系统的基本概念
自1992年,施乐的帕拉奥图研究中心(PARC,PARC有很多创造性的发明,
比如打印机,鼠标,操作系统图形界面等)发明了基于协同过滤的推荐系统以后,
后面比较出名的工业界应用就是亚马逊的UCF,的推荐系统等,
进入到深度学习后,推荐系统基本在做电商、资讯、视频的公司里都开启了大规模的应用 。
在PC互联网时代,主线是 “人找信息”,所以搜索引擎的地位如日中天,
进入到移动互联网时代后,大量的信息井喷,由此开启了 “信息找人” 。
所以推荐和搜索之间的关系,可以简单的理解:
推荐是无query的搜索 。
这篇博客主要介绍一下推荐系统的整体架构以及一些个人认为挺优秀的资料书籍 。
推荐系统的整体架构可以简单的用下图来描述 。
简单的描述一下推荐过程:当用户端发送一条请求到推荐系统端后,
整个推荐检索过程也就开始了,
首先各路召回会根据请求中携带的用户画像信息候选物料库中筛选出千级别的候选集;
送到粗排服务中进行打分排序,通过截断后选取百级别的候选集,
然后送到精排服务进行打分排序,精排排序后,
最终根据混排【重排】服务的要求,选择topN的物料发送到混排服务,参与混排;
混排服务则采用一些策略决定最终的展现列表 。
一、用户画像
用户画像是整个推荐系统最基础且最关键的模块,服务于整个推荐系统各个环节 。
因此,用户画像数据的质量直接决定了推荐系统效果的好坏 。【数据是核心】
用户画像主要基于用户的行为日志信息挖掘出用户的长期兴趣、短期兴趣、用户行为统计信息、用户DMP信息、用户负反馈 等等信息 。
二、召回
一个推荐系统中的召回模块,通常由几十个召回通道构成,
每一个召回通道侧重点各不相同,常见的召回算法有:
CF类召回(ICF、UCF)、
规则类召回(最新、最热关键词等)、
以及各种基于语义向量也就是的召回,比如DSSM双塔召回,图召回(其实就是各种x2vec) 。
主要是为了降低后面排序环节的候选集大小,通常会把百万级的候选集缩小到千级别的候选集 。
这么做就是为了发掘用户可能潜在喜欢的物品,同时也是为了大大降低计算量
二、粗排
粗排的存在完全就是因为精排排序受限于时间复杂度,
因为目前的精排模型往往是层数很深的DNN网络,由于线上时间的限制,