互联网大厂面试官:推荐系统最经典的 排序模型 有哪些?你了解多少?( 四 )


咱们的目标就是要随机打乱,保证多样性,同时还要插播广告啥的,赚钱呢!
五、在离线一致性:
推荐系统中,大多人只关注模型部分,
但实际上整个推荐系统是一个庞大的工程
(虽然相比较广告是小巫见大巫,等后面有机会写一写关于广告的那些事儿),
离线的模型训练只是推荐系统的一个环节,
对于有过工业界经验的人来说,最头疼的莫过于如何保证离线一致性了,
因此通常负责离线模型的同学和负责在线工程的同学不是同一个,
往往还是不同的语言,比如离线,在线C++,就会导致很多不一致的问题 。
在离线不一致主要有两部分:
1.特征的在离线不一致;
2.模型的在离线不一致 。
先来说说产生在离线不一致的根源,
以特征为例:在离线没有采用统一的框架,比如在线用一套C++抽取框架,
离线用一套java抽取框架,还是不同的人实现的,那么必然产生在离线不一致的情况 。
因此,最好的解决办法,就是在离线采用相同的特征抽取框架 。
模型也是,离线在线采用相同的代码框架,在百度内部,模型部分在离线采用相同的C++代码编译出来的bin文件,
只要参数不配置错误,就能从根源上避免在离线不一致的情况 。
此外在离线特征一致性的监控也非常重要,能够检测出不一致的特征,及时修复 。
【关于这部分问题,我在前面24篇文章已经透彻地讲过业界小红书是咋搞的】
下一篇文章开始,我会仔细一个个把精排模型梳理清楚都有哪些?他们有啥特点?
面试官很在乎你的基础功底的,所以你务必自己理解透了
总结
提示:如何系统地学习推荐系统,本系列文章可以帮到你
(1)找工作投简历的话,你要将招聘单位的岗位需求和你的研究方向和工作内容对应起来,这样才能契合公司招聘需求,否则它直接把简历给你挂了
(2)你到底是要进公司做推荐系统方向?还是纯cv方向?还是NLP方向?还是语音方向?还是深度学习机器学习技术中台?还是硬件?还是前端开发?后端开发?测试开发?产品?人力?行政?这些你不可能啥都会,你需要找准一个方向,自己有积累,才能去投递,否则面试官跟你聊什么呢?
(3)今日推荐系统学习经验:下一篇文章开始,我会仔细一个个把精排模型梳理清楚都有哪些?他们有啥特点?
面试官很在乎你的基础功底的,所以你务必自己理解透了