另外,最大的问题是不能充分利用淘宝内网数据的力量 。目前,我们主要采用全局采样的策略来解决这个问题 。抽样得到的训练样本的分布合理性直接决定了分类效果 。
(4)直接关键词匹配
对于某些品类的商品,淘宝历史上很少有的产品,比如针对海外卖家的英文产品,医药产品等 。前者是去年开始抓取的产品数据,后者是2012年国家才允许电商卖药的产品,所以产品很少,无法简单用模型进行统计学习 。为此,我们采用关键词直击的方法来解决这些小众产品的叶类分类问题 。(货少仓储少的时候,可以考虑用这个策略)
(5)高级类别预测
1.在模型中引入先验知识,将类别的品牌、货号、型号、系列等先验知识融入预测模型,改善训练样本分布不合理带来的问题;
(即如果有正确的训练集,最好有更全面的数据训练集,训练出来的模型会更容易使用)
2.基于误差驱动采样技术解决训练样本分布不合理的问题;
3.查询品类预测知识辅助商品品类预测 。有些商品用短标题,用;
4.基于模型的预测效果较差,而使用查询类别来预测知识会有较好的效果 。通过计算标题和查询之间的相似度,使用相似的查询类别来拟合商品的类别 。
5.利用商品的聚类特性来提高品类预测 。
PS:名词解释
面包屑:网上对商品的品类等级描述,如“服装鞋帽->:男装->: Polo衫”
类别:淘宝后台类别结构中的最后一个类别,如“书籍/杂志/报纸->:计算机/网络->:编程->: C”,“C语言”是“书籍/杂志/报纸”类别下的一个叶子类别 。
- 尚品网官方网站 尚品网官方网站下载
- 京东好还是淘宝好 京东自营店好还是京东旗舰店好
- 拼多多商家后台登录 拼多多官方网站入口
- 京东淘宝购物 京东淘宝购物衣服
- 一淘返利网 一淘返利网官方网站
- 名牌折扣网 名牌折扣网站
- 淘宝网络推广怎么做?掌握这两个技巧,淘宝推
- 800团购网站大全 装修团购网站大全
- 刷淘宝信誉平台 淘宝信誉查询平台
- 在家开店赚钱 淘宝开店赚钱不