【笔试题目整理】小红书2019年校园招聘数据分析岗位在线笔试第一批( 三 )


举例:能够使用:excel-图表-柱状图-作图说明不同年龄群有多少人;能够使用:R--plot+-
可视化,说明不同城市的人群占比;知道了解:R-dplyr-数据清洗(希望可以知道候选人在数据分析这个方面技能上是否有积累、过去的水平)
【民间回答参考】:
首先进行数据预处理过程,进行必要的检查,数据重复,缺失值,异常值等问题
分析人群特点:可以按照总体特征的分布情况对人群进行分类,总结人群特点,比如按年龄或者城市分档,也可以两者结合起来作为一个人群特点进行分析 。
入口点击率:对总体入口点击率进行趋势分析;然后拆分计算入口点击率,进行细分对比 。可以结合人群特点进行分析,挑出重点进行阐述 。比如点击率最高的集中是哪个年龄层的用户,某个年龄层内最高的点击率的操作对象是什么,等等 。
掌握:excel-图表-柱状图、折线图、甘特图、双层饼图-作图说明用户年龄分层情况和点击率的分布情况
掌握:excel-数据透视表-(切片器)-通过数据透视表进行用户年龄分布和入口点击率的分布情况
掌握:--hist-作图说明用户人群特点的年龄、城市分布情况
**14. 假设:浦东机场近日因车位紧张导致车流堵塞;为了解决这个问题,领导打算扩建停车场并且让你预估需要添加的车位数量 。
1、请写出你认为需要的辅助数据
2、如果给你题1中你需要的数据,请阐述你如何使用这些数据预估车位数量 。**
【 民间回答参考 】
1.需要历史访问车次数据,访问的时间,离开的时间
2.统计平均每辆车停车时长t1
以t1作为time 统计平均每t1时间段内访问车辆数量
以t1作为时间区间,每区间内访问车辆数量为k的概率P(k)满足泊松分布P(k) = exp(-)*^k/k!
此时,我们有,下一个时间段t1内访问车次的数量为k1的概率P(k1),此时上一个时段进来的车辆已经开始陆续离开(平均停留时间t1)
因此,假如我们要求95%的概率不会出现拥堵,则可以让p(k1) = 0.95 求出 k1 。则k1 - 现有车位,就是我们要扩建的数量 。