【笔试题目整理】小红书2019年校园招聘数据分析岗位在线笔试第一批( 二 )


![](
=image/,pdGk,,==,,,t_70)
![](
=image/,pdGk,,==,,,t_70)
8. 下列关于相关系数的说法,正确的是
**A. 相关系数的数值越大,说明两个变量之间的相关程度越高
B. 若相关系数r=0,则表明两个变量之间不存在任何相关关系
C. 若相关系数>0,则称两个变量正相关;若相关系数 D. 相关系数取值范围是(-1,1) **
正确答案:A C
「题目解析」
B: r=0,只说明线性无关,不明确非线性关系;
D:-1和1可取,所以应该是闭区间 。
**9. 如下SQL建表语句:
table ( INTkey,char(8) not
null,char(20),INT),那么可以插入到该表中的数据是? **
**A. (1234, ‘口红’, ‘化妆品’, 5)
B. (NULL, ‘口红’, 化妆品, ‘5’)
C. (‘1234’, NULL, NULL, ‘5’)
D. (1234, ‘口红’, NULL, NULL) **
正确答案:A D

【笔试题目整理】小红书2019年校园招聘数据分析岗位在线笔试第一批

文章插图
「题目解析」
主键不能为空,故排除B;根据代码,不能为空,故排除C 。
10. 已知一个家庭有两个小孩,且已知家中至少有一个男孩,则家中至少有一个女孩的概率是(填分数)
正确答案:2/3
?条件概率
「题目解析」
一个家庭中有两个小孩只有4种可能:{(男,男),(男,女),(女,男),(女,女)} 。
设事件A为“至少有一个男孩”,事件B为“至少有一个女孩”,则
A = {(男,女),(男,男),(女,男)},
B = {(男,女),(女,男),(女,女)},
AB = {(男,女),(女,男)}
故,P(A) = 3/4; P(AB) = 2/4
P(B | A) = P(AB) / P(A) = 2/3 。
11.、where、group by语句同时出现在一段sql代码中,那么他们正确的出现的顺序是
正确答案:
(1) where
(2) group by
(3)
12. 某地区居民以同样多的人民币,2006年比2005年少购买5%的商品,则该地的物价上涨了?%(保留一位小数)
正确答案:5.3
「答案解析」
今年100块钱,买100个鸡蛋,每个1元,明年100块钱买95个鸡蛋,每个100/95元,物价上涨率:(100/95-1)/1
**13、需求:当前希望分析产品上线两周后,页面的使用人群特点(年龄、性别、城市)和页面上不同入口点击率(页面上各种按钮、超链接等等的点击次数/页面访问次数)的关系 。
拿到的数据格式为csv格式,每行数据包括:用户操作时间、用户id、用户对应的信息(好几列,年龄、性别、城市)、操作行为(访问、点击)、被操作模块名称(访问行为此列为空,点击行为此列为被点击入口的名称),示例如下
**
**任务:对过去两周产品的使用人群特点和入口点击率进行描述和可视化作图,说明上两周的现状情况 。要求:从整体角度描述提到两个指标的变动情况;将不同入口点击率按照人群特点进行划分,描述不同人群的入口点击偏好、对某个入口点击率的差异 。
问题1:简述一下拿到这个数据文件后你根据任务所规划的处理步骤(画图or文字描述皆可,文字描述需要写清步骤序号) 。
问题2:列出你能够使用以及知道了解的软件名称-对应功能名称-
用来处理什么内容(功能名称可以是程序包、具体某个包后插件下的、使用的图的类型名称等),请把答案是属于“掌握”(知道名字,辅以简单查询后可以自己做出来)还是“了解”(听过这个名字,但没有实践应用过)分成两个部分 。
(举例:掌握:excel-图表-柱状图-作图说明不同年龄群有多少人) **
参考答案:
清洗->(以xx维度拆分->组合->)计算人群特点->统计整体不同特征人群人数,计算总体入口点击率->描述趋势->拆分计算入口点击率->细分对比,描述每个细分人群的特点->挑出重点进行阐述(希望知道候选人拿到任务之后如何开展自己的工作,对工作步骤是否能有自己的思路)