【笔试题目整理】小红书2019年校园招聘数据分析岗位在线笔试第一批

1. 想要了解上海市中学生的身高,从中抽取了1000个样本,这项调查中的样本是
**A. 上海市全部中学生
B. 上海市全部中学生的身高
C. 从中抽取的1000名中学生
D. 从中抽取的1000名中学生的身高 **
正确答案:D
举一反三
对应《小红书2019年校园招聘数据分析岗位在线笔试第二批》的第1题,考察知识点「抽样」 。
2.偏态分布一般用以下哪个指标描述集中趋势
**A. 标准差
【【笔试题目整理】小红书2019年校园招聘数据分析岗位在线笔试第一批】B. 平均值
C. 中值
D. 方差 **
正确答案:C
「题目解析」
正态分布用「期望」描述集中趋势;
正态分布用「标准差」描述离散程度;
偏态分布用「中值」描述集中趋势 。
举一反三
《小红书2019年校园招聘数据分析岗位在线笔试第二批》第2题,考察偏态分布;
《小红书2019年校园招聘数据分析岗位在线笔试第二批》第5题,考察正态分布的集中趋势;
3. 在以下不同的场景中,使用的分析方法不正确的有
**A. 根据商家最近一年的经营及服务数据,用聚类算法判断出小红书商家在各自主营类目下所属的商家层级
B. 用关联规则算法分析出对护肤内容有兴趣的用户,是否对彩根据妆内容感兴趣
C. 根据用户最近购买的商品信息,用决策树算法识别出用户是男是女
D. 根据商家近几年的成交数据,用聚类算法拟合用户未来一个月可能的消费金额公式 **
正确答案:D
「题目解析」
D应当用回归分析拟合 。
4. 用算法拦截可疑笔记,描述拦截的笔记中有多少是真的可疑笔记是
**A. AUC
B. ROC
C.
D.**
正确答案:D
?分类器的评价
ROC曲线
接收者操作特征( ),roc曲线上每个点反映着对同一信号刺激的感受性 。
横轴:(1-)
纵轴:(正类覆盖率)
= TN / Total
= TP / Total= TP / (TP+FN)
AUC
ROC曲线与轴围成的面积
即= TP / Total
= TP / Total
= (TP+TN) / Total
F1:和的调和均值
2/ F1 = 1/ + 1/

【笔试题目整理】小红书2019年校园招聘数据分析岗位在线笔试第一批

文章插图
5. 当总体分布未知的情况下,可以采用以下哪种检验方法?
**A. T检验
B. 方差分析
C. F检验
D. KS检验 **
正确答案:D
「题目解析」
t检验:适用小样本,总体标准差未知的正态分布;比较两个平均数的差异是否显著 。
方差分析( of,简称ANOVA):又称“变异数分析”,用于两个及两个以上样本均数差别的显著性检验 。
F检验:(F-test),最常用的别名叫做联合假设检验(英语:joint
test),此外也称方差比率检验、方差齐性检验 。它是一种在零假设(null , H0)之下,统计值服从F-分布的检验 。
ks检验:-
是比较一个频率分布f(x)与理论分布g(x)或者两个观测值分布的检验方法 。其原假设H0:两个数据分布一致或者数据符合理论分布 。D=max|
f(x)- g(x)|,当实际观测值D>D(n,α)则拒绝H0,否则则接受H0假设 。
6. 在做数据分析中,如何处理异常或是缺失数据,请选择一下你认为正确的答案
**A. 不处理
B. 删除元组
C. 数据补齐
D. 以上全对 **
正确答案:D
7. 下列哪一项不是描述连续变量的
**A. 二项分布
B. 泊松分布
C. 超几何分布
D. 正态分布 **
正确答案:A B C
?常用离散随机变量分布
![](
=image/,pdGk,,==,,,t_70)
![](
=image/,pdGk,,==,,,t_70)