“金秋十月,尽情挥洒”,国庆节又快要到了,各大企业招聘旺季还在如火如荼地进行着,期盼了好久的7天国庆长假,你是不是打算来场说走就走的旅行,在这之前,也勇敢地进行了一次说走就走的辞职,想给自己全新的开始。想进入或转行到大数据或数据分析领域的朋友们,戳进来好好看看,2018年大数据&数据分析行业的面试机密吧,我亲自为你解答! 为了帮助更多即将进入数据分析行列或大数据领域的朋友找到更好更适合自己的工作,CDA数据分析研究院分享了一份2018年10个常见大数据&数据分析面试题合集,既有基本的业务分析面试题,也有高阶数据挖掘算法试题,更有分析工具应用试题来指导你准备面试,试题均附有答案。 3) 数据清洗,整合与检查数据,缺失值和异常值处理 A2:联系:二者都是对变量之间不严格依存关系的分析,在理论基础和方法上具有一致性。只有存在相关关系的变量才能进行回归分析,相关程度越高,回归分析的结果越可靠。 区别:相关分析研究的是变量之间的依存关系,这些变量的地位相等,不区分主从因素或因果关系。回归分析却是在控制或给定一个(或多个)变量条件下来观察对应的某一变量的变化,给定的变量为自变量,被观察的变量为因变量。因此回归分析中必须根据研究目的来确定自变量和因变量。 相关关系主要测定的是变量之间关系的密切程度,回归分析则着重于变量之间的具体变量关系,通过建立回归模型,控制或给定自变量进行估计和预测。 A3:基于内容推荐算法:基于物品或内容的特征,发现物品之间的相似性,然后基于用户以前的喜好记录推荐给用户相似的物品。本质是对物品或内容进行分析建立特征,基于用户对什么特征的内容感兴趣以及分析一个物品具备什么特征来做推荐。不考虑用户之间的关系,只关注物品本身的特征,根据Item获得与之特征相似的Item进行推荐。简单来说就是根据用户之前喜欢的物品,通过对特征的匹配分析,预测用户的喜好。 基于用户的协同过滤推荐算法:寻找与目标用户有相同喜好的邻居,然后根据邻居的喜好向目标用户进行推荐。基本原理就是利用用户访问行为的相似性来推荐用户可能感兴趣的资源。根据用户-物品的评分矩阵,计算用户的相似度,根据相似用户的喜好进行推荐。主要关注User与Item之间的关联,与具体Item本身的特征没有关系,基于相似用户会喜欢相似物品的假设进行推荐。简单来说就是根据和某一用户有相似喜好的其他用户的喜好,从而预测该用户对物品的可能喜好。 差别在于:协同过滤必须要有用户行为,基于内容的推荐不考虑用户行为。冷启动阶段只能用基于内容的推荐,因为没有用户行为数据,积累一段时间用户行为数据后才可以使用协同过滤。 从用途上来说,协同过滤适合给用户带点新鲜感的使用场景,如“逛”淘宝的用户;而基于内容推荐更适合用户焦点比较集中的使用场景,如垂直领域的内容推送。 Q1-Q3主要考察应聘者对数据分析方法、流程和算法的理解及应用能力。 A4:=IF(A<60,0,IF(A<80,80,100)) A5:Excel常用的函数有: SUM求和函数、AVERAGE求平均值函数,COUNT计数函数、IF逻辑判断函数、NOW日期时间的无参函数、VLOOKUP查找引用函数,ISNUMBER判断是否为数字函数,SUMIFS多条件求和函数等等。 Q4、Q5主要考察业务数据分析师使用Excel处理轻量数据进行业务分析的能力。 A6:delete from A where B in (select B from A having count(B)>1 and B=’b’); A7:select 姓名 from A where 学号 in (select 学号 from B where 语文>80 and 数学>80); Q6、Q7主要考察SQL语法,应聘者对数据库的基本操作能力。 #这是一个用来检测用户输入手机号码是否合法的小脚本。 #号码前缀,如果运营商启用新的号段,只需要在此列表将新的号段加上即可。 phoneprefix=[''130'',''131'',''132'',''133'',''134'',''135'',''136'',''137'',''138'',''139'',''150'',''151'',''152'',''153'',''156'',''158'',''159'',''170'',''183'',''182'',''185'',''186'',''188'',''189''] return("The length of phonenum is 11.") if s.isdigit():#检测输入的号码是否全部是数字。 if s[:3] in phoneprefix: #检测前缀是否是正确。 return("The phone num is valid.") return("The phone num is invalid.") return("The phone num is made up of digits.") phonenum=input("Input your phone num:") valid=phonecheck(phonenum) nowTime=datetime.datetime.now().strftime(''%Y-%m-%d %H:%M:%S'')#现在 if (valid == ''The phone num is valid.''): print(nowTime,phonenum[0:3],phonenum[3:7],phonenum[7:],sep='' '') print(''The phone num is invalid.'') os.chdir(''C:\Users\lifei\Desktop'') with open(''Today.txt'') as today: Q8、Q9主要考察应聘者的Python基础编程能力。 学生的年龄比小张大,小张不是学生,张是商人或是士兵。 小王的年龄和大学生的不一样,小王不是学生,王是商人或是士兵。 小赵的年龄比士兵大,大学生的年龄比小张小,小张比小赵大,而小赵比士兵大,那么小王是士兵,小张是商人。 Q10考察应聘者的逻辑思维能力,是否具备从海量数据中挖掘有趣关系的分析思维。 数据小白在谋求一份数据分析工作前,必须熟知数据分析的基础知识。除了上文提到的相关知识,一名合格的数据分析师还应该掌握相关的行业动态,能够敏锐的把握数据背后的潜在规律,为业务发展做出正确指导和决策。 整装待发,以待来日!黄金招聘季,你准备好如何脱颖而出了吗?
|