一亩三分地论坛

 找回密码
 获取更多干货,去instant注册!

扫码关注一亩三分地公众号
查看: 1498|回复: 5
收起左侧

Yelp HQ onsite,data mining组

[复制链接] |试试Instant~ |关注本帖
chicagoloop 发表于 2016-2-28 12:07:24 | 显示全部楼层 |阅读模式

2016(1-3月) 码农类 硕士 全职@Yelp - 校园招聘会 - 技术电面 Onsite 校园招聘会 |Failfresh grad应届毕业生

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?获取更多干货,去instant注册!

x
简历是10月份在学校的招聘会上投给Yelp的recruiter。1个月之后recuriter发邮件给了HackerRank上的OA。题目很简单。不用额外准备。然后就是电面。一个美国小哥,西雅图data mining 组的,做anti-spam方向。首先聊LZ简历上的项目经历。然后开始聊data mining相关的。比如说什么是false positive,false negative。在anti-spam中,如何降低false positive rate。然后给了一个yelp里面的实际应用。就是说,如何检测yelp review中的spam review。这个问题LZ一开始觉得有点大,不知从何如入手。小哥很善意的给了提示,让我从设计feature vector入手。整个回答得不是很有信心。在回答过程当中提到了一个统计概念,confidence interval。小哥又追问这个概念的定义,以及如何使用。接下来开始做题,题目是leetcode原题https://leetcode.com/problems/minimum-path-sum/ 。很简答吧。LZ上来就给个DP的code。Bug free一遍过。小哥又追问如何找到这个minimum path。LZ说用一个parent matrix,专门记录matrix中每个元素在其min path上面的parent是谁。小哥说可以。然后又追问时间复杂度,以及brute force的方式及其时间复杂度。小哥很高兴。电面就到此为止了。. visit 1point3acres.com for more.
3天之后收到on-site邀请。

2月中去的Yelp HQ做的onsite。中午之前到的。先吃午饭,就在yelp食堂。一个广告组的美国小哥陪同。领完饭就搬椅子开吃。期间和其他的员工简单地聊几句。饭后是一个tech talk。正式面试是在1:30开始。首先是广告组的engineer manager。美国大叔。先问我简历上的项目。然后就问LZ会不会map reduce。我说知道一些简单的。大叔先给一个场景,假设有大量的以json文件存储的单个广告的显示和点击日志。就是记录每个广告被显示和点击了多少次。计算每个广告的CTR, 即click through rate。因为CTR的分子分母都是count,LZ很快用python写完。大叔追问如何同时计算出所有广告的总CTR。LZ说做两次就行了呗。大叔说可以。但又说能否一次做完。这下LZ卡主了。说了几个,都被否了...最后大叔说你的code改一行就行了,就是在mapper里面yield两次,一次是算单个的CTR,另一个是去算总CTR。LZ一直把yield当做return用。学python时不下力啊。。。第一面过后就感觉不妙。
. 鐣欏鐢宠璁哄潧-涓浜╀笁鍒嗗湴
第二个面试官来晚了10分钟。美国小哥。好像刚来上班,而且刚睡醒。上来先问简历。让我介绍过去的项目。我边说,他边做笔记。20分钟过去后,小哥说要考一个coding题。给一个python 的function,名字为worker,参数是worker id和job queue。worker从queue中取出job( list of int),记下开始时间和job的大小,然后开始处理job中的每个int。每个worker会运行在不同机器上,因此处理能力不能同一看待。假设有Q个job,一个deadline D,问最少需要多少个worker能够在D之前把Q个job完成。题目信息就是这些。LZ当时觉得信息及其不完整。开始发问,说我不知道job的大小,也不知道work的处理能力。然后面试官在白板上写下一个log 样例。列是: start time, worker id和job 大小。LZ觉得信息差不多,就开始写code。主要的想法是扫描log文件,估计出每个worker的处理能力。然后用greedy的方式,选出最快的几个worker把job处理完。code还没写完,时间就到了。小哥没有什么反馈,匆忙离开了。感觉花在确认问题和沟通上的时间过多了。. more info on 1point3acres.com

第三个也是个美国小哥。上来也是先问简历。很详细的问。然后问我对yelp的哪个data mining的team感兴趣。然后他开始介绍每个team。时间过去大半了,问我最熟悉哪个data mining算法。我开始想说SVM。后来想想还是说frequent itemset mining吧。结果没想到小哥说他不是很了解。冷场一小会。上coding题。类似于 https://leetcode.com/problems/sort-colors/ 的问题。LZ之前没做过这个题。看时间不多了,就直接用counting sort。很快代码写完,没有bug。小哥说可以,然后就走了。后来才知道,有更好的方法。解这个题。刷题不够啊!

第四个面试官是个印度小胖子。上来先问我想做什么。LZ吧啦吧啦把自己过去的经历简单说一遍。然后跟yelp做的几个方向都往一起扯一扯。小胖子觉得也问不出来啥,就开始coding。leetcode原题https://leetcode.com/problems/longest-palindromic-substring/。LZ很快在白板上把code写完。小胖子发现一个小bug,很得意。我很快修正。看见他得意的样子,我心里有些生气。然后小胖子说,假设给你的一个Oracle,它能够判断出奇数长的最长的palindrome,问能否用这个oracle找到最长的palindromic substr。LZ说了几种方案,都被否定了。小胖子提示我string中都是alphanumeric letter。LZ没有反应过来。然后面试结束了。事后才知道有一个加dummy letter的trick把偶数长的palindrome变成奇数长的。. 鐣欏鐢宠璁哄潧-涓浜╀笁鍒嗗湴

Recruiter最后过来聊一聊,然后送我离开office。

总之,LZ在Yelp的onsite是非常失败的。说实话,问题都不难。对于语言的理解,对于算法coding的细致程度,以及临场反应和与面试官的互动 都做的不够好。只能move on了。
. 鐗涗汉浜戦泦,涓浜╀笁鍒嗗湴
祝大家面试顺利!有谁最后拿到yelp data mining组offer的,在地里冒个泡,讲讲面经啥的啊

说了这么多,求大家多给些大米积分啊! 多谢多谢!



评分

5

查看全部评分

本帖被以下淘专辑推荐:

Rodic 发表于 2016-3-1 07:31:24 | 显示全部楼层
楼主能详细说说第二题么?
每个worker处理某个job需要多少时间是给定的么?
回复 支持 反对

使用道具 举报

Ridingstar01 发表于 2016-3-2 07:16:12 | 显示全部楼层
谢谢楼主,分享的很详细!Good luck!
回复 支持 反对

使用道具 举报

 楼主| chicagoloop 发表于 2016-3-2 10:24:42 | 显示全部楼层
Rodic 发表于 2016-3-1 07:31
. 1point3acres.com/bbs楼主能详细说说第二题么?
每个worker处理某个job需要多少时间是给定的么?

没有给定,需要从log file中分析出来。每一个worker在从queue中取出job之前会在全局的log file中记录下开始的时间和list的大小。还隐约记得面试官给的log file是这样的 鏉ユ簮涓浜.涓夊垎鍦拌鍧.
time stamp, worderID, list size
100, A, 9
170,B,100
390,A,5
500,B,7. From 1point 3acres bbs
..... 鐣欏鐢宠璁哄潧-涓浜╀笁鍒嗗湴
这样worker A的执行效率(单位时间处理int的个数),就是 9/(390-100),B的就是100/(500-170)。

我觉得我这轮表现不好的原因主要是与面试官沟通不是太流畅以及白板coding速度太慢。
回复 支持 反对

使用道具 举报

Rodic 发表于 2016-3-3 00:38:31 | 显示全部楼层
chicagoloop 发表于 2016-3-2 10:24
. from: 1point3acres.com/bbs 没有给定,需要从log file中分析出来。每一个worker在从queue中取出job之前会在全局的log file中记录下开 ...

这题好难啊,楼主能说下思路么?谢谢
回复 支持 反对

使用道具 举报

NitaHoult 发表于 2016-9-13 12:19:05 | 显示全部楼层
jiajingyan
回复 支持 反对

使用道具 举报

本版积分规则

请点这里访问我们的新网站:一亩三分地Instant.

Instant搜索更强大,不扣积分,内容组织的更好更整洁!目前仍在beta版本,努力完善中!反馈请点这里

关闭

一亩三分地推荐上一条 /5 下一条

手机版|小黑屋|一亩三分地论坛声明 ( 沪ICP备11015994号 )

custom counter

GMT+8, 2016-12-9 16:36

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表