一亩三分地论坛

 找回密码
 获取更多干货,去instant注册!

扫码关注一亩三分地公众号
查看: 305|回复: 2
收起左侧

[找工就业] Lyft DS 面试流程及建议

[复制链接] |试试Instant~ |关注本帖
oldfish 发表于 2016-11-29 12:23:21 | 显示全部楼层 |阅读模式

2017(10-12月)-[]EE博士+fresh grad 无实习/全职 - 内推| 分析|数据科学类全职@fresh grad应届毕业生

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?获取更多干货,去instant注册!

x
拿到了口头 offer,人怂,所以不打算透露具体题目,请见谅。说说我对于准备面试的建议吧,希望对于准备DS面试有些帮助。
就我的了解,目前 lyft 的 DS 团队大概有30号人左右,据说明年要扩张到60人,近期应该有不少机会,想去的同学们抓紧了,骚扰 HR 也许会有收获吧。
Lyft的DS比较偏向数学建模和工程实现,据说是需要写 production code 的,而不是纯粹的分析数据,比较符合我的胃口。我猜可能他们比较喜欢stem的phd背景。

我十月中旬让同学帮忙 refer, HR 的动作奇快无比,refer后一小时就联系我了。先是做了一个 data challenge,属于标准的 ML 建模预测题,如果做过kaggle的话应该很熟练。给了24小时,动作快的话10个小时能做完,但是我磨蹭了整整20个小时。所幸还是过关了。. From 1point 3acres bbs

之后是电话面试。没有coding。讨论之前的project和 data challenge 的心得体会。之后问了一个关于扔骰子的概率题,不难。

再之后就是 onsite 了。主要有下面几个方面可以准备。下面所有的例子都不是我面试被问到的问题,对于想看面经的同学们说声,对不起...

1. 概率和统计基本知识。包括常用概率分布,求各种期望和方差,假设检验。我对于准备的建议是要搞清楚基础概念,时不时地拿出来问自己,并且揣摩消化。一个例子是 frequentist 里假设检验的 statistical power 是什么?这和假设检验的第一类错误、第二类错误有什么关系?假设检验的size,或者叫 level,是什么意思?和 p-value 又有什么关系?如何通过 p-value 做假设检验?Bayesian 里的假设检验又有什么样的 assumption?Frequentist 里如何理解 confidence interval? Confidence testing 和 hypothesis testing 又有什么关系?这些概念并不简单,想要完全弄明白需要花一些力气。但是以不变应万变,搞清楚基础概念才能在面试时有发挥的空间。另外对于概率,我特别推荐一本书 a practical guide to quantitative finance interviews。我发现 DS 里概率方面的面试和 quant 里很相似,很有借鉴意义。当然金融和随机微分方程什么的还是不用看了哈。申明一下,上面列举的只是我自己想的例子,并不是面试时我被问到的问题。

2. ML。这个很难准备,因为 ML 里东西实在太多了,上一门 ML 的课是远远学不完的。更重要的是有一些基础概念在大部分 ML 课里并不会讨论的很详细。比如 bias - variance tradeoff,大家都大概知道是怎么回事,但是谁能一五一十讲的特别清楚?另一个例子是 logistic regression 和 Naive Bayes 有什么联系和关键的区别? 而这些基础概念很可能是面试官喜欢问的。我准备面试的时候翻了一遍 elements of statistical learning。这本书实在不错,我比较建议大家有空的时候都拿出来读一读,尤其是其中的 insight 和各种讨论。我觉得这本书相比 PRML 更容易读。我感觉准备 ML 方面面试的时候需要注意很多基本细节和假设,而对于各种 fancy 的 model 倒不要太过关注。毕竟除了 ML 的 phd,很难对所有的 state-of-the-art 有深入的了解。另外,这个帖子我觉得很有代表性 http://www.1point3acres.com/bbs/ ... read&tid=210225 强烈推荐。不过这个帖子里的题目好难,问我的话我必挂无疑...

3. Product。给一个lyft的产品,你和面试官一起分析如何把产品fomulate成数学问题。这个有点像 system design。这方面我就呵呵了,答的和屎一样。我也不知道怎么准备。也许面试前拜拜佛是个不错的选择?Glassdoor 上的面经也许有帮助。恕我不能更加详细地描述题目细节。

总之面试不容易。感觉那里的DS都挺聪明的,大部分都是好学校的工科或者统计phd出身,或者名校本科。同时大家都比较愿意讨论,而不是顾持己见。比较幸运拿到了offer,现在还没有offer细节。很多人都说 DS 的 package 一般比 SDE 少。那样子的话,我也只能认命吧...-google 1point3acres


. more info on 1point3acres.com
补充内容 (2016-11-29 12:37):
有个笔误 confidence testing -> confidence interval
asianyoungman 发表于 2 小时前 | 显示全部楼层
楼主,祝贺你。问下他们家data challenge数据量多大?需要在cluster上跑吗?跟kaggle上101的水平相比更难吗?另外怎么算是通过了呢?我也要做他家的data challenge, 申的是实习,所以想从楼主那里取取经。多谢啦。
回复 支持 反对

使用道具 举报

 楼主| oldfish 发表于 1 小时前 | 显示全部楼层
asianyoungman 发表于 2016-12-8 13:41. from: 1point3acres.com/bbs
楼主,祝贺你。问下他们家data challenge数据量多大?需要在cluster上跑吗?跟kaggle上101的水平相比更难吗 ...

数据量和难度和这个 Kaggle 很类似 https://www.kaggle.com/c/avazu-ctr-prediction. 鐣欏鐢宠璁哄潧-涓浜╀笁鍒嗗湴

不过他们家现在招 DS 的 intern 么?
回复 支持 反对

使用道具 举报

本版积分规则

请点这里访问我们的新网站:一亩三分地Instant.

Instant搜索更强大,不扣积分,内容组织的更好更整洁!目前仍在beta版本,努力完善中!反馈请点这里

关闭

一亩三分地推荐上一条 /5 下一条

手机版|小黑屋|一亩三分地论坛声明 ( 沪ICP备11015994号 )

custom counter

GMT+8, 2016-12-8 16:31

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表