一亩三分地

 找回密码 注册账号

扫描二维码登录本站


码农求职神器Triplebyte
不用海投
内推多家公司面试

Total Comp Calculator
输入offer信息
系统自动计算每年收入

科技公司如何
用数据分析驱动产品开发
coupon code 250off 立减$250

深入浅出AB Test
从入门到精通
coupon code 250off 立减$250
游戏初创公司招聘工程师、UIUX Designer和游戏策划
坐标湾区
DreamCraft创始团队
招聘游戏开发工程师
查看: 3351|回复: 31
收起左侧

DS面试心得总结

  [复制链接] |试试Instant~
论坛匿名账号
论坛匿名账号  发表于 2019-6-30 09:27:52 |阅读模式
本楼: 👍   100% (9)
 
 
0% (0)   👎

2019(4-6月) 分析|数据科学类 博士 全职@Uberfb/google/wayfair/insight - 内推 - Onsite 其他  | Pass/Offer | fresh grad应届毕业生

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?注册账号

x
本帖最后由 stultus 于 2019-6-30 20:00 编辑

找工作的事终于告一段落,特别感谢这段时间在地里读到的大家总结的各种经验,获益匪浅。回馈地里,总结一下我自己在准备过程中觉得有用的资料和经验,希望可以帮到还在面试的大家。

我是物理phd new grad,没实习也没有ds方面的经验,平时做的东西和统计完全无关。决定转行找ds工作以后从四月初开始认真准备,六月中拿到了自己满意的offer。我一共面了Insight/脸书/领英/波屯家具公司/黑车/狗家/一家网路安全公司,都是ds的职位。除了领英第一轮就挂了以外,其他都过了,或者因为接了offer没继续面onsite。所以大家真的,不要怕!!!像我这种完全没经验背景的小白恶补两个月也是可以找到工作的,所以只要付出努力一定可以拿到自己心仪的offer。

刚刚开始面试的时候心里是很慌的,因为读了这么多年书第一次找工作,不知道要准备到什么程度才能过各家公司到bar。每面完一轮都会因有不perfect的地方觉得自己挂了,患得患失影响自己和朋友的心情。回头看,我想和大家说的是,如果是第一次找工作,千万不要给自己太大压力。其实大多公司到bar都没有你心里想象的高,题目问的难也并不等于他们expect你都能回答上来,毕竟他们是拿你和其他人比较。就像100分的测验你拿了20分,但别人都拿10分,你也是佼佼者。面脸家的时候我觉得我有一轮挂的非常彻底,站在白板前一脸懵比脑袋空白了十分钟,以为自己肯定挂了回来还哭了好一会儿,但是最后还是拿到了offer并且有非常好的feedback。

说一下timeline的问题,我从三月份开始投简历,其实对于new grad来说是很蠢的,因为大多公司的无经验新人headcount都是每年fall开始的,到了来年三四月份基本已经进入尾声了或者招满了。我在刚开始投简历的时候觉得很dejected,因为没有什么opening,所以new grad找工作不管自己有没有准备好,最好都先在fall的时候投一下,有些面试可以拖着面,但是如果等到来年三月份再投的话,可能连面试的机会都没有了。

面过的几家公司地里都有很多前辈的经验总结,具体题目我就不讲了。但是对于ds这个职位,我最大的体会是:不管什么样的面试,最终围绕的都是要有problem solving skills/product sense,即使是看起来想要测试你technical skills/ML skills的那些。我举个例子,比如insight的面试会让大家demo一段自己写的code,要给面试官通过share screen。很多人会一行一行地go through code,但正确的做法是先讲你做的到底是什么,你为什么要做这个,它解决了什么问题,然后再宏观地讲你都做了啥用了什么technique,为啥用这个model。Insight主要考查的其实是你的自主problem solving skills/product sense,并不是你写的code能不能run,你懂多少个models。很多人喜欢demo kaggle/class project,这个是insight最不喜欢的,因为他们会觉得你并没有自主解决问题的能力,只是按照老师要求的去做,没有创造力。我觉得其实大多数的面试都是同一个道理,at the end of the day 都是为了解决实际问题的,所以按照怎么solve problem的角度来approach所有的问题是一个比较好的做法。再比如我面的一家
游客,本帖隐藏的内容需要积分高于 188 才可浏览,您当前积分为 0。
查看如何攒积分 Click here for more info.
只是局限于我面的这些公司里我觉得没啥用),可以不做。a/b testing方面我觉得除了udacity以外,lisa qian的tutorial也很好(http://shop.oreilly.com/product/0636920043508.do),而且看起来比udacity快很多。除了这两个以外,我建议看一下任何stats textbook的hypothesis testing的部分,对于应付a/b test比较theoretical的问题绰绰有余了。ML方面,完全没经验的看一下ISL,学过ML的看ESL,把基本概念看懂了就够了。

最后特别感谢找工作中给我很多指点的朋友同学,特别是m同学陪我一次又一次mock面试,能找到自己喜欢的工作主要是归功于她。

大家加油!


. check 1point3acres for more.

评分

参与人数 12大米 +18 收起 理由
outlooker + 1 赞一个
b289zhan + 1 赞一个
winston90 + 1 很有用的信息!
tzuyiyen + 2 很有用的信息!
AlexaLee + 1 赞一个
connasyx + 1 赞一个
tinlittle + 3 恭喜上岸
NewRita + 3 很有用的信息!
铅笔 + 1 很有用的信息!
crystalcc + 1 很有用的信息!

查看全部评分


上一篇:狗家数科HR+Phone screen经验+小意外
下一篇:保险-Travelers-DS intern-面经

本帖被以下淘专辑推荐:

我的人缘0
novavistamn 2019-7-20 04:35:45 | 显示全部楼层
本楼: 👍   80% (4)
 
 
20% (1)   👎
全局: 👍   79% (34)
 
 
20% (9)    👎
我觉得这个时间线也太诡异了,一点统计背景都没有是怎么过简历关的?lz难道一个月刷完机器学习+Leetcode+Product Sense
回复

使用道具 举报

我的人缘0
dw357 2019-7-21 13:23:55 | 显示全部楼层
本楼: 👍   100% (2)
 
 
0% (0)   👎
全局: 👍   100% (105)
 
 
0% (0)    👎
novavistamn 发表于 2019-7-21 08:20
看了你的回复,你应该不怎么懂机器学习,也没正式开始工作吧?掉包,调参,data imputation算是机器学习 ...

啊.. 我没有要贬低data scientist职位的意思,让你这么觉得真是十分抱歉!无论什么职业,能找到自己想要的工作肯定是要付出很多努力的,我并没有对这个职业嗤之以鼻的意思,也不是想要表达我很厉害随便看看书就能面到工作。大概是我的文字表达不准确,让大家有这种错觉,真是不好意思!写这篇文章的初衷完全是因为自己在找工作的时候觉得很没有信心,但是最终还是很幸运的找到了工作,想给大家打打气,也分享一下我对找ds工作肤浅的理解和可能有能帮助到大家的地方。

DS这个title确实像你说的一样,有从偏analytics到偏ML research的一个很宽的spectrum。我最开始投简历的时候并不了解其中的区别,也是一边面试一边学习慢慢了解总结出来的。我面的公司文章最前面有列出来,其中脸书是比较偏analytics的,狗家是比较偏stats的,波士顿家具公司/网路安全公司/黑车/Insight是比较偏ML的。可能我面试的比较少,我面的公司中,考ML知识的时候确实没有问到具体需要掉包的details,我猜可能是因为这是比较好pick up的东西。相对问的比较多的都是具体对概念的理解,有些问的比较深入。唯一用到掉包的技能是做大作业的时候,这个我确实也有去学习,读了sklearn的documentation,确实比较肤浅,也没有涉及deep learning的部分。我觉得公司在面试的时候并不需要面试者十项全能,不会的东西可以大方的说不会,会的东西要掌握的透彻彻底。从公司的角度来说,如果一个面试者能把自己会的部分掌握的很通透,那不会的东西应该也能很快学会,这就够了。

对于ISLR,我觉得这本书在我面的这些公司里还算是够用的,部分原因是因为我没有面任何ML research的职位,都是比较applied的position。我在准备ML部分的过程中,有反复读过ISLR好几遍,每次都有不同的新的体会。我学习新知识确实比较慢,有时候要反复多读很多次才会明白,这个每个人的学习方式肯定都不一样,怎样对自己有效就怎样来。虽然我准备了两个多月,我确实是有全心全意认认真真付出了很多时间在上面。读ISLR的时候,遇到我没有完全理解的部分,或者心中有的疑惑和延伸的问题,也会去google查更多的资料,可能会对thorough understanding有帮助。hmm如果觉得两个月不够准备,那就准备三个月四个月?这个每个人想要学习的重点都不太一样,花的时间肯定也不同,我没有说一定要准备两个月的意思呀。

背景方面,我确实没有什么统计的基础,对于这个thread里面大家提到的很多统计概念我都没听过。如果硬要说的话,我本科有double数学专业,了解一些很基础的本科生stats知识,可能复习起来的时候会觉得比较comfortable。sql这之前我也的确没有接触过,不过感觉sql还是比较intuitive的,没有特别复杂的逻辑,是比较容易上手的。python我在research的时候有用过一些,局限于一些简单的data manipulation/plotting。我面过的公司里几乎没有遇到过考algo和data structure的,有一家公司考了我white board一道sorting的变形题,我很诚实地说我没有学过这个,但是我有个大概的idea可以怎么做,虽然我觉得不是最efficient的。面试官说没关系,你写写看,不需要efficient。后来我写了一个brute force answer,最后也有拿到offer。我们之后聊天的时候她说,其实只是想看看我有多comfortable handling python, 以及在不会的情况下怎么能写出一个还算合理的答案。大多数的ds确实不需要deployment level coding,所以不需要考lc等级的data structure questions也make sense。之前的文章里我也有提到过,我觉得很多时候面试官考我们的问题也只是想知道我们的知识boundary在哪里,并不是一定要把所有的问题都回答出来。

对于你之前说的domain knowledge,虽然我没有经验,但这并不是说我没有花时间去了解。比如我知道我要去面试一家网络安全公司的时候,面试之前我是有去网上读文章了解这个领域,肯定是有去做相关的准备呀。而且这家公司面试有很多轮,第一轮聊过一次之后大概就知道公司的业务侧重,准备下一轮面试的时候肯定也会事先多去网上读一些相关的资料,自己在家想想都有什么可以顾虑的方面,这些一般面试之前的准备工作我都有好好认真去做。我感觉那些面试中需要domain knowledge的公司,公司不会因为你不懂这个domain就penalize你,他们会当场告诉你一些需要知道的知识,看看你怎么思考和面对这样的问题,如何approach没有遇到过的问题和挑战,应该也是面试考察的一部分。

对于简历关,我当然也有被拒绝!我的自我感觉是大公司比较容易过简历关,因为opening多,小公司相对难一些。我也投过几家我觉得很不错的start ups,比如impossible foods,brex之类的,都是直接被简历拒,twitter我也是直接被简历拒了,并不是所有的都有拿到面试。

我觉得复习准备的过程每个人都不一样,时间长短肯定也不同。提到我准备了两个多月只是客观陈述事实,不是重点,也真的完全没有一点点要炫耀的意思(再次十分抱歉!)我只是想给大家加油打气,特别是和我一样第一次找工作的人。我在面试的过程中慢慢了解到了analytics和ML modeling ds的区别,所以在一边面试一边复习的过程中,也有慢慢侧重准备自己喜欢以及需要补充知识点的部分。我觉得面试准备的过程中,最能提高efficiency的办法是要经常总结自己的弱点和knowledge gap在哪里,以及自己短时间内的learning goals到底是什么,这样才能在复习的过程中知道应该往哪个方向努力,在哪些area上多花时间。其实在面试的过程中也会慢慢对自己多了解一些,随而不断地调节复习的节奏和侧重点。我因为觉得自己过去十年都是在一个很narrow的领域里研究东西,眼光有些局限,想要在未来的五年里学习一下更board picture的事情,所以最后选择了偏向analytics的职位。我不觉得analytics或者ML相比较哪个就更厉害,soft skills和hard skills哪一个就更难develop一点,选择什么侧重的职业完全是因自己的喜好而决定就好,不要太在意别人的眼光啦!

评分

参与人数 1大米 +1 收起 理由
X88 + 1 给你点个赞!

查看全部评分

回复

使用道具 举报

我的人缘0
novavistamn 2019-7-21 08:20:28 | 显示全部楼层
本楼: 👍   0% (0)
 
 
100% (2)   👎
全局: 👍   79% (34)
 
 
20% (9)    👎
本帖最后由 novavistamn 于 2019-7-21 08:25 编辑
铅笔 发表于 2019-7-21 07:11
你说的有严重的逻辑错误。你说的是你面试他人的经历,不是其他公司的面试官来面试人的经历。我参加了十 ...

看了你的回复,你应该不怎么懂机器学习,也没正式开始工作吧?掉包,调参,data imputation算是机器学习里最基本的操作了,好像驾驶员必须要知道怎么打方向盘踩油门一样。至于word2vec, LDA,也是业界常用的文字挖掘技巧,地里搜一搜,就有大把相关面经,怎么会是刁难面试人呢?
lz找到了好工作,当然值得祝贺。但是文字实在让人觉得machine learning仿佛是一件门槛很低的工作。一个完全没有经验的人,只要花一两个月,看几本入门教材,几篇博客,就能横扫各大公司ds面试。This is strongly biased。当然主要原因是因为现在data science title泛滥,做deep learning research的和写sql query的都可以叫这个职称。我也是出于经验,give my 2 cents。
回复

使用道具 举报

我的人缘0
铅笔 2019-7-21 07:11:13 | 显示全部楼层
本楼: 👍   100% (1)
 
 
0% (0)   👎
全局: 👍   90% (48)
 
 
9% (5)    👎
novavistamn 发表于 2019-7-21 06:25
这位同学,我已经是在职modeling ds了,最近几个月还参与了好几次面试。面过的人(new grad也好,转行的 ...


你说的有严重的逻辑错误。你说的是你面试他人的经历,不是其他公司的面试官来面试人的经历。我参加了十几次面试,国内国外的大公司都有,没有任何一家像你这样来刁难他人。在这里他人分享面试经历是希望给别人帮助,不是让你来挑刺找麻烦的。

如果都像你这样问,我现在面试他人直接问hoeffding's inequality的证明,Kolmogorov consistency theorem的证明,Rao-Blackwell定理的证明和应用,central limit theorem在Lindeburg condition下的证明,可能机器学习的博士甚至MSR的研究员都回答不上来。我做过概率,统计课的助教。在我看来你提到的那些东西意义更小,知道和不知道几乎没有本质差别。Data scientist本来就不是研究性质的职位,你居然还在讨论所谓的"hard skills"。如果要求"hard skills",看的是publication record和实打实的工作,不是你这种吹毛求疵的问题。你说这些真的很没礼貌。
回复

使用道具 举报

我的人缘0
novavistamn 2019-7-21 06:25:20 | 显示全部楼层
本楼: 👍   0% (0)
 
 
100% (1)   👎
全局: 👍   79% (34)
 
 
20% (9)    👎
铅笔 发表于 2019-7-20 12:18
你这都是在猜测,没有实实在在的东西。她已经把面试经历都写出来给你了,你还不相信认为自己的那一套。 ...

这位同学,我已经是在职modeling ds了,最近几个月还参与了好几次面试。面过的人(new grad也好,转行的也好)里很多都是没什么实际ML经验,看了几本教材,上了几本网课,就来申data scientist/MLE职位。稍微问细一点,比如问某个包怎么用,怎么调参,对于某一类数据怎么impute,怎么避免data leakage,或者问些课本上没写的sql用法,就答不上来了。所以lz说零基础准备 2个月拿下一堆大公司ds offer,我估计是比较侧重soft skills,对hard skills要求相对低的title。另外谷歌的data scientist面试最多考到回归和统计,几乎不考ML。
回复

使用道具 举报

我的人缘0
铅笔 2019-7-20 12:18:31 | 显示全部楼层
本楼: 👍   100% (1)
 
 
0% (0)   👎
全局: 👍   90% (48)
 
 
9% (5)    👎
novavistamn 发表于 2019-7-20 11:25
又不是内推就有面试了,很多公司内推后要HR审核的,如果背景不够match照样没面试的。
另外仔细看了文章 ...


你这都是在猜测,没有实实在在的东西。她已经把面试经历都写出来给你了,你还不相信认为自己的那一套。我经历了六次Google面试,你提到的那些根本就没有考。

你这样胡乱猜测别人,真的很不礼貌。大家来这里主要是向他人学习,不是评价别人的背景,在这里根据一些道听途说的东西来抱怨。
回复

使用道具 举报

我的人缘0
本楼: 👍   0% (0)
 
 
100% (1)   👎
全局: 👍   88% (16)
 
 
11% (2)    👎
楼主真的0基础吗 两个月好厉害
简历上的proj怎么办?
我感觉phd期间如果做data很多的实验 可以写上
回复

使用道具 举报

我的人缘0
novavistamn 2019-7-20 04:36:34 | 显示全部楼层
本楼: 👍   0% (0)
 
 
100% (1)   👎
全局: 👍   79% (34)
 
 
20% (9)    👎
novavistamn 发表于 2019-7-20 04:35
我觉得这个时间线也太诡异了,一点统计背景都没有是怎么过简历关的?lz难道一个月刷完机器学习+Leetcode+Pr ...

当然如果lz是harvard, MIT, Princeton的物理博士可能有名校光环加成
回复

使用道具 举报

我的人缘0
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   100% (28)
 
 
0% (0)    👎
楼主 楼主,能问一下LinkedIn 你面试的DS是什么title 吗?是不是内推拿到面试的。谢谢分享。
回复

使用道具 举报

我的人缘0
铅笔 2019-6-30 09:57:46 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   90% (48)
 
 
9% (5)    👎
本帖最后由 nunuh89 于 2019-6-29 20:46 编辑

祝你一路走好!很喜欢你的照片。
回复

使用道具 举报

我的人缘0
铅笔 2019-6-30 10:04:08 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   90% (48)
 
 
9% (5)    👎
另外你不要哭,祝贺你!
回复

使用道具 举报

我的人缘1
crystalcc 2019-6-30 10:21:40 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   100% (19)
 
 
0% (0)    👎
铅笔 发表于 2019-6-30 10:13
这个论坛好像没办法删除或者修改过时的留言。对不起!

可以去农民工社版申请删除的,https://www.1point3acres.com/bbs/forum-39-1.html
回复

使用道具 举报

我的人缘0
铅笔 2019-6-30 10:25:07 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   90% (48)
 
 
9% (5)    👎
crystalcc 发表于 2019-6-30 10:21
可以去农民工社版申请删除的,https://www.1point3acres.com/bbs/forum-39-1.html

联系了。
回复

使用道具 举报

我的人缘1
crystalcc 2019-6-30 10:29:16 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   100% (19)
 
 
0% (0)    👎
恭喜楼主,同应届生找工,很受鼓舞!想问下你是怎么使用mode的呀?我最近也在看mode的sql tutorial,觉得拆解问题的思路非常有帮助。但是需要掌握到那些sql query都可以写出来的程度吗?基本上每个query都很复杂,我理解得非常痛苦,不知面试时是否也需要这个水平。我还感觉tutorial的分析过程像是take home challenge做的事情,不知楼主遇到过什么样的take home么,有木有什么经验分享?感谢!
回复

使用道具 举报

论坛匿名账号
论坛匿名账号  发表于 2019-6-30 11:18:35
本楼: 👍   0% (0)
 
 
0% (0)   👎
本帖最后由 stultus 于 2019-6-30 20:06 编辑
论坛匿名帐号 发表于 2019-6-30 10:29
恭喜楼主,同应届生找工,很受鼓舞!想问下你是怎么使用mode的呀?我最近也在看mode的sql tutorial,觉得拆 ...

mode sql的练习题我都做了一遍,第一次尽量别看答案自己写,真正面试时候感觉也没有遇到特别复杂的题目。我觉得mode上面的exercise反复练习几遍面试应该没有问题,sql就是一个熟能生巧的工,我从完全不会sql到能够应对面试基本就是反复练习mode上面的东西。我遇到的take home challenge都是python的建模题目,没有用到sql。
回复

使用道具 举报

我的人缘1
crystalcc 2019-6-30 14:18:36 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   100% (19)
 
 
0% (0)    👎
本帖最后由 stultus 于 2019-6-30 20:06 编辑
论坛匿名账号 发表于 2019-6-30 11:18
mode sql的练习题我都做了一遍,第一次尽量别看答案自己写,真正面试时候感觉也没有遇到特别复杂的题目。 ...

谢谢这么快回复,我会把练习题多刷刷的!我其实是想问Yammer的case部分,你也反复做了很多遍吗?感谢!
回复

使用道具 举报

我的人缘0
xiana406 2019-6-30 15:47:47 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   97% (46)
 
 
2% (1)    👎
楼主可以说下更多的复习思路吗?虽然看到了各种各样的介绍,但是还是想大概知道楼主这段时间做了什么,我准备明年找工作
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册账号

本版积分规则

提醒:发帖可以选择内容隐藏,部分板块支持匿名发帖。请认真读完以下全部说明:

■隐藏内容方法 - 不要多加空格: [hide=200]你想要隐藏的内容比如面经[/hide]
■意思是:用户积分低于200则看不到被隐藏的内容
■可以自行设置积分值,不建议太高(200以上太多人看不到),也不建议太低(那就没必要隐藏了)
■建议只隐藏关键内容,比如具体的面试题目、涉及隐私的信息,大部分内容没必要隐藏。
■微信/QQ/电子邮件等,为防止将来被骚扰甚至人肉,以论坛私信方式发给对方最安全。
■匿名发帖的板块和方法:http://www.1point3acres.com/bbs/thread-405991-1-1.html

手机版||一亩三分地

GMT+8, 2019-8-25 21:34

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表