楼主: 匿名
跳转到指定楼层
上一主题 下一主题
收起左侧

DS面试心得总结

 
🔗
novavistamn 2019-7-21 08:20:28 | 只看该作者
全局:
本帖最后由 novavistamn 于 2019-7-21 08:25 编辑
铅笔 发表于 2019-7-21 07:11
你说的有严重的逻辑错误。你说的是你面试他人的经历,不是其他公司的面试官来面试人的经历。我参加了十 ...

看了你的回复,你应该不怎么懂机器学习,也没正式开始工作吧?掉包,调参,data imputation算是机器学习里最基本的操作了,好像驾驶员必须要知道怎么打方向盘踩油门一样。至于word2vec, LDA,也是业界常用的文字挖掘技巧,地里搜一搜,就有大把相关面经,怎么会是刁难面试人呢?-baidu 1point3acres
lz找到了好工作,当然值得祝贺。但是文字实在让人觉得machine learning仿佛是一件门槛很低的工作。一个完全没有经验的人,只要花一两个月,看几本入门教材,几篇博客,就能横扫各大公司ds面试。This is strongly biased。当然主要原因是因为现在data science title泛滥,做deep learning research的和写sql query的都可以叫这个职称。我也是出于经验,give my 2 cents。
回复

使用道具 举报

🔗
finding_alpha 2019-7-21 10:00:59 | 只看该作者
全局:
同是物理phd, 给题主点个赞,谢谢分享!
回复

使用道具 举报

🔗
铅笔 2019-7-21 10:43:48 | 只看该作者
全局:
novavistamn 发表于 2019-7-21 08:20
看了你的回复,你应该不怎么懂机器学习,也没正式开始工作吧?掉包,调参,data imputation算是机器学习 ...

我过了好几轮机器学习的面试,现在还在一起写机器学习的paper。我懂不懂机器学习真的不是你说了算的。我在这里不用英文,不代表我不懂英文。你的逻辑完全不通。如果按照你这个逻辑推理,这个帖子里没有直接提到微积分和牛顿力学,大概楼主“应该不怎么懂微积分,也没正式开始做物理博士论文吧?”。
. check 1point3acres for more.
我反复和你说,要抱着学习的心态读他人的帖子。如果你看不到任何值得学习的东西,还要写一些莫名其妙的东西来抬杠要求对方炫耀"hard skills",认为找到工作靠的是"soft skills", 那是你的问题。我经历了十几次各大公司的面试,感觉读下来还是学到很多。你提到imputation, 我现在问你如何用Gibbs sampling给time series的数据做imputation,你能写吗?. 1point 3acres

你的评论极不礼貌,不再回复了。
回复

使用道具 举报

🔗
adorming 2019-7-21 11:19:20 | 只看该作者
全局:
多谢楼主的信息!
回复

使用道具 举报

🔗
novavistamn 2019-7-21 11:37:19 | 只看该作者
全局:
本帖最后由 novavistamn 于 2019-7-21 11:41 编辑
铅笔 发表于 2019-7-21 10:43
我过了好几轮机器学习的面试,现在还在一起写机器学习的paper。我懂不懂机器学习真的不是你说了算的。我 ...

等你工作一段时间再看吧。进工业界之后不懂MCMC, gibbs sampling不是问题,但是不知道怎么提取特征、调包,imputation、发现data leakage就是大问题了。
回复

使用道具 举报

🔗
dw357 2019-7-21 13:23:55 | 只看该作者
全局:
novavistamn 发表于 2019-7-21 08:20
看了你的回复,你应该不怎么懂机器学习,也没正式开始工作吧?掉包,调参,data imputation算是机器学习 ...

啊.. 我没有要贬低data scientist职位的意思,让你这么觉得真是十分抱歉!无论什么职业,能找到自己想要的工作肯定是要付出很多努力的,我并没有对这个职业嗤之以鼻的意思,也不是想要表达我很厉害随便看看书就能面到工作。大概是我的文字表达不准确,让大家有这种错觉,真是不好意思!写这篇文章的初衷完全是因为自己在找工作的时候觉得很没有信心,但是最终还是很幸运的找到了工作,想给大家打打气,也分享一下我对找ds工作肤浅的理解和可能有能帮助到大家的地方。

DS这个title确实像你说的一样,有从偏analytics到偏ML research的一个很宽的spectrum。我最开始投简历的时候并不了解其中的区别,也是一边面试一边学习慢慢了解总结出来的。我面的公司文章最前面有列出来,其中脸书是比较偏analytics的,狗家是比较偏stats的,波士顿家具公司/网路安全公司/黑车/Insight是比较偏ML的。可能我面试的比较少,我面的公司中,考ML知识的时候确实没有问到具体需要掉包的details,我猜可能是因为这是比较好pick up的东西。相对问的比较多的都是具体对概念的理解,有些问的比较深入。唯一用到掉包的技能是做大作业的时候,这个我确实也有去学习,读了sklearn的documentation,确实比较肤浅,也没有涉及deep learning的部分。我觉得公司在面试的时候并不需要面试者十项全能,不会的东西可以大方的说不会,会的东西要掌握的透彻彻底。从公司的角度来说,如果一个面试者能把自己会的部分掌握的很通透,那不会的东西应该也能很快学会,这就够了。

对于ISLR,我觉得这本书在我面的这些公司里还算是够用的,部分原因是因为我没有面任何ML research的职位,都是比较applied的position。我在准备ML部分的过程中,有反复读过ISLR好几遍,每次都有不同的新的体会。我学习新知识确实比较慢,有时候要反复多读很多次才会明白,这个每个人的学习方式肯定都不一样,怎样对自己有效就怎样来。虽然我准备了两个多月,我确实是有全心全意认认真真付出了很多时间在上面。读ISLR的时候,遇到我没有完全理解的部分,或者心中有的疑惑和延伸的问题,也会去google查更多的资料,可能会对thorough understanding有帮助。hmm如果觉得两个月不够准备,那就准备三个月四个月?这个每个人想要学习的重点都不太一样,花的时间肯定也不同,我没有说一定要准备两个月的意思呀。. 1point 3acres

背景方面,我确实没有什么统计的基础,对于这个thread里面大家提到的很多统计概念我都没听过。如果硬要说的话,我本科有double数学专业,了解一些很基础的本科生stats知识,可能复习起来的时候会觉得比较comfortable。sql这之前我也的确没有接触过,不过感觉sql还是比较intuitive的,没有特别复杂的逻辑,是比较容易上手的。python我在research的时候有用过一些,局限于一些简单的data manipulation/plotting。我面过的公司里几乎没有遇到过考algo和data structure的,有一家公司考了我white board一道sorting的变形题,我很诚实地说我没有学过这个,但是我有个大概的idea可以怎么做,虽然我觉得不是最efficient的。面试官说没关系,你写写看,不需要efficient。后来我写了一个brute force answer,最后也有拿到offer。我们之后聊天的时候她说,其实只是想看看我有多comfortable handling python, 以及在不会的情况下怎么能写出一个还算合理的答案。大多数的ds确实不需要deployment level coding,所以不需要考lc等级的data structure questions也make sense。之前的文章里我也有提到过,我觉得很多时候面试官考我们的问题也只是想知道我们的知识boundary在哪里,并不是一定要把所有的问题都回答出来。

对于你之前说的domain knowledge,虽然我没有经验,但这并不是说我没有花时间去了解。比如我知道我要去面试一家网络安全公司的时候,面试之前我是有去网上读文章了解这个领域,肯定是有去做相关的准备呀。而且这家公司面试有很多轮,第一轮聊过一次之后大概就知道公司的业务侧重,准备下一轮面试的时候肯定也会事先多去网上读一些相关的资料,自己在家想想都有什么可以顾虑的方面,这些一般面试之前的准备工作我都有好好认真去做。我感觉那些面试中需要domain knowledge的公司,公司不会因为你不懂这个domain就penalize你,他们会当场告诉你一些需要知道的知识,看看你怎么思考和面对这样的问题,如何approach没有遇到过的问题和挑战,应该也是面试考察的一部分。. Χ

对于简历关,我当然也有被拒绝!我的自我感觉是大公司比较容易过简历关,因为opening多,小公司相对难一些。我也投过几家我觉得很不错的start ups,比如impossible foods,brex之类的,都是直接被简历拒,twitter我也是直接被简历拒了,并不是所有的都有拿到面试。. 1point 3 acres
. Waral dи,
我觉得复习准备的过程每个人都不一样,时间长短肯定也不同。提到我准备了两个多月只是客观陈述事实,不是重点,也真的完全没有一点点要炫耀的意思(再次十分抱歉!)我只是想给大家加油打气,特别是和我一样第一次找工作的人。我在面试的过程中慢慢了解到了analytics和ML modeling ds的区别,所以在一边面试一边复习的过程中,也有慢慢侧重准备自己喜欢以及需要补充知识点的部分。我觉得面试准备的过程中,最能提高efficiency的办法是要经常总结自己的弱点和knowledge gap在哪里,以及自己短时间内的learning goals到底是什么,这样才能在复习的过程中知道应该往哪个方向努力,在哪些area上多花时间。其实在面试的过程中也会慢慢对自己多了解一些,随而不断地调节复习的节奏和侧重点。我因为觉得自己过去十年都是在一个很narrow的领域里研究东西,眼光有些局限,想要在未来的五年里学习一下更board picture的事情,所以最后选择了偏向analytics的职位。我不觉得analytics或者ML相比较哪个就更厉害,soft skills和hard skills哪一个就更难develop一点,选择什么侧重的职业完全是因自己的喜好而决定就好,不要太在意别人的眼光啦!

评分

参与人数 6大米 +8 收起 理由
BarryYun + 1 赞一个
光影流转 + 1 给你点个赞!
alineyuyang + 1 赞一个
humyhumy + 1 给你点个赞!
joycevernon + 3 说的太好了

查看全部评分

回复

使用道具 举报

🔗
lanzizuan 2019-8-22 05:26:47 | 只看该作者
全局:
感谢楼主分享~
回复

使用道具 举报

🔗
justvic 2019-10-24 07:47:17 | 只看该作者
本楼:
全局:
谢谢分享
回复

使用道具 举报

全局:
谢谢楼主分享
回复

使用道具 举报

🔗
chanel66 2020-3-4 11:49:04 | 只看该作者
全局:
楼主 你没用python做任何 data challenge?
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册账号
隐私提醒:
  • ☑ 禁止发布广告,拉群,贴个人联系方式:找人请去🔗同学同事飞友,拉群请去🔗拉群结伴,广告请去🔗跳蚤市场,和 🔗租房广告|找室友
  • ☑ 论坛内容在发帖 30 分钟内可以编辑,过后则不能删帖。为防止被骚扰甚至人肉,不要公开留微信等联系方式,如有需求请以论坛私信方式发送。
  • ☑ 干货版块可免费使用 🔗超级匿名:面经(美国面经、中国面经、数科面经、PM面经),抖包袱(美国、中国)和录取汇报、定位选校版
  • ☑ 查阅全站 🔗各种匿名方法

本版积分规则

>
快速回复 返回顶部 返回列表