一亩三分地

 找回密码 注册账号

扫描二维码登录本站

BBS
Offer多多
Salarytics
交友
Learn
Who's Hiring?
Visa Tracker
疫情动态
指尖新闻
Instant
客户端
微信公众号
扫码关注公众号
留学申请公众号
扫码关注留学申请公众号
Youtube频道
留学博客
关于我们
查看: 10011|回复: 60
收起左侧

(商科转data)Entry level DS/DA 求职总结 (最终offer ds)【求大米!】

    [复制链接] |只看干货 |数据科学
我的人缘0

升级   80%


分享帖子到朋友圈
yy2799 | 显示全部楼层 |阅读模式
本楼: 👍   100% (20)
 
 
0% (0)   👎
全局: 👍   100% (100)
 
 
0% (0)    👎

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?注册账号

x
本帖最后由 大队管理员 于 2020-5-1 15:26 编辑

这是我19年9月写的总结,为求大米,发到地里来~~

背景: 陆本商科专业,美硕工科,19年毕业。几段quant实习。19年2月决定转数据科学,DA/BA/DS/DE同时申请。


时间线: 从7/25开始投简历,8/7第一个面试,至9/13,共近30个面试,2个offer。
        
        第一周:投了一个周末简历,只有一个面试,觉得简历问题很大,找学长学姐改简历,整周都在改简历
        第二周:疯狂海投,陆续收到一些OA和introductory call。
        第三周:保持每天海投,每天一个面试。
        第四周:停止海投,保持内推,保持每天1-3个面试的强度,陆续完成2个终面。
        第五周:每天一个面试,收到第一个offer,收到flag面试并面挂,完成第3个终面。
        第六周:完成最后几个一面,继续面flag并面挂,完成第4个终面,拿到第二个offer,接offer,而后收到第5个终面。
        
        之前的几个月:刷了点题,写了些稚嫩的projects,整理了一下github,约了几轮coffee chat,改了几轮简历。


关于简历:
        / 找业界的人改,尤其是target position/company的人改简历有很大的帮助。
        / 对da,ds的requirement要有很清晰的认识。
        / 通过面试,不断改进自己的简历

刚开始简历上列了一堆deep learning projects,觉得hr会自动认为你都会搭model了,处理数据肯定不在话下。但实际da以及大部分偏analytics 的ds岗对深度学习需求都不大,hr更想从简历里看到data manipulation/etl/ab-testing/statistical learning的经验。ds和da也有区别,ds岗感兴趣ab-testing和machine learning,da岗对这些几乎无要求,希望看到的是data visualization/reporting/sql, sql , 以及sql。

当然有相当一部分岗位明确需要deep learning经验,大部分集中在NLP, computer vision领域(目前还没遇到reinforcement learning以及GAN的岗位,可能是我太渣自动忽略了)。我当时的简历就属于高不成低不就,达不到可以面deep learning的水平,但经历又集中在deep learning方面。在ds学长建议下,大刀阔斧删了很多项目。

简历空了怎么办?
        / 自己做项目。

当时感觉业界对spark的需求很高,于是去学spark,学kafka,期间又点了几个non-sql database的技术点,refresh了一下AWS ec2/s3/dynamodb,刷了几个个人项目,把其中最满意的放在了简历上。后来证明, 的确有很多de岗位需要spark、hadoop经验,但极少会考到spark的具体问题。做个人项目主要用处在于扩充项目经历、学习新的技能点、扩充简历technical skill section的内容,更重要的是给hr一种你在持续学习,对技术有好奇心的观点,这个其实和你在工作中具体做了什么项目一样重要。

        / 空了就空了。
空一点更好。我删了两段实习经历,大大减轻了准备简历面的压力。更简洁精炼的简历提高可读性,反而更容易让hr想看到的关键词凸显出来。


关于海投:

不同公司applicant系统不一样,我对自己海投的速度基本要求5分钟内填不完的就弃填。不写cover letter,这个不一定对,career center一般都建议大家能加cover letter就加,我的观点是海投量大是关键,dream company的话应该找内推。
除了第一天投简历投最近一周的,之后每天都投最近24小时po出来的,且每天都保证一定的投递量。


关于refer:

Flag 社招一定要refer。反正refer也不一定有面试,面试也会面挂(校招还是可以通过投简历最后拿到intern或者fulltime offer的)。


关于面试:

/sql

好好刷sql。sql 我刷了两遍mode,三遍leetcode。sql是所有ds/da岗必考项目。口述题比如描述四种join的区别,code题比如second highest salary,datetime manipulation, window function等都是常考题。sql应该是da/ba岗位面试最重要的部分,百分之一百会遇到join的花式考法,一定要对几种join的logic了然于心。

/python

ds/da岗可能会考,问答题集中在几种数据结构的区别,code题一般写关于array/string非常简单的algorithm,有可能会考pandas(dataframe)的操作。

/算法

我没有大量刷leetcode,主要是精力+基础不足。但ds大概率是会考algo,de一定会考algo。不会algo以及分析复杂度会错失很多机会。比如有两个我非常感兴趣的de岗,就因为hold不住算法面就cancel了。拿offer的那个ds岗考了algo,但因为简单,做出来就让我过了。
. From 1point 3acres bbs
/machine learning

只有ds岗要求ml。问法一般两种。
一种直接考题目,intro to stat learning那本书可以cover全部考题,比如讨论一下bias & variance,boosting和bagging的区别,unbalanced dataset下如何select model(confusion matrix相关的各个rate),解释一下auc/roc,几种validation的方法,linear regression的assumption等等。我没有被考过但朋友有被考过比如smo,ridge regression 最优参数推导,数据复制一倍对R2和p-value的影响等等。依然是ISLR和ESL(撑死加个cs229)可以轻松cover。
另一种问法是问怎么用ml解决一个问题,比如问简历上的一段ml经历,你是怎么做的,怎么处理数据缺失,怎么处理unbalanced,怎么manipulate大型数据集,怎么调参,为什么选这个模型不是那个模型,如何解释模型给nontechnical的人,如何说服nontechnical的人采取data-driven approach等等。

没有被考过deep learning,但因为简历上有reinforcement learning的经验,偶尔被不懂但感兴趣的面试官问过“什么是rl”的问题。

/statistics

问过normal distribution相关的各种概念/intuition/绘图,考过(conditional)expectation的计算,考过贝叶斯,感觉都是intro to probability (以前的教科书)可以cover的内容。

/ behavior
太杂了。问的最多的就是how did you (innovative/independent/...) solve a (challenging/difficult/...) (technical/business) problem in work (or conflict with (manager/coworker))。
ba岗或者consulting firm的所有岗位会对communication/client facing的经验感兴趣。

可以参照STAR的原则来写sample。有时候讲半天对方不一定理解你的situation,但只要落脚点在浅显易懂的result上,对方大概也能接受。

/ business question

在ds/da/ba的面试中都被考过一些business analytics的问题,比如如何判断某个xx是否popular,做xxx的分析会对xx公司的什么决策产生什么影响等等scenario/hypothesis下的分析。
我真的不懂,全靠编。买了cracking the pm interview,但木有时间看。


/ 其他hr问题

我所有面试hr必问“你在哪个城市?”“为啥想relocate?”
relocation for family/fiancé/boyfriend 是最好的理由(且是真的)。尤其是我上一段经历只有半年,美国人特别能理解family reason造成的离职。

相反我有一个终面,面一家不在Seattle area的公司,我说漏嘴说我男朋友在Seattle,hm立刻警觉了起来,反复问我异地不会有影响吗?你是不是最终还是要回Seattle?

总结做的不好的地方:
/ 算法题刷太少。
如果有比较solid的算法基础,应该能很自信的打开一整片data engineer的森林。之前的经历和tech skill其实和de很吻合,但不刷题让我错过了至少两个de岗,一个quant developer岗,一个quant strat岗继续面下去的可能。当然时间精力是有限的,focus在最擅长的地方也很重要。侥幸苟住了一个ds岗,以后想蒙混过关不大可能,过一段时间应该会系统刷一下leetcode easy/medium。

/ 安排面试时间不太合理。
onsite没有安排时间集中面。大公司没有提前refer和申请导致求职后期才开始面flag。
不过合理安排面试时间难度好高,不是我等半路出家的弱渣考虑的了的,先拿offer再说,能不能compete只能听天由命。
游客,本帖隐藏的内容需要积分高于 50 才可浏览,您当前积分为 0。
查看如何攒积分 Click here for more info.

评分

参与人数 69大米 +154 收起 理由
lyq123 + 2 给你点个赞!
bluecloudszy + 2 很有用的信息!
DL + 3 给你点个赞!
baddestsharon + 2 很有用的信息!
datapath2020 + 1 给你点个赞!
michaelmiaomiao + 1 给你点个赞!
alice.hq + 1 特别棒的分享!
mutd + 1 谢谢分享!
zycalice + 1 赞一个
crystalcc + 2 很有用的信息!

查看全部评分


上一篇:学金融工程的毕业以后去写JAVA,OPT和H1B给批吗?
下一篇:学ML的模型的时候怎么判断自己学会了这个模型呢?

本帖被以下淘专辑推荐:

我的人缘0

升级   80%

 楼主| yy2799 2020-5-1 08:42:32 | 显示全部楼层
本楼: 👍   100% (8)
 
 
0% (0)   👎
全局: 👍   100% (100)
 
 
0% (0)    👎
virginia825 发表于 2020-5-1 08:01-baidu 1point3acres
关于怎么找proj做这块楼主可以再详细分享一下吗?是指把学校课内的proj自己扩展继续做吗?

比如学校做过一个deep learning的model。之后就可以在同样的use case下,完善整个ETL,接上model,或者多implement几个model做些comparison,再做个visualization最好是web-based的, deploy到云上,refactor code,让它能出去见人,好好写github readme,有兴趣再写篇medium博客(我为了求职自己建了个博客
回复

使用道具 举报

我的人缘0

升级   80%

 楼主| yy2799 2020-5-2 06:34:22 | 显示全部楼层
本楼: 👍   100% (3)
 
 
0% (0)   👎
全局: 👍   100% (100)
 
 
0% (0)    👎
swimmingele 发表于 2020-5-2 05:41
谢谢分享,想问下楼主是19年年底毕业的吗?
我们项目是12月份毕业,身边的师兄师姐大多是同年9月份以后才 ...

肯定是越早越好。不管投递的timing怎么样,这个过程开始的越早越能积累更多的面试经验和发现自己的不足
回复

使用道具 举报

我的人缘0

升级   80%

 楼主| yy2799 2020-5-1 02:09:18 | 显示全部楼层
本楼: 👍   100% (3)
 
 
0% (0)   👎
全局: 👍   100% (100)
 
 
0% (0)    👎
julian1008 发表于 2020-5-1 01:59
感谢lz分项~ 想问问lz提到的通过做新项目提高熟练度 是在哪里做新项目呢?kaggle吗~?还是有其他好的平台或 ...

我觉得很多人都在做的就不要去做。kaggle首先战线太长,如果不能拿很好的名次我觉得没有太大意义。我一般是在以前学校的project,medium,github找灵感,然后自己设计end-to-end data solutions, 自己做ml system design。
回复

使用道具 举报

我的人缘0

升级   14.5%

本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   100% (3)
 
 
0% (0)    👎
感谢楼主分享 醍醐灌顶
回复

使用道具 举报

我的人缘0

升级   6.9%

HHHHarold 2020-5-1 01:49:07 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   99% (439)
 
 
0% (2)    👎
谢谢楼主分享,请问可以推荐一下spark和Hadoop相关的项目或课程么
回复

使用道具 举报

我的人缘0

升级   0%

julian1008 2020-5-1 01:59:22 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   0% (0)
 
 
0% (0)    👎
感谢lz分项~ 想问问lz提到的通过做新项目提高熟练度 是在哪里做新项目呢?kaggle吗~?还是有其他好的平台或者online course推荐呢 谢谢~
回复

使用道具 举报

我的人缘0

升级   80%

 楼主| yy2799 2020-5-1 02:11:43 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   100% (100)
 
 
0% (0)    👎
HHHHarold 发表于 2020-5-1 01:49
谢谢楼主分享,请问可以推荐一下spark和Hadoop相关的项目或课程么

我上过yandex在coursera上关于hadoop的系列课程,还有udemy一门讲pyspark的。具体忘记了名字了。前者讲理论,后者很practical

评分

参与人数 2大米 +4 收起 理由
still602 + 1 赞一个
HHHHarold + 3 给你点个赞!

查看全部评分

回复

使用道具 举报

我的人缘0

升级   78.5%

本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   100% (41)
 
 
0% (0)    👎
关于怎么找proj做这块楼主可以再详细分享一下吗?是指把学校课内的proj自己扩展继续做吗?
回复

使用道具 举报

我的人缘0

升级   46.71%

Xnnnnn23 2020-5-1 08:38:02 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   100% (10)
 
 
0% (0)    👎
请问可以加楼主微信问一下简历修改方面的事情嘛~
回复

使用道具 举报

我的人缘0

升级   80%

 楼主| yy2799 2020-5-1 08:49:44 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   100% (100)
 
 
0% (0)    👎
Xnnnnn23 发表于 2020-5-1 08:38
请问可以加楼主微信问一下简历修改方面的事情嘛~
. check 1point3acres for more.
sorry啊,wx就不留了。有什么具体问题直接在评论问吧,也可以有peer review,毕竟我说的只是我的经验。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册账号

本版积分规则

隐私提醒:
■拉群请前往同学同事飞友|拉群结伴版块,其他版块拉群,帖子会被自动删除
■论坛不能删帖,为防止被骚扰甚至人肉,不要公开留微信等联系方式,请以论坛私信方式发送。
■特定版块可以超级匿名:https://pay.1point3acres.com/tools/thread
■其他版块匿名方法:http://www.1point3acres.com/bbs/thread-405991-1-1.html

手机版|||一亩三分地

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

Some icons made by Freepik from flaticon.com

快速回复 返回顶部 返回列表