一亩三分地

 找回密码 注册账号

扫描二维码登录本站

BBS
Offer多多
Salarytics
交友
Learn
Who's Hiring?
疫情动态
指尖新闻
Instant
客户端
微信公众号
扫码关注公众号
留学申请公众号
扫码关注留学申请公众号
Youtube频道
留学博客
关于我们
查看: 14018|回复: 33
收起左侧

[谈专业] 猿族星球DATA岗之等级划分:DL Monkey >ML Monkey >DS Monkey >SQL Monkey

  [复制链接] |只看干货 |machinelearningeng, 谈专业, 求职, facebook, 工作信息
我的人缘15

分享帖子到朋友圈
Warald | 显示全部楼层 |阅读模式
本楼: 👍   92% (24)
 
 
7% (2)   👎
全局: 👍   95% (12022)
 
 
4% (619)    👎

2019(4-6月)-CS博士+3个月-1年 | 内推|BayArea MachineLearningEng全职@Facebook

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?注册账号

x
一亩三分地里有同学发帖说:
听了很多留学培训机构讲座,听上去DS很有前途。。。感觉转DS做data scientist(data scientist我默认是做机器学习,会涉及到统计知识,但是我看过一些面试题,本科期间学的统计知识基本够用。面试拉差距主要还是机器学习和算法)会比直接转CS平稳。到研究生快结束找全职前,我已经有三份美国中小公司实习经历,两份机器学习相关,其中一份是Data scientist Intern。。。简历关全跪。无心插柳投的软件开发,倒是收了很多面试,最终我个人是软件开发上岸,认识的人没有数据上岸或者机器学习上岸的。我曾经在招聘网站上搜索关键字,软件开发岗位是数据科学岗位的五倍还多。另外,数据科学家岗位学历普遍要求更高。

Data Science是个很宽泛的概念,沾边的岗位和专业都跟多,很多说法也很模糊,比如这位同学提到的 Data Science = machine Learning,相信工业界人士不会赞成;以及学DS的、学统计、学CS的、学EE的,都有人做ML,但是大家说的可能不是一回事。

在这里,Warald做个划分,帮助大家理解:当我们说DS、说ML的时候,我们说的是什么职位?


《1》Machine Learning Engineer

公司里很多做ML的职位叫 Machine Learning Engineer,可以认为是 Software Engineer with a specialization in Machine Learning,换言之,MLE跟mobile, front end一样,可以理解为是SDE的一个track。面试当然要刷题,最对口的专业当然是CS。

就工作内容而言,只有硕士学位、工作经验也不丰富的MLE,一般做不了model和算法,大多做的是实现。很多EECS PhD,做的也不是建模,依然是ML system development。

有的公司里也有专注做ML建模的组,一般要求phd,但是这样的职位很少。



《2》Data Engineer

data engineer这个title在不同公司意义不同。

有的是SQL,论收入 SQL << Data Scientist < SDE。

有些公司里,data engineer做data pipeline/platform/infrastructure的开发,是个软件开发的工作,跟MLE、mobile、 front end一样,也可以认为是SDE的一个technical track,这种职位我们称为DI(Data Infra),其收入当然跟SDE看齐 - 所有的SDE technical tracks应该都是同一个收入标准。



《3》Data Scientist

data scientist 情况更加复杂和混乱。

DS里最高端的是职位俗称“建模”,但公司里哪有那么多模型给人建?职位太少了。所以,学统计、学data science专业的同学们,找建模的工作非常难,即使有PhD。

在很多行业、很多公司,DS其实只是 data analyst or market/business analyst,无非是给了个好听的title。工作内容SQL为主、写点简单的R或者python就算高难度技术活了。这些是DS里的低端职位。尤其是非互联网公司,基本都是此类职位。

搁在中间的DS职位,在互联网公司里俗称 analytics

在facebook, DS是二等公民,因为收入比 SDE低一级,也就是说, DS的level 5,收入参考SDE level 4。一亩三分地每日答题里有一道题目,就是针对这个情况设计的。

但在airbnb, DS跟SDE同等级同收入。

在这两家,DS做的事情其实是类似的。既然类似,为什么A家地位高?DS们可以设计metrics来衡量一个产品的impact,但是DS工作本身的impact是很难客观衡量的,所以全看公司领导们怎么看待。

现在analytics待遇最好的地方,应该就是Airbnb了。你会看到不少人在FB工作几年去Airbnb,那怕在表面上是平级移动,比如 FB DS 5 -> Airbnb DS 5,用收入衡量,其实是 FB SDE 4 -> Airbnb sde 5,跳槽涨钱了。
. check 1point3acres for more.
去Airbnb做DS = 从各种公司去FB/Google做SDE。

无论FB还是Airbnb,都不怎么招 new grad,因为analytics最好懂有实践经验,工作内容不是 ”用某个统计方法解决某个问题“,而是诸如:

  • Facebook打算给用户的发text notification 告诉他们close friends 的Update, 如何评估这个feature 值不值得加?
  • 一亩三分地是否应该上每日答题这个feature?如何衡量其影响?


现在的data science项目课程应该没有哪家是解决以上问题的吧?然后学生们一脸懵逼,不知道怎么解决此类问题。只能去做低端的analyst,给个数据集写SQL,close ended questions更容易handle。



《4》未来的方向

Data Science:

个人感觉今后趋势是往FB靠近,往Airbnb远离。当然,这个还是要看公司、看职位,如果是一个写的了代码、做的了分析的人,其实是非常宝贵的。相信会找到适合你的职位。


ML:

最牛逼的人,会逐渐集中在Deep Learning。DL和ML是不一样的。linkedin有很多MLE,它家的MLE质量很棒,但是大部分人不做DL。做DL比较多的行业,比如无人车 – 无论无人车啥时候落地,DL总归是技术前沿。

Software Engineer 里的track:Data Infra和 Machine learning 甚至前些年Mobile,都曾经出现过短时间的人才缺口,也都迅速填上了。MLE前两年奇缺,很多人公司也提供内部training,帮助员工做ML,坑逐渐填上了。DL门槛高很多,估计填坑速度会远比ML慢。DL Engineer目前很抢手。有机会入行的同学,应该毫不犹豫跳进。


总结:

  • DL monkey 是monkey中的monkey,拥有跟多个公司配对的权利。
  • ML monkey、DI money,跟mobile monkey, front end monkey等,作为主流,身强力壮者,也有跟多个公司配对的权利。
  • Analytics monkey,R monkey,市场需求会一直在,但在猿族星球里会逐渐变成 second class monkey,憧憬着可以去圣地Airbnb。那里据说香蕉很多,鸟语花香,还跟 engineer monkey平权。
  • SQL monkey 是最不值钱的monkey – actually,猿族里很多人认为SQL非我族类,也好意思叫monkey?


作者:一只名叫Warald的老monkey~~



评分

参与人数 29大米 +38 收起 理由
2tackle + 1 很有用的信息!
Highhigh715 + 1 给你点个赞!
MichiMochi + 1 赞一个
caramelk + 1 很有用的信息!
icyjia + 2 很有用的信息!
harrywang624 + 1 赞一个
martinma + 1 赞一个
CenturyZ + 1 赞一个
tkwang0530 + 1 赞一个
andyandy666 + 3 很有用的信息!

查看全部评分


上一篇:Heaven Life VS GS Marcus
下一篇:狗家gMatch流程
我的人缘8
本楼: 👍   100% (3)
 
 
0% (0)   👎
全局: 👍   94% (9066)
 
 
5% (480)    👎
搞data 并且跟SDE同pay 的是data infra. 因为那也是infra

绝大部分公司里data eng 过不了data infra 的代码和设计面。

data infra 应该不会使劲考SQL。应该构架为主。
回复

使用道具 举报

我的人缘0

升级   27.86%

本楼: 👍   100% (20)
 
 
0% (0)   👎
全局: 👍   98% (149)
 
 
1% (3)    👎
回楼主对L家model的评论。从KDD15开始,L家的各个ML驱动的产品线都开始deploy deep+wide model。说l家不做deep learning是不正确的。

第二个需要厘清的问题是,AI, ML, DL的概念范围。DL是ML的一个分支,ML是AI的一个分支。说DL和ML是不同的,就外行了。

无人驾车驱动的核心model是应用于CV的model(一般都是各种CNN),这也是最常用的deep model之一。但deep learning远远不仅仅只有这个方向而已。

NLP是L家最重要的topic,我们有大量的deep model例如sequence model(LSTM, GRU) 应用于ranking,translation,normalization, representational learning. 这些不是DL,哪些算是DL?


DL不是ML的全部,还有RL,还有Statistical learning。 DL绝对不是super hammer, 有他应用的背景和场合。加上DL本身hyper param难以训练的问题,经验非常重要,这大概是DL人才还比较稀缺的原因吧。

另外我很好奇,每个人都跑去做无人车才算是DL么?需要那么多人么?

评分

参与人数 9大米 +62 收起 理由
5668157 + 25 给你点个赞!
wxwx199301 + 1 很有用!
martinma + 1 赞一个
konglong + 1 谢谢分享!
mwang011 + 1 赞一个
danny.kuo + 1 赞一个
forrestxu + 1 赞一个
goshining + 1 赞一个
Warald + 30 很有用的信息!

查看全部评分

回复

使用道具 举报

我的人缘0

升级   7.5%

本楼: 👍   100% (18)
 
 
0% (0)   👎
全局: 👍   86% (130)
 
 
13% (20)    👎
个人觉得ds对于个人综合能力的发展还是很有用的。可能很多人complain这个track的主要原因还停留在pay相对于sde来说略低一点。但不同公司也是不一样的,不同组或许也不同。如果一个公司或org是ds driven,但留给ds创造impact的机会还是挺大的。至于w说的很多时候impact无法衡量…我觉得衡量impact也是ds挺擅长的事情。我们组动不动就broadcast我们的model save了公司xxM…我自己都觉得不好意思…

整个thread浏览下来,感觉大家或许对sql or sql monkey有点误解。写好sql并不容易…写好一个highly efficient的queries也不是简单的事情。更何况就算是建模为主的ds面试里,如果sql不行,基本上是拒。因为建模需要做feature table,而大多数时候不会有dedicated的DE帮你建table,就算有,你也不放心别人做。所以sql是基础,没有的话 肯定很难做成任何类型的ds,当然伦比重的话,sql顶多占10%(建模导向型ds)。

回到之前的话题,为何我说ds可能或许是个不错的track,至少对于一部分人来说。主要因为这个职业要求的技能多啊!拿我们组的面试来说,coding需要eng电面水平,ML要好,query要会写,communication能力要出色等等(我绝壁会fail,如果让我再走一遍面试…)。而且在实际工作的时候,在project前期需要很多communication和stakeholder management的技能,这些机会对于软性技能的锻炼真的是非常有效。project敲定下来后,又要有能写RFC把整个project给scope好,具体到每一个步骤,这里能锻炼的东西就多。等scope完,很多时候就是你一个人完成所有scope好了的步骤,包括 找feature,写逻辑做data engineering,测试不同api以及调整参数,再offline以及online test,最后还花精力写一个漂亮的ppt,还没完…还要能convince你的stakeholder去用。然后从头到尾顺利执行下来,有需要很强的leadership能力去coordinate以及处理dependency和conflicts的能力…

做个优秀的ds还是挺难的…

没做过sde的活,但至少在工作内容的多样性上来说,ds应该是胜过sde,以及大多数其他职业。






求大米……

评分

参与人数 16大米 +71 收起 理由
ZzMonsterr + 1 很有用的信息!
2tackle + 1 很有用的信息!
PPfrog + 1 给你点个赞!
无聊小浣熊 + 2 给你点个赞!
5668157 + 25 楼主手打真厉害!
SpencerSi + 1 赞一个
illumine + 1 赞一个
martinma + 1 赞一个
2Y2Simple + 1 赞一个
jimmyYang + 1 很有用的信息!

查看全部评分

回复

使用道具 举报

我的人缘0

升级   8.73%

jliu 2019-5-22 05:03:52 | 显示全部楼层
本楼: 👍   100% (4)
 
 
0% (0)   👎
全局: 👍   96% (127)
 
 
3% (5)    👎
如果早两年看到这个就不会被坑了。当年挤破头去面DS,不去刷题,因为看到大家都说这是当前最sexy的工作。结果到头来还是做二等公民,杂活一大堆,也没有什么明确的career path.
回复

使用道具 举报

我的人缘0

升级   0.2%

本楼: 👍   0% (0)
 
 
100% (1)   👎
全局: 👍   94% (53)
 
 
5% (3)    👎
顶站长!

很形象!

有启发!
回复

使用道具 举报

我的人缘0

升级   7.71%

AmyWei 2019-5-21 05:32:46 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   100% (7)
 
 
0% (0)    👎
默默同情 SQL monkey~
回复

使用道具 举报

我的人缘0

升级   14%

本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   96% (24)
 
 
4% (1)    👎
感谢楼主分享 非常有用 想请问楼主 在马上要读analytics相关的master的情况下 应该如何定位和学习呢 应该侧重于sql, algorithms 还是ml/dl 同时frontend还应该继续精进吗(我本科和master都跟software无关) full stack只是因为兴趣学习 我的ultimate goal就是找到工作

补充内容 (2019-5-21 08:10):
应该走软件开发的道路还是跟着grad school 走data science
回复

使用道具 举报

我的人缘0

升级   50.71%

本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   100% (23)
 
 
0% (0)    👎
顶站长,不知道Google的ds,engineer算是哪一类呢?介于2,3之间还是属于特别的一类?
回复

使用道具 举报

我的人缘0

升级   7.57%

本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   93% (106)
 
 
6% (7)    👎
哈哈 不知道苦逼的etl pipeline monkey属于哪一个,感觉被渐渐淘汰了,然后现在的de也在慢慢的sql化
回复

使用道具 举报

我的人缘0

升级   70.5%

hrcn1128 2019-5-21 15:15:41 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   100% (1)
 
 
0% (0)    👎
DA monkey呢
回复

使用道具 举报

我的人缘0

升级   2.14%

本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   96% (195)
 
 
3% (7)    👎
半个sas monkey
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册账号

本版积分规则

隐私提醒:
■为防止被骚扰甚至人肉,不要公开留微信等联系方式,请以论坛私信方式发送。
■特定版块可以超级匿名:https://pay.1point3acres.com/tools/thread
■其他版块匿名方法:http://www.1point3acres.com/bbs/thread-405991-1-1.html

手机版|||一亩三分地

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表