一亩三分地

 找回密码 注册账号

扫描二维码登录本站


Salarytics=Salary Analytics
查询工资数据
系统自动计算每年收入

科技公司如何
用数据分析驱动产品开发
coupon code 250off 立减$250

深入浅出AB Test
从入门到精通
coupon code 250off 立减$250
游戏初创公司招聘工程师、UIUX Designer和游戏策划
坐标湾区
DreamCraft创始团队
招聘游戏开发工程师
把贵司信息放这里
查看: 10091|回复: 32
收起左侧

[谈专业] 猿族星球DATA岗之等级划分:DL Monkey >ML Monkey >DS Monkey >SQL Monkey

  [复制链接] |试试Instant~ |machinelearningeng, 谈专业, 求职, facebook, 工作信息
我的人缘15

分享帖子到朋友圈
Warald | 显示全部楼层 |阅读模式
本楼: 👍   92% (24)
 
 
7% (2)   👎
全局: 👍   95% (7840)
 
 
4% (338)    👎

2019(4-6月)-CS博士+3个月-1年 | 内推|BayArea MachineLearningEng全职@Facebook

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?注册账号

x
一亩三分地里有同学发帖说:
听了很多留学培训机构讲座,听上去DS很有前途。。。感觉转DS做data scientist(data scientist我默认是做机器学习,会涉及到统计知识,但是我看过一些面试题,本科期间学的统计知识基本够用。面试拉差距主要还是机器学习和算法)会比直接转CS平稳。到研究生快结束找全职前,我已经有三份美国中小公司实习经历,两份机器学习相关,其中一份是Data scientist Intern。。。简历关全跪。无心插柳投的软件开发,倒是收了很多面试,最终我个人是软件开发上岸,认识的人没有数据上岸或者机器学习上岸的。我曾经在招聘网站上搜索关键字,软件开发岗位是数据科学岗位的五倍还多。另外,数据科学家岗位学历普遍要求更高。

Data Science是个很宽泛的概念,沾边的岗位和专业都跟多,很多说法也很模糊,比如这位同学提到的 Data Science = Machine Learning,相信工业界人士不会赞成;以及学DS的、学统计、学CS的、学EE的,都有人做ML,但是大家说的可能不是一回事。
. check 1point3acres for more.
在这里,Warald做个划分,帮助大家理解:当我们说DS、说ML的时候,我们说的是什么职位?


《1》Machine Learning Engineer

公司里很多做ML的职位叫 Machine Learning Engineer,可以认为是 Software Engineer with a specialization in Machine Learning,换言之,MLE跟mobile, front end一样,可以理解为是SDE的一个track。面试当然要刷题,最对口的专业当然是CS。

就工作内容而言,只有硕士学位、工作经验也不丰富的MLE,一般做不了model和算法,大多做的是实现。很多EECS PhD,做的也不是建模,依然是ML system development。

有的公司里也有专注做ML建模的组,一般要求phd,但是这样的职位很少。



《2》Data Engineer

data engineer这个title在不同公司意义不同。

有的是SQL,论收入 SQL << Data Scientist < SDE。

有些公司里,data engineer做data pipeline/platform/infrastructure的开发,是个软件开发的工作,跟MLE、mobile、 front end一样,也可以认为是SDE的一个technical track,这种职位我们称为DI(Data Infra),其收入当然跟SDE看齐 - 所有的SDE technical tracks应该都是同一个收入标准。



《3》Data Scientist

data scientist 情况更加复杂和混乱。

DS里最高端的是职位俗称“建模”,但公司里哪有那么多模型给人建?职位太少了。所以,学统计、学data science专业的同学们,找建模的工作非常难,即使有PhD。 . check 1point3acres for more.

在很多行业、很多公司,DS其实只是 data analyst or market/business analyst,无非是给了个好听的title。工作内容SQL为主、写点简单的R或者python就算高难度技术活了。这些是DS里的低端职位。尤其是非互联网公司,基本都是此类职位。

搁在中间的DS职位,在互联网公司里俗称 analytics

在facebook, DS是二等公民,因为收入比 SDE低一级,也就是说, DS的level 5,收入参考SDE level 4。一亩三分地每日答题里有一道题目,就是针对这个情况设计的。

但在airbnb, DS跟SDE同等级同收入。

在这两家,DS做的事情其实是类似的。既然类似,为什么A家地位高?DS们可以设计metrics来衡量一个产品的impact,但是DS工作本身的impact是很难客观衡量的,所以全看公司领导们怎么看待。
. From 1point 3acres bbs
现在analytics待遇最好的地方,应该就是Airbnb了。你会看到不少人在FB工作几年去Airbnb,那怕在表面上是平级移动,比如 FB DS 5 -> Airbnb DS 5,用收入衡量,其实是 FB SDE 4 -> Airbnb sde 5,跳槽涨钱了。

去Airbnb做DS = 从各种公司去FB/Google做SDE。

无论FB还是Airbnb,都不怎么招 new grad,因为analytics最好懂有实践经验,工作内容不是 ”用某个统计方法解决某个问题“,而是诸如:

  • Facebook打算给用户的发text notification 告诉他们close friends 的Update, 如何评估这个feature 值不值得加?
  • 一亩三分地是否应该上每日答题这个feature?如何衡量其影响?


现在的data science项目课程应该没有哪家是解决以上问题的吧?然后学生们一脸懵逼,不知道怎么解决此类问题。只能去做低端的analyst,给个数据集写SQL,close ended questions更容易handle。



《4》未来的方向

Data Science:

个人感觉今后趋势是往FB靠近,往Airbnb远离。当然,这个还是要看公司、看职位,如果是一个写的了代码、做的了分析的人,其实是非常宝贵的。相信会找到适合你的职位。

. check 1point3acres for more.
ML:

最牛逼的人,会逐渐集中在Deep Learning。DL和ML是不一样的。linkedin有很多MLE,它家的MLE质量很棒,但是大部分人不做DL。做DL比较多的行业,比如无人车 – 无论无人车啥时候落地,DL总归是技术前沿。

Software Engineer 里的track:Data Infra和 Machine learning 甚至前些年Mobile,都曾经出现过短时间的人才缺口,也都迅速填上了。MLE前两年奇缺,很多人公司也提供内部training,帮助员工做ML,坑逐渐填上了。DL门槛高很多,估计填坑速度会远比ML慢。DL Engineer目前很抢手。有机会入行的同学,应该毫不犹豫跳进。


总结:

  • DL monkey 是monkey中的monkey,拥有跟多个公司配对的权利。
  • ML monkey、DI money,跟mobile monkey, front end monkey等,作为主流,身强力壮者,也有跟多个公司配对的权利。
  • Analytics monkey,R monkey,市场需求会一直在,但在猿族星球里会逐渐变成 second class monkey,憧憬着可以去圣地Airbnb。那里据说香蕉很多,鸟语花香,还跟 engineer monkey平权。
  • SQL monkey 是最不值钱的monkey – actually,猿族里很多人认为SQL非我族类,也好意思叫monkey?


作者:一只名叫Warald的老monkey~~



评分

参与人数 29大米 +38 收起 理由
2tackle + 1 很有用的信息!
Highhigh715 + 1 给你点个赞!
MichiMochi + 1 赞一个
caramelk + 1 很有用的信息!
icyjia + 2 很有用的信息!
harrywang624 + 1 赞一个
martinma + 1 赞一个
CenturyZ + 1 赞一个
tkwang0530 + 1 赞一个
andyandy666 + 3 很有用的信息!

查看全部评分


上一篇:Heaven Life VS GS Marcus
下一篇:狗家gMatch流程
我的人缘8
本楼: 👍   100% (3)
 
 
0% (0)   👎
全局: 👍   95% (7039)
 
 
4% (318)    👎
搞data 并且跟SDE同pay 的是data infra. 因为那也是infra

绝大部分公司里data eng 过不了data infra 的代码和设计面。

data infra 应该不会使劲考SQL。应该构架为主。
回复

使用道具 举报

我的人缘0
本楼: 👍   100% (20)
 
 
0% (0)   👎
全局: 👍   97% (145)
 
 
2% (3)    👎
回楼主对L家model的评论。从KDD15开始,L家的各个ML驱动的产品线都开始deploy deep+wide model。说l家不做deep learning是不正确的。. check 1point3acres for more.

第二个需要厘清的问题是,AI, ML, DL的概念范围。DL是ML的一个分支,ML是AI的一个分支。说DL和ML是不同的,就外行了。

无人驾车驱动的核心model是应用于CV的model(一般都是各种CNN),这也是最常用的deep model之一。但deep learning远远不仅仅只有这个方向而已。

NLP是L家最重要的topic,我们有大量的deep model例如sequence model(LSTM, GRU) 应用于ranking,translation,normalization, representational learning. 这些不是DL,哪些算是DL?


DL不是ML的全部,还有RL,还有Statistical learning。 DL绝对不是super hammer, 有他应用的背景和场合。加上DL本身hyper param难以训练的问题,经验非常重要,这大概是DL人才还比较稀缺的原因吧。

另外我很好奇,每个人都跑去做无人车才算是DL么?需要那么多人么?

评分

参与人数 9大米 +62 收起 理由
5668157 + 25 给你点个赞!
wxwx199301 + 1 很有用!
martinma + 1 赞一个
konglong + 1 谢谢分享!
mwang011 + 1 赞一个
danny.kuo + 1 赞一个
forrestxu + 1 赞一个
goshining + 1 赞一个
Warald + 30 很有用的信息!

查看全部评分

回复

使用道具 举报

我的人缘0
本楼: 👍   100% (18)
 
 
0% (0)   👎
全局: 👍   86% (121)
 
 
13% (19)    👎
个人觉得ds对于个人综合能力的发展还是很有用的。可能很多人complain这个track的主要原因还停留在pay相对于sde来说略低一点。但不同公司也是不一样的,不同组或许也不同。如果一个公司或org是ds driven,但留给ds创造impact的机会还是挺大的。至于w说的很多时候impact无法衡量…我觉得衡量impact也是ds挺擅长的事情。我们组动不动就broadcast我们的model save了公司xxM…我自己都觉得不好意思…

整个thread浏览下来,感觉大家或许对sql or sql monkey有点误解。写好sql并不容易…写好一个highly efficient的queries也不是简单的事情。更何况就算是建模为主的ds面试里,如果sql不行,基本上是拒。因为建模需要做feature table,而大多数时候不会有dedicated的DE帮你建table,就算有,你也不放心别人做。所以sql是基础,没有的话 肯定很难做成任何类型的ds,当然伦比重的话,sql顶多占10%(建模导向型ds)。

回到之前的话题,为何我说ds可能或许是个不错的track,至少对于一部分人来说。主要因为这个职业要求的技能多啊!拿我们组的面试来说,coding需要eng电面水平,ML要好,query要会写,communication能力要出色等等(我绝壁会fail,如果让我再走一遍面试…)。而且在实际工作的时候,在project前期需要很多communication和stakeholder management的技能,这些机会对于软性技能的锻炼真的是非常有效。project敲定下来后,又要有能写RFC把整个project给scope好,具体到每一个步骤,这里能锻炼的东西就多。等scope完,很多时候就是你一个人完成所有scope好了的步骤,包括 找feature,写逻辑做data engineering,测试不同api以及调整参数,再offline以及online test,最后还花精力写一个漂亮的ppt,还没完…还要能convince你的stakeholder去用。然后从头到尾顺利执行下来,有需要很强的leadership能力去coordinate以及处理dependency和conflicts的能力…

做个优秀的ds还是挺难的…

没做过sde的活,但至少在工作内容的多样性上来说,ds应该是胜过sde,以及大多数其他职业。






求大米……

评分

参与人数 16大米 +71 收起 理由
ZzMonsterr + 1 很有用的信息!
2tackle + 1 很有用的信息!
PPfrog + 1 给你点个赞!
无聊小浣熊 + 2 给你点个赞!
5668157 + 25 楼主手打真厉害!
SpencerSi + 1 赞一个
mchen117 + 1 赞一个
martinma + 1 赞一个
Ivanclj + 1 赞一个
jimmyYang + 1 很有用的信息!

查看全部评分

回复

使用道具 举报

我的人缘0
jliu 2019-5-22 05:03:52 | 显示全部楼层
本楼: 👍   100% (4)
 
 
0% (0)   👎
全局: 👍   95% (102)
 
 
4% (5)    👎
如果早两年看到这个就不会被坑了。当年挤破头去面DS,不去刷题,因为看到大家都说这是当前最sexy的工作。结果到头来还是做二等公民,杂活一大堆,也没有什么明确的career path.
回复

使用道具 举报

我的人缘0
biomedicineman 2019-5-23 02:41:57 | 显示全部楼层
本楼: 👍   100% (3)
 
 
0% (0)   👎
全局: 👍   74% (3128)
 
 
25% (1065)    👎
erince 发表于 2019-5-22 12:32
个人觉得ds对于个人综合能力的发展还是很有用的。可能很多人complain这个track的主要原因还停留在pay相对于 ...

虽然的确SQL monkey是最被人看不起的,
但我很赞同 “写好sql并不容易。。。”

我在AT&T实习的时候,就亲眼看到组里一个白大叔,专业写SQL + database 20年,可以写非常非常复杂的SQL,就靠着这个手艺混了一辈子。。。
回复

使用道具 举报

我的人缘0
enpc 2019-7-10 04:14:21 | 显示全部楼层
本楼: 👍   100% (2)
 
 
0% (0)   👎
全局: 👍   100% (21)
 
 
0% (0)    👎
其实并不喜欢这样的鄙视链,每个职位的作用不同,要求的skillset不同,没有必要这个瞧不起那个的。
回复

使用道具 举报

我的人缘0
Dulala 2019-7-7 03:49:00 | 显示全部楼层
本楼: 👍   100% (1)
 
 
0% (0)   👎
全局: 👍   92% (138)
 
 
8% (12)    👎
感谢W大分享。
作为一个搞预测模型的monkey,自己在项目中也会用到ML和DL的一些基本,但是仅仅是使用,调参,并且没有通过大量的阅读论文来提升自己这方面的能力,所以还是一直在二等monkey的路上。
之前有听K姐的DS career 的讲座,里面有提到DS的两个path,一个就是以report 为output,另外一个是以产品为output。虽然还在analytics专业就读中,在学校的项目已经写了很多data driven report。但是个人的兴趣还是会偏用building product 一些,所以喽,可能会在毕业之后继续读一个part time cs master,慢慢往building something努力。

评分

参与人数 1大米 +1 收起 理由
2tackle + 1 加油加油

查看全部评分

回复

使用道具 举报

我的人缘0
本楼: 👍   0% (0)
 
 
100% (1)   👎
全局: 👍   93% (31)
 
 
6% (2)    👎
顶站长!

很形象!

有启发!
回复

使用道具 举报

我的人缘0
AmyWei 2019-5-21 05:32:46 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   100% (5)
 
 
0% (0)    👎
默默同情 SQL monkey~
回复

使用道具 举报

我的人缘0
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   96% (24)
 
 
4% (1)    👎
感谢楼主分享 非常有用 想请问楼主 在马上要读analytics相关的master的情况下 应该如何定位和学习呢 应该侧重于sql, algorithms 还是ml/dl 同时frontend还应该继续精进吗(我本科和master都跟software无关) full stack只是因为兴趣学习 我的ultimate goal就是找到工作

补充内容 (2019-5-21 08:10):
应该走软件开发的道路还是跟着grad school 走data science
回复

使用道具 举报

我的人缘0
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   100% (20)
 
 
0% (0)    👎
顶站长,不知道Google的ds,engineer算是哪一类呢?介于2,3之间还是属于特别的一类?
回复

使用道具 举报

我的人缘0
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   93% (104)
 
 
6% (7)    👎
哈哈 不知道苦逼的etl pipeline monkey属于哪一个,感觉被渐渐淘汰了,然后现在的de也在慢慢的sql化
回复

使用道具 举报

我的人缘0
hrcn1128 2019-5-21 15:15:41 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   100% (1)
 
 
0% (0)    👎
DA monkey呢
回复

使用道具 举报

我的人缘0
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   96% (176)
 
 
3% (7)    👎
半个sas monkey
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册账号

本版积分规则

隐私提醒:
■为防止被骚扰甚至人肉,不要公开留微信等联系方式,请以论坛私信方式发送。
■特定版块可以超级匿名:https://pay.1point3acres.com/tools/thread
■其他版块匿名方法:http://www.1point3acres.com/bbs/thread-405991-1-1.html

手机版||一亩三分地

GMT+8, 2019-12-8 20:29

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表