旅居在Texas - 关于德克萨斯的二三事

一亩三分地

 找回密码 注册账号

扫描二维码登录本站

最近看过此主题的会员


码农求职神器Triplebyte
不用海投
内推多家公司面试

Total Comp Calculator
输入offer信息
系统自动计算每年收入

科技公司如何
用数据分析驱动产品开发
coupon code 250off 立减$250

深入浅出AB Test
从入门到精通
coupon code 250off 立减$250
游戏初创公司招聘工程师、UIUX Designer和游戏策划
坐标湾区
DreamCraft创始团队
招聘游戏开发工程师
查看: 5242|回复: 25
收起左侧

[谈专业] 猿族星球DATA岗之等级划分:DL Monkey >ML Monkey >DS Monkey >SQL Monkey

  [复制链接] |试试Instant~
我的人缘15

分享帖子到朋友圈
Warald 发表于 2019-5-21 04:44:35 | 显示全部楼层 |阅读模式
本楼: 👍   95% (23)
 
 
4% (1)   👎
全局: 👍   95% (6194)
 
 
4% (290)    👎

2019(4-6月)-[[planyrvalue]]CS博士+3个月-1年 - 内推|BayArea MachineLearningEng全职@Facebook在职跳槽

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?注册账号

x
一亩三分地里有同学发帖说:
听了很多留学培训机构讲座,听上去DS很有前途。。。感觉转DS做data scientist(data scientist我默认是做机器学习,会涉及到统计知识,但是我看过一些面试题,本科期间学的统计知识基本够用。面试拉差距主要还是机器学习和算法)会比直接转CS平稳。到研究生快结束找全职前,我已经有三份美国中小公司实习经历,两份机器学习相关,其中一份是Data scientist Intern。。。简历关全跪。无心插柳投的软件开发,倒是收了很多面试,最终我个人是软件开发上岸,认识的人没有数据上岸或者机器学习上岸的。我曾经在招聘网站上搜索关键字,软件开发岗位是数据科学岗位的五倍还多。另外,数据科学家岗位学历普遍要求更高。

Data Science是个很宽泛的概念,沾边的岗位和专业都跟多,很多说法也很模糊,比如这位同学提到的 Data Science = Machine Learning,相信工业界人士不会赞成;以及学DS的、学统计、学CS的、学EE的,都有人做ML,但是大家说的可能不是一回事。

在这里,Warald做个划分,帮助大家理解:当我们说DS、说ML的时候,我们说的是什么职位?


《1》Machine Learning Engineer

公司里很多做ML的职位叫 Machine Learning Engineer,可以认为是 Software Engineer with a specialization in Machine Learning,换言之,MLE跟mobile, front end一样,可以理解为是SDE的一个track。面试当然要刷题,最对口的专业当然是CS。

就工作内容而言,只有硕士学位、工作经验也不丰富的MLE,一般做不了model和算法,大多做的是实现。很多EECS PhD,做的也不是建模,依然是ML system development。

有的公司里也有专注做ML建模的组,一般要求phd,但是这样的职位很少。



《2》Data Engineer

data engineer这个title在不同公司意义不同。

有的是SQL,论收入 SQL << Data Scientist < SDE。

有些公司里,data engineer做data pipeline/platform/infrastructure的开发,是个软件开发的工作,跟MLE、mobile、 front end一样,也可以认为是SDE的一个technical track,这种职位我们称为DI(Data Infra),其收入当然跟SDE看齐 - 所有的SDE technical tracks应该都是同一个收入标准。



《3》Data Scientist

data scientist 情况更加复杂和混乱。

DS里最高端的是职位俗称“建模”,但公司里哪有那么多模型给人建?职位太少了。所以,学统计、学data science专业的同学们,找建模的工作非常难,即使有PhD。

在很多行业、很多公司,DS其实只是 data analyst or market/business analyst,无非是给了个好听的title。工作内容SQL为主、写点简单的R或者python就算高难度技术活了。这些是DS里的低端职位。尤其是非互联网公司,基本都是此类职位。

搁在中间的DS职位,在互联网公司里俗称 analytics

在facebook, DS是二等公民,因为收入比 SDE低一级,也就是说, DS的level 5,收入参考SDE level 4。一亩三分地每日答题里有一道题目,就是针对这个情况设计的。

但在Airbnb, DS跟SDE同等级同收入。

在这两家,DS做的事情其实是类似的。既然类似,为什么A家地位高?DS们可以设计metrics来衡量一个产品的impact,但是DS工作本身的impact是很难客观衡量的,所以全看公司领导们怎么看待。

现在analytics待遇最好的地方,应该就是Airbnb了。你会看到不少人在FB工作几年去Airbnb,那怕在表面上是平级移动,比如 FB DS 5 -> Airbnb DS 5,用收入衡量,其实是 FB SDE 4 -> Airbnb sde 5,跳槽涨钱了。

去Airbnb做DS = 从各种公司去FB/Google做SDE。

无论FB还是Airbnb,都不怎么招 new grad,因为analytics最好懂有实践经验,工作内容不是 ”用某个统计方法解决某个问题“,而是诸如:

  • Facebook打算给用户的发text notification 告诉他们close friends 的Update, 如何评估这个feature 值不值得加?
  • 一亩三分地是否应该上每日答题这个feature?如何衡量其影响?
. From 1point 3acres bbs

现在的data science项目课程应该没有哪家是解决以上问题的吧?然后学生们一脸懵逼,不知道怎么解决此类问题。只能去做低端的analyst,给个数据集写SQL,close ended questions更容易handle。



《4》未来的方向

Data Science:

个人感觉今后趋势是往FB靠近,往Airbnb远离。当然,这个还是要看公司、看职位,如果是一个写的了代码、做的了分析的人,其实是非常宝贵的。相信会找到适合你的职位。


ML:

最牛逼的人,会逐渐集中在Deep Learning。DL和ML是不一样的。linkedin有很多MLE,它家的MLE质量很棒,但是大部分人不做DL。做DL比较多的行业,比如无人车 – 无论无人车啥时候落地,DL总归是技术前沿。

Software Engineer 里的track:Data Infra和 Machine learning 甚至前些年Mobile,都曾经出现过短时间的人才缺口,也都迅速填上了。MLE前两年奇缺,很多人公司也提供内部training,帮助员工做ML,坑逐渐填上了。DL门槛高很多,估计填坑速度会远比ML慢。DL Engineer目前很抢手。有机会入行的同学,应该毫不犹豫跳进。


总结:

  • DL monkey 是monkey中的monkey,拥有跟多个公司配对的权利。
  • ML monkey、DI money,跟mobile monkey, front end monkey等,作为主流,身强力壮者,也有跟多个公司配对的权利。
  • Analytics monkey,R monkey,市场需求会一直在,但在猿族星球里会逐渐变成 second class monkey,憧憬着可以去圣地Airbnb。那里据说香蕉很多,鸟语花香,还跟 engineer monkey平权。
  • SQL monkey 是最不值钱的monkey – actually,猿族里很多人认为SQL非我族类,也好意思叫monkey?
. From 1point 3acres bbs

作者:一只名叫Warald的老monkey~~



评分

参与人数 25大米 +34 收起 理由
icyjia + 2 很有用的信息!
harrywang624 + 1 赞一个
martinma + 1 赞一个
CenturyZ + 1 赞一个
tkwang0530 + 1 赞一个
andyandy666 + 3 很有用的信息!
alex_wang0513 + 2 很有用的信息!
每日一题 + 1 很有用的信息!
danny.kuo + 1 赞一个
yu170825tZ + 1 很有用的信息!

查看全部评分


上一篇:Uber ATG 电面两轮
下一篇:狗家gMatch流程
我的人缘8
K姐 发表于 2019-5-21 10:19:47 来自一亩三分地官方APP | 显示全部楼层
本楼: 👍   100% (3)
 
 
0% (0)   👎
全局: 👍   95% (6197)
 
 
4% (270)    👎
搞data 并且跟SDE同pay 的是data infra. 因为那也是infra

绝大部分公司里data eng 过不了data infra 的代码和设计面。

data infra 应该不会使劲考SQL。应该构架为主。
回复

使用道具 举报

我的人缘0
本楼: 👍   100% (17)
 
 
0% (0)   👎
全局: 👍   97% (137)
 
 
2% (3)    👎
回楼主对L家model的评论。从KDD15开始,L家的各个ML驱动的产品线都开始deploy deep+wide model。说l家不做deep learning是不正确的。

第二个需要厘清的问题是,AI, ML, DL的概念范围。DL是ML的一个分支,ML是AI的一个分支。说DL和ML是不同的,就外行了。

无人驾车驱动的核心model是应用于CV的model(一般都是各种CNN),这也是最常用的deep model之一。但deep learning远远不仅仅只有这个方向而已。

NLP是L家最重要的topic,我们有大量的deep model例如sequence model(LSTM, GRU) 应用于ranking,translation,normalization, representational learning. 这些不是DL,哪些算是DL?


DL不是ML的全部,还有RL,还有Statistical learning。 DL绝对不是super hammer, 有他应用的背景和场合。加上DL本身hyper param难以训练的问题,经验非常重要,这大概是DL人才还比较稀缺的原因吧。

另外我很好奇,每个人都跑去做无人车才算是DL么?需要那么多人么?

评分

参与人数 8大米 +37 收起 理由
wxwx199301 + 1 很有用!
martinma + 1 赞一个
konglong + 1 谢谢分享!
mwang011 + 1 赞一个
danny.kuo + 1 赞一个
forrestxu + 1 赞一个
goshining + 1 赞一个
Warald + 30 很有用的信息!

查看全部评分

回复

使用道具 举报

我的人缘0
本楼: 👍   100% (14)
 
 
0% (0)   👎
全局: 👍   84% (95)
 
 
15% (17)    👎
个人觉得ds对于个人综合能力的发展还是很有用的。可能很多人complain这个track的主要原因还停留在pay相对于sde来说略低一点。但不同公司也是不一样的,不同组或许也不同。如果一个公司或org是ds driven,但留给ds创造impact的机会还是挺大的。至于w说的很多时候impact无法衡量…我觉得衡量impact也是ds挺擅长的事情。我们组动不动就broadcast我们的model save了公司xxM…我自己都觉得不好意思…

整个thread浏览下来,感觉大家或许对sql or sql monkey有点误解。写好sql并不容易…写好一个highly efficient的queries也不是简单的事情。更何况就算是建模为主的ds面试里,如果sql不行,基本上是拒。因为建模需要做feature table,而大多数时候不会有dedicated的DE帮你建table,就算有,你也不放心别人做。所以sql是基础,没有的话 肯定很难做成任何类型的ds,当然伦比重的话,sql顶多占10%(建模导向型ds)。

回到之前的话题,为何我说ds可能或许是个不错的track,至少对于一部分人来说。主要因为这个职业要求的技能多啊!拿我们组的面试来说,coding需要eng电面水平,ML要好,query要会写,communication能力要出色等等(我绝壁会fail,如果让我再走一遍面试…)。而且在实际工作的时候,在project前期需要很多communication和stakeholder management的技能,这些机会对于软性技能的锻炼真的是非常有效。project敲定下来后,又要有能写RFC把整个project给scope好,具体到每一个步骤,这里能锻炼的东西就多。等scope完,很多时候就是你一个人完成所有scope好了的步骤,包括 找feature,写逻辑做data engineering,测试不同api以及调整参数,再offline以及online test,最后还花精力写一个漂亮的ppt,还没完…还要能convince你的stakeholder去用。然后从头到尾顺利执行下来,有需要很强的leadership能力去coordinate以及处理dependency和conflicts的能力…

做个优秀的ds还是挺难的…

没做过sde的活,但至少在工作内容的多样性上来说,ds应该是胜过sde,以及大多数其他职业。


. From 1point 3acres bbs



求大米……

评分

参与人数 11大米 +41 收起 理由
SpencerSi + 1 赞一个
mchen117 + 1 赞一个
martinma + 1 赞一个
Ivanclj + 1 赞一个
jimmyYang + 1 很有用的信息!
sunnypig0329 + 2 给你点个赞!
deardeergogo + 1 赞一个
volador + 1 给你点个赞!
danny.kuo + 1 赞一个
admin + 30 写好sql并不容易 - 有的人连SQL都写不好,.

查看全部评分

回复

使用道具 举报

我的人缘0
biomedicineman 发表于 2019-5-23 02:41:57 | 显示全部楼层
本楼: 👍   100% (2)
 
 
0% (0)   👎
全局: 👍   72% (2677)
 
 
27% (1009)    👎
erince 发表于 2019-5-22 12:32
个人觉得ds对于个人综合能力的发展还是很有用的。可能很多人complain这个track的主要原因还停留在pay相对于 ...

虽然的确SQL monkey是最被人看不起的,-baidu 1point3acres
但我很赞同 “写好sql并不容易。。。”
. check 1point3acres for more.
我在AT&T实习的时候,就亲眼看到组里一个白大叔,专业写SQL + database 20年,可以写非常非常复杂的SQL,就靠着这个手艺混了一辈子。。。
回复

使用道具 举报

我的人缘0
jliu 发表于 2019-5-22 05:03:52 | 显示全部楼层
本楼: 👍   100% (2)
 
 
0% (0)   👎
全局: 👍   95% (78)
 
 
4% (4)    👎
如果早两年看到这个就不会被坑了。当年挤破头去面DS,不去刷题,因为看到大家都说这是当前最sexy的工作。结果到头来还是做二等公民,杂活一大堆,也没有什么明确的career path.
回复

使用道具 举报

我的人缘0
本楼: 👍   0% (0)
 
 
100% (1)   👎
全局: 👍   90% (18)
 
 
10% (2)    👎
顶站长!

很形象!

有启发!
回复

使用道具 举报

我的人缘0
AmyWei 发表于 2019-5-21 05:32:46 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   100% (3)
 
 
0% (0)    👎
默默同情 SQL monkey~
回复

使用道具 举报

我的人缘0
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   96% (24)
 
 
4% (1)    👎
感谢楼主分享 非常有用 想请问楼主 在马上要读analytics相关的master的情况下 应该如何定位和学习呢 应该侧重于sql, algorithms 还是ml/dl 同时frontend还应该继续精进吗(我本科和master都跟software无关) full stack只是因为兴趣学习 我的ultimate goal就是找到工作. 1point3acres

补充内容 (2019-5-21 08:10):
应该走软件开发的道路还是跟着grad school 走data science
回复

使用道具 举报

我的人缘0
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   100% (5)
 
 
0% (0)    👎
顶站长,不知道Google的ds,engineer算是哪一类呢?介于2,3之间还是属于特别的一类?
回复

使用道具 举报

我的人缘0
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   93% (102)
 
 
6% (7)    👎
哈哈 不知道苦逼的etl pipeline monkey属于哪一个,感觉被渐渐淘汰了,然后现在的de也在慢慢的sql化
回复

使用道具 举报

我的人缘0
hrcn1128 发表于 2019-5-21 15:15:41 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   0% (0)
 
 
0% (0)    👎
DA monkey呢
回复

使用道具 举报

我的人缘0
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   96% (159)
 
 
3% (5)    👎
半个sas monkey
回复

使用道具 举报

游客
请先登录
您需要登录后才可以回帖 登录 | 注册账号

本版积分规则

提醒:发帖可以选择内容隐藏,部分板块支持匿名发帖。请认真读完以下全部说明:

■隐藏内容方法 - 不要多加空格: [hide=200]你想要隐藏的内容比如面经[/hide]
■意思是:用户积分低于200则看不到被隐藏的内容
■可以自行设置积分值,不建议太高(200以上太多人看不到),也不建议太低(那就没必要隐藏了)
■建议只隐藏关键内容,比如具体的面试题目、涉及隐私的信息,大部分内容没必要隐藏。
■微信/QQ/电子邮件等,为防止将来被骚扰甚至人肉,以论坛私信方式发给对方最安全。
■匿名发帖的板块和方法:http://www.1point3acres.com/bbs/thread-405991-1-1.html

手机版|小黑屋|一亩三分地

GMT+8, 2019-6-25 19:28

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表