一亩三分地论坛

 找回密码
 获取更多干货,去instant注册!

扫码关注一亩三分地公众号
查看: 6983|回复: 25
收起左侧

[DataScience] 数科统计类职位 - 按面试难度排序

  [复制链接] |试试Instant~ |关注本帖
小K 发表于 2014-8-29 12:59:20 | 显示全部楼层 |阅读模式

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?获取更多干货,去instant注册!

x
大体按hiring bar排序,大体叫数科的职位


1. -google 1point3acres
IT公司Data scientist 职位,大部分仍然是针对会一些统计的码农(production level code),而不是会一点编程的统计师。大部分需要的仍然是data engineer.
越是小公司越是需要编程,因为一个人需要做的事情很多,你必须有能力从头做到尾。不像大公司更有分工。
哪怕大公司也只有比较少的地方真的会找偏统计方向的人,目前看的有:G, M, Apple(不需要刷题), 其他地方貌似没有大面积见到过。L坚持需要要能编程(需要刷题水平)。F虽然不明说但是对编程要求也是比较高(略低于刷题),但是对统计和Hive的要求较高。
MSR 当然有招ML的,但是要求超高,不懂,不多说了。ATT labs, IBM labs, 这类,不太清楚如何分类,招的人数好像不太多,不同地方要求也不太一样,不懂。。
.1point3acres缃
Machine learning scientist 有时候也被认为是数科职位,其实就是有偏向性的数科,显然这个对ML的要求,远超过(我用weka做过一个classification),一般要求比较深的理解,能改进算法,至少要能prototype你改进的东西,最好能写production code. 这种职位有时候也不肯招ML PhD - 有些人虽然会做理论,但是亲自动手写实用代码的能力不够。
. visit 1point3acres.com for more.
这些职位,可以想象,hiring pool 其实不小:. more info on 1point3acres.com
Fresh PhD in CS, EE, ML, Stat/Biostat, BME,OR, IE, Math, AppliedMath, Bioinfo, or
researchers from institutes, 没有拿到 tenure的AP,  
or 已经在以上这些位置就职的人(这些公司都极其喜欢相互挖墙脚,这类墙角一般也的确命中率最高)。
They can afford to be really, really picky.
有的地方必须你每道题都答对才会要你。
这类职位会看重
编程. 1point 3acres 璁哄潧
统计
分析能力
缺一不可。. 涓浜-涓夊垎-鍦帮紝鐙鍙戝竷
会有所谓的technical interview

在这个band的好处是,这些技能彼此通用,如果在这些地方做的还可以的话,会有类似公司的HR经常的来挖你墙角。各个IT公司都在奋勇建设数科部门,L的合并数科,M新开设数科职业道路(M从前的3条是SDE, SDET, PM,不久前跟着裁员一起去掉了SDET track,新添加了Data Science track)可见数科的热点是正在到来,而不是什么”已经饱和“。

厚着脸皮引用我发在另外帖子的一段“能扒拉数据洗数据,能统计建模,机器学习,数据挖掘,能写production code,能设计数据模型,能优化数据库,懂MapReduce从应用到实现,能随手出个小网站demo/prototype新研究idea,能发paper能给讲座,能砍倒engineer能抡晕MBA,手下还能带几个小兵,估计就full stack data scientist了 :)” 这个是full stack data scientist终极要求,不是自我描述啊。。。我自己估计在这里面能做到15-20%.


赶脚在这个band希望做好,最终只怕难免还是需要有能刷题或者接近刷题水平,才吃的开。
. more info on 1point3acres.com
2.
做SQL为主的,在有些地方也被称为数科,但是更正规的还是BI analyst,这类职位对编程要求比较低,job description 经常都不提需要会Java之类的compiled language,有些虽然也提R/Matlab or py/perl但是要求其实不高。这类工作内容可能约等于从前药厂的SAS programmer,都属于要求不太高的,一般适合master level 统计数科。
. from: 1point3acres.com/bbs
3.
Walmart, target, disney, consumer products公司的analyst,经常在marketing之类部门。对统计本身要求会更低(面试官本身也许也根本就不懂多少统计),更多是靠侃。但是由于现在对数科的重视,这类职位现在pay的其实还挺不错的,对于不想一直搞技术的人来说,其实是很好的机会。

4. 其他适合统计的还有
保险
. 鐣欏鐢宠璁哄潧-涓浜╀笁鍒嗗湴银行
药厂/biotech/CROMarket research. from: 1point3acres.com/bbs
研究所之类非工业界职位,好像pay比较低,这个不太清楚了。

这些未必有technical interview,很多就是随便聊聊。

NA
花街投行 --  这个方面个人不熟悉,不多说了


===================

我自己认识的人的小样本分析,大体统计方向的找工作的时候很多人会cover以上这些行业,随便拿药厂的offer但是被IT挂的最常见。
. 1point 3acres 璁哄潧
===================

关于技术准备,其实另外帖子里面已经有了,还是自引用一下:http://www.1point3acres.com/bbs/thread-76429-1-1.html
. 鍥磋鎴戜滑@1point 3 acres
分析解决问题的能力-google 1point3acres

这到底什么意思,还有人会没有这种能力吗?为什么需要培养?
具体说,就是面对一个问题(不是你教科书里面的那种别人已经给归闹好了的习题),而是实际问题,比如常见的是(这个产品是否值得开发,面对两种产品,怎么选择去买哪个)你需要自己从里面抽象出可以用数据解决的问题来,比如:要看是否值得开发,就需要知道cost and benefit,然后cost包含什么方面,benefit包含什么方面,这两点经常包含了暴多的方面。然后你需要有什么数据来看这两方面,如何确定平衡成什么样子,这件事就是值得做的。你分析这件事用了什么假设,这些假设经得起推敲吗?有没有什么问题没有考虑到?这些假设如果调整一下,对最后结论会有影响吗?至于产品A和B哪个更好,可以有暴多个方面需要考虑,哪些会更重要?为什么?历史数据支持你的看法吗?需要什么数据去支持?你的看法做了哪些假设?这些假设经得起推敲吗?当然这些需要一定的domain knowledge,技术面试的一部分,也就是面试官给你提成这类问题,等着你去问出所需要的domain knowledge,然后根据这些提示,你进一步分析问题,直到解决为止。
. 鍥磋鎴戜滑@1point 3 acres
面试人一般会觉得,你公司做的东西我之前又不知道,你凭什么要求我提出这些思路?可是有没有思路,正是考察的方面之一。除了最初级的职位,是做出别人让你做的事情职位,很多稍微高级的职位都需要你自己去“解决问题”,而不是仅仅照别人的指示做事。这些么当然就是多思考。脑筋灵活,不要narrow focus。现实生活里面没人有空给你把问题清晰的定义好了,只让你求解。这种事情其实又不难。. 鐗涗汉浜戦泦,涓浜╀笁鍒嗗湴



评分

5

查看全部评分

本帖被以下淘专辑推荐:

joyce1322 发表于 2014-9-8 10:20:55 | 显示全部楼层
“能扒拉数据洗数据,能统计建模,机器学习,数据挖掘,能写production code,能设计数据模型,能优化数据库,懂MapReduce从应用到实现,能随手出个小网站demo/prototype新研究idea,能发paper能给讲座,能砍倒engineer能抡晕MBA,手下还能带几个小兵,估计就full stack data scientist了 :)”

这要求, 看得我泪流满面....

顺便关于解决问题的能力这一点, 个人觉得每个行业都有自己的domain knowledge, 外行的人(面试的新手)
如果完全没有相关知识储备的话, 确实很感到比较棘手. 面试官扔两个行业术语小白们就歇菜了.

hiring bar 不是很高的公司, 比如上面写到的做 marketing 的招statistician, (也是我现在的公司) 重点考察基础统计和R编程. 完全不care 你懂不懂CPG 这个行业, 也不会问你要怎么具体 define metrics, 如何 evaluate 两个new product 的potential. 老大们的意思是只要人聪明就行了, 别的可以进来慢慢training.

hiring bar 高的公司, 比如那些牛逼哄哄的大IT公司, 就会对domain knowledge 有要求. 不过好在这些公司 比如 M,G 都会发paper, google 还有blogpost 介绍自己research 方向, 各家公司的产品大家也多少也会用到或者听说过, 所以信息来源其实还是很多的.  data scientist 三个主要素质要求, statistical expertise, hacking skills, domain knowledge. 前两个需要系统专注地学习, domain knowledge 是完全可以利用零散的时间积累, 比如每天睡前看两个wikipedia 上的relative term, 地铁上看篇blog,  或者 google搜索下行业内的popular问题. .鐣欏璁哄潧-涓浜-涓夊垎鍦
回复 支持 2 反对 0

使用道具 举报

 楼主| 小K 发表于 2014-9-9 08:24:27 | 显示全部楼层
对了刚刚想到一件事. From 1point 3acres bbs

SQL 除了学习资料 另外那个帖子里面有,对付面试可以看 coding interview exposed什么的那本书相关部分

对在校生来说关键就是,别人不是来问你:请问left outer join具体语法是什么,而是问:我现在有若干数据,你给取出足够数据来回答某相关问题。
然后你需要提问:table长什么样?key?谁跟谁之间相同的那个id是什么?是否unique?
然后再写出正确的SQL表达(不同地方要求不同,有的需要你一字不错,有的大体差不多就可以了)
然后你需要自己去check边界情况,其实无非是:有重复的怎么办,有NULL的怎么办,join有对不上的怎么办
然后自己想2个例子检查可能的错误. 涓浜-涓夊垎-鍦帮紝鐙鍙戝竷
效率上,也是不同地方要求不同,我目前只知道,一般join比写subquery要快,不知道什么是recursive join,好像也不太碍事

SQL可能是技术面里面最简单的一个环节了,网上有题目可以突击,自学简单,而且也的确不涉及什么智商和情商。。。就一熟练工。假定你知道最起码的数科基础,那么从不知道什么是SQL到能通过简单的数科技术面SQL题,的确只需要1-2周时间。. 鐗涗汉浜戦泦,涓浜╀笁鍒嗗湴

. 鍥磋鎴戜滑@1point 3 acres但是。。。。我还真见过fail在这个环节的phd,挺可惜的。


回复 支持 1 反对 0

使用道具 举报

dalejace 发表于 2014-8-30 23:52:28 来自手机 | 显示全部楼层
赞一个!
回复 支持 反对

使用道具 举报

parachutemd 发表于 2014-9-2 22:58:10 | 显示全部楼层
其实SQL的能力在很多情况下都被低估了,尤其是跟bash,python,java之类的combine, automatic scripting的能力,对新手很重要
回复 支持 反对

使用道具 举报

cinkie 发表于 2014-9-4 10:58:09 | 显示全部楼层
所以说还是要读个PhD咩~~
回复 支持 反对

使用道具 举报

Blogo 发表于 2014-9-7 19:53:54 | 显示全部楼层
第一档门槛好高,感觉和后面的不是一个概念,master学位的有机会进吗?
回复 支持 反对

使用道具 举报

 楼主| 小K 发表于 2014-9-9 01:22:41 | 显示全部楼层
joyce1322 发表于 2014-9-7 18:20
“能扒拉数据洗数据,能统计建模,机器学习,数据挖掘,能写production code,能设计数据模型,能优化数据 ...

“能扒拉数据洗数据,能统计建模,机器学习,数据挖掘,能写production code,能设计数据模型,能优化数据库,懂MapReduce从应用到实现,能随手出个小网站demo/prototype新研究idea,能发paper能给讲座,能砍倒engineer能抡晕MBA,手下还能带几个小兵,估计就full stack data scientist了 :)”
这个是终极要求嘛,我这里我还没看到谁做到了。。。。最接近的人也差个2-3条。我自己还大部分都做不到 :(. 1point3acres.com/bbs

回复 支持 反对

使用道具 举报

 楼主| 小K 发表于 2014-9-9 02:38:06 | 显示全部楼层
另外是否需要一个人包揽全部,也可以讨论。. 涓浜-涓夊垎-鍦帮紝鐙鍙戝竷

个人感觉是,如果想作为数科人进startup,起队伍什么的,恐怕以上这些绝大部分都需要会.鐣欏璁哄潧-涓浜-涓夊垎鍦
最终当了老板以后哪怕不再亲手洗数据编程了,后面那些事情也是少不了,多少要做一些的,

至于想一直做tech方向的IC还是管理人的manager这个就是个人偏好。从前的确是不做管理人的人,就升不上去,现在我觉得起码在技术公司里面,这一点不是太大问题。但是传统公司,我想必须要管人才好爬上去。熟人在传统行业的,现在基本全是什么什么manager, director, sr director这样,在技术公司的,这种title就不太多见。

另外数科的三个方向也代表了不同的偏向性和skillset,全部都会,那是终极目标。但是一个人其实很可能还是有偏好的。有人更喜欢接近技术底层(不是高低的意思)的数据,比如datamodel这些,更喜欢做出一个好软件,有人则更倾向于做出更赚钱的产品,两个mindset其实不同。

. From 1point 3acres bbs只会编程的是小dev
只会统计的是其他公司的统计师
只会domain知识的可能是部门小职员(比如consumer products亲自卖东西的人,或者marketing部门的人,或者亲自做support的人)

会domain and coding的不知道,可能是dev 的头儿
会domain and stats的是analytics
会stats and coding的是大部门里面的入门数科

目前看来数科的工资已经跟码农差不多了。所以最终做什么还是看个人喜好。

personal impact:. 鐣欏鐢宠璁哄潧-涓浜╀笁鍒嗗湴
大公司的码农我不知道接触所谓domain knowledge的有多少,应该说大方向上接触的东西比较少吧(个人观察)
当然大公司的数科绝大部分做的也是小螺丝钉的事情,在接触面是否广,做的事情是否有impact上面,大科技公司的数科估计会不如小公司,或者传统公司的analytics。毕竟你一个RF能改进VIP客户的识别率的话,那收益是看得见摸得着的,轻易可以是10%。而你在大公司里面,baseline已经是一个复杂的要死的推荐算法了,你就算做了改进,可能也就是revenue增加个0.3%,click through rate 提高个0.1%什么的。当然了,能跟很聪明的人一起玩那种很高级的算法,也可能已经足够rewarding了。. 1point 3acres 璁哄潧

大池子的小鱼 vs 小池子的大鱼,也绝对是个人选择。 鏉ユ簮涓浜.涓夊垎鍦拌鍧.

愿意在工作中投入多少精力来达到什么样的水平,也是个人选择。

没有什么对错

把personal impact, 和做高级有趣的事情全部结合起来的工作,我也还在寻找中

当然,一开始可能根本不知道自己到底喜欢哪种情况,可能做什么做的成功了就会喜欢。这些就需要通过实践来探索了。

回复 支持 反对

使用道具 举报

星儿星儿 发表于 2014-9-17 03:33:30 | 显示全部楼层
本帖最后由 星儿星儿 于 2014-9-17 03:36 编辑
.鐣欏璁哄潧-涓浜-涓夊垎鍦
感谢小K,这个帖子非常实用!想请教一个关于学习和职业发展的问题:现在的工作比较清闲,如何有针对性地准备下家需要的skill set? 本人统计master,现在non-profit工作,日常做的跟统计没啥关系,也基本没做过model。半路出家转的统计,理论基础薄弱,SAS/SQL编程还不错,R会一点点(平时工作不用),Python不会。non profit过得还是很舒服的,性价比不错,但我很怕路越走越窄,遭遇funding cut和lay off就很被动。求指点,谢谢!PS:没有身份问题。
回复 支持 反对

使用道具 举报

shingtime 发表于 2014-9-18 13:48:32 | 显示全部楼层
学习了,看来想进大公司估计还得PHD
回复 支持 反对

使用道具 举报

lovehoff 发表于 2014-9-18 22:40:59 | 显示全部楼层
第一项要求很高啊,好像要全能选手啊
MS估计够呛啊,
回复 支持 反对

使用道具 举报

duanmupeiyi 发表于 2014-9-20 15:53:17 | 显示全部楼层
我是进来膜拜K姐的

IT公司也有比较传统的统计职位,面试没有编程的那种
回复 支持 反对

使用道具 举报

 楼主| 小K 发表于 2014-9-20 17:46:12 | 显示全部楼层
duanmupeiyi 发表于 2014-9-19 23:53
我是进来膜拜K姐的. 鍥磋鎴戜滑@1point 3 acres

IT公司也有比较传统的统计职位,面试没有编程的那种

求引荐~!我快累死了。。。。。
回复 支持 反对

使用道具 举报

duanmupeiyi 发表于 2014-9-21 00:57:59 | 显示全部楼层
小K 发表于 2014-9-20 01:46
求引荐~!我快累死了。。。。。

快来快来~
回复 支持 反对

使用道具 举报

蝶舞之殇啊 发表于 2014-9-21 19:50:28 | 显示全部楼层
mark 一下 第一条要求真心高
回复 支持 反对

使用道具 举报

wesley 发表于 2014-9-22 00:41:46 | 显示全部楼层
厚着脸皮引用我自己的一段“能扒拉数据洗数据,能统计建模,机器学习,数据挖掘,能写production code,能设计数据模型,能优化数据库,懂MapReduce从应用到实现,能随手出个小网站demo/prototype新研究idea,能发paper能给讲座,能砍倒engineer能抡晕MBA,手下还能带几个小兵,估计就full stack data scientist了 :)”
.鏈枃鍘熷垱鑷1point3acres璁哄潧

哈哈 这个是全才了  好帖子  
回复 支持 反对

使用道具 举报

calalia 发表于 2015-6-18 07:05:03 | 显示全部楼层
IT公司的BA飘过 今天已经抱怨了一天没事做
每次老板出差去了没有及时安利我 我就一副╭(╯^╰)╮的样子
今天老板老喊我的时候我正在申苹果家

不过不知道为什么,我接触的apple的亲 都一副很高冷的样子
不知道是不是企业文化的关系 可是Apple家钱真的好多
我们跟Dell应该差不多
回复 支持 反对

使用道具 举报

Ruscello 发表于 2015-7-5 04:44:09 | 显示全部楼层
看到小K说的分析问题的能力真的好有感触! 前两天面了一家E-commerce的公司marketing analyst,就被问了个case,他家要不要去Facebook上投放广告,回头想想觉得自己解的好弱智==。感觉就是缺乏这种分析解决问题的能力。
回复 支持 反对

使用道具 举报

calalia 发表于 2015-7-5 05:39:19 | 显示全部楼层
IT公司也有挺多2的 不都是1
1的职位一般看都不敢看
回复 支持 反对

使用道具 举报

本版积分规则

请点这里访问我们的新网站:一亩三分地Instant.

Instant搜索更强大,不扣积分,内容组织的更好更整洁!目前仍在beta版本,努力完善中!反馈请点这里

关闭

一亩三分地推荐上一条 /5 下一条

手机版|小黑屋|一亩三分地论坛声明 ( 沪ICP备11015994号 )

custom counter

GMT+8, 2016-12-7 18:46

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表