一亩三分地论坛

 找回密码
 获取更多干货,去instant注册!

扫码关注一亩三分地公众号
查看: 9985|回复: 73
收起左侧

[DataScience] 统计专业在读, 迷茫是否投奔Data Science大军 (跪求K姐赏光,求大家踊跃)

  [复制链接] |试试Instant~ |关注本帖
地有多大产 发表于 2015-1-9 07:42:35 | 显示全部楼层 |阅读模式

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?获取更多干货,去instant注册!

x
本人统计专业在读, 最近学了不少有关于Data Science, machine learning的网课, 越学越觉得data science里面用到的统计知识都很浅显,很多统计的内容只是一些需要记忆的algorithm, 这对CS的人来说学起来应该很容易。但是要在现实生活中(不是网课里面)实现这些algorithm,却需要很好的编程能力,这对我等stat专业的人是个大挑战。。。好迷茫。。。怀疑自己该不该拿自己的短板跟CS专业的人擅长的东西拼机会。。。求指点迷津。。。
. 1point3acres.com/bbs
P.S. 现在已经熟悉掌握R, matlab, python, sql, 对Java和C++略懂,linux环境也比较熟悉, 做网课作业没有问题, 但是怀疑在实际工作中我的编程能力是否能胜任data science的要求。。
大家觉得统计专业的人做自己老本行,去银行之类的比较好呢?还是做data scientist比较好呢?求指导啊啊啊啊~~~~~


demonhunter 发表于 2015-1-15 05:41:24 | 显示全部楼层
我决定两手抓两条技能树都点,统计系这边老板的research和consulting好好做,data science的公开课照刷编程照样练。时间都是挤出来的。。。我反正已经把游戏戒了

就像培养游戏人物,如果CS是战士职业,统计师法师职业,那么我觉得data science就是魔法剑士,肉搏(coding)比统计的强,法术(modelling)比CS得强,不也挺好的么,哪里都能顶上。. From 1point 3acres bbs

找工作时候统计和Data science的工作都能同时找了,机会当然就更多了。
. 1point3acres.com/bbs

评分

2

查看全部评分

回复 支持 10 反对 0

使用道具 举报

我寄愁心与明月 发表于 2015-3-11 01:18:42 | 显示全部楼层
转自知乎:
机器学习的确是博大精深的领域,对计算机和数学能力要求极高。但是,个人认为这个答案有一定误导性,并不是所有机器学习相关的岗位都要求你掌握每一个算法的细节,并不是只有专业搞机器学习的优秀研究生才能从事这个行业。
. 1point3acres.com/bbs
目前业界(我的了解仅限于金融和咨询)还真的有非常多的工作是那位答主所说的“用几个软件调几个library跑跑数据的工作”。我目前正在从事的工作属于data science&consulting的范畴,做的最难的也就仅限于用grid search&cross validation来确定算法的参数,其余大部分时候就是clean data和 "用几个软件调几个library“。

个人体会,很多机器学习的相关岗位最看重的反而是对所在行业的business knowledge. 我在某次招聘会上和AIG负责招聘data scientist的人聊过,那个director of analytics department一上来就问我What business problem have u solved? 还有几个月前面过一家汽车贷款公司的machine learning risk analyst, 面部门老大的时候他居然只问简历和business case。。。然后就以我缺少business sense把我拒了。。。我技术面(一面)的时候答对了80%的问题啊。。。.1point3acres缃
鏉ユ簮涓浜.涓夊垎鍦拌鍧.
我就答主提的问题和排名第一的回答,和一个机器学习的PhD学长(目前在四大之一的咨询部门工作)探讨了下。以下是学长的回答:“(排名第一的答案)主要针对的是研究型工作例如research scientist,金融服务业没人关心。关键是理解business,定义好问题,再找到好的feature。Domain knowledge is far more important than the technology. 试想你将来想说服客户你的模型好,你觉得客户会关心技术细节吗?(排名第一的答案)和很多CS博士一样,太迷信技术的力量,太把技术的细枝末节当回事了。保持好奇心,多多思考模型背后要解决的商业问题,是最重要的。”

综上,我觉得题主现在努力还来得及。只是方向上要正确,研究性岗位(或许还包含纯科技公司?)什么的就不要考虑了,往金融、咨询、制造等行业走,一边积累行业知识,一边完善机器学习方面的知识储备(一定要尝试自己写代码!作为计算机专业的学生,题主肯定清楚光看不编是绝对不行的)

评分

2

查看全部评分

回复 支持 5 反对 0

使用道具 举报

zhangwenteng 发表于 2015-3-10 20:44:53 | 显示全部楼层
本帖最后由 zhangwenteng 于 2015-3-10 20:50 编辑
.鐣欏璁哄潧-涓浜-涓夊垎鍦
两年时间,你学到什么程度,也都是非常一般的,你牛,你再牛,读什么学位,找什么工作。。。。自己创业就好了。现在大多数CS的人都是给几个大学没毕业的人工作。两年时间,你无论什么都不会很牛的。而且主要是给我举个例子,公司没了DS就没办法干下去了的。
Netflix, 这几年自我炒作数据挖掘很牛X,其实就是个平台公司,如果不是7.99一个月,没人会用它。.1point3acres缃

Google, 数据也很牛X, 其实没有CS和数学的人搞算法,谁会用它?

。。。。。数据科学永远都不会是主流,只是锦上添花。这就造成了,他不是核心业务,永远无法和CS的人compete。其次,做模型,你的理论基础和搞数学统计的比还要差很多。最多也就是拿来用用主义,你说你可以更深入的学,统计的人也可以反过来说他可以更深入的学写程序。。。

这个就是公说公有理,牛说我牛逼的意思了。再具体探讨没什么意思。中心思想还是,能投奔CS就去投奔CS,能投奔统计or数学phd就投奔这两个,有钱,编程也不好,统计也不好,数学也不好,还很任性。。。就去读DS或者BA.
回复 支持 3 反对 0

使用道具 举报

almost 发表于 2015-3-8 01:37:11 | 显示全部楼层
本帖最后由 almost 于 2015-3-8 01:43 编辑
. 鐣欏鐢宠璁哄潧-涓浜╀笁鍒嗗湴
走Data Science的路线工作机会虽然不如CS多,但肯定会大大扩宽你的路,而且如果有一天你要回国,你会庆幸没有局限在统计内

不要觉得DS的算法都很简单哦,SVM、NN、ensemble看上去好像是拍脑袋想出来的,不如统计的理论看上去数学那么完备,但为什么这些是最终能work的,而不是其他(有不知道多少Machine Learning算法被淘汰),背后有原理的

而且也不需要你的编程能力超强,有机会你照着论文编一个你就会了,而且现在编这玩意的人多了,去github上学学别人怎么编的,实在不会直接复制过来用也无所谓

另外,Data Scientist一定要会java和C++,python是用来做demo的,DS的建模结果最终要放在企业的生产系统中,尤其大规模数据很注重效率,python不能胜任。Hadoop是基于java的,C++的效率自不必说,如果你只会python,你需要配合一个系统架构师帮助你用java实现算法,别人多实现几次自己也会了,你最后就是没用的人. 鐗涗汉浜戦泦,涓浜╀笁鍒嗗湴

lz我觉得你如果放弃DS这条路有点可惜,会浪费你现有的编程能力,可以说你的编程能力处于中间状态。不要怕CS那帮人,以为他们coding很强吗,他们也觉得我们数学很厉害哦,哈哈。你就算只会python你一样能找DS工作,无非是做个上述的“没用的人”(其实也不是没用啦,可以做数据处理、feature engineering、调参),找到之后还能继续练coding嘛,最终成为一个同时熟练模型和代码的全能选手
回复 支持 3 反对 0

使用道具 举报

小K 发表于 2015-2-7 18:22:08 | 显示全部楼层
不用java的数科真的很常见么?
大数据的哪有几个真用python包圆mapreduce的

真有那种不需要任何真正coding,只用R/Py,甚至SQL的,干几年后出路会极其的窄,出去找工作根本抬不起头来,因为一般根本就不认为你是数科!!不过是个business analyst
回复 支持 3 反对 0

使用道具 举报

luhanqiao 发表于 2015-1-14 17:25:37 | 显示全部楼层
data science必须和business结合才行,再强大的技术没有business sence 也是白搭。
所以我觉得要做一个好的data scientist必须有些business sence,然后才是相应的技术支持。
坛子上基本都是技术宅,思维也都局限在传统领域里,不是programming就是modeling,而数科的挑战就在于你能不能把这些技术用起来,如果没有商业方面的灵性和创造力很难做一个合格的data scientist

评分

2

查看全部评分

回复 支持 2 反对 0

使用道具 举报

小K 发表于 2015-1-17 03:51:00 | 显示全部楼层
for phd, 药厂真心不推荐。绝对下坡路
银行不清楚,投行反正做好了还依然高大上的。.1point3acres缃
IT目前还是上坡路的。代码拼上去将来会有发展的。


=====
on the other hand如果一个人还没觉得读统计博士,在数科跟码农之间摇摆,那么除非你确定兴趣在数字上,否则建议能码农则码农。当然不妨选23门统计课,概率,inference,linear regression什么的
数科听起来高大上,但是职位肯定还没有码农职位的1/10多
而且specificity更强,对口职位更少,所以一个做数科的phd工作个2年后会发现你能去的地方只有一个类似级别码农的1/100那么多。绝不夸张。
回复 支持 2 反对 0

使用道具 举报

QiQi 发表于 2015-1-12 22:07:50 | 显示全部楼层
一直觉得Data Science MS有点高不成低不就的, 做Model竞争不过PhD,programming又没有人CS轻车熟路。。。
回复 支持 1 反对 0

使用道具 举报

Grace 发表于 2016-4-2 06:37:15 | 显示全部楼层
我本科国内念得CS,在美国读了一年CS的phd,后来转了专业,现在生统phd毕业去了药厂。

找工作的时候研究过data scientist,也面试过一些公司。发现job market上title叫data scientist的~70-80%的干的是data analyst的活,master或者本科都能干,这类工作多半只要求会SAS SQL excel, 最多一些简单regression model,这类工作早已有之,现在叫做data scientist不过是旧瓶装新酒。所以学CS还是stat其实根本无所谓,反正是个人稍微培训下都能干。
剩下来的大概有2/3是搭建平台or实现算法的,要求会java C++等等,这些工作适合CS master或者本科生。CS和统计对代码的差距实在太大了。统计实现自己的idea就行,重点不在考虑效率/robustness/quality control,CS的编程抽象程度更高,对质量要求也更高。不太了解那些半路出家刷了一年题的,但是我觉得科班CS在无数course project里锻炼出来的编程水平,统计phd真的鲜有人能看齐。更重要的是,抛弃自己在modeling上的专长去和人竞争这类职位,也没什么意思。
另外的1/3职位多是大公司的research positions,这类职位侧重development new statistical methods to solve their business problems, 喜欢统计基础扎实并且phd做machine learning之类方向的,最好在KDD一类的journal上有paper。个别公司对coding完全没有要求,比如apple。 我觉得这类职位才适合统计phd,只是positions少,有这个水平的人也可以试试faculty了。 这类职位有一个问题是,在没有data scientist的时代公司也运行的好好地,所以这个相对新的部门在公司有多少contribution,有多被看重,目前有点questionable.

我觉得基础扎实,machine learning方向,喜欢解决real world problem的统计phd可以多试一试最后一类职位。也许这个相对新的工种在未来会有它巨大的价值。至于编程, 有效率地实现自己的idea就行。现在一味强调把编程水平和CS major看齐,有点矫枉过正了,毕竟不该用自己的短处比人家的长处。
以上是我个人对统计phd找data scientist工作的一些一家之言,欢迎不同意见。. From 1point 3acres bbs


评分

1

查看全部评分

回复 支持 1 反对 0

使用道具 举报

almost 发表于 2015-3-10 19:11:46 | 显示全部楼层
zhangwenteng 发表于 2015-3-10 02:02 鏉ユ簮涓浜.涓夊垎鍦拌鍧.
business sense不是在学校培养的,我实在不知道 data sciense培养出来给谁用,我需要编程的我有学cs的,我 ...

那要看学到什么程度了,有可能学的一般毕业没办法往DS发展,只能先做DA和BA积累业务知识。也有毕业就把编程和model都掌握不错的,可以直接往DS发展,不见得需要business sense很好,数据挖掘任务很宽泛,往往团队成员各有擅长,业务、model、coding,三个里面擅长两个,算是厉害了
回复 支持 1 反对 0

使用道具 举报

QAZ123! 发表于 2015-1-9 07:45:00 | 显示全部楼层
这个问题,通病相连
回复 支持 反对

使用道具 举报

cinkie 发表于 2015-1-11 05:03:55 | 显示全部楼层
本帖最后由 cinkie 于 2015-1-10 15:06 编辑 . more info on 1point3acres.com

LZ的编程背景以及超过大部分stat的人了呀~ big data什么的确实没有统计太多事情,具体从事哪个方向主要还是看LZ的追求和兴趣了吧~ 不同的行业对数据的interpretation也不太一样,LZ是想走IT?
回复 支持 反对

使用道具 举报

 楼主| 地有多大产 发表于 2015-1-11 10:23:21 | 显示全部楼层
本帖最后由 地有多大产 于 2015-1-11 10:30 编辑 . 鍥磋鎴戜滑@1point 3 acres
QAZ123! 发表于 2015-1-9 07:45
这个问题,通病相连

病友~~握手~~你最后有纠结出什么结果吗
回复 支持 反对

使用道具 举报

 楼主| 地有多大产 发表于 2015-1-11 10:25:35 | 显示全部楼层
本帖最后由 地有多大产 于 2015-1-11 10:36 编辑
cinkie 发表于 2015-1-11 05:03. Waral 鍗氬鏈夋洿澶氭枃绔,
LZ的编程背景以及超过大部分stat的人了呀~ big data什么的确实没有统计太多事情,具体从事哪个方向主要还是 ...

哎可惜对手都是学CS的战斗机~ 我其实对未来干什么没啥太大的偏向,向钱看齐~~ 向前途看齐~~ 只是觉得data science是个统计大方向,以后肯定很多地方用得到,就想凑个热闹。至于具体怎么走,还真没想好。你有什么计划不?IT好像太累,其他行业搞DS又好像没前途。。难办啊. Waral 鍗氬鏈夋洿澶氭枃绔,
回复 支持 反对

使用道具 举报

Deelers 发表于 2015-1-11 10:34:16 | 显示全部楼层
对于统计小硕来讲DS不是那么好走的方向,个人觉得还是回归老本行吧。不过话说回来,统计的老本行也不是去银行吧...
回复 支持 反对

使用道具 举报

 楼主| 地有多大产 发表于 2015-1-11 10:41:59 | 显示全部楼层
本帖最后由 地有多大产 于 2015-1-11 10:43 编辑
Deelers 发表于 2015-1-11 10:34
对于统计小硕来讲DS不是那么好走的方向,个人觉得还是回归老本行吧。不过话说回来,统计的老本行也不是去银 ...

.鏈枃鍘熷垱鑷1point3acres璁哄潧你指的是去药厂吗?个人愚见,总觉得药厂搞的太条条框框。。。万一以后都CRO了,不好找下家啊
我其实是PhD, 但是学的东西与这个根本没关系。。。所以情况更加纠结。。
回复 支持 反对

使用道具 举报

小K 发表于 2015-1-14 05:18:21 | 显示全部楼层
学好代码是王道
其他的再说。

多做做具体事情体会下自己喜欢什么也很重要

做个不喜欢的domain会陡然痛苦不少

评分

2

查看全部评分

回复 支持 1 反对 0

使用道具 举报

Teenieweevie 发表于 2015-1-14 09:39:01 | 显示全部楼层
向钱看齐就要programming‘了,这个比较实在啊
回复 支持 反对

使用道具 举报

小K 发表于 2015-1-14 18:26:28 | 显示全部楼层
在学校里面学代码比在外面自己瞎学容易多了啊
business sense业界对fresh grad 容忍度较高,我们一般并不指望新人马上就能懂很多domain/biz,主要还是看硬技能. more info on 1point3acres.com
而且软技能比较容易在工作的时候培养

评分

3

查看全部评分

回复 支持 1 反对 0

使用道具 举报

privateinme 发表于 2015-1-15 06:11:58 | 显示全部楼层
还是看职业理想吧。个人觉得ds在it公司里给cs做support,那就很难比cs同事们更受重视,也容易更早碰到职业天花板
回复 支持 反对

使用道具 举报

ryanzjlib 发表于 2015-1-15 17:19:52 | 显示全部楼层
不是有个广为流传的说法么。。data scientist就是一个比其他stats人更会programming的stats,或者一个比其他programmer更懂stats的programmer
回复 支持 反对

使用道具 举报

QAZ123! 发表于 2015-1-16 12:35:48 | 显示全部楼层
地有多大产 发表于 2015-1-11 10:23
病友~~握手~~你最后有纠结出什么结果吗
. 1point3acres.com/bbs
读读统计,旁听下cs的基础课,练练编程。
回复 支持 反对

使用道具 举报

zyhswr 发表于 2015-1-18 06:07:15 | 显示全部楼层
顶楼主因为和楼主存在一样的问题!我也在犹豫是否继续按照数科走下去还是转成码农

我目前在读数科master program,从我上半年面试的感觉来看,数科确实对口职位没有传统码农多,K姐说的是很有道理的。

其实我觉得和公司去做实习,做project是了解这个行业最直观的做法
回复 支持 反对

使用道具 举报

supervicky 发表于 2015-1-21 00:36:48 | 显示全部楼层
demonhunter 发表于 2015-1-15 05:41
我决定两手抓两条技能树都点,统计系这边老板的research和consulting好好做,data science的公开课照刷编程 ...
. 鐗涗汉浜戦泦,涓浜╀笁鍒嗗湴
都说数科要练编程,可到底练哪个编程啊??r和python么?这都不算编程吧。。可java的话,我听说只有软件开发才用到java。。。我们数科的何必呢??很好奇大家到底练什么编程?
回复 支持 反对

使用道具 举报

本版积分规则

请点这里访问我们的新网站:一亩三分地Instant.

Instant搜索更强大,不扣积分,内容组织的更好更整洁!目前仍在beta版本,努力完善中!反馈请点这里

关闭

一亩三分地推荐上一条 /5 下一条

手机版|小黑屋|一亩三分地论坛声明 ( 沪ICP备11015994号 )

custom counter

GMT+8, 2016-12-4 17:03

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表