传说中的谷歌招聘委员会成员之一,从幕后走出来,教你学系统设计!


一亩三分地论坛

 找回密码
 获取更多干活,快来注册
天天打游戏、照样领工资、还办H1B
这份工作你要不要?
把贵司招聘信息放这里
查看: 5416|回复: 18
收起左侧

[统计--转专业和交叉方向] Data Science/Machine Learning读统计还是CS?

[复制链接] |试试Instant~ |关注本帖
whoisit 发表于 2016-5-16 16:13:24 | 显示全部楼层 |阅读模式

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?获取更多干活,快来注册

x
老生常谈的话题,有说读统计好的,也有说读CS好的,总结如下:
读统计好处:大数据/机器学习本质是数学,读统计可以深入了解模型,统计知识比CS难度大得多 鏉ユ簮涓浜.涓夊垎鍦拌鍧.
读统计坏处:编程能力差,专门modelling的公司基本都要phd.一般大公司不一定需要做modelling,或者说modelling的需求少,programming的需求大,而且都是用现成的package.一些数学统计高级课程比如实分析,测度论,随机过程被认为太理论,只有做研究发论文的人才需要,一般找工作的普罗大众还是撸几行代码更实在

读CS好处:编程能力强,公司需求大,用现成的算法日积月累,滴水穿石,反而经验比数学统计背景的溜,kaggle上排名靠前的基本是CS/ENG背景.鏈枃鍘熷垱鑷1point3acres璁哄潧
读CS坏处:数学统计背景欠佳,而且数学知识很难补,对模型无法升入了解,停留在黑箱操作上,而编程相对简单,有自学的可能.
. 1point3acres.com/bbs
请教下大神对以上发表下看法,然后下个定论下对于本科不是CS或是统计的童鞋,硕士到底读统计好还是CS好.. 涓浜-涓夊垎-鍦帮紝鐙鍙戝竷



switchboy 发表于 2017-6-26 03:27:14 | 显示全部楼层
首先,大数据本质不是数学,大数据本质是系统和算法。
其次,请你扪心自问,如果统计知识比cs的难,为什么你认识的那些海本math/stat的本科生成绩普遍比cs的好。事实上统计的东西很弱智,在数学所有方向构成的鄙视链的最底端。
再次,黑箱是说有些ml模型的可解释性差,不是说做ml的人不知道模型在干什么。经验主义本身就是科学的一个重要方面。
第四点,这个世界上没有专门做modeling的公司,你对业界的认识基本上是出于幻想。
第五点,请你分清楚math和stat是两个专业两回事,不要偷换概念变来变去,不知道自己在说什么。
最后一点,像你这样什么都搞不清,说了一大堆hot word搅在一起的人,最好直接念cs以后做码农,不要乱跟风。
回复 支持 2 反对 0

使用道具 举报

fanghao 发表于 2016-5-16 16:21:05 | 显示全部楼层
kaggle上次看到有好几个厉害的大神都是数学专业毕业的,不过人家程序能力也很6就是了。。
个人感觉现在kaggle的流行solution都是套一个DL模型或者用个DL抽一下feature;然后再用不同上层的model ensemble一下结果就能蛮好了。。。。如此的话 对快速搭建pipline和熟悉各种模型的调用 的动手能力要求感觉比较高。。. 鐗涗汉浜戦泦,涓浜╀笁鍒嗗湴
所以感觉硕士还是老老实实读cs吧

PS,忘了之前在哪看到的,说是千万不要把数据竞赛当成research,不要纠结发明一个更屌的模型。感觉还是有点道理的。但是也许在大公司真正做工作的时候会不太一样吧。
回复 支持 反对

使用道具 举报

小K 发表于 2016-5-16 18:03:41 | 显示全部楼层
大公司很少职位是纠结提升那一点点的模型的. from: 1point3acres.com/bbs
绝大部分是用一个现有东西,connect pipes, design work flow etc 解决实际问题
公司里面需要做的内容经常特别多,专门纠结在某一个方面提升那一点点,往往对改变整个问题的局面无济于事
还不如通盘考虑,寻求短板去提高,找low hanging fruit 往往事倍功半
除非是偏向researcher 的data scientist,否则不太会有机会做很高大上的能发论文的事情其实。。。。
回复 支持 反对

使用道具 举报

 楼主| whoisit 发表于 2016-5-16 18:14:37 | 显示全部楼层
小K 发表于 2016-5-16 18:03
大公司很少职位是纠结提升那一点点的模型的
绝大部分是用一个现有东西,connect pipes, design work flow  ...

所以您也是推荐CS么?自己本身也没有那天赋做研究
CS的话除了machine learning有关的课,还有哪些课是比较重要,需要学习的?
回复 支持 反对

使用道具 举报

gyzjay 发表于 2016-5-16 18:21:44 | 显示全部楼层
fanghao 发表于 2016-5-16 16:21
kaggle上次看到有好几个厉害的大神都是数学专业毕业的,不过人家程序能力也很6就是了。。
个人感觉现在kag ...

kaggle哪里有那么多DL……兄弟。你这是入了DL的坑啊……
回复 支持 反对

使用道具 举报

gyzjay 发表于 2016-5-16 18:25:09 | 显示全部楼层
whoisit 发表于 2016-5-16 18:14
所以您也是推荐CS么?自己本身也没有那天赋做研究
CS的话除了machine learning有关的课,还有哪些课是比较 ...
.鏈枃鍘熷垱鑷1point3acres璁哄潧
关键看你想干什么,data science方向?
回复 支持 反对

使用道具 举报

gyzjay 发表于 2016-5-16 18:37:44 | 显示全部楼层
实际上cs做模型很少黑盒操作的………你不懂模型不可能做好的。全都要自己学。
回复 支持 反对

使用道具 举报

 楼主| whoisit 发表于 2016-5-16 18:41:59 | 显示全部楼层
gyzjay 发表于 2016-5-16 18:25. From 1point 3acres bbs
关键看你想干什么,data science方向?
鏉ユ簮涓浜.涓夊垎鍦拌鍧.
是的,想做Machine Learning方向. CS的基本课比如JAVA,C++,Database我都已经学完了,学得不深就是了.CS硕士的课程我的学校是有两门ML的课,这肯定要选,其他基础比如discrete math,operating system选完后,那些CS课还是要选的呢?
回复 支持 反对

使用道具 举报

gyzjay 发表于 2016-5-16 18:47:06 | 显示全部楼层
whoisit 发表于 2016-5-16 18:41. 鐗涗汉浜戦泦,涓浜╀笁鍒嗗湴
是的,想做Machine Learning方向. CS的基本课比如JAVA,C++,Database我都已经学完了,学得不深就是了.CS硕士 ...

算法吧。基础课程要学的。然后python应该要学学。leetcode要刷。然后关键是ml什么方向。很多的,深度的。非深度的。实际上很多很复杂。做大方向推荐多读源码。多做pipeline尝试。kaggle是个不错的选择。但似乎上学了没有那么多课余时间。因为刷题依然是第一位。
回复 支持 反对

使用道具 举报

cY123 发表于 2017-6-14 16:12:44 | 显示全部楼层
本科CS的想要申请stat phd 哎。。。。
回复 支持 反对

使用道具 举报

yydong13 发表于 2017-6-20 07:01:50 来自手机 | 显示全部楼层
cY123 发表于 2017-6-14 16:12
本科CS的想要申请stat phd 哎。。。。

为什么啊,CS不是很好吗
回复 支持 反对

使用道具 举报

switchboy 发表于 2017-6-26 03:28:49 | 显示全部楼层
cY123 发表于 2017-6-14 16:12
本科CS的想要申请stat phd 哎。。。。

你为什么要从业界鄙视链的上端专业转换到下端专业?你知道统计phd在干什么吗?你知道cs phd在干什么吗?
回复 支持 反对

使用道具 举报

小K 发表于 2017-6-26 06:39:41 | 显示全部楼层
switchboy 发表于 2017-6-25 11:27
首先,大数据本质不是数学,大数据本质是系统和算法。
其次,请你扪心自问,如果统计知识比cs的难,为什么 ...

讲道理是OK的,话里话外批楼主的,没必要吧
第一次口头警告
回复 支持 反对

使用道具 举报

switchboy 发表于 2017-6-26 10:09:42 | 显示全部楼层
小K 发表于 2017-6-26 06:39
讲道理是OK的,话里话外批楼主的,没必要吧
第一次口头警告

楼主话里话外贬低cs的算怎么回事儿?而且根本就没依据。
回复 支持 反对

使用道具 举报

小K 发表于 2017-6-26 11:54:01 | 显示全部楼层
switchboy 发表于 2017-6-25 18:09
楼主话里话外贬低cs的算怎么回事儿?而且根本就没依据。

my warning for you stands
回复 支持 反对

使用道具 举报

switchboy 发表于 2017-6-27 11:05:52 | 显示全部楼层
本帖最后由 switchboy 于 2017-6-27 11:24 编辑
小K 发表于 2017-6-26 11:54
my warning for you stands

不管我的语气怎么样,作为一个很多人看的论坛,这一大堆胡说八道的言论应该被指正,以免误人子弟。
回复 支持 反对

使用道具 举报

小K 发表于 2017-6-27 13:33:44 | 显示全部楼层
switchboy 发表于 2017-6-26 19:05
不管我的语气怎么样,作为一个很多人看的论坛,这一大堆胡说八道的言论应该被指正,以免误人子弟。
. 1point 3acres 璁哄潧
这是你的第一次警告。三次警告则禁言。谢谢合作
回复 支持 反对

使用道具 举报

CathyC90 发表于 2017-7-19 23:56:41 | 显示全部楼层
其实沙发的回帖,除了最后一句有人参公鸡之嫌,前面几条我都想second。
感觉lz没太搞清math、stat、cs具体都是在干啥。. from: 1point3acres.com/bbs
统计知识并没有比CS“难度大太多”。统计master program把实分析、测度论这种课弄成必修的并不多。随机过程还是挺有用的。而且不知道lz说的“数学知识很难补”指的是什么数学知识。
妄言一句:我觉得其实在公司里,做master level的machine learning,除了工科本科都会学的那几门课外,并不需要什么具体的数学知识。在统计系,即使做learning的research,所需要的数学知识,顶多顶多,也就是简单的泛函,和少数人会用到的简单的微分几何,而且这些都是modelling才用。
回复 支持 反对

使用道具 举报

本版积分规则

关闭

一亩三分地推荐上一条 /5 下一条

手机版|小黑屋|一亩三分地论坛声明

custom counter

GMT+8, 2017-9-26 17:19

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表