[八我司] 介绍一下Uber tech stack和各个大组的情况

一亩三分地论坛

 找回密码
 Sign Up 注册获取更多干货
E轮2.5亿美元融资
K12教育独角兽一起作业
北京-诚聘人工智能/教育/大数据岗
坐标湾区
Games Startup
招聘游戏开发工程师
游戏初创公司招聘工程师、UIUX Designer和游戏策划
码农求职神器Triplebyte:
不用海投
内推多家公司面试
把贵司招聘信息放这里
查看: 7391|回复: 19
收起左侧

[统计--转专业和交叉方向] Data Science/Machine Learning读统计还是CS?

[复制链接] |试试Instant~ |关注本帖
whoisit 发表于 2016-5-16 16:13:24 | 显示全部楼层 |阅读模式

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?Sign Up 注册获取更多干货

x
老生常谈的话题,有说读统计好的,也有说读CS好的,总结如下:
读统计好处:大数据/机器学习本质是数学,读统计可以深入了解模型,统计知识比CS难度大得多
读统计坏处:编程能力差,专门modelling的公司基本都要phd.一般大公司不一定需要做modelling,或者说modelling的需求少,programming的需求大,而且都是用现成的package.一些数学统计高级课程比如实分析,测度论,随机过程被认为太理论,只有做研究发论文的人才需要,一般找工作的普罗大众还是撸几行代码更实在
.本文原创自1point3acres论坛
读CS好处:编程能力强,公司需求大,用现成的算法日积月累,滴水穿石,反而经验比数学统计背景的溜,kaggle上排名靠前的基本是CS/ENG背景
读CS坏处:数学统计背景欠佳,而且数学知识很难补,对模型无法升入了解,停留在黑箱操作上,而编程相对简单,有自学的可能.
. 牛人云集,一亩三分地
请教下大神对以上发表下看法,然后下个定论下对于本科不是CS或是统计的童鞋,硕士到底读统计好还是CS好.



switchboy 发表于 2017-6-26 03:27:14 | 显示全部楼层
首先,大数据本质不是数学,大数据本质是系统和算法。
其次,请你扪心自问,如果统计知识比cs的难,为什么你认识的那些海本math/stat的本科生成绩普遍比cs的好。事实上统计的东西很弱智,在数学所有方向构成的鄙视链的最底端。
再次,黑箱是说有些ml模型的可解释性差,不是说做ml的人不知道模型在干什么。经验主义本身就是科学的一个重要方面。-google 1point3acres
第四点,这个世界上没有专门做modeling的公司,你对业界的认识基本上是出于幻想。
第五点,请你分清楚math和stat是两个专业两回事,不要偷换概念变来变去,不知道自己在说什么。
.1point3acres网最后一点,像你这样什么都搞不清,说了一大堆hot word搅在一起的人,最好直接念cs以后做码农,不要乱跟风。
回复 支持 3 反对 0

使用道具 举报

fanghao 发表于 2016-5-16 16:21:05 | 显示全部楼层
kaggle上次看到有好几个厉害的大神都是数学专业毕业的,不过人家程序能力也很6就是了。。.1point3acres网
个人感觉现在kaggle的流行solution都是套一个DL模型或者用个DL抽一下feature;然后再用不同上层的model ensemble一下结果就能蛮好了。。。。如此的话 对快速搭建pipline和熟悉各种模型的调用 的动手能力要求感觉比较高。。
所以感觉硕士还是老老实实读cs吧

PS,忘了之前在哪看到的,说是千万不要把数据竞赛当成research,不要纠结发明一个更屌的模型。感觉还是有点道理的。但是也许在大公司真正做工作的时候会不太一样吧。
回复 支持 反对

使用道具 举报

小K 发表于 2016-5-16 18:03:41 | 显示全部楼层
大公司很少职位是纠结提升那一点点的模型的
绝大部分是用一个现有东西,connect pipes, design work flow etc 解决实际问题. From 1point 3acres bbs
公司里面需要做的内容经常特别多,专门纠结在某一个方面提升那一点点,往往对改变整个问题的局面无济于事. 围观我们@1point 3 acres
还不如通盘考虑,寻求短板去提高,找low hanging fruit 往往事倍功半
除非是偏向researcher 的data scientist,否则不太会有机会做很高大上的能发论文的事情其实。。。。
回复 支持 反对

使用道具 举报

 楼主| whoisit 发表于 2016-5-16 18:14:37 | 显示全部楼层
小K 发表于 2016-5-16 18:03
大公司很少职位是纠结提升那一点点的模型的
绝大部分是用一个现有东西,connect pipes, design work flow  ...

所以您也是推荐CS么?自己本身也没有那天赋做研究
CS的话除了machine learning有关的课,还有哪些课是比较重要,需要学习的?
回复 支持 反对

使用道具 举报

gyzjay 发表于 2016-5-16 18:21:44 | 显示全部楼层
fanghao 发表于 2016-5-16 16:21
kaggle上次看到有好几个厉害的大神都是数学专业毕业的,不过人家程序能力也很6就是了。。
个人感觉现在kag ...

kaggle哪里有那么多DL……兄弟。你这是入了DL的坑啊……
回复 支持 反对

使用道具 举报

gyzjay 发表于 2016-5-16 18:25:09 | 显示全部楼层
whoisit 发表于 2016-5-16 18:14
所以您也是推荐CS么?自己本身也没有那天赋做研究
CS的话除了machine learning有关的课,还有哪些课是比较 ...

关键看你想干什么,data science方向?
回复 支持 反对

使用道具 举报

gyzjay 发表于 2016-5-16 18:37:44 | 显示全部楼层
实际上cs做模型很少黑盒操作的………你不懂模型不可能做好的。全都要自己学。
回复 支持 反对

使用道具 举报

 楼主| whoisit 发表于 2016-5-16 18:41:59 | 显示全部楼层
gyzjay 发表于 2016-5-16 18:25
关键看你想干什么,data science方向?

是的,想做Machine Learning方向. CS的基本课比如JAVA,C++,Database我都已经学完了,学得不深就是了.CS硕士的课程我的学校是有两门ML的课,这肯定要选,其他基础比如discrete math,operating system选完后,那些CS课还是要选的呢?
回复 支持 反对

使用道具 举报

gyzjay 发表于 2016-5-16 18:47:06 | 显示全部楼层
whoisit 发表于 2016-5-16 18:41
是的,想做Machine Learning方向. CS的基本课比如JAVA,C++,Database我都已经学完了,学得不深就是了.CS硕士 ...

算法吧。基础课程要学的。然后python应该要学学。leetcode要刷。然后关键是ml什么方向。很多的,深度的。非深度的。实际上很多很复杂。做大方向推荐多读源码。多做pipeline尝试。kaggle是个不错的选择。但似乎上学了没有那么多课余时间。因为刷题依然是第一位。
回复 支持 反对

使用道具 举报

cY123 发表于 2017-6-14 16:12:44 | 显示全部楼层
本科CS的想要申请stat phd 哎。。。。
回复 支持 反对

使用道具 举报

yydong13 发表于 2017-6-20 07:01:50 来自手机 | 显示全部楼层
cY123 发表于 2017-6-14 16:12
本科CS的想要申请stat phd 哎。。。。

为什么啊,CS不是很好吗
回复 支持 反对

使用道具 举报

switchboy 发表于 2017-6-26 03:28:49 | 显示全部楼层
cY123 发表于 2017-6-14 16:12. more info on 1point3acres
本科CS的想要申请stat phd 哎。。。。

你为什么要从业界鄙视链的上端专业转换到下端专业?你知道统计phd在干什么吗?你知道cs phd在干什么吗?
回复 支持 反对

使用道具 举报

小K 发表于 2017-6-26 06:39:41 | 显示全部楼层
switchboy 发表于 2017-6-25 11:27
首先,大数据本质不是数学,大数据本质是系统和算法。. 1point 3acres 论坛
其次,请你扪心自问,如果统计知识比cs的难,为什么 ...

讲道理是OK的,话里话外批楼主的,没必要吧
第一次口头警告
回复 支持 反对

使用道具 举报

switchboy 发表于 2017-6-26 10:09:42 | 显示全部楼层
小K 发表于 2017-6-26 06:39. 围观我们@1point 3 acres
讲道理是OK的,话里话外批楼主的,没必要吧
第一次口头警告

楼主话里话外贬低cs的算怎么回事儿?而且根本就没依据。
回复 支持 反对

使用道具 举报

小K 发表于 2017-6-26 11:54:01 | 显示全部楼层
switchboy 发表于 2017-6-25 18:09.留学论坛-一亩-三分地
楼主话里话外贬低cs的算怎么回事儿?而且根本就没依据。
. 留学申请论坛-一亩三分地
my warning for you stands
回复 支持 反对

使用道具 举报

switchboy 发表于 2017-6-27 11:05:52 | 显示全部楼层
本帖最后由 switchboy 于 2017-6-27 11:24 编辑 -google 1point3acres
小K 发表于 2017-6-26 11:54
my warning for you stands

不管我的语气怎么样,作为一个很多人看的论坛,这一大堆胡说八道的言论应该被指正,以免误人子弟。
回复 支持 反对

使用道具 举报

小K 发表于 2017-6-27 13:33:44 | 显示全部楼层
switchboy 发表于 2017-6-26 19:05. 留学申请论坛-一亩三分地
不管我的语气怎么样,作为一个很多人看的论坛,这一大堆胡说八道的言论应该被指正,以免误人子弟。

这是你的第一次警告。三次警告则禁言。谢谢合作
回复 支持 反对

使用道具 举报

CathyC90 发表于 2017-7-19 23:56:41 | 显示全部楼层
其实沙发的回帖,除了最后一句有人参公鸡之嫌,前面几条我都想second。
感觉lz没太搞清math、stat、cs具体都是在干啥。
. 一亩-三分-地,独家发布统计知识并没有比CS“难度大太多”。统计master program把实分析、测度论这种课弄成必修的并不多。随机过程还是挺有用的。而且不知道lz说的“数学知识很难补”指的是什么数学知识。
妄言一句:我觉得其实在公司里,做master level的machine learning,除了工科本科都会学的那几门课外,并不需要什么具体的数学知识。在统计系,即使做learning的research,所需要的数学知识,顶多顶多,也就是简单的泛函,和少数人会用到的简单的微分几何,而且这些都是modelling才用。
回复 支持 反对

使用道具 举报

warmjoe 发表于 2017-10-19 09:20:36 | 显示全部楼层
其实一般大公司用的model都是现成的,除非大牛,要不很少给你机会让你自己研究的,一个是太慢,一个是研究出来也不一定能用,所以用不到学术那么深
回复 支持 反对

使用道具 举报

本版积分规则

提醒:发帖可以选择内容隐藏,部分板块支持匿名发帖。请认真读完以下全部说明:

■隐藏内容方法: [hide=200]你想要隐藏的内容比如面经[/hide]
■意思是:用户积分低于200则看不到被隐藏的内容
■可以自行设置积分值,不建议太高(200以上太多人看不到),也不建议太低(那就没必要隐藏了)
■建议只隐藏关键内容,比如具体的面试题目、涉及隐私的信息,大部分内容没必要隐藏。
■微信/QQ/电子邮件等,为防止将来被骚扰甚至人肉,以论坛私信方式发给对方最安全。
■匿名发帖的板块和方法:http://www.1point3acres.com/bbs/thread-405991-1-1.html

关闭

一亩三分地推荐上一条 /5 下一条

手机版|小黑屋|一亩三分地论坛声明

custom counter

GMT+8, 2018-5-26 01:14

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表