一亩三分地论坛

 找回密码
 获取更多干货,去instant注册!

扫码关注一亩三分地公众号
查看: 2668|回复: 20
收起左侧

[背景提升] 大家觉得大数据值得学吗?

[复制链接] |试试Instant~ |关注本帖
ShangShang123 发表于 2016-4-22 01:59:41 来自手机 | 显示全部楼层 |阅读模式

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?获取更多干货,去instant注册!

x
本人CS背景, 今年fall就要去读CS master了。介于自己不是属于CS牛人那一块的, 所以还是想再学点什么增加一下实力。。。
. from: 1point3acres.com/bbs
我看见我的学校有一个business analytics的program, part time的, 就5门课, 讲一些大数据和businesses的基本知识。。正好CS和big data也沾点边, 大家觉得这个program值得去吗? 可以为找工加分吗? . more info on 1point3acres.com

课程有business analytics, advanced analytics, programming in R, Data Science, database systems.
cccpwx 发表于 2016-4-22 13:21:07 | 显示全部楼层
我觉得大数据过热了。

---------------------------------------------------------------------------

发信人: hci (海螺子), 信区: Programming
标  题: 关于搞ML刷数据的职业前途
发信站: BBS 未名空间站 (Thu Mar 17 17:28:01 2016, 美东)
. from: 1point3acres.com/bbs

很多人看见别人用python搞ML, 参加比赛拿奖,搞得热火朝天,很羡慕。我来泼点冷
水。

用python搞ML刷数据,只是线下的ML训练阶段。这个阶段目前看用python有一定的优势
。但这个阶段在整个产品生产环境中,无论从哪个方面看都是很小的一部分,也就是所谓
的data scientist的工作。老实说,在大部分公司,这一行都是不太受待见的。你自己
觉得核心,别的人都不这么看。说来说去还是"nice to have",不是什么离了你公司就
不能运转的行当。

就举一个专门搞ML为业的一个初创公司为例吧,这样一个公司,最先要找的,必然是几
个full stack工程师,把前前后后的架子搭起来,随便搞点ML算法,弄个prototype. From 1point 3acres bbs
,好去忽悠钱,这些都没什么data scientist的事;. from: 1point3acres.com/bbs
. from: 1point3acres.com/bbs
然后忽悠到钱了,要grow了,必然要招更多的full stack, 还要找些backend工程师,
把后台搞得solid点,前台也要搞得漂亮点,是不是?当然还要有business
development的人,这些都没什么data scientist的事;-google 1point3acres

好了,公司发展不错,A,B轮拿了,老板想想,我们不是一个ML公司么,得搞点ML才像
样啊
,这才开始想,是不是搞个有点名气的ML人来好看点? 这才开始去挖个把ML人来,给. From 1point 3acres bbs
个VP, Chief Scientist等等空衔。然后这个人就雄心勃勃来了,然后,然后就悲剧了. From 1point 3acres bbs
,一两年就走人了, “与公司文化不和拍”,“我个人需要休息一下”,诸如此类,
我见得不少。
鏉ユ簮涓浜.涓夊垎鍦拌鍧.
这还是ML大牛,小喽啰就不提了。

-----------------------------------------------------------------------------------
鏉ユ簮涓浜.涓夊垎鍦拌鍧. . 1point 3acres 璁哄潧
发信人: wdong (cybra), 信区: Programming. from: 1point3acres.com/bbs
标  题: Re: 关于搞ML刷数据的职业前途
发信站: BBS 未名空间站 (Thu Mar 17 19:56:50 2016, 美东)
-google 1point3acres
完全同意。真正需要data scientist的职位并没有那么多,对于一个公司来说,. 鐣欏鐢宠璁哄潧-涓浜╀笁鍒嗗湴
即使有一个问题要分析,完了以后可能也就没有下一个了。人家出十万块钱,
放在kaggle上就是大比赛了,全世界的人得给你来想算法。如果拿十万块钱
钱去顾人,按现在的市价能雇到的人,给的方案还真未必可靠。专业搞ML我觉得
job security不是特别好。而且现在搞ML都是套轮子,偶尔有几个问题,. 1point 3acres 璁哄潧
full stack工程师随便google一下也就顺手解决了。如果非要在ML和写
javascript之间选一个,为了活命肯定是选javascript。如果写网站功底.鏈枃鍘熷垱鑷1point3acres璁哄潧
扎实,或者有别的一技之长保底的,然后再学点ML锦上添花,这样我觉得
比较不错。.鏈枃鍘熷垱鑷1point3acres璁哄潧

如果随便能在kaggle上拿第一的自然另说。如果只是前十,根本没人理。

-----------------------------------------------------------------------------------
发信人: zhaoce073 (迟到早退不思上进的蜥蜴), 信区: DataSciences
标  题: Re: data science Master, 美国哪个大学好?
发信站: BBS 未名空间站 (Sat Jul 26 01:53:46 2014, 美东)

那我建议楼主学分布式计算这个方向
这几门课非常有用
.鏈枃鍘熷垱鑷1point3acres璁哄潧
adv db,不是教sql那些,而是教怎么实现transaction这些原理
还有write ahead log,如何编程实现原子操作,老师如果能讲nosql就perfect

distributed algorithm,不是教简单的复杂度,单机算法,而是教paxos这些. visit 1point3acres.com for more.
教分布式transaction这些,如果能说p2p还有consistent hashing这些就perfect

web search & text analysis,真正的cs应用统计学
教怎么从unstructured data中分析出需要的结论,从bag of words开始说

前提是你必需有cs基础
因为这个时候不会再教算法和数据结构,java,sql和db这种本科生学的东西
【 在 wdong (cybra) 的大作中提到: 】
: 现在这种master program简直就是雨后春笋。基本上就是从统计系和计算机系找几个教
: 授兼职讲讲课。教授其实自己也是啥都不懂,只好按着统计和database那一路教。

评分

1

查看全部评分

回复 支持 3 反对 0

使用道具 举报

dangertrip 发表于 2016-4-22 14:41:45 | 显示全部楼层
窃以为DS也是需要解决问题,用ML或者stat的手段来从数据里面获得一些想要的

所以我觉得做ML的同学会偏科研,而DM就是类似工程师来套轮子解决问题。

其实前后端也是套轮子不是么?
回复 支持 1 反对 0

使用道具 举报

Sin 发表于 2016-4-22 02:05:14 | 显示全部楼层
好好学习代码+刷题才是找工作王道
回复 支持 1 反对 0

使用道具 举报

lha_1313 发表于 2016-4-22 02:47:09 | 显示全部楼层
学感兴趣的 做感兴趣的
回复 支持 反对

使用道具 举报

tingting24 发表于 2016-4-22 03:17:49 | 显示全部楼层
不需要,完全overated
回复 支持 反对

使用道具 举报

houpy 发表于 2016-4-22 05:52:09 | 显示全部楼层
tingting24 发表于 2016-4-22 03:17
不需要,完全overated

well, for me, it's good. Big data helped me find a job.
回复 支持 反对

使用道具 举报

 楼主| ShangShang123 发表于 2016-4-22 07:13:41 | 显示全部楼层
houpy 发表于 2016-4-22 05:52. 1point 3acres 璁哄潧
well, for me, it's good. Big data helped me find a job.
.鏈枃鍘熷垱鑷1point3acres璁哄潧
可以问问big data怎么帮到你的吗? 你的背景也是cs吗?十分感谢!
回复 支持 反对

使用道具 举报

find_advice 发表于 2016-4-22 09:56:40 | 显示全部楼层
其实我觉得学学无妨。

纯写代码的话,现在人越来越多,会不会饱和不好说。DS相关的理论还是需要一些功底的,多学点数学有一技傍身,抗风险性会强一些。毕竟未来如果所有人都会写代码,可能写代码本身就不是核心竞争力了。哪怕对普遍算法有一些基本概念总是好的。

当然不一定要这么看重学位,上上公开课给自己充充电也是好的。
回复 支持 反对

使用道具 举报

 楼主| ShangShang123 发表于 2016-4-22 12:16:08 | 显示全部楼层
find_advice 发表于 2016-4-22 09:56. 涓浜-涓夊垎-鍦帮紝鐙鍙戝竷
其实我觉得学学无妨。

纯写代码的话,现在人越来越多,会不会饱和不好说。DS相关的理论还是需要一些功底 ...
. visit 1point3acres.com for more.
多想指教~我也是这么想得!
回复 支持 反对

使用道具 举报

find_advice 发表于 2016-4-22 13:27:00 | 显示全部楼层
cccpwx 发表于 2016-4-22 13:21. visit 1point3acres.com for more.
我觉得大数据过热了。

---------------------------------------------------------------------------
...

要再深入一些。kaggle那种比赛更多的是用ML解决问题,研究生要深入到ML最基本的原理上。.1point3acres缃

补充内容 (2016-4-22 13:28):. from: 1point3acres.com/bbs
其实kaggle这种比赛更多的是所谓的DM而不是ML,二者略有区别
回复 支持 反对

使用道具 举报

dlstns 发表于 2016-4-22 13:40:58 | 显示全部楼层
mark一下 看看大家都怎么说
回复 支持 反对

使用道具 举报

cccpwx 发表于 2016-4-22 13:57:44 | 显示全部楼层
find_advice 发表于 2016-4-22 13:27.1point3acres缃
要再深入一些。kaggle那种比赛更多的是用ML解决问题,研究生要深入到ML最基本的原理上。

补充内容 (2016 ...

这个是Kaggle几年的第二名。纯数学出身,ML Phd candidate,用的就是最热的深度学习。

http://irakorshunova.github.io/2016/03/15/heart.html
. 鐣欏鐢宠璁哄潧-涓浜╀笁鍒嗗湴
https://irakorshunova.github.io/CV.pdf. from: 1point3acres.com/bbs

-------------------------------------------------------------------
【 在 wdong (cybra) 的大作中提到: 】
: 现在这种master program简直就是雨后春笋。基本上就是从统计系和计算机系找几个教
: 授兼职讲讲课。教授其实自己也是啥都不懂,只好按着统计和database那一路教。. 1point3acres.com/bbs

wdong是北大CS+普林斯顿CS Phd,好像明尼苏达大学请他去教DS program的课。这次他也只拿了Kaggle的前十。
回复 支持 反对

使用道具 举报

paavo 发表于 2016-4-22 15:05:35 | 显示全部楼层
关注,积极读相关的专业,打算还是得往CS上靠
回复 支持 反对

使用道具 举报

芝士达人 发表于 2016-4-22 16:39:18 | 显示全部楼层
I think business analytics is quite different from data science and big data.
回复 支持 反对

使用道具 举报

2016要加油go 发表于 2016-4-23 01:02:12 | 显示全部楼层
我不太建议楼主学business analysis的课程,我是转专业到DS的,也学了一些business analysis的课程,这种课感觉可以把自己包装的很好看,project什么的,但是找工作的话 如果你对自己要求不高一般公司的entrylevel倒是可以找到,但是FLAG那些公司就好好刷题吧真的。你都是CS了 肯定business的课对你来说非常容易的
回复 支持 反对

使用道具 举报

zpinthehouse 发表于 2016-4-23 01:21:07 | 显示全部楼层
find_advice 发表于 2016-4-22 13:27. 1point 3acres 璁哄潧
要再深入一些。kaggle那种比赛更多的是用ML解决问题,研究生要深入到ML最基本的原理上。. 鍥磋鎴戜滑@1point 3 acres

补充内容 (2016 ...

但是master level的课程也好project大多是想kaggle那样用ML的model解决问题。。真的去研究ML的model是phd做的事情。。而且论找工作,data science方面搞research的主要招phd,普通的data analyst入门门槛低,大部分都是搞BA的,浪费了cs的学位。。所以我觉得CS还是以SDE为主比较好,如果搞research再去考虑data science。。
回复 支持 反对

使用道具 举报

2016要加油go 发表于 2016-4-23 02:51:44 | 显示全部楼层
zpinthehouse 发表于 2016-4-23 01:21
但是master level的课程也好project大多是想kaggle那样用ML的model解决问题。。真的去研究ML的model是phd ...

楼上正解。data analyst门槛真的很低 不如多充电几年CS 专注ML的research 如果真的想在Big data这个领域
回复 支持 反对

使用道具 举报

 楼主| ShangShang123 发表于 2016-4-24 21:50:14 | 显示全部楼层
十分感谢大家的意见!

我仔细想了想,觉得首先一点大伙说的没错,cs这块坚决要好好靠牢,算法这些东西才是找好工作的关键,所以我的大部分的时间还是应该投入到这一块

大数据&ml这一块是目前美国最火的topic,但是地里地外的人都觉得这块比较shallow。我对这块不太了解,所以也就跟风同意大家的说法:流行,但是入门低。

不过我认为,在学好cs算法的基础上,把这个做为一个爱好的话,学学也无妨。不求是专家大神,只是希望了解了解现在这个人人都在高颂的topic到底是咋回事。。。

大家轻拍啊。。。我只是个小小白。。。


回复 支持 反对

使用道具 举报

本版积分规则

请点这里访问我们的新网站:一亩三分地Instant.

Instant搜索更强大,不扣积分,内容组织的更好更整洁!目前仍在beta版本,努力完善中!反馈请点这里

关闭

一亩三分地推荐上一条 /5 下一条

手机版|小黑屋|一亩三分地论坛声明 ( 沪ICP备11015994号 )

custom counter

GMT+8, 2016-12-9 03:01

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表