一亩三分地论坛

 找回密码
 获取更多干货,去instant注册!

扫码关注一亩三分地公众号
查看: 2575|回复: 22
收起左侧

[BigData] 求问关于Data Science和Analysis~~

[复制链接] |试试Instant~ |关注本帖
dingxiaoxi 发表于 2014-11-1 10:17:28 | 显示全部楼层 |阅读模式

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?获取更多干货,去instant注册!

x
最近在地里发现了原来统计下面还有这个版块觉得异常兴奋啊,由于给自己的定位是最后想去做big data方向的,读个PhD啥的完全没问题,但是进版后发现和自己想的有点不大一样,所以请各位亲们帮忙解答下呗~~

最开始我的印象中big data好像应该是与理科有很大相关的,比如处理好大好大的实验数据啥的,最后成为一名data scientist,但是版里总是有人提到Data Science/analysis不仅需要一些专业知识,对于表达和沟通的能力也是很看重的,而且觉得版里大家在讨论的基本都是关于商业或金融啥的~~虽然不排斥将来也会做这方面,但是看到表达沟通能力的要求还是让我有点凌乱啊。。。
.1point3acres缃
还有个问题就是,data science和analysis在我看地里的情况,好像后者更偏向于金融啥的吧,有些帖子的data science点进去读完还是很难发现和analysis的区别……所以…求大家解答下呗~~. From 1point 3acres bbs

最后就是,看了熊哥和Purdue教授的话,觉得ms读个统计会挺不错的啊,如果还能自学一些编程的话,觉得这样岂不是会比那些既看重tech又看重social的analysis项目更好申phd嘛??(好吧这是关于一点规划的问题了,还请有经验的前辈不吝赐教啊~~~)
慎独 发表于 2014-11-7 08:24:11 | 显示全部楼层
沟通表达能力的确是很需要的,因为master项目都是就业导向的,你作为一个data scientist需要和一个团队里的组员讨论交流,你需要跟你的boss交流沟通,不是简单的纯技术路线。你想,你做data science的工作是为了帮助你的boss做出正确的商业决定,你需要告诉他跟他解释清楚,你的模型怎么选的,为什么这么选,选出来以后做的结果怎样,为什么用线性不是非线性,为什么是X1*X2的形式,而不是X1^2的形式,这样两个变量的乘积在business上的解释是如何,然后告诉他你的数据支持的决策是什么,比如每个月在什么地方多投入多少万或者减少多少之类的。
前不久我们系主任在学校跟EMC,IBM还有其他公司的大boss开会交流,她说公司里的人说觉得他们的雇员多半是技术过硬,但是觉得缺乏想法,缺乏良好沟通交流的能力。我觉得这是data scientist 最显著区别于别的技术岗位的特点,他们需要一种灵性的思维,不是简单的说你告诉我问题,我来解决。最有价值的是需要创造性地发现问题解决问题的。大数据案例里面,用google搜索来预测疾病流行状况也好,尿布与啤酒的营销案例也好,技术上都很复杂很高端么?不是啊,数据就在那儿放着,但是你怎么会想起来跑哪些变量的回归?. 鐣欏鐢宠璁哄潧-涓浜╀笁鍒嗗湴
就好像《一代宗师》里的叶问和宫家比武,比武是个平局,但是比文最后赢在了想法。我现在觉得叶问就更像是个data scientist的角色:他要是只跟别人比武比力气的话肯定有比他厉害的人,但是历史留名的却不是那些人,因为他赢在了想法。他发扬永春拳弘扬这种文化,让全世界的习武爱好者从他这里获益,这个想法不是那些只会武功不会交流沟通的莽夫可以达到的。
回复 支持 1 反对 0

使用道具 举报

luhanqiao 发表于 2014-11-6 00:58:09 | 显示全部楼层
espange 发表于 2014-11-5 12:42. 1point 3acres 璁哄潧
那mis和DS差别大么??看一个帖子说MIS侧重cs,analytics侧重统计= = 我搞不清到底申MIS好还是申analytics

差很大 = = 没一个字母一样的
MIS == CS+BUSINESS
Analytic == business + statistic
DS == Statistic+CS

评分

1

查看全部评分

回复 支持 1 反对 0

使用道具 举报

 楼主| dingxiaoxi 发表于 2014-11-5 17:12:25 | 显示全部楼层
espange 发表于 2014-11-5 12:42
那mis和DS差别大么??看一个帖子说MIS侧重cs,analytics侧重统计= = 我搞不清到底申MIS好还是申analytics

个人觉得MIS好像是很多文科转cs的首选

评分

1

查看全部评分

回复 支持 1 反对 0

使用道具 举报

luhanqiao 发表于 2014-11-2 15:19:34 | 显示全部楼层
首先你要确定自己能handle许多math以及coding然后考虑data science方向,big data 看你怎么定义,现在随着处理能力的增加原来叫big data的现在只能叫中等或者小量的data。Analysis(Business Analysis)我觉得不能算是 data science, 学点business+统计+communication+一点码,倾向于就业导向而不是技术。
如果你学统计,偏数学轻coding,可能最后只能当个analyst用用SAS,顶多用R编编function,而不是data scientist。
data science我觉得其实是偏CS多于统计,如何提出合适的问题,寻找相关的data,然后清理data,发现建立模型,这些都和CS分不开,学统计天天推公式搞证明我觉得很没用。

评分

1

查看全部评分

回复 支持 反对

使用道具 举报

luhanqiao 发表于 2014-11-2 15:19:48 | 显示全部楼层
首先你要确定自己能handle许多math以及coding然后考虑data science方向,big data 看你怎么定义,现在随着处理能力的增加原来叫big data的现在只能叫中等或者小量的data。Analysis(Business Analysis)我觉得不能算是 data science, 学点business+统计+communication+一点码,倾向于就业导向而不是技术。
如果你学统计,偏数学轻coding,可能最后只能当个analyst用用SAS,顶多用R编编function,而不是data scientist。
data science我觉得其实是偏CS多于统计,如何提出合适的问题,寻找相关的data,然后清理data,发现建立模型,这些都和CS分不开,学统计天天推公式搞证明我觉得很没用。
回复 支持 反对

使用道具 举报

 楼主| dingxiaoxi 发表于 2014-11-2 15:43:59 | 显示全部楼层
luhanqiao 发表于 2014-11-2 15:19
首先你要确定自己能handle许多math以及coding然后考虑data science方向,big data 看你怎么定义,现在随着 ...
. 1point3acres.com/bbs
首先很谢谢你的回答啦~~~
. 鐣欏鐢宠璁哄潧-涓浜╀笁鍒嗗湴
虽说data science可能更偏CS一点,但是觉得打基础啥的不是用统计更好嘛?
回复 支持 反对

使用道具 举报

小K 发表于 2014-11-2 16:03:47 | 显示全部楼层
dingxiaoxi 发表于 2014-11-1 23:43
首先很谢谢你的回答啦~~~. 鐗涗汉浜戦泦,涓浜╀笁鍒嗗湴

虽说data science可能更偏CS一点,但是觉得打基础啥的不是用统计更好嘛?

No.
DS for big data is mostly CS plus a bit of stats.

Even if you have a PhD in stats, if your coding skill is light, it would be extremely hard to get into a "real" DS for big data position.
回复 支持 反对

使用道具 举报

小K 发表于 2014-11-2 16:06:36 | 显示全部楼层
and by coding skills, i mean you do have to know at least a scripting language like python or perl, a compiled language, like java, you have to know the basic data structure and algorithm, know the big O notation, know some basic SQL, and are willing to learn doing some basic stuff in mapreduce.

If you are a DS in big data, it would be very rare if you spend 20%+ of your time doing stats (i mean stat modeling and inference, not counting reports or visualization). and you will for sure do quite a bit of coding.
回复 支持 反对

使用道具 举报

 楼主| dingxiaoxi 发表于 2014-11-2 16:53:55 | 显示全部楼层
小K 发表于 2014-11-2 16:06
and by coding skills, i mean you do have to know at least a scripting language like python or perl,  ...

So to be more specific, the better way to a DS is to study for a CS master then a PhD? What about a stat master and then applying for PhD in DS?
回复 支持 反对

使用道具 举报

小K 发表于 2014-11-2 19:28:49 | 显示全部楼层
what is phd in DS?
回复 支持 反对

使用道具 举报

 楼主| dingxiaoxi 发表于 2014-11-2 19:32:32 | 显示全部楼层


maybe just like doing something deeper in data science?
回复 支持 反对

使用道具 举报

Ryan_Panda 发表于 2014-11-2 19:57:06 | 显示全部楼层
dingxiaoxi 发表于 2014-11-2 19:32
maybe just like doing something deeper in data science?
. from: 1point3acres.com/bbs
要申DS的同学路过。
我看的大部分学校DS学到顶是master,没有Phd
回复 支持 反对

使用道具 举报

 楼主| dingxiaoxi 发表于 2014-11-2 20:55:05 | 显示全部楼层
Ryan_Panda 发表于 2014-11-2 19:57.1point3acres缃
要申DS的同学路过。
我看的大部分学校DS学到顶是master,没有Phd

我觉得DS只是一个大方向吧,应该是在有扎实的基础上才玩得来的,愚见
回复 支持 反对

使用道具 举报

luhanqiao 发表于 2014-11-2 23:10:33 | 显示全部楼层
if you refer DS PHD ad something deeper in big data, then phd in CS specialized in machine learning or data mining is a good choice. Of course you may like to do a stat Phd if you are more interested in math and build stat modeling, but this is definately not enough for big data.
stat ms ==math && != data science
DS ms = CS+a bit stat && DS ms instanceof CS
回复 支持 反对

使用道具 举报

 楼主| dingxiaoxi 发表于 2014-11-2 23:12:57 | 显示全部楼层
luhanqiao 发表于 2014-11-2 23:10
if you refer DS PHD ad something deeper in big data, then phd in CS specialized in machine learning  ...
. 鐗涗汉浜戦泦,涓浜╀笁鍒嗗湴
哈哈一目了然!拜谢了~~~
回复 支持 反对

使用道具 举报

Blogo 发表于 2014-11-3 16:48:06 | 显示全部楼层
小K 发表于 2014-11-2 16:06
-google 1point3acresand by coding skills, i mean you do have to know at least a scripting language like python or perl,  ...

Basic SQL感觉不太够吧,DS应该对数据库要求蛮高的。
回复 支持 反对

使用道具 举报

小K 发表于 2014-11-3 18:04:31 | 显示全部楼层
想学的深的话职位反而出路更窄,即使你要phd,肯定也是偏重CS
if you have stat phD + CS MS,那的确可以当不错的数据科学家,你可以尝试的职位会在大IT公司和MSR之类的地方
但是还是不如PhD in ML的职位多。
回复 支持 反对

使用道具 举报

小K 发表于 2014-11-3 18:05:47 | 显示全部楼层
Blogo 发表于 2014-11-3 00:48
Basic SQL感觉不太够吧,DS应该对数据库要求蛮高的。

看公司
facebook问的仔细,因为他们用hive之类吧
越接近科研的组问的越少. 鐗涗汉浜戦泦,涓浜╀笁鍒嗗湴
回复 支持 反对

使用道具 举报

 楼主| dingxiaoxi 发表于 2014-11-3 20:40:37 | 显示全部楼层
小K 发表于 2014-11-3 18:04
想学的深的话职位反而出路更窄,即使你要phd,肯定也是偏重CS
if you have stat phD + CS MS,那的确可以 ...

谢谢小K啦~算是有点头绪了~~
回复 支持 反对

使用道具 举报

espange 发表于 2014-11-5 12:42:15 | 显示全部楼层
那mis和DS差别大么??看一个帖子说MIS侧重cs,analytics侧重统计= = 我搞不清到底申MIS好还是申analytics
回复 支持 反对

使用道具 举报

本版积分规则

请点这里访问我们的新网站:一亩三分地Instant.

Instant搜索更强大,不扣积分,内容组织的更好更整洁!目前仍在beta版本,努力完善中!反馈请点这里

关闭

一亩三分地推荐上一条 /5 下一条

手机版|小黑屋|一亩三分地论坛声明 ( 沪ICP备11015994号 )

custom counter

GMT+8, 2016-12-11 14:55

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表