一亩三分地论坛

 找回密码
 获取更多干货,去instant注册!

扫码关注一亩三分地公众号
查看: 1475|回复: 7
收起左侧

[DataScience] 如果以Data Scientist 作为职业愿景,地理位置到底有多重要?

[复制链接] |试试Instant~ |关注本帖
karte_polo 发表于 2015-4-27 21:58:46 | 显示全部楼层 |阅读模式

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?获取更多干货,去instant注册!

x
我想问问大家,地理位置对于找Data Scientist方向的工作(不是Data Engineer哦),到底有多重要呢?
比方说,一个会统计的码工在麻省波士顿这儿会比一个会码的STAT/OR在加州找DATA 方向的工作更容易吗?两个地区在DATA方向的机会到底差距有多大呢?
希望在职的前辈们能分享一些相关经验,也欢迎大家踊跃参与讨论,迷茫的LZ就指望你们了(没错,LZ现在就陷入这样两难的境地,难以抉择啊- -)
aegis 发表于 2015-4-27 22:30:55 | 显示全部楼层
帮你顶一下。。同求建议。。哈哈
回复 支持 反对

使用道具 举报

 楼主| karte_polo 发表于 2015-4-29 20:07:51 | 显示全部楼层
看来是无人分享呐

LZ说点自己的想法,权当抛砖引玉,望各位轻拍;

于我看来,之所以造成今日会码的统计远不如会统计的码工找DATA方向坑的原因,是因为目前海量数据带来的优势是统计的精巧模型所不能比拟的(当你有了海量数据,就相当于有了样本总体,还需要基于概率论与统计的参数估计么?),所以会MAPREDUCE问题,拥有码代码抓取、处理海量数据的能力是能否找到DATA 职位的关键。. 涓浜-涓夊垎-鍦帮紝鐙鍙戝竷

如果以上YY成立的话,那基本上只要会SQL(这个可以通过MOOC或者ELECTIVE解决) 数据结构和算法(可以顺带学个C++或者JAVA) 和一门OOP的语言就行了(或者PYTHON这种胶水语言)。现在很多项目一般都会有自由选修课吧,那选修这三门,再加上本专业培养的建模能力和课余时间打KAGGLE积累的项目经验,这样一来应该能够在找DATA方向职位的时候有了一争之力了吧?
回复 支持 反对

使用道具 举报

taomudehua 发表于 2015-4-29 22:22:19 | 显示全部楼层
顶。。同迷茫ing
回复 支持 反对

使用道具 举报

wwtpcsuper 发表于 2015-4-29 22:50:29 | 显示全部楼层
大概idea是对的,结论也是对的。

但是海量数据是优势,有了就不需要参数估计了是对大数据的误解
回复 支持 反对

使用道具 举报

小K 发表于 2015-4-30 04:08:13 | 显示全部楼层
wwtpcsuper 发表于 2015-4-29 06:50
大概idea是对的,结论也是对的。

但是海量数据是优势,有了就不需要参数估计了是对大数据的误解

2nd this
. more info on 1point3acres.com
basic sums and averages are only the first steps-google 1point3acres
. 涓浜-涓夊垎-鍦帮紝鐙鍙戝竷
in any business, pretty soon, given you are doing well, your business needs will go beyond simple summaries, and will need deeper expertise. Some skills can allow you to quickly AB test many things together, increasing output. Some enable you to run complex experiments efficiently (expt design, bandit etc). Some use sophisticated predictions (more on the ML side, like recommendation system, ranking, etc), most business will have some unique ranking challenges. observed change can have vastly meanings: shift in cohort composition? or sth caused by product change? (causal inference) ML as on textbook does not seem that hard, just call a package, right? but what about model evaluation? How do you know if it really worked? data leakage? online vs offline? how often should you refresh model? etc.....

a good SDE is not necessarily a good data scientist - sometimes can be terrible actually, since SDEs tend to "know just enough to be dangerous".

btw many people straight from academia tend to have weaker data sense. ie always be mindful of what the data means, to the bigger problem at hand. Many people tend to quickly go down a rabbit hole deeply involved in complex model
.1point3acres缃

============
i dont think location matters that much, as long as you are good enough
回复 支持 反对

使用道具 举报

dummy88 发表于 2015-5-2 19:27:34 | 显示全部楼层
小K 发表于 2015-4-30 04:08
2nd this

basic sums and averages are only the first steps

i dont think location matters that much, as long as you are good enough





回复 支持 反对

使用道具 举报

 楼主| karte_polo 发表于 2015-5-7 01:34:03 | 显示全部楼层
小K 发表于 2015-4-30 04:08
2nd this. 鍥磋鎴戜滑@1point 3 acres

basic sums and averages are only the first steps

谢谢K姐赏光!您说的我非常同意,MODEL VALIDATION 以及 每个MODEL背后是否有BUSINESS LOGIC支撑非常重要,若是一味依赖于ML暴力黑盒的算法,势必做不好DATA SCIENCE;同样的,过分痴迷于FANCY MODEL 却没有足够的DATA SENSE,也很容易陷在海量的数据迷宫中,这个职业既需要扎实的码功、对统计模型的理解,也需实际商业项目的积累。. Waral 鍗氬鏈夋洿澶氭枃绔,
另外,我想再追问一下,在您看来,统计模型的理解和掌握程度,与CODE和算法设计能力相比,两个更适合自学呢?还有就是HIVE HADOOP平台的实际经验,是不是在找DATA SCIENCE工作的时候非常重要呢?谢谢!
回复 支持 反对

使用道具 举报

本版积分规则

请点这里访问我们的新网站:一亩三分地Instant.

Instant搜索更强大,不扣积分,内容组织的更好更整洁!目前仍在beta版本,努力完善中!反馈请点这里

关闭

一亩三分地推荐上一条 /5 下一条

手机版|小黑屋|一亩三分地论坛声明 ( 沪ICP备11015994号 )

custom counter

GMT+8, 2016-12-9 15:59

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表