在国外一跟老外吵架口语立刻就不够用了

一亩三分地论坛

 找回密码
 Sign Up 注册获取更多干货
E轮2.5亿美元融资
K12教育独角兽一起作业
北京-诚聘人工智能/教育/大数据岗
坐标湾区
Games Startup
招聘游戏开发工程师
游戏初创公司招聘工程师、UIUX Designer和游戏策划
码农求职神器Triplebyte:
不用海投
内推多家公司面试
把贵司招聘信息放这里
查看: 1874|回复: 7
收起左侧

如果以Data Scientist 作为职业愿景,地理位置到底有多重要?

[复制链接] |试试Instant~ |关注本帖
karte_polo 发表于 2015-4-27 21:58:46 | 显示全部楼层 |阅读模式

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?Sign Up 注册获取更多干货

x
我想问问大家,地理位置对于找Data Scientist方向的工作(不是Data Engineer哦),到底有多重要呢?
比方说,一个会统计的码工在麻省波士顿这儿会比一个会码的STAT/OR在加州找DATA 方向的工作更容易吗?两个地区在DATA方向的机会到底差距有多大呢?
希望在职的前辈们能分享一些相关经验,也欢迎大家踊跃参与讨论,迷茫的LZ就指望你们了(没错,LZ现在就陷入这样两难的境地,难以抉择啊- -)
aegis 发表于 2015-4-27 22:30:55 | 显示全部楼层
帮你顶一下。。同求建议。。哈哈
回复 支持 反对

使用道具 举报

 楼主| karte_polo 发表于 2015-4-29 20:07:51 | 显示全部楼层
看来是无人分享呐

LZ说点自己的想法,权当抛砖引玉,望各位轻拍;

于我看来,之所以造成今日会码的统计远不如会统计的码工找DATA方向坑的原因,是因为目前海量数据带来的优势是统计的精巧模型所不能比拟的(当你有了海量数据,就相当于有了样本总体,还需要基于概率论与统计的参数估计么?),所以会MAPREDUCE问题,拥有码代码抓取、处理海量数据的能力是能否找到DATA 职位的关键。

如果以上YY成立的话,那基本上只要会SQL(这个可以通过MOOC或者ELECTIVE解决) 数据结构和算法(可以顺带学个C++或者JAVA) 和一门OOP的语言就行了(或者PYTHON这种胶水语言)。现在很多项目一般都会有自由选修课吧,那选修这三门,再加上本专业培养的建模能力和课余时间打KAGGLE积累的项目经验,这样一来应该能够在找DATA方向职位的时候有了一争之力了吧?
回复 支持 反对

使用道具 举报

taomudehua 发表于 2015-4-29 22:22:19 | 显示全部楼层
顶。。同迷茫ing
回复 支持 反对

使用道具 举报

wwtpcsuper 发表于 2015-4-29 22:50:29 | 显示全部楼层
大概idea是对的,结论也是对的。
. visit 1point3acres for more.
但是海量数据是优势,有了就不需要参数估计了是对大数据的误解
回复 支持 反对

使用道具 举报

小K 发表于 2015-4-30 04:08:13 | 显示全部楼层
wwtpcsuper 发表于 2015-4-29 06:50
大概idea是对的,结论也是对的。

但是海量数据是优势,有了就不需要参数估计了是对大数据的误解

2nd this

basic sums and averages are only the first steps

in any business, pretty soon, given you are doing well, your business needs will go beyond simple summaries, and will need deeper expertise. Some skills can allow you to quickly AB test many things together, increasing output. Some enable you to run complex experiments efficiently (expt design, bandit etc). Some use sophisticated predictions (more on the ML side, like recommendation system, ranking, etc), most business will have some unique ranking challenges. observed change can have vastly meanings: shift in cohort composition? or sth caused by product change? (causal inference) ML as on textbook does not seem that hard, just call a package, right? but what about model evaluation? How do you know if it really worked? data leakage? online vs offline? how often should you refresh model? etc...... from: 1point3acres

a good SDE is not necessarily a good data scientist - sometimes can be terrible actually, since SDEs tend to "know just enough to be dangerous".

btw many people straight from academia tend to have weaker data sense. ie always be mindful of what the data means, to the bigger problem at hand. Many people tend to quickly go down a rabbit hole deeply involved in complex model


============. Waral 博客有更多文章,
i dont think location matters that much, as long as you are good enough
回复 支持 反对

使用道具 举报

dummy88 发表于 2015-5-2 19:27:34 | 显示全部楼层
小K 发表于 2015-4-30 04:08. 1point 3acres 论坛
2nd this

basic sums and averages are only the first steps

i dont think location matters that much, as long as you are good enough. 牛人云集,一亩三分地





回复 支持 反对

使用道具 举报

 楼主| karte_polo 发表于 2015-5-7 01:34:03 | 显示全部楼层
小K 发表于 2015-4-30 04:08
2nd this

basic sums and averages are only the first steps

谢谢K姐赏光!您说的我非常同意,MODEL VALIDATION 以及 每个MODEL背后是否有BUSINESS LOGIC支撑非常重要,若是一味依赖于ML暴力黑盒的算法,势必做不好DATA SCIENCE;同样的,过分痴迷于FANCY MODEL 却没有足够的DATA SENSE,也很容易陷在海量的数据迷宫中,这个职业既需要扎实的码功、对统计模型的理解,也需实际商业项目的积累。
另外,我想再追问一下,在您看来,统计模型的理解和掌握程度,与CODE和算法设计能力相比,两个更适合自学呢?还有就是HIVE HADOOP平台的实际经验,是不是在找DATA SCIENCE工作的时候非常重要呢?谢谢!
回复 支持 反对

使用道具 举报

本版积分规则

提醒:发帖可以选择内容隐藏,部分板块支持匿名发帖。请认真读完以下全部说明:

■隐藏内容方法: [hide=200]你想要隐藏的内容比如面经[/hide]
■意思是:用户积分低于200则看不到被隐藏的内容
■可以自行设置积分值,不建议太高(200以上太多人看不到),也不建议太低(那就没必要隐藏了)
■建议只隐藏关键内容,比如具体的面试题目、涉及隐私的信息,大部分内容没必要隐藏。
■微信/QQ/电子邮件等,为防止将来被骚扰甚至人肉,以论坛私信方式发给对方最安全。
■匿名发帖的板块和方法:http://www.1point3acres.com/bbs/thread-405991-1-1.html

关闭

一亩三分地推荐上一条 /5 下一条

手机版|小黑屋|一亩三分地论坛声明

custom counter

GMT+8, 2018-5-23 12:56

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表