一亩三分地论坛

 找回密码
 获取更多干货,去instant注册!

扫码关注一亩三分地公众号
查看: 2604|回复: 23
收起左侧

[DataScience] 关于kaggle

[复制链接] |试试Instant~ |关注本帖
NeilZhao 发表于 2016-3-8 12:44:40 | 显示全部楼层 |阅读模式

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?获取更多干货,去instant注册!

x
即将赴美念DS的master,估计要以此为业了最近想着刷kaggle,下了一个数据,刚开始分析,不知道kaggle在数科这个行当是什么地位?比如做research会不会看?招工会不会看?拿奖金难度有多大呢?
欢迎大家讨论下,如果有北京的朋友欢迎面基组队
小K 发表于 2016-3-8 14:29:44 | 显示全部楼层
research不会看 --
hiring 个人感觉:不太会看,你列上,可以,但是面试的时候必须回答的上具体问题。
我面人的时候遇到的candidate列kaggle项目,会仔细问具体方法,有的人的确做的非常好,可是有的(fresh MS) 除了简单书本知识,也说不上任何其他内容。
kaggle纠结最后那一点点的准确度什么的,但是实际遇到问题你经常需要顾及系统,feature engineering的简单,计算速度,可行性,可懂程度什么的,跟kaggle做事角度不完全相同。

not all data science problems are machine learning prediction problems
in real life you often have to find the right data and perform lots of cleaning/EDA
in real life you may or may not even have a clearly defined question

i personally am not a fan of kaggle -- it may add or detract from working successfully as a data scientist in a particular company.

for example, kaggle people usually take any problem and turn them into a ML prediction problem 很多情况下根本就驴唇不对马嘴。

评分

1

查看全部评分

回复 支持 1 反对 0

使用道具 举报

liziyuan 发表于 2016-3-8 13:01:12 | 显示全部楼层
占位看答案哈哈
回复 支持 反对

使用道具 举报

cherryfaraway 发表于 2016-3-8 13:12:33 | 显示全部楼层
同占位。等大神。
回复 支持 反对

使用道具 举报

Zhengbanduoduo 发表于 2016-3-8 13:20:13 | 显示全部楼层
占位求答案~ps. Quora上有人问过这个问题,但是回答不多,大家也可以关注下
回复 支持 反对

使用道具 举报

liziyuan 发表于 2016-3-8 14:36:04 | 显示全部楼层
小K 发表于 2016-3-8 14:29
research不会看 -- . From 1point 3acres bbs
hiring 个人感觉:不太会看,你列上,可以,但是面试的时候必须回答的上具体问题。
...

谢谢解答~那请问如果走的是量化金融方向呢?感觉ML在quant的应用主要就是预测?不知道理解对不对
回复 支持 反对

使用道具 举报

小K 发表于 2016-3-8 14:41:06 | 显示全部楼层
liziyuan 发表于 2016-3-7 22:36
谢谢解答~那请问如果走的是量化金融方向呢?感觉ML在quant的应用主要就是预测?不知道理解对不对

sorry i have no idea about quant
回复 支持 反对

使用道具 举报

 楼主| NeilZhao 发表于 2016-3-8 14:56:08 | 显示全部楼层
小K 发表于 2016-3-8 14:29. more info on 1point3acres.com
research不会看 -- .1point3acres缃
hiring 个人感觉:不太会看,你列上,可以,但是面试的时候必须回答的上具体问题。
...

多谢K姐回答,从就业角度来说刷一篇论文和参与两三个Kaggle比赛哪个会更有帮助呢
回复 支持 反对

使用道具 举报

小K 发表于 2016-3-8 15:06:14 | 显示全部楼层
NeilZhao 发表于 2016-3-7 22:56
多谢K姐回答,从就业角度来说刷一篇论文和参与两三个Kaggle比赛哪个会更有帮助呢
. from: 1point3acres.com/bbs
for MS?
用处都有限吧。。。paper如果不是相关领域的也然并卵. more info on 1point3acres.com
这些都没有一个实习管用

kaggle is a ML competition, not all DS jobs are ML
and most ML used in industry have nothing to do with 高大上算法
回复 支持 反对

使用道具 举报

 楼主| NeilZhao 发表于 2016-3-8 15:13:22 | 显示全部楼层
小K 发表于 2016-3-8 15:06
for MS?
用处都有限吧。。。paper如果不是相关领域的也然并卵
这些都没有一个实习管用

作为在校生,表示很容易就被HighBigUp算法吸引了
回复 支持 反对

使用道具 举报

RARARAAAAA 发表于 2016-3-8 15:29:48 | 显示全部楼层
https://www.kaggle.com/ys19931006
有机会可以组个队。但是kaggle对于ds工作实际用处并不大,竞赛大多数时间还是在钻牛角尖,比如一个很简单做出来的排500名的模型,和非常非常难做出来的排第5的模型其实差距非常小。kaggle也就是让那些PHD娱乐娱乐,秀秀花式stack,花式mata feature,普通人完全不用考虑。如果python/R用得熟练了,倒是建议先学习一个存储管理系统如:hadoop/spark/hive/sql,和一个visualization的软件:如tableau/cognos/power BI/dom.

评分

3

查看全部评分

回复 支持 反对

使用道具 举报

RARARAAAAA 发表于 2016-3-8 15:36:26 | 显示全部楼层
liziyuan 发表于 2016-3-8 14:36
谢谢解答~那请问如果走的是量化金融方向呢?感觉ML在quant的应用主要就是预测?不知道理解对不对

据我所知,金融数据是非常随机的,ML在quant的方面完全没有用啊,不然大家早发了。quant用的应该是随机方法比较多。
回复 支持 反对

使用道具 举报

小K 发表于 2016-3-8 16:52:09 | 显示全部楼层
quant trading seems to use advanced ML stuff
not sure what it is about tho
回复 支持 反对

使用道具 举报

liziyuan 发表于 2016-3-8 17:49:37 | 显示全部楼层
小K 发表于 2016-3-8 16:52
quant trading seems to use advanced ML stuff
not sure what it is about tho

所以用还是不用呢…据我了解业内还是在不断尝试的
回复 支持 反对

使用道具 举报

liziyuan 发表于 2016-3-8 17:50:13 | 显示全部楼层
RARARAAAAA 发表于 2016-3-8 15:36
据我所知,金融数据是非常随机的,ML在quant的方面完全没有用啊,不然大家早发了。quant用的应该是随机方 ...

据我了解业内还是有不少人在尝试的…不过的确是没出什么大的成果
回复 支持 反对

使用道具 举报

 楼主| NeilZhao 发表于 2016-3-8 18:18:56 | 显示全部楼层
liziyuan 发表于 2016-3-8 17:50
据我了解业内还是有不少人在尝试的…不过的确是没出什么大的成果

暑假参加了大摩这方面的夏令营,个人感觉直接针对价格序列的话,如何设计feature是重中之重,毕竟基础的ML算法只是对特征空间划分方法的不同。
另外,其实HFT真的不需要有多明显的效果,毕竟噪声太大。50%+的正确率交易次数上去了,能覆盖手续费就行了
回复 支持 反对

使用道具 举报

 楼主| NeilZhao 发表于 2016-3-8 18:22:12 | 显示全部楼层
RARARAAAAA 发表于 2016-3-8 15:29
https://www.kaggle.com/ys19931006
有机会可以组个队。但是kaggle对于ds工作实际用处并不大,竞赛大多数 ...

好啊,等这两天忙过了开始弄kaggle了联系你,新手,还希望多交流
回复 支持 反对

使用道具 举报

liziyuan 发表于 2016-3-8 18:28:46 | 显示全部楼层
NeilZhao 发表于 2016-3-8 18:18
暑假参加了大摩这方面的夏令营,个人感觉直接针对价格序列的话,如何设计feature是重中之重,毕竟基础的M ...

谢谢资讯!话说大摩这个夏令营是怎么参加的?愿意分享一些培训的资料什么的吗 非常感兴趣…
回复 支持 反对

使用道具 举报

 楼主| NeilZhao 发表于 2016-3-8 18:37:44 | 显示全部楼层
liziyuan 发表于 2016-3-8 18:28
谢谢资讯!话说大摩这个夏令营是怎么参加的?愿意分享一些培训的资料什么的吗 非常感兴趣…

哦 这个可以网上搜一搜 都有的 每年主题都不一定
回复 支持 反对

使用道具 举报

liziyuan 发表于 2016-3-8 19:02:56 | 显示全部楼层
NeilZhao 发表于 2016-3-8 18:37
哦 这个可以网上搜一搜 都有的 每年主题都不一定

好的 谢谢!
回复 支持 反对

使用道具 举报

本版积分规则

请点这里访问我们的新网站:一亩三分地Instant.

Instant搜索更强大,不扣积分,内容组织的更好更整洁!目前仍在beta版本,努力完善中!反馈请点这里

关闭

一亩三分地推荐上一条 /5 下一条

手机版|小黑屋|一亩三分地论坛声明 ( 沪ICP备11015994号 )

custom counter

GMT+8, 2016-12-5 10:35

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表