一亩三分地论坛

 找回密码
 获取更多干货,去instant注册!

扫码关注一亩三分地公众号
查看: 1646|回复: 26
收起左侧

[DataScience] 非stat非cs转行da打卡贴

[复制链接] |试试Instant~ |关注本帖
hlbt 发表于 2016-1-21 06:21:59 | 显示全部楼层 |阅读模式

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?获取更多干货,去instant注册!

x
本帖最后由 hlbt 于 2016-1-21 07:01 编辑

lz ms刚毕业,专业是geophysics。念本专业的最后一个学期发现对Data Science感兴趣,想做自己感兴趣的职业,所以不打算找自己本专业的工作,打算转行,现在家里蹲充电。所学专业也是理工科,基础的数学课都有上过,但是需要复习。matlab用的比较熟练,会一点python和R,shell scripting和并行计算也会一点(这些估计然并卵吧)。sql没用过,也打算学。现在打算狂刷coursera udacity data analysis和ml 公开课加学习版上各位大大们推荐的资料再加lc刷题。总之lz还是个小白,慢慢摸索中。。。
目标是找到一份junior data analyst的工作。再去申请读一个相关ms学位暂时还没考虑,觉得消耗时间和钱,现阶段想先学习各种技能提高自己。
如果大家有关于学习方面的建议欢迎砸过来哈。.鐣欏璁哄潧-涓浜-涓夊垎鍦
这只猫叫公爵 发表于 2016-1-21 12:30:20 | 显示全部楼层
我来说一下我自己的学习历程:1.机器学习方面:coursera ng ml, 斯坦福 stt learning+配套的书,这两部分下来觉得对机器学习和统计学习都有了入门的感觉,esl 我不太推荐,太难了,里面的公式推导太多了,涉及到矩阵微分什么的,建议看斯坦福那个配套的书,链接在此:https://lagunita.stanford.edu/courses/HumanitiesandScience/StatLearning/Winter2015/courseware/41ce0170b29f43ab9d490b5f37d16fdf/
里面课程和书都有
2.目前正在看 design and analysis of experiment 就是 DOE, 建议对照K姐的帖子来完善自己的知识储备
3.统计方面t-test p-vaule power anova(方差分析),等等也是按照K姐的帖子给出的书来看的
4. python很早前就学过,python for data analysis 这本书好好敲敲代码没多大问题;
5. hadoop生态圈,hdfs mapreduce yarn hive hbase...基本介绍,我是跟的公开课 地址如下:https://www.coursera.org/learn/hadoop/home/welcome 很基础,适合入门。
以上就是我知道的了,希望大家一起学习进步.鏈枃鍘熷垱鑷1point3acres璁哄潧

评分

2

查看全部评分

回复 支持 3 反对 0

使用道具 举报

 楼主| hlbt 发表于 2016-1-21 06:27:18 | 显示全部楼层
昨天算是正式开始吧。
注册了udacity的ML系列的课,完成week1 intro to AI。同时复习statistics。小k的http://www.1point3acres.com/bbs/thread-76429-1-1.html 里面有很多干货。太赞了!
回复 支持 反对

使用道具 举报

BabeLucia 发表于 2016-1-21 11:00:20 | 显示全部楼层
要不是专业不一样我都要以为这是我梦游发的帖了。。。
LZ我会的东西跟你差不多,现在蹲家里补各种知识点,也是打算找data science方向的工作,以后多交流呀~~
回复 支持 反对

使用道具 举报

 楼主| hlbt 发表于 2016-1-21 11:40:36 | 显示全部楼层
BabeLucia 发表于 2016-1-21 11:00
要不是专业不一样我都要以为这是我梦游发的帖了。。。
LZ我会的东西跟你差不多,现在蹲家里补各种 ...
. from: 1point3acres.com/bbs
嗯嗯,握手。一定多交流呀,一起摸索〜
话说你是什么专业啊
回复 支持 反对

使用道具 举报

BabeLucia 发表于 2016-1-21 12:01:54 | 显示全部楼层
hlbt 发表于 2016-1-21 11:40
嗯嗯,握手。一定多交流呀,一起摸索〜.鏈枃鍘熷垱鑷1point3acres璁哄潧
话说你是什么专业啊

我是计算数学专业,也是matlab用的最多,整点儿simulation啥的。。。最多拿python处理点儿实验数据。。。parallel computing也学过但是感觉没啥卵用...哈哈是不是和你很像~~~

统计,machine learning这些,知道一些皮毛,感觉需要找本书仔细看看,现在打算是啃ESL
lc我用python,刚刷完easy
回复 支持 反对

使用道具 举报

 楼主| hlbt 发表于 2016-1-21 13:22:35 | 显示全部楼层
BabeLucia 发表于 2016-1-21 12:01
我是计算数学专业,也是matlab用的最多,整点儿simulation啥的。。。最多拿python处理点儿实验数据。。。 ...
鏉ユ簮涓浜.涓夊垎鍦拌鍧.
嗯嗯,我专业也是写过代码,做inversion什么的,但是写过的code也不是ds这种的,你懂的。。
我还正在学习皮毛中。。这两天在看各种introduction和复习stat,再就是准备找门database的网课上着。。 我目前还没打算看相关的书,想各种信息都了解下,再找书啃。ESL刚看到楼下说公式推导很多。。。
回复 支持 反对

使用道具 举报

 楼主| hlbt 发表于 2016-1-21 13:26:38 | 显示全部楼层
这只猫叫公爵 发表于 2016-1-21 12:30
我来说一下我自己的学习历程:1.机器学习方面:coursera ng ml, 斯坦福 stt learning+配套的书,这两部分 ...

多谢回复!我也是参考了k组的贴子,里面有用的资源很多,感觉你已经学了很多了,大家一起加油!
回复 支持 反对

使用道具 举报

 楼主| hlbt 发表于 2016-1-21 13:31:51 | 显示全部楼层
这只猫叫公爵 发表于 2016-1-21 12:30
我来说一下我自己的学习历程:1.机器学习方面:coursera ng ml, 斯坦福 stt learning+配套的书,这两部分 ...

对了,python for data analysis用的是这本吗?http://www.amazon.com/Python-Dat ... ython/dp/1449319793
回复 支持 反对

使用道具 举报

这只猫叫公爵 发表于 2016-1-21 13:36:02 | 显示全部楼层
hlbt 发表于 2016-1-21 13:31
对了,python for data analysis用的是这本吗?http://www.amazon.com/Python-Data-Analysis-Wrangling-I ...

就是这本  我有电子版的 你需要吗
回复 支持 反对

使用道具 举报

 楼主| hlbt 发表于 2016-1-21 13:43:10 | 显示全部楼层
这只猫叫公爵 发表于 2016-1-21 13:36
就是这本  我有电子版的 你需要吗

Ok. 刚从网上下了一本〜
回复 支持 反对

使用道具 举报

 楼主| hlbt 发表于 2016-1-21 14:18:45 | 显示全部楼层
本帖最后由 hlbt 于 2016-1-21 14:20 编辑

1/20/15
Online Statistics Education Chapter 1
Intro to ML , Intro to DS from Udacityand 持续收集学习资料。。
回复 支持 反对

使用道具 举报

BabeLucia 发表于 2016-1-21 23:50:50 来自手机 | 显示全部楼层
hlbt 发表于 2016-1-21 13:22. 1point 3acres 璁哄潧
嗯嗯,我专业也是写过代码,做inversion什么的,但是写过的code也不是ds这种的,你懂的。。
我还正在学 ...

嗯 ESL推导确实比较多,内容也更多更深一些。如果不喜欢太多数学的话可以看简化版,是个很好的starting point。(就是前面同学推荐的那个,和ESL是同一群作者,而且有公开课。)其实说起来我打算啃ESL正好是因为它detail多,因为看简化版的时候会觉得有些地方讲的比较笼统。

统计的基本知识点你是怎么复习的?我过了一遍udacity的intro to stats感觉太浅了,打算接下来过一下另外两门(Intro to descriptive/inferential stats) ,也不知道够不够。
回复 支持 反对

使用道具 举报

 楼主| hlbt 发表于 2016-1-22 01:49:26 | 显示全部楼层
BabeLucia 发表于 2016-1-21 23:50
嗯 ESL推导确实比较多,内容也更多更深一些。如果不喜欢太多数学的话可以看简化版,是个很好的starting p ...
. from: 1point3acres.com/bbs
我现在用的这个http://onlinestatbook.com/2/index.html 也是小k推荐的。有文字版也有video。也是introductory level,看目录里面含的基本知识点还算比较全。就跟着溜一遍吧。比udacity的intro感觉稍微好点。再advanced一点的我计划做具体的project时候再缺啥补啥吧。。。
回复 支持 反对

使用道具 举报

north_sas 发表于 2016-1-22 12:06:37 | 显示全部楼层
握个手,也算earth专业的,在刷统计master。我觉得吧,统计理论找个国内的“概率论和数理统计”的书看看就行了,然后就是学regression和logistics regression,再然后再学machine learning,code把SQL+R/Python/SAS学学就够了。Hadoop/Spark,数据结构算法,刷题,DOE,Time Series, Bayesian et al. 这些都可以放一放以后再学。
回复 支持 反对

使用道具 举报

 楼主| hlbt 发表于 2016-1-22 13:26:43 | 显示全部楼层
north_sas 发表于 2016-1-22 12:06
握个手,也算earth专业的,在刷统计master。我觉得吧,统计理论找个国内的“概率论和数理统计”的书看看就 ...
. 1point3acres.com/bbs
嗯嗯,握爪〜你的学学就够list的顺序很赞啊。我也刚发现貌似现在刷题太早,而且python和R还没熟练,强刷效果也不好啊。祝你刷master顺利哈〜
回复 支持 反对

使用道具 举报

 楼主| hlbt 发表于 2016-1-24 06:18:43 | 显示全部楼层
1/21/16
Udacity intro to sta. 1point3acres.com/bbs
1/23/16
Numpy and Pandas tutorial
scikit-learn turtorial

评分

1

查看全部评分

回复 支持 反对

使用道具 举报

tangwenlu 发表于 2016-1-24 11:15:21 | 显示全部楼层
谢谢楼主,我是数学+统计专业,计算机基础差是硬伤,希望一起努力哈,不过找工作的时候真的不在意专业么?狂刷coursera那种会被承认吗
回复 支持 反对

使用道具 举报

 楼主| hlbt 发表于 2016-1-24 11:59:45 | 显示全部楼层
tangwenlu 发表于 2016-1-24 11:15
谢谢楼主,我是数学+统计专业,计算机基础差是硬伤,希望一起努力哈,不过找工作的时候真的不在意专业么? ...

我也不知道狂刷会不会承认。我目前想先把基础打好,然后试着投工作,要是不行再考虑读个相关学位。你有统计学位,比我背景好多了,一起加油〜
回复 支持 反对

使用道具 举报

这只猫叫公爵 发表于 2016-1-24 12:02:17 | 显示全部楼层
hlbt 发表于 2016-1-24 11:59
.鐣欏璁哄潧-涓浜-涓夊垎鍦我也不知道狂刷会不会承认。我目前想先把基础打好,然后试着投工作,要是不行再考虑读个相关学位。你有统 ...

我觉得是有相关的技能就好了,要是相关专业更好了,其实可以去打kaggle,打出一个好名次出来就很有说服力了
回复 支持 反对

使用道具 举报

本版积分规则

请点这里访问我们的新网站:一亩三分地Instant.

Instant搜索更强大,不扣积分,内容组织的更好更整洁!目前仍在beta版本,努力完善中!反馈请点这里

关闭

一亩三分地推荐上一条 /5 下一条

手机版|小黑屋|一亩三分地论坛声明 ( 沪ICP备11015994号 )

custom counter

GMT+8, 2016-12-11 09:03

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表