一亩三分地论坛

 找回密码
 获取更多干货,去instant注册!

扫码关注一亩三分地公众号
查看: 3284|回复: 6
收起左侧

[经验总结] Machine Learning工作,学校情况总结

  [复制链接] |试试Instant~ |关注本帖
pfli1995 发表于 2016-4-8 14:33:05 | 显示全部楼层 |阅读模式

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?获取更多干货,去instant注册!

x
Machine Learning现在从就业和工作的方向上来说的话,更多的是和Data Science和Big Data联系在一起。一般只要是公司在招"Data Scientist" 类的职位,都会在Requirement里面或者Preferred Requirement里面写上Artificial Intelligence 和Machine Learning, 意思就是说如果有这些方向的经验是可以加分的。而对于公司直接招"Machine Learning Engineer"或者"Machine Learning Scientist"的职位,一般都要求是硕士和博士,甚至大部分"Machine Learning Scientist" 是直接要求PhD的,小硕看不上眼。Machine Learning方向在硕士期间当然可以走,但如果没有PhD的志向,要早点打算多学一些跟Machine Learning 应用相关的课程,譬如Data Mining, Data Analysis, Data Science 以及Information Retrieval等,向Data Science那边多靠一靠,这样的话一个很对口的职位就是公司的"Data Scientist"。做Data Scientist,一些基本的能力譬如Python, Matlab/R 是必需,但同时一些"Data Scientist"职位也会对基本的Data Structure and Programming(C++/Java),Database方向的知识有要求,这个在选课和准备上也要多考虑考虑。但如果真的想把Machine Learning作为主方向来学的话,个人觉得还是继续读PhD为好,这样学出来自己以后在这方向上做研究和工作才会更有发展潜力。

Machine Learning确实对数学基础要求比较高,主要在于概率论和线性代数,你要想上Machine Learning,建议可以在学期开始前的假期看看视频或者书籍来补补概率论和线性代数方面的知识。
EECS 545 Machine Learning这门课主要有两个老师教,目前的Winter Term是Computer Science的一位老师,上课用 PPT, 他的machine learning更加注重算法的编程实现,布置的作业和project基本都是算法编程,编程语言不做要求,让学生自己去选,不过一般都离不开Matlab/Python/R。 Fall Term的Machine learning 是我们EE:S的一位老师教,他就更注重数学方面的东西了,据说上课都是自己板书公式的。但确实能帮助学生更好的理解机器学习的算法基础,作业当然也有编程实现的部分,要求使用Matlab。.1point3acres缃
. 涓浜-涓夊垎-鍦帮紝鐙鍙戝竷
统计概率,凸优化,及线性代数

stanford的Machine learning video.
https://www.youtube.com/playlist?list=PLFC36A799B7FFD0CF
还有相关的notes
http://cs229.stanford.edu/materials.html
建议先看notes,不懂的再看video。
. From 1point 3acres bbs
SVM的话Coursera NTU Machine Learning Technique那课讲得非常细~可以参考

前几天发现Yoshua Bengio大神要出一本Deep Learning的书,前几章似乎就是这些先修很好的回顾~打算最近有空看看
http://www.iro.umontreal.ca/~bengioy/dlbook/
. Waral 鍗氬鏈夋洿澶氭枃绔,
吐血推荐Coursera的机器学习基石和CalTech的Learning From Data

CMU CEE,这门课就是ML系开的,老师是Roni Rosenfeld,10601. 鐣欏鐢宠璁哄潧-涓浜╀笁鍒嗗湴
prerequisite吧:
1. You need to have, before starting this course, significant experience programmingin a general programming language like JAVA, Python, C, or C++.  For undergraduate students, this will be satisfied for example by having passed 15-122 (Principles ofImperative Computation) with a grade of ‘C’ or higher, or comparable courses elsewhere.(没必要,用不着啥数据结构,只要会Python或者Java,对写几百行代码不发憷就行,我就是跟15-122一起上的)
2. You need to have, before starting this course, college-level discrete mathematicalmaturity, as can be achieved at CMU by having passed 21-127 (Concepts of Mathematics) or 15-151 (Mathematical Foundations of Computer Science) with a grade of ‘C’ or higher, or comparable courses elsewhere.(我真觉得没用多少数学知识)
3. You need to have a basic familiarity with probability and statistics, as can be achieved at CMU by having taken, or concurrently taking: 36-217 (Probability Theory and Random Processes) or 36-225 (Introduction to Probability and Statistics I), or 15-359 or 21-325, or comparable courses elsewhere.(本科倒是上过概率论,期末突击的,早忘光了,但是之前的一个学期刚上了本系的Probability,挺赞的)

第二学期。比想象的简单。一个原因是并非每次作业都是coding,而且就算是from scratch实现算法,Mitchell那本书也都有很清晰的伪代码。另一个原因是我对ML比较感兴趣,这门课基本就是按Mitchell那本书来的,下课后我就会把课本对应的部分过一遍,所以比内容比较熟,作业写起来也快。

没有project,一共9次作业,除去第一次hello world性质的,剩下的是:
Concept learning (Python/Java)
Information theory (math)
Decision trees (Python/Java)
Probability, statistics, and linear regression (math)
Neural networks (MATLAB)
Hypothesis testing, ML estimator, and MAP estimator (math)
Naive Bayes (Python/Java)
Hidden Markov models (Python/Java)
HMM那个比较麻烦,因为evaluatoin, decoding, learning都要写,learning的部分有一堆参数群,有的参数角标有4个,相互计算,写着写着都快不知道自己写的是什么了……不过仔细点按着公式来还是能写对的。. 1point 3acres 璁哄潧

Section A,和Section B是两个老师讲的,内容啥的也都不一样。A一共100个人出头吧。B应该也差不多。-google 1point3acres

No more than 10% of students receive an 'A+'.
About 50% of students receive a version of A (A+, A, or A-).
About 35% receive a version of B, roughly equally distributed between B+, B, B-.
中国学生不太了解,因为我只认识本系的几个同学,不过作业基本上大家都是满分,主要差距应该在考试了。
没有期中,期末占~35%,闭卷。
难度倒是不大,考的基本都是基础的理念上的东西,确实体现了老师上课的风格和他的想法。

最新的课程说明:
10-601, 10-701, and 10-715 all share the same goal: a survey/intro to machine learning, with a focus on being able to derive the appropriate methods and algorithms for new ML situations.  They differ in their target audience: the target audience for10-715 is PhD students whose research area is machine learning.  For 10-701, it's grad students (PhD or MS) who want to do research related to machine learning, but for whom machine learning is not the primary topic.  (E.g., research in natural language that relies heavily on machine learning.)  For 10-601, the target audience isundergrads, MS students, and some PhD students from outside of SCS.

评分

4

查看全部评分

 楼主| pfli1995 发表于 2016-4-8 15:34:59 | 显示全部楼层
CMU 10701(PhD Level)
        Due date        Type        Topic
1        January 26        Theory (Solution)        Modeling, Distributions
2        February 2        Programming        Linear Regression, Nearest Neighbor
3        February 9        Theory (Solution)        AB Testing, K Nearest Neighbor Regression
4        February 16        Programming        Kernel Density Estimation, Kernel Regression
5        February 23        Theory (Solution)        Exponential Family
6        March 9        Programming        Perceptrons
7        March 24        Theory (Solution)        Quantile Regression, Minimum Enclosing Ball
8        March 30        Programming        Stochastic Gradient Descent
9        April 20        Theory (Solution)        Inference on Mixture Models 鏉ユ簮涓浜.涓夊垎鍦拌鍧.
10        April 20        Programming        Gaussian Mixture Model
11        April 27        Theory (Solution)        Kalman Filter, Recommender Systems


第5次作业推有关expoential family的posterior distribution 推了整整一个周末
理论作业全是数学都比较难推 有兴趣的点进去看一下就好. from: 1point3acres.com/bbs
开卷 随便带多少资料
时间紧题量大 说难不难 说简单绝对不简单(期中均分40.28/82 期末均分36.5/85)
临时抱佛脚必死
http://alex.smola.org/teaching/10-701-2015/website/
Prof. Alex Smola CMU
回复 支持 1 反对 0

使用道具 举报

 楼主| pfli1995 发表于 2016-4-8 14:33:48 | 显示全部楼层
都是收集过来的
现在总结一下给大家分享,望大米多多
回复 支持 反对

使用道具 举报

nunuh89 发表于 2016-4-8 15:24:34 | 显示全部楼层
pfli1995 发表于 2016-4-7 22:33
都是收集过来的
现在总结一下给大家分享,望大米多多

转载 请注明出处
回复 支持 反对

使用道具 举报

 楼主| pfli1995 发表于 2016-4-8 15:27:48 | 显示全部楼层
nunuh89 发表于 2016-4-8 15:24.1point3acres缃
转载 请注明出处

哦哦,下面贴
回复 支持 反对

使用道具 举报

Hualiang 发表于 2016-5-8 15:42:42 | 显示全部楼层
mark. zhishuzhishu
回复 支持 反对

使用道具 举报

gtertaisha 发表于 2016-5-18 22:25:26 | 显示全部楼层
打算出国读二学位CS,预计两年,走data scientist的方向,8门CS基础课,两门数据库课程,一门机器学习,一门人工智能,还有5门课可在CS和STAT之间安排,请问能不能推荐一些统计学的课程呢?
回复 支持 反对

使用道具 举报

本版积分规则

请点这里访问我们的新网站:一亩三分地Instant.

Instant搜索更强大,不扣积分,内容组织的更好更整洁!目前仍在beta版本,努力完善中!反馈请点这里

关闭

一亩三分地推荐上一条 /5 下一条

手机版|小黑屋|一亩三分地论坛声明 ( 沪ICP备11015994号 )

custom counter

GMT+8, 2016-12-9 10:19

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表