男生找男友:我希望你至少是0.628,如果是0.942那就更好了。

一亩三分地论坛

 找回密码
 Sign Up 注册获取更多干货
码农求职神器Triplebyte:
不用海投,内推多家公司面试
[Google级团队]:实时大数据分析领域践行者
北京/深圳-大数据/搜索/机器学习职位
日志易机器大数据行业践行者Web/大数据/机器学习等职位-北京or深圳
把贵司招聘信息放这里
查看: 6766|回复: 6
收起左侧

[经验总结] Machine Learning工作,学校情况总结

  [复制链接] |试试Instant~ |关注本帖
pfli1995 发表于 2016-4-8 14:33:05 | 显示全部楼层 |阅读模式

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?Sign Up 注册获取更多干货

x
Machine Learning现在从就业和工作的方向上来说的话,更多的是和Data Science和Big Data联系在一起。一般只要是公司在招"Data Scientist" 类的职位,都会在Requirement里面或者Preferred Requirement里面写上Artificial Intelligence 和Machine Learning, 意思就是说如果有这些方向的经验是可以加分的。而对于公司直接招"Machine Learning Engineer"或者"Machine Learning Scientist"的职位,一般都要求是硕士和博士,甚至大部分"Machine Learning Scientist" 是直接要求PhD的,小硕看不上眼。Machine Learning方向在硕士期间当然可以走,但如果没有PhD的志向,要早点打算多学一些跟Machine Learning 应用相关的课程,譬如Data Mining, Data Analysis, Data Science 以及Information Retrieval等,向Data Science那边多靠一靠,这样的话一个很对口的职位就是公司的"Data Scientist"。做Data Scientist,一些基本的能力譬如Python, Matlab/R 是必需,但同时一些"Data Scientist"职位也会对基本的Data Structure and Programming(C++/Java),Database方向的知识有要求,这个在选课和准备上也要多考虑考虑。但如果真的想把Machine Learning作为主方向来学的话,个人觉得还是继续读PhD为好,这样学出来自己以后在这方向上做研究和工作才会更有发展潜力。

Machine Learning确实对数学基础要求比较高,主要在于概率论和线性代数,你要想上Machine Learning,建议可以在学期开始前的假期看看视频或者书籍来补补概率论和线性代数方面的知识。
EECS 545 Machine Learning这门课主要有两个老师教,目前的Winter Term是Computer Science的一位老师,上课用 PPT, 他的machine learning更加注重算法的编程实现,布置的作业和project基本都是算法编程,编程语言不做要求,让学生自己去选,不过一般都离不开Matlab/Python/R。 Fall Term的Machine learning 是我们EE:S的一位老师教,他就更注重数学方面的东西了,据说上课都是自己板书公式的。但确实能帮助学生更好的理解机器学习的算法基础,作业当然也有编程实现的部分,要求使用Matlab。. 鍥磋鎴戜滑@1point 3 acres

统计概率,凸优化,及线性代数

stanford的Machine learning video. . visit 1point3acres.com for more.
https://www.youtube.com/playlist?list=PLFC36A799B7FFD0CF
还有相关的notes
http://cs229.stanford.edu/materials.html
建议先看notes,不懂的再看video。
. from: 1point3acres.com/bbs
SVM的话Coursera NTU Machine Learning Technique那课讲得非常细~可以参考. 1point3acres.com/bbs

前几天发现Yoshua Bengio大神要出一本Deep Learning的书,前几章似乎就是这些先修很好的回顾~打算最近有空看看
http://www.iro.umontreal.ca/~bengioy/dlbook/

吐血推荐Coursera的机器学习基石和CalTech的Learning From Data

CMU CEE,这门课就是ML系开的,老师是Roni Rosenfeld,10601
prerequisite吧:
1. You need to have, before starting this course, significant experience programmingin a general programming language like JAVA, Python, C, or C++.  For undergraduate students, this will be satisfied for example by having passed 15-122 (Principles ofImperative Computation) with a grade of ‘C’ or higher, or comparable courses elsewhere.(没必要,用不着啥数据结构,只要会Python或者Java,对写几百行代码不发憷就行,我就是跟15-122一起上的)
2. You need to have, before starting this course, college-level discrete mathematicalmaturity, as can be achieved at CMU by having passed 21-127 (Concepts of Mathematics) or 15-151 (Mathematical Foundations of Computer Science) with a grade of ‘C’ or higher, or comparable courses elsewhere.(我真觉得没用多少数学知识). 鐗涗汉浜戦泦,涓浜╀笁鍒嗗湴
3. You need to have a basic familiarity with probability and statistics, as can be achieved at CMU by having taken, or concurrently taking: 36-217 (Probability Theory and Random Processes) or 36-225 (Introduction to Probability and Statistics I), or 15-359 or 21-325, or comparable courses elsewhere.(本科倒是上过概率论,期末突击的,早忘光了,但是之前的一个学期刚上了本系的Probability,挺赞的)

第二学期。比想象的简单。一个原因是并非每次作业都是coding,而且就算是from scratch实现算法,Mitchell那本书也都有很清晰的伪代码。另一个原因是我对ML比较感兴趣,这门课基本就是按Mitchell那本书来的,下课后我就会把课本对应的部分过一遍,所以比内容比较熟,作业写起来也快。

没有project,一共9次作业,除去第一次hello world性质的,剩下的是:-google 1point3acres
Concept learning (Python/Java)
Information theory (math)
Decision trees (Python/Java)
Probability, statistics, and linear regression (math)
Neural networks (MATLAB)
Hypothesis testing, ML estimator, and MAP estimator (math)
Naive Bayes (Python/Java)
Hidden Markov models (Python/Java)
HMM那个比较麻烦,因为evaluatoin, decoding, learning都要写,learning的部分有一堆参数群,有的参数角标有4个,相互计算,写着写着都快不知道自己写的是什么了……不过仔细点按着公式来还是能写对的。-google 1point3acres

Section A,和Section B是两个老师讲的,内容啥的也都不一样。A一共100个人出头吧。B应该也差不多。

No more than 10% of students receive an 'A+'.
About 50% of students receive a version of A (A+, A, or A-).
About 35% receive a version of B, roughly equally distributed between B+, B, B-.
中国学生不太了解,因为我只认识本系的几个同学,不过作业基本上大家都是满分,主要差距应该在考试了。
没有期中,期末占~35%,闭卷。
难度倒是不大,考的基本都是基础的理念上的东西,确实体现了老师上课的风格和他的想法。

最新的课程说明:
10-601, 10-701, and 10-715 all share the same goal: a survey/intro to machine learning, with a focus on being able to derive the appropriate methods and algorithms for new ML situations.  They differ in their target audience: the target audience for10-715 is PhD students whose research area is machine learning.  For 10-701, it's grad students (PhD or MS) who want to do research related to machine learning, but for whom machine learning is not the primary topic.  (E.g., research in natural language that relies heavily on machine learning.)  For 10-601, the target audience isundergrads, MS students, and some PhD students from outside of SCS.

评分

4

查看全部评分

 楼主| pfli1995 发表于 2016-4-8 15:34:59 | 显示全部楼层
CMU 10701(PhD Level)
        Due date        Type        Topic
1        January 26        Theory (Solution)        Modeling, Distributions
2        February 2        Programming        Linear Regression, Nearest Neighbor
3        February 9        Theory (Solution)        AB Testing, K Nearest Neighbor Regression
4        February 16        Programming        Kernel Density Estimation, Kernel Regression. 涓浜-涓夊垎-鍦帮紝鐙鍙戝竷
5        February 23        Theory (Solution)        Exponential Family
6        March 9        Programming        Perceptrons. from: 1point3acres.com/bbs
7        March 24        Theory (Solution)        Quantile Regression, Minimum Enclosing Ball
8        March 30        Programming        Stochastic Gradient Descent
9        April 20        Theory (Solution)        Inference on Mixture Models
10        April 20        Programming        Gaussian Mixture Model
11        April 27        Theory (Solution)        Kalman Filter, Recommender Systems


第5次作业推有关expoential family的posterior distribution 推了整整一个周末
理论作业全是数学都比较难推 有兴趣的点进去看一下就好-google 1point3acres
开卷 随便带多少资料
时间紧题量大 说难不难 说简单绝对不简单(期中均分40.28/82 期末均分36.5/85)
临时抱佛脚必死
http://alex.smola.org/teaching/10-701-2015/website/
Prof. Alex Smola CMU
回复 支持 1 反对 0

使用道具 举报

 楼主| pfli1995 发表于 2016-4-8 14:33:48 | 显示全部楼层
都是收集过来的
现在总结一下给大家分享,望大米多多
回复 支持 反对

使用道具 举报

nunuh89 发表于 2016-4-8 15:24:34 | 显示全部楼层
pfli1995 发表于 2016-4-7 22:33
都是收集过来的
现在总结一下给大家分享,望大米多多

转载 请注明出处
回复 支持 反对

使用道具 举报

 楼主| pfli1995 发表于 2016-4-8 15:27:48 | 显示全部楼层
nunuh89 发表于 2016-4-8 15:24
转载 请注明出处

哦哦,下面贴
回复 支持 反对

使用道具 举报

Hualiang 发表于 2016-5-8 15:42:42 | 显示全部楼层
mark. zhishuzhishu
回复 支持 反对

使用道具 举报

gtertaisha 发表于 2016-5-18 22:25:26 | 显示全部楼层
打算出国读二学位CS,预计两年,走data scientist的方向,8门CS基础课,两门数据库课程,一门机器学习,一门人工智能,还有5门课可在CS和STAT之间安排,请问能不能推荐一些统计学的课程呢?
回复 支持 反对

使用道具 举报

本版积分规则

提醒:发帖可以选择内容隐藏,部分板块支持匿名发帖。请认真读完以下全部说明:

■隐藏内容方法: [hide=200]你想要隐藏的内容比如面经[/hide]
■意思是:用户积分低于200则看不到被隐藏的内容
■可以自行设置积分值,不建议太高(200以上太多人看不到),也不建议太低(那就没必要隐藏了)
■建议只隐藏关键内容,比如具体的面试题目、涉及隐私的信息,大部分内容没必要隐藏。
■微信/QQ/电子邮件等,为防止将来被骚扰甚至人肉,以论坛私信方式发给对方最安全。
■匿名发帖的板块和方法:http://www.1point3acres.com/bbs/thread-405991-1-1.html

关闭

一亩三分地推荐上一条 /5 下一条

手机版|小黑屋|一亩三分地论坛声明

custom counter

GMT+8, 2018-4-23 02:30

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表