一亩三分地论坛

 找回密码
 获取更多干货,去instant注册!

扫码关注一亩三分地公众号
查看: 6864|回复: 99
收起左侧

地里首个Machine Learning Intern 面经,回报一亩三分地

[复制链接] |试试Instant~ |关注本帖
尚佳蕾 发表于 2014-4-6 14:47:50 | 显示全部楼层 |阅读模式

2014(4-6月) 分析|数据科学类 硕士 实习@Dow Agroscience - 网上海投 - 技术电面 |Pass

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?获取更多干货,去instant注册!

x
背景: https://github.com/caogl/resume/ ... 9%E5%88%86%E5%9C%B0. 鐣欏鐢宠璁哄潧-涓浜╀笁鍒嗗湴
找工作经历:
本人是umich mfe ms的first year, 其实刚来的时候就知道基本上很难做quant,本来的意向是码农,但投简历的时候发现,基本上码农的工作,没戏,而不经意投的machine learning,Data Science方向,回报率很高,于是侧重了一下,最终在经过拿到了dow 的machine learning intern offer。月薪5100,提供实习生住宿。
面经:码农类的我也面过8家左右,但我觉得在这里贴这些面经价值不大,还是专门说data science/machine learning的,尤其是我拿到offer这家的面经(最有代表性)。

-- difference between classification and regression, if given a linear regression model, how to turn to classification model
-- 如何做feature selection, 你喜欢用什么方法,我回答pca,接着问什么是pca,最终得出的结果是什么,在什么条件下用。我说最后得出的是linearcombination of features to better extract information, do dimension reduction. 接着问,pca的linear combination 是怎么算出来的,简述算法,我回答用feature的product谱分解,特征值排序,取95%。接着问,pca在共线时候能不能用,当然能,就是做这个的,接着问,什么时候不能用,回答不是gaussian时候不能用。问怎么判断是不是Gaussian分布,回答qqplot,或者visualize看是不是椭圆。接着问为什么不是gaussian不能用,如果有一个feature,用pca看不显著,但其实包含有用信息,怎么处理,给跪--------后来想了一下,正确答案是因为gaussian是exponential family, pca是根据mean/variance来的,只有正态时候满足他们是sufficient,另一个问题的答案其实简单, 作kernel,nonlinear 等等。
-- ridge and lasso constraint, tell what they are, when should they be used, 答出来以后问我为什么避免overfit, denoise,我用几何角度解释了一下, 可以推广到高维, 不知道他们听懂没。
-- decision tree and random forest
-- image processing 时候如何对pixel transform 来做k-means,考pre-processing,我把作业里怎么转成vector说了一下,他不怎么满意。-google 1point3acres
-- 本科最喜欢的数学课是什么? 答real analysis, 问知不知道Gaussian Process and application in machine learning
                                       什么是metric space, inner product space, when to be hilbert space,明明问的泛函的东西,还好这块学的当年很认真,其实他这么问得目的是想考了解kernel没有。
--what is oop, what is the difference between struct and class, inheritance and polymorphism

--ps: 我面另一家og technology的machine learning 的时候问了os,问在multi-threaded下如何debug,database基础知识之类的coding知识。

组里面我的人全是phd,用一个iit毕业的印度人的话说,some of us have dual phds......面完以为肯定没戏,没想到来了offer。


IMPORTANT SUMMARY:

(1) 码农职位多,但绝对没有到供不应求!!!Umich的计算机系,gpa最高的都是交大来的中国人,他们中有一半还没有找到intern,更别说我们这种想暴力转的了。我面了不少software, 投的时候大公司一概不鸟也正常,但至少4个不大的公司,第一轮感觉不错,出题的题也作出来了,电话里都说给我安排下一轮了,但是到了下一轮的时候另一个人就告诉我,我们有更好的candidate,或者我们又重新看了一下觉得还是不是很match。。。。。。我上过数据结构,os,database和machine learning,题刷了三遍,cracking, programming interview exposed and some of leetcode......,班里跟我一样不喜欢金工班混finance课,背景修课与我相近的人,也没有找到。转专业做码农,决不是只上过数据结构和算法,就fulltime了那么简单。
(2)数学背景强的,coding不错的,data science是个大蛋糕,因为stat的人编程不行,cs的人都找software。
(3)data science的面试题,统计的地方不会超出machine learning的范围,doe, time series, survival, longitudinal 一概没碰到,robust会碰到。
(4)内推作用没那么大,靠的是自己认真地学习的日常的积累,投机取巧很难。
(5)好好参考Warald黑finance和mfe的文章这是美国,不是不努力,你天天上finance的水课,混gpa,天天social,简历胡编乱造,就可以找工作的,绿卡除外。. more info on 1point3acres.com

希望学习态度认真,脚踏实地,不投机取巧的想做tech的同学们找到工作,这也是应有的回报!这样的同学欢迎联系我,提供更多信息!. From 1point 3acres bbs



补充内容 (2014-4-6 15:14):
我说的是我们这种非ee非cs的,去跟cs的p码农职位,很难,现在cs人也很多 cs的工作好找,是肯定的

评分

18

查看全部评分

本帖被以下淘专辑推荐:

eusoff 发表于 2014-4-6 15:07:21 | 显示全部楼层
请问为什么cs的没戏呢?我刚拿到umich cs ms。。。。。
还有,就是ms暑期实习一般是第二个学期才开始找是么?谢谢。. 涓浜-涓夊垎-鍦帮紝鐙鍙戝竷

支持一下学长!
回复 支持 反对

使用道具 举报

 楼主| 尚佳蕾 发表于 2014-4-6 15:10:02 | 显示全部楼层

因为是不是cs的,我说的是跟你们p职位,没戏 你们cs的还是好找的,你ms 早找也没问题的
回复 支持 反对

使用道具 举报

eusoff 发表于 2014-4-6 15:16:17 | 显示全部楼层
尚佳蕾 发表于 2014-4-6 15:10
因为是不是cs的,我说的是跟你们p职位,没戏 你们cs的还是好找的,你ms 早找也没问题的
鏉ユ簮涓浜.涓夊垎鍦拌鍧.
好,谢谢。不过我看你也学了不少cs的课。。。
回复 支持 反对

使用道具 举报

eusoff 发表于 2014-4-6 17:04:57 | 显示全部楼层
尚佳蕾 发表于 2014-4-6 15:10
因为是不是cs的,我说的是跟你们p职位,没戏 你们cs的还是好找的,你ms 早找也没问题的

对了,你说早找没问题。。。第一学期就要开始找?第一学期没结束,没有成绩,那简历上的全是本科的东西啊。。。。
回复 支持 反对

使用道具 举报

paulkinglj 发表于 2014-4-6 17:38:00 | 显示全部楼层
data science的全职岗位多不多?找fulltime注重些什么?码农可以刷题,但是data science这个侧重在哪儿?
回复 支持 反对

使用道具 举报

paulkinglj 发表于 2014-4-6 17:42:06 | 显示全部楼层
刚问的不完整。我主要是问两个问题:第一,data science面试前要做哪些准备,码农有题可以刷,data science需要干些什么,希望能具体解答;第二,data science的岗位需求大吗?感觉各种网站炒得很火
回复 支持 反对

使用道具 举报

carter13466 发表于 2014-4-6 22:43:27 | 显示全部楼层
umich的计算机系找实习这么难哇,还是说大行情是很难?
回复 支持 反对

使用道具 举报

数字媒体技术 发表于 2014-4-6 22:52:19 | 显示全部楼层
data science感觉stat要有优势啊,这玩意一般码农干不了.....
回复 支持 反对

使用道具 举报

 楼主| 尚佳蕾 发表于 2014-4-7 02:47:57 | 显示全部楼层
数字媒体技术 发表于 2014-4-6 22:52
data science感觉stat要有优势啊,这玩意一般码农干不了.....

是 但是stat人的coding不行
回复 支持 反对

使用道具 举报

 楼主| 尚佳蕾 发表于 2014-4-7 02:48:55 | 显示全部楼层
paulkinglj 发表于 2014-4-6 17:42
刚问的不完整。我主要是问两个问题:第一,data science面试前要做哪些准备,码农有题可以刷,data science ...
. from: 1point3acres.com/bbs
我认为就是把machine learning相关的东西一定要特别熟,还有很考你的数学和统计基础
data science肯定没有software多,但还是不少的,要是有实力肯定能找到
回复 支持 反对

使用道具 举报

 楼主| 尚佳蕾 发表于 2014-4-7 02:50:39 | 显示全部楼层
eusoff 发表于 2014-4-6 17:04
对了,你说早找没问题。。。第一学期就要开始找?第一学期没结束,没有成绩,那简历上的全是本科的东西啊 ...

个人觉得 应付面试题 你本科东西足够了 我觉得你可以问一下umich cs的学生 另外这个帖子可能对你比较有用:http://blog.renren.com/share/225640863/15476742895
回复 支持 反对

使用道具 举报

 楼主| 尚佳蕾 发表于 2014-4-7 02:51:56 | 显示全部楼层
carter13466 发表于 2014-4-6 22:43
umich的计算机系找实习这么难哇,还是说大行情是很难?

其实还是比较号好找的我说的是转cs的比较难找, 这类问题你可以咨询一下cs的人 毕竟我背景跟她们不一样
回复 支持 反对

使用道具 举报

nibuxing 发表于 2014-4-7 03:00:24 | 显示全部楼层
恭喜,有用的面经。打算好好刷题好好上几门核心课,向楼主学习。
都是ML和SL的题,难度适中,不错。
回复 支持 反对

使用道具 举报

Lisepher 发表于 2014-4-7 05:09:14 | 显示全部楼层
恭喜校友!
回复 支持 反对

使用道具 举报

vlsi2012 发表于 2014-4-7 05:14:49 | 显示全部楼层
赞ML面经!原来还要问数学分析的知识。
话说简历地址不全打不开,可以重发吗?

补充内容 (2014-4-7 05:20):
可以看到了。
回复 支持 反对

使用道具 举报

seyiqi 发表于 2014-4-7 05:58:36 | 显示全部楼层
恭喜大神  问一下大神觉得具体哪些stat领域的知识对面试题比较有用 比如很多人面到time series, ARIMA, 还有MCMC等sampling method 请问这些也有需要准备么
回复 支持 反对

使用道具 举报

 楼主| 尚佳蕾 发表于 2014-4-7 09:03:35 | 显示全部楼层
seyiqi 发表于 2014-4-7 05:58
恭喜大神  问一下大神觉得具体哪些stat领域的知识对面试题比较有用 比如很多人面到time series, ARIMA, 还有 ...

这些是面的statistician用的,我说的是职位名称是machine learning的。statistician 跟machine learning是不一样的职位。当然我不敢保证完全这些没有,但是在我面试中没有碰到,我觉得如果你在简历里写了例如time series,可能会问
回复 支持 反对

使用道具 举报

 楼主| 尚佳蕾 发表于 2014-4-7 09:04:22 | 显示全部楼层
vlsi2012 发表于 2014-4-7 05:14
赞ML面经!原来还要问数学分析的知识。
话说简历地址不全打不开,可以重发吗?
. Waral 鍗氬鏈夋洿澶氭枃绔,
主要是kernel 是在reproducing hilbert space
他是想问这一块明白了没
回复 支持 反对

使用道具 举报

 楼主| 尚佳蕾 发表于 2014-4-7 09:12:22 | 显示全部楼层
seyiqi 发表于 2014-4-7 05:58
恭喜大神  问一下大神觉得具体哪些stat领域的知识对面试题比较有用 比如很多人面到time series, ARIMA, 还有 ...

MCMC虽然面试没有碰到 但我认为比较有用,你最好的是看一下machine learning的基本经典教材,然后想办法把里面的东西都掌握了
回复 支持 反对

使用道具 举报

本版积分规则

请点这里访问我们的新网站:一亩三分地Instant.

Instant搜索更强大,不扣积分,内容组织的更好更整洁!目前仍在beta版本,努力完善中!反馈请点这里

关闭

一亩三分地推荐上一条 /5 下一条

手机版|小黑屋|一亩三分地论坛声明 ( 沪ICP备11015994号 )

custom counter

GMT+8, 2016-12-9 06:01

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表