一亩三分地论坛

 找回密码
 获取更多干货,去instant注册!

扫码关注一亩三分地公众号
查看: 1711|回复: 4
收起左侧

独家放送Palantir Machine Learning Team Onsite

[复制链接] |试试Instant~ |关注本帖
shawlin 发表于 2015-4-15 23:49:39 | 显示全部楼层 |阅读模式

2015(4-6月) 码农类 硕士 实习@Palantir - 网上海投 - Onsite |Failfresh grad应届毕业生

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?获取更多干货,去instant注册!

x
Palantir 俗称帕兰铁,早就听说是一家逼格很高的公司,楼主在网上海投了intern的简历,也没指望他们看上LZ
没想到意外的收到了店面  面经看这里 http://www.1point3acres.com/bbs/thread-125640-1-1.html.鐣欏璁哄潧-涓浜-涓夊垎鍦

他们家HR还是很赞的,很快收到回复,LZ在东部,本来给LZ安排到NYC onsite, 后来又安排去加州总部
LZ人事的第一次onsite, 没想到就送给了最难的一家,世事难料啊

之后LZ还是正常刷算法题,刷面经,直到面试的前三天,HR发邮件大概讲了下面试的内容,突然发现全是. more info on 1point3acres.com
Machine Learning的东西,LZ狂补

Palantir还是很土豪的, 给的酒店很好,机场来回接机,每顿饭可以报销40刀, office也很赞
好了,废话大多,上题吧

第一轮: 白人小哥 + 白人小哥shallow
Machine learning theory:
上来给了个survival rate的问题,具体记不清了,大概就是求t时间的survival rate,其实就是一个简单的HMM, LZ最开始有些紧张,.1point3acres缃
公式总写错,小哥都很nice,LZ平静下来还是写出来了. visit 1point3acres.com for more.
之后在这个基础上问了些概率的问题,什么是unbiased estimator啊,我们这里是不是unbiased的啊,什么情况是啊,总之不难
而且小哥一直会提醒. more info on 1point3acres.com
之后问了些简历的问题,都是关于machine learning的,这轮算是过了

第二轮: 中国PHD大哥 + 继续shallow的小哥
Machine Learning coding:
这轮就比较惨了,之前一直在用Java刷算法,很久没有python写Data Science 和machine learning的东西了.鐣欏璁哄潧-涓浜-涓夊垎鍦
问题其实很简单,就是给你一些emails, 写一个spam classifier, 不能用scikit-learn. From 1point 3acres bbs
. 1point 3acres 璁哄潧
要做的就是读数据,取feature, 建模,prediction

LZ出师不利,用pandas 读数据,老是有问题, 耽误了时间,后面大哥说直接open file一行行读好了
取feature, LZ用的bags of words模型, 遇到问题就是feature数目很大,很多词都只出现一两次,可以选. 鍥磋鎴戜滑@1point 3 acres
出现次数大于一个threshhold的词作为我们的词典, 这个threshhold用CV 选, LZ在编程实现上遇到点问题,又耽误时间

做完feature extraction, 写一个classifer, LZ用的logistic regression,写好cost-function, gradient-function, 做optimization的 鏉ユ簮涓浜.涓夊垎鍦拌鍧.
时候又遇到问题 给跪, 大哥说你自己写一个gradient-descend吧, 别用scipy的method
.鐣欏璁哄潧-涓浜-涓夊垎鍦
勉强写好,算出parameter, 做了prediction, 结果很一般, 来不及用CV选参数时间就到了, 中国大哥很不满意,LZ.鏈枃鍘熷垱鑷1point3acres璁哄潧
此时就知道已经跪了

第三轮: Skpye 白人小哥:
Machine Learning Design:.鐣欏璁哄潧-涓浜-涓夊垎鍦
这轮很和一个白人小哥Skype,白人小哥在NYC, Orz, LZ大老远从NYC飞过来,你就给我看这个!
这轮就是给你一些machine learning的问题,乱扯,LZ实力还是不行,好多次卡壳

第一个问题:给你很多tweets, 你去找一些controversial topic
当时就懵逼了,只能乱扯,如何定义controversial啦, 有木有label啦, 没用的话去Amazon maechanical turk找人弄啦
这个小哥问:你的feature是什么,用什么模型, LZ继续瞎扯
然后小哥问: 我们要的时topic,不是tweets怎么办?
LZ又扯了些LDA(topic modelling)的东西 . 鐗涗汉浜戦泦,涓浜╀笁鍒嗗湴
. 1point3acres.com/bbs
第二个问题:给你学生的成绩单,就是谁选了什么课,得了什么成绩,如何找到best student
LZ就说最naive的就是看GPA了,但是我们要注意有些课比较水什么的,大家都得A, 我们可以给每个课一些weight 水课weight就小
小哥follow up: 假如都是大神选这个课,大神们都是A,怎么办?
LZ急中生智想到用collaborative filtering的方法,每门课学一个feature,每个学生学一个feature
小哥继续进攻: 说两个系他们交叉很少怎么办,有些学生选课很少怎么办
LZ只能瞎扯,说模型会不好啊,学出来的feature不好啦
然后就结束了, 这轮跪
. visit 1point3acres.com for more.
之后shallow小哥带去吃午饭,他说他们有三个食堂,让我挑一个,我们去了一个专门吃面的,吃了越南米粉,真心不错. 涓浜-涓夊垎-鍦帮紝鐙鍙戝竷
和小哥聊了一会天,就去看demo了,之后有个tour,晚了HR就叫我,发了纪念T就滚蛋了,昨天接到HR电话说跪

总结:对palantir印象还是很好的,人都挺nice,感觉没什么印度人,中国人有,吃饭时隔壁一桌4个中国人,做的东西都. 鐗涗汉浜戦泦,涓浜╀笁鍒嗗湴
和数据有关,LZ去之前就知道要跪,就当人家掏钱给我一次学习的机会了. 鐗涗汉浜戦泦,涓浜╀笁鍒嗗湴

教训就是如果不是general hire的话一定要搞请粗是什么team,这样可以有的放矢,不过话说回来,如果是specific team
刷题没什么用,关键看你平时的积累了,短期确实不好突击

machine learning的面经很少,发出来希望能帮到大家!






. From 1point 3acres bbs
补充内容 (2015-4-15 21:13):-google 1point3acres
弱弱的再来求大米

评分

2

查看全部评分

tbu 发表于 2015-4-23 11:36:36 | 显示全部楼层
LZ好厉害!换了我去应该一道题也答不出吧。。。。= =||||
回复 支持 反对

使用道具 举报

qmovision 发表于 2015-10-3 00:02:29 | 显示全部楼层
这个面经技术含量好高啊,感觉ML面试很多是扯淡,很少有这么真刀真枪的。谢楼主。
回复 支持 反对

使用道具 举报

苹果 发表于 2015-10-21 00:23:55 | 显示全部楼层
吓的简历都不敢投了....
回复 支持 反对

使用道具 举报

wingschains 发表于 2015-11-9 06:13:49 | 显示全部楼层
我的妈啊。。。LZ能当场写Logistic regression和gradient descent已经很吊了!LZ有没有去掉stopwords?而且有时候我发现这些跟text mining有关的classification问题,光是用bag of words感觉效果有些不好,有时候需要混合一些其他parameter,像什么大小写啦,符号啦,长度啦什么的。第二轮interview多长时间啊?
回复 支持 反对

使用道具 举报

本版积分规则

请点这里访问我们的新网站:一亩三分地Instant.

Instant搜索更强大,不扣积分,内容组织的更好更整洁!目前仍在beta版本,努力完善中!反馈请点这里

关闭

一亩三分地推荐上一条 /5 下一条

手机版|小黑屋|一亩三分地论坛声明 ( 沪ICP备11015994号 )

custom counter

GMT+8, 2016-12-4 14:20

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表