查看: 9813|回复: 30
收起左侧

[其他] Google/LinkedIn等MLE面试分享

    |只看干货
dennis | 显示全部楼层 |阅读模式
本楼: 👍   100% (37)
 
 
0% (0)   👎
全局: 👍   100% (167)
 
 
0% (0)    👎

2021(4-6月)-CS硕士+3-5年 | 内推|BayArea MachineLearningEng全职@GoogleLinkedin
本帖最后由 dennis 于 2021-7-21 10:54 编辑

Inspired by 这个帖子:https://www.1point3acres.com/bbs/thread-775808-1-1.html 同感于上面帖子在地里的情况,经验有可复制性,希望对你有点参考价值。格式上,也用上面帖子的逻辑,我觉得挺organized的。分享ML modeling和ML system design的面试经验。-baidu 1point3acres

5月到7月,面了一波,拿了L4和L5 MLE offer。分享经验来回馈地里。因为上面的帖子总结了coding + system + behavior的内容了,大佬们总结很全很好了,但我发现分享ML modeling和ML system design的比较少,分享这方面的内容。如果大佬们认为内容有错误,可以assume我是错的:)

我的背景是CS本科,到了美国念了研究生,到现在是5年工作经验。我这次的目标是Applied ML modeling的组,不做ML infra,也不是research scientists。FLAG是最想去的,准备他们是最优先的,而面试他们的次序,也安排在最后。
. check 1point3acres for more.
按照面试时间的timeline
Instacart:phone reject
Coinbase: phone reject
Discord: phone reject
Apple Ads: phone -> onsite ->  reject

TikTok: VO1 -> VO2 -> reject
Snapchat: phone reject
Snorkel: phone -> onsite -> reject
DeepMind: phone -> reject
Salesforce: phone -> reject

Airbnb: phone -> onsite -> considering L4 offer
Google (Youtube): phone waived -> onsite -> L4 offer,还在argue L5中
FB: phone -> onsite -> E5 offer
LinkedIn: phone -> onsite -> Senior Offer
Uber: phone -> onsite -> withdrew


换公司的想法是从去年12月就开始的,开始准备起ML modeling和ML system design,刷题没开始。今年3月到6月是集中准备的时间,80%时间花在刷题上。

  • 面试机会:拿到面试机会的公司,几乎都是朋友内推的
  • 刷题:二刷从200多,刷到600多题


MLE面试的内容,phone基本是coding+ML。Onsite有以下部分,每个公司有侧重。
  • Coding:平均2轮
  • ML coding:0到1轮
  • System design:0到1轮
  • ML fundamental (model & techniques):平均1轮。概率和数学,放在ML fundamental里面,解一个概率题
  • ML system design:平均1轮
  • Behavior:1轮

重点讲一下ML modeling和ML system design的准备,我分成了4个部分
  • ML coding:手写K-Means,手写一下KNN(e.g. 2NN),推一下Logistic regression的loss function(不需要coding)。准备的方法也很暴力,就是背下来。
  • ML fundamental (model & techniques):复习一下deep learning specialization的课程,面试过程,被面的最多的,是specialization里面improving neural networking的那门课,象dropout和batch normalization。模型的问题,我是选了3个model重点准备的,logistic regression,linear regression,neural network。之所以选这3个,是因为logistic解决classification的问题,linear解决regression的问题,而neural network是进阶版的。另外,重点看了各种metric的用法和计算方法(e.g. Precision/Recall, MSE, NDCG)
  • ML System design:我是以educative.IO的ML system design课程为template的,重点看了recommendation system的那一章。另外,我看了K姐的课程,地里“Learning”的页面上课程,machine learning mock interview(回放)
  • 概率和数学:重点看了Data Science Prep的例题(https://datascienceprep.com

MLE 面试总结一下
  • 没有用上的:重点准备了Object oriented design,concurrency等,没有被问到过。用Pytorch/Keras写一个2层的neural network model,没有用到
  • 准备不足的:常见算法的实现(e.g. KNN, Naive bayes)
  • 效果好的:刷题。MLE对coding的要求很高,和SE没有区别,问到hard的难度,也是正常的。推荐一题多刷。Deep learning specialization, educative.io ML system design课程为template的, K姐的课程对我面试帮助也很大
  • 效果不好的:Github上的各种资源,没有章法,也不一定是为面试而准备的。Interview.IO,overlap了educative.IO的内容. 1point3acres

因为准备面试的时间是有限的,如果下次再准备,我会这样分配时间
  • ML coding:多花在常见算法的实现(e.g. KNN, Gaussian Naive bayes),和用numpy手写一个end2end过程,从场面数据生成、数据分析、classification/regression model、training、K Fold Cross Validation、serving
  • ML fundamental (model & techniques):3个model和metric,附了4种基于classification情景选择的metric,在附件里图片
  • ML System design,重点看这2个部分
  • ML问题:发现Regression的问题占大多数
  • 选择和分析metric,定义目标函数。附了基于Twitter情景,在附件里图片

Team-match和方向
和Google、LinkedIn等聊了10+个team match,从聊天中,也帮助我了解到未来工业界的一些方向。最近的Applied NLP方向,都喜欢用DNN去做entity embedding,象user embedding和product embedding。很多公司也开始研究multi-modal的,我也不是很了解。如果有这个experience,会在以后简历上更大概率显示出relevancy吧。另外,如果有志于往ML domain发展的,C++和python是不错的选择。

地里是个好地方,地里积极回馈对我帮助很大。希望这个帖子可以回馈地里,对大家找MLE起点作用。祝大家面试顺利,多拿offer,以后在公司里和面试中相互帮忙~

请加米,谢谢

. check 1point3acres for more.









本帖子中包含更多资源

您需要 登录 才可以下载或查看附件。没有帐号?注册账号

x

评分

参与人数 93大米 +167 收起 理由
xinyiwu + 1 很有用的信息!
Misato + 1 很有用的信息!
ChristinaH + 1 很有用的信息!
brangao2016 + 1 赞一个
Robinsky2018 + 1 赞一个
c010110 + 1 给你点个赞!
find_advice + 3 很有用的信息!
epochholly1990 + 2 给你点个赞!

查看全部评分


上一篇:Amazon多伦多选组求建议
下一篇:以前同事都离职了,如何提供实习证明??

本帖被以下淘专辑推荐:

本楼: 👍   100% (5)
 
 
0% (0)   👎
全局: 👍   97% (220)
 
 
2% (5)    👎
byt2015 发表于 2021-07-21 16:16:58
“我这次的目标是Applied ML modeling的组,不做ML infra,也不是research scientists”
---请问 ML Modeling 跟 research scien
我理解research scientists就是很多公司的AI Lab做研究的,ML infra就是中台部门做general的ml tools,而ml modeling就是各个业务部门的mle,针对特定业务场景的特定数据完成data preprocessing- model building&training- ABtest-model deployment&serving。说的不对请指正

评分

参与人数 3大米 +4 收起 理由
dennis + 1 赞一个
byt2015 + 1 给你点个赞!
CharlesYD + 2 Thanks for sharing!!

查看全部评分

回复

使用道具 举报

ilikeed 2021-7-22 06:37:31 来自APP | 显示全部楼层
本楼: 👍   100% (1)
 
 
0% (0)   👎
全局: 👍   99% (390)
 
 
0% (3)    👎
如果楼主的目标是applied modelling的话,感觉AS是比较对口的岗位吧?更多公司的MLE还是ML infra为主。可以问一下lz具体申请的岗位title是什么吗?
扫码关注一亩三分地求职与职场公众号
更多干货内容等你发现
回复

使用道具 举报

Falldawn 2021-7-22 04:45:37 | 显示全部楼层
本楼: 👍   100% (1)
 
 
0% (0)   👎
全局: 👍   95% (688)
 
 
4% (35)    👎
多谢多谢!现在AI,ML自动驾驶很火,但是大家觉得这个很有前景嘛,记得之前有帖子说做了几年ML感觉不好觉得还不如换回SDE的。那么多公式模型,如果不是Phd毕业,是不是很头疼
回复

使用道具 举报

ZZ_2315 2021-7-22 02:45:26 来自APP | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   100% (33)
 
 
0% (0)    👎
感谢分享~
回复

使用道具 举报

liazou 2021-7-22 02:54:49 来自APP | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   99% (307)
 
 
0% (2)    👎
想问一下楼主MLE的面试会问以往简历的内容吗?面了那么多家公司,你认为简历筛选的标准是什么呢?
回复

使用道具 举报

本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   99% (737)
 
 
0% (6)    👎
学习了 和我写的很像
回复

使用道具 举报

本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   94% (1542)
 
 
5% (89)    👎
除了fg其他公司都java居多吧
回复

使用道具 举报

righteous 2021-7-22 04:04:51 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   97% (2490)
 
 
2% (65)    👎
感谢分享
回复

使用道具 举报

Huopo 2021-7-22 04:49:29 来自APP | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   100% (3)
 
 
0% (0)    👎
感谢分享 感觉很难啊
回复

使用道具 举报

ccky 2021-7-22 05:39:41 来自APP | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   96% (25)
 
 
3% (1)    👎
楼主可以把包裹也分享一下吗?
回复

使用道具 举报

BrightFeather 2021-7-22 05:58:46 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   98% (95)
 
 
1% (1)    👎
感谢分享!楼主能透露下最后为什么选了狗家吗?
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册账号
隐私提醒:
  • ☑ 禁止发布广告,拉群,贴个人联系方式:找人请去🔗同学同事飞友,拉群请去🔗拉群结伴,广告请去🔗跳蚤市场,和 🔗租房广告|找室友
  • ☑ 论坛内容在发帖 30 分钟内可以编辑,过后则不能删帖。为防止被骚扰甚至人肉,不要公开留微信等联系方式,如有需求请以论坛私信方式发送。
  • ☑ 干货版块可免费使用 🔗超级匿名:面经(美国面经、中国面经、数科面经、PM面经),抖包袱(美国、中国)和录取汇报、定位选校版
  • ☑ 查阅全站 🔗各种匿名方法

本版积分规则

>
快速回复 返回顶部 返回列表