一亩三分地

 找回密码 注册账号

扫描二维码登录本站


北美版丁香园
美国和加拿大
疫情地图实时动态追踪

热门职场讲座
Career in Tech
职场晋升之路

Salarytics=Salary Analytics
查询工资数据
系统自动计算每年收入

科技公司如何
用数据分析驱动产品开发
coupon code 250off 立减$250
游戏初创公司招聘工程师、UIUX Designer和游戏策划
坐标湾区
DreamCraft创始团队
招聘游戏开发工程师
查看: 7342|回复: 38
收起左侧

ML design 面试的答题模板,step by step

    [复制链接] |试试Instant~ |amazon, 面试经验, machinelearningeng, facebook, google, 美国面经
我的人缘0

分享帖子到朋友圈
本楼: 👍   100% (33)
 
 
0% (0)   👎
全局: 👍   100% (287)
 
 
0% (0)    👎

2019(10-12月) MachineLearningEng 博士 全职@GoogleFacebook, Amazon - 猎头 - 技术电面 Onsite 校园招聘会 视频面试  | Other | 在职跳槽

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?注册账号

x
我之前在另一个帖子里面分享了,ML design 面试的解题思路总结,大家反应很有用。最近又在实践中总结出来一套ML design答题模板,成功的过了几个大厂的ML design面试。因此分享给大家。
求加米,给我米不会减少你自己的米,举手之劳,互惠互利。

面试就是要在有限的时间里,尽量把自己懂的东西都让面试官看到。你懂那么多模型理论,怎么才能让面试官也觉得你很懂呢?要有策略,有重点。什么样的策略好用呢?
抓住核心,兼顾深度和广度。

ML design的核心,万变不离其宗,本质都是train一个model来实现某个task,比如prediction/ranking/classification。有经验的人都知道,实际上给定一个问题,好用/常用的solution基本上只有很少的几种。所以想要显得你懂很多,不仅要从深度上要cover这几种solution,更要从广度上显示你有end-to-end的experience。具体怎么实行呢?

Step 1:理清核心问题。
-        不是每个面试官都能用一目了然的方式提问。有的面试官水平差,自己也理不清问题的逻辑。遇到问题很模糊的时候,要尽快理清核心问题。抽象出来,可用信息/输入有哪些,要求的输出是什么样的,这是一个classification的问题,还是regression,还是relevance/matching/ranking?理清楚核心问题,就能判断需要train哪种类型的model,整个pipeline就很容易flow out了。

Step 2:理清核心问题后,请白板画图,最好是一个diagram。有前后逻辑关系的work flow最能展示你思维的广度。
-        在理清核心问题后,具体分析model之前,先把solution的大体框架在白板上画出来。目的是让整个讲解过程逻辑清晰。按照逻辑的先后关系,typical的解答逻辑包括这几大块:training/testing data, input representation, model, output, evaluation, optimization(parameter estimation). 我一般从model开始画,一个框框摆在中间,这是核心。然后画上游,下游。在这里,只要把框架搭好,告诉面试官,我要讲这些内容,面试官有个心理准备,就可以开始听你讲课了。

Step 3:讨论model。为什么我用“讨论”这个词?因为能seriously被考到design的人,都不是entry level。对于更senior的人来说,面试的最好氛围不是你问我答,而是我把我知道的都讲给你听,你看看还有什么想听的。所以你讲的过程中要和面试官互动。要看ta的反应,哪里皱眉了,哪里表情不轻松了,你就要停下来,问他Is there anywhere that you want me to talk more? 这给面试官一个机会表达自己,也帮助你更好的address面试官的考点。
-        Model方面,针对task 的类型,propose哪些model可用,把你能想到的都name出来。选择2-3个常用的,比较优劣,然后选择一个大家常用的。不同的model,输入输出可能不一样。所以决定了model,其他的component就很自然的浮现了。这一步,要在你的model框框里,把关键的component列出来,说明它们之间的关系。分析各个model的优劣,可能需要在旁边额外画出model的visualization,比如说到dnn,你就画几层multi perceptron layer,再顺便提一下SGD和ADAM。说到用logistic regression 做classification,你就顺手写一下log likelihood,显得你optimization也很懂。说到regularization,你就写写L1 norm和L2 norm。显示你的深度,主要就靠这一步。
有时候面试官会告诉你ta想用的model,你就按照ta的来,你也可以在讲解完几个model的优劣后,根据经验自己决定一个model。
游客,本帖隐藏的内容需要积分高于 20 才可浏览,您当前积分为 0。
查看如何攒积分 Click here for more info.

Step6:evaluation
- evaluation很容易讲,重点在metrics。主要有三个部分,一个是ROC/AUC curve。第二个是domain specific metrics,比如广告就有CTR。第三个是confusion matrix,重点是从它延申出来precision/recall/accuracy等等对你的solution重要的metrics。

最后再说几个加分项:
-        熟练的讲解参数估计,能显示solid的数学背景。讲估计参数可以用哪些optimization的方法(MSE, loglikelihood+GD, SGD-training data太大量, ADAM-sparse input),比较优劣.
-        解答逻辑的每个部分,尤其是你熟悉的方面,要自己主动讲,因为每个部分都很重要。别问面试官想不想听你说,除非他明确制止你讲(如果面试官说不用讲,你就失去了一个展示自己的机会)。正确的做法是,lead conversation,一边白板画框图,一边告知面试官我要讲XXX这几个部分。整个design讲完了以后,再问面试官:Is there anywhere that you feel I missed?

求加米,等米看贴,给我米不会减少你自己的米,举手之劳,互惠互利!

The last but not the least: 每一步都尽快和面试官确认,move on,不耽误时间。想要在45分钟之内把面试官讲的心服口服,这么多个component,每个只有很少的时间。


评分

参与人数 212大米 +431 收起 理由
自己路上的风景 + 2 很有用的信息!
阿钟 + 2 很有用的信息!
beerpooo + 1 赞一个
SherryZhangALAD + 1 很有用的信息!
森林妄想鱼GNLR + 1 欢迎分享你知道的情况,会给更多积分奖励!
Lily1126 + 1 赞一个
zzz15 + 1 很有用的信息!
lpzjerry + 1 很有用的信息!
喵狗狗 + 1 很有用的信息!
JarryL + 1 赞一个

查看全部评分


上一篇:热带雨林系统设计面试记录
下一篇:01/15 Uber 电面

本帖被以下淘专辑推荐:

我的人缘0
本楼: 👍   100% (1)
 
 
0% (0)   👎
全局: 👍   100% (287)
 
 
0% (0)    👎
tinyrookie 发表于 2020/01/25 01:34:17
非常感谢楼主的总结,很多干货!关于先讲model还是先讲data,我个人可能会选择先讲data,毕竟data很大程度上限...
对于一个成功的面试来说,先讲什么取决于面试官最想听什么。
根据结构化表达的原则,我们要主题先行。什么是一个ML design的主题?显然是model。同样的data,不同的modelling,水平立分高下。
其次,一般在面试官出题的时候,随着问题介绍,data都会告诉你,如果这时候继续讲data,就陷入data的细节挖掘了。如果你有很多面试的经验,你就会知道,一个design的面试中,讲清楚主题之前,如果陷入任何一部分的细节挖掘,都会让面试官开始皱眉头。
回复

使用道具 举报

我的人缘0
helloworld00 2020-1-19 22:09:31 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   80% (21)
 
 
19% (5)    👎
给lz点赞了

如果内容有个实际的例子可以结合你说的那些东西就更好了!
回复

使用道具 举报

我的人缘0
HHHHarold 2020-1-20 01:10:22 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   100% (101)
 
 
0% (0)    👎
Thanks for sharing!
回复

使用道具 举报

我的人缘0
HHHHarold 2020-1-20 01:10:31 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   100% (101)
 
 
0% (0)    👎
Thanks for sharing!
回复

使用道具 举报

我的人缘0
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   97% (1317)
 
 
2% (28)    👎
满满的干货诶
优秀的楼主
回复

使用道具 举报

我的人缘0
groundzyy 2020-1-20 02:02:21 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   96% (29)
 
 
3% (1)    👎
赞,感觉说的已经非常非常到位了,扁平一点就是problem and label,data,feature,model, metric, online.,
回复

使用道具 举报

我的人缘0
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   100% (287)
 
 
0% (0)    👎
helloworld00 发表于 2020/01/19 22:09:31
给lz点赞了

如果内容有个实际的例子可以结合你说的那些东西就更好了!
那我的ML design就要写成一个系列了,哈哈。

这里我主要是总结一下答题的套路和模版,帮助有ML背景和经验,但是面试不出彩的同学更好的发挥自己。具体的实操还是因人而异,大家按照自己的所长,强化擅长的方面,掩饰弱的方面,就能事半功倍。
回复

使用道具 举报

我的人缘0
menghuanboluomi 2020-1-20 11:02:11 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   100% (14)
 
 
0% (0)    👎
楼主能不能share一些自己看到的比较好的资料呢?谢谢
回复

使用道具 举报

我的人缘0
shpittsaustin 2020-1-20 11:27:28 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   93% (31)
 
 
6% (2)    👎
感谢楼主分享~ 楼主几年工作经验?亚马逊给了l6 as吗?谢谢
回复

使用道具 举报

我的人缘0
FinalLi 2020-1-20 13:25:48 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   41% (5)
 
 
58% (7)    👎
感谢楼主分享
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册账号

本版积分规则

隐私提醒:
■为防止被骚扰甚至人肉,不要公开留微信等联系方式,请以论坛私信方式发送。
■特定版块可以超级匿名:https://pay.1point3acres.com/tools/thread
■其他版块匿名方法:http://www.1point3acres.com/bbs/thread-405991-1-1.html

手机版|||一亩三分地

GMT+8, 2020-2-20 00:22

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表