活跃农民
- 积分
- 331
- 大米
- 颗
- 鳄梨
- 个
- 水井
- 尺
- 蓝莓
- 颗
- 萝卜
- 根
- 小米
- 粒
- 学分
- 个
- 注册时间
- 2015-11-27
- 最后登录
- 1970-1-1
|
本楼: |
👍
100% (20)
|
|
0% (0)
👎
|
全局: |
👍 99% (208) |
|
0% (1) 👎 |
一般会有这么三种问法
1. 问简历上的相关项目。例如,要解决什么问题,用的什么features ,数据长什么样(是不是所谓的大数据,有没有imbalanced classes, missing values等等,如何解决),用了什么模型,为什么用这个模型而不用别的模型,这个模型的原理和特点是什么,用什么标准去评判模型(为什么不用吃的评判标准),模型部署过程中有什么挑战(比如对latency有什么要求,是否看重interpretability),模型部署之后产生了多大的impact,等等等等。
2. Case study。面试官会描述一个问题(多半就是这个公司正在做或者曾经做过的项目),然后问你怎么解决(不一定非要是做ml model,但此处我们假设就是要用ml model)。如果面试官是product manager,可能不会在意技术细节,而是更在意你的business sense,比如哪些features会对建模比较有帮助。如果面试官是技术背景,可能会更注重技术部分。典型的问题包括,模型定义(这是个supervised还是non supervised模型,classification还是regression,response variable是什么),哪些features会对建模有帮助(一般会需要一点brainstorm,以及对该domain的常识性了解),从哪里得到数据,数据可能存在的问题及解决方案,用什么类型的model,各个备选model的原理和优缺点是什么(比如logistic regression的数学公式怎么写,loss function是什么,如何fit;regularization是什么,为什么可以防止overfitting或者做variable selection;如果logistic regression和gradient boosting都可以用,哪个更好),怎么做model validation, hyper parameter tuning和model selection,用什么指标评价model(比如,如果有imbalanced classes,使用ROC AUC作为评判指标是否合理),如何interpret output(可否把prediction当作probability,如何衡量feature importance,等等),模型部署之后如果效果不如预期,可能的原因及解决方案是什么,等等等等。
3. 纯问答型。这种一般是在电面阶段,比前两种容易很多,就是考察对ml fundamentals的理解,比如用decision tree做classification时候以什么为split标准,random forest和gradient boosting的区别,等等。
另外,除非职位是做跟deep learning直接相关的项目,否则不会问deep learning,即使问,也只是为了看看知识面的广度,不会起到决定性的作用。deep learning说到底也只是一种ml model而已,面试更多的是考察对基础知识的理解程度和建模经验,而不会纠结于某一种特定类型的model. |
评分
-
查看全部评分
|