查看: 1573|回复: 6
收起左侧

关于ds岗位机器学习面试题

  |只看干货
孙侨辰 | 显示全部楼层 |阅读模式
本楼: 👍   100% (1)
 
 
0% (0)   👎
全局: 👍   74% (52)
 
 
25% (18)    👎

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看附件。没有帐号?注册账号

x
本人最近在准备ds岗的面试,正在学机器学习相关的知识。我想知道,我记了很多model的公式,然后很多evaluate model的这些方法,在面试的时候面试官到底会怎么问这些知识?会让你手写公式吗?还是说了解原理即可。(btw:跪求大米看面经,感谢)

上一篇:强化学习 vs 深度学习
下一篇:ML推荐网课
本楼: 👍   100% (20)
 
 
0% (0)   👎
全局: 👍   99% (208)
 
 
0% (1)    👎
一般会有这么三种问法

1. 问简历上的相关项目。例如,要解决什么问题,用的什么features ,数据长什么样(是不是所谓的大数据,有没有imbalanced classes, missing values等等,如何解决),用了什么模型,为什么用这个模型而不用别的模型,这个模型的原理和特点是什么,用什么标准去评判模型(为什么不用吃的评判标准),模型部署过程中有什么挑战(比如对latency有什么要求,是否看重interpretability),模型部署之后产生了多大的impact,等等等等。

2. Case study。面试官会描述一个问题(多半就是这个公司正在做或者曾经做过的项目),然后问你怎么解决(不一定非要是做ml model,但此处我们假设就是要用ml model)。如果面试官是product manager,可能不会在意技术细节,而是更在意你的business sense,比如哪些features会对建模比较有帮助。如果面试官是技术背景,可能会更注重技术部分。典型的问题包括,模型定义(这是个supervised还是non supervised模型,classification还是regression,response variable是什么),哪些features会对建模有帮助(一般会需要一点brainstorm,以及对该domain的常识性了解),从哪里得到数据,数据可能存在的问题及解决方案,用什么类型的model,各个备选model的原理和优缺点是什么(比如logistic regression的数学公式怎么写,loss function是什么,如何fit;regularization是什么,为什么可以防止overfitting或者做variable selection;如果logistic regression和gradient boosting都可以用,哪个更好),怎么做model validation, hyper parameter tuning和model selection,用什么指标评价model(比如,如果有imbalanced classes,使用ROC AUC作为评判指标是否合理),如何interpret output(可否把prediction当作probability,如何衡量feature importance,等等),模型部署之后如果效果不如预期,可能的原因及解决方案是什么,等等等等。

3. 纯问答型。这种一般是在电面阶段,比前两种容易很多,就是考察对ml fundamentals的理解,比如用decision tree做classification时候以什么为split标准,random forest和gradient boosting的区别,等等。

另外,除非职位是做跟deep learning直接相关的项目,否则不会问deep learning,即使问,也只是为了看看知识面的广度,不会起到决定性的作用。deep learning说到底也只是一种ml model而已,面试更多的是考察对基础知识的理解程度和建模经验,而不会纠结于某一种特定类型的model.

评分

参与人数 15大米 +33 收起 理由
北辰一 + 2 很有用的信息!
Спутник + 1 很有用的信息!
pewpewpew + 1 给你点个赞!
小柒愔 + 1 赞一个
小亩_merengue + 1 给你点个赞!
lenan + 1 很有用的信息!
土豆君你好 + 1 赞一个
duanmupeiyi + 18 很有用的信息!

查看全部评分

回复

使用道具 举报

 楼主| 孙侨辰 2021-11-19 00:36:56 | 显示全部楼层
本楼: 👍   100% (1)
 
 
0% (0)   👎
全局: 👍   74% (52)
 
 
25% (18)    👎
试着注册一下吧 发表于 2021-11-17 21:58
DS已经水到可以现学现卖的程度了吗😆

?           
回复

使用道具 举报

 楼主| 孙侨辰 2021-11-18 13:35:16 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   74% (52)
 
 
25% (18)    👎
catstep 发表于 2021-11-17 20:54
一般会有这么三种问法

1. 问简历上的相关项目。例如,要解决什么问题,用的什么features ,数据长什么样( ...

赞一个,谢谢非常有用
回复

使用道具 举报

本楼: 👍   16% (1)
 
 
83% (5)   👎
全局: 👍   91% (507)
 
 
8% (50)    👎
DS已经水到可以现学现卖的程度了吗😆
回复

使用道具 举报

本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   98% (125)
 
 
1% (2)    👎
catstep 发表于 2021-11-17 20:54:21
一般会有这么三种问法

1. 问简历上的相关项目。例如,要解决什么问题,用的什么features ,数据长什么样(是不是所谓的大数据,有没有imbalanced classes, missing va
感谢大佬!好人一生平安!
回复

使用道具 举报

bruce2021 2021-11-19 07:24:04 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   71% (5)
 
 
28% (2)    👎
学んだ、ありがとうございます~
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册账号
隐私提醒:
  • ☑ 禁止发布广告,拉群,贴个人联系方式:找人请去🔗同学同事飞友,拉群请去🔗拉群结伴,广告请去🔗跳蚤市场,和 🔗租房广告|找室友
  • ☑ 论坛内容在发帖 30 分钟内可以编辑,过后则不能删帖。为防止被骚扰甚至人肉,不要公开留微信等联系方式,如有需求请以论坛私信方式发送。
  • ☑ 干货版块可免费使用 🔗超级匿名:面经(美国面经、中国面经、数科面经、PM面经),抖包袱(美国、中国)和录取汇报、定位选校版
  • ☑ 查阅全站 🔗各种匿名方法

本版积分规则

>
快速回复 返回顶部 返回列表