回复: 20
跳转到指定楼层
上一主题 下一主题
收起左侧

Amazon DS 第一轮电面

全局:

2019(7-9月) 分析|数据科学类 博士 全职@amazon - 网上海投 - 技术电面  | | Other | 在职跳槽

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看附件。没有帐号?注册账号

x
这个DS第二轮电面。
因为已经面过第一轮了,一上来没有废话直奔主题。. 1point3acres

讲一个project,问的非常详细,数据多少行,多少Feature,顺便借此问了一下deep dive的leadership principle,模型的选择,能回想起来的问题如下。. .и

1. logistic regression vs. random forest.
2. random forest vs. decision tree
3. 为什么random forest要去subset of data, 为什么还要取subset of features,问的很深,答得不太好
4. 有没有用Boosting,boosting vs bagging.
5. evaluation metric, unbalanced data, precision/recall的定义和tradeoff

接下来是一个hypothesis testing的问题

您好!
本帖隐藏的内容需要积分高于 150 才可浏览
您当前积分为 0。
使用VIP即刻解锁阅读权限或查看其他获取积分的方式
游客,您好!
本帖隐藏的内容需要积分高于 150 才可浏览
您当前积分为 0。
VIP即刻解锁阅读权限查看其他获取积分的方式
Unlock interview details and practice with AI
Curated Interview Questions from Top Companies


最后是关于linear regression的问题
1. 什么是Linear regression, coefficients 是什么 ..
2. Assumptions都有哪些
3. 如何得到最佳的parameters, 用gradient descent.1point3acres
4. 如果处理collinearity问题
5. 如果两个variable perfectly correlated 会出现什么问题,好像是gradient descent就不是Convex了,每次得到的parameter都不一样,这块问的很深很数学有点懵 (regularized 了就能Converge了)
6. 什么是regularization,效果是什么





评分

参与人数 9大米 +41 收起 理由
kayokocnwx + 2 很有用的信息!
huixingzhijia + 2 很有用的信息!
garyzccisme + 1 很有用的信息!
mikozhuzhu + 1 赞一个
danma9023 + 1 给你点个赞!

查看全部评分


上一篇:FB脸书热腾腾的店面面经
下一篇:Akuna quant dynamic python 新鲜OA题

本帖被以下淘专辑推荐:

推荐
 楼主| enpc 2019-9-25 02:04:00 | 只看该作者
全局:
lsdah 发表于 2019-9-25 00:43
所以为什么用subset features楼主知道了吗?我觉得是不是因为如果用了全部features,一些strong predictors ...

恩恩 我觉得是对的。
关于第一个问题,有一个blog是这么写的,跟你说的是一个意思
“Random forest improves on bagging because it decorrelates the trees with the introduction of splitting on a random subset of features. This means that at each split of the tree, the model considers only a small subset of features rather than all of the features of the model. That is, from the set of available features n, a subset of m features (m=square root of n) are selected at random. This is important so that variance can be averaged away. Consider what would happen if the data set contains a few strong predictors. These predictors will consistently be chosen at the top level of the trees, so we will have very similar structured trees. In other words, the trees would be highly correlated.”
回复

使用道具 举报

推荐
 楼主| enpc 2020-4-23 11:39:55 | 只看该作者
全局:
huixingzhijia 发表于 2020-4-23 10:09
楼主我看你是面试amazon ads,是纽约的岗位吗?能分享一下onsite的消息吗?

面的是湾区的ads岗位,已经是半年前了,有些记不太清了。

onsite太概是5轮+吃饭,有两轮是完全Behavioral问题,其他的三轮一轮是考model,machine learning相关的,一轮是考Coding,还有一轮考ab testing,统计的知识。大概是这样。反正是大量behavior问题。
回复

使用道具 举报

🔗
 楼主| enpc 2019-9-11 08:00:25 | 只看该作者
全局:
标题更正:是第二轮电面
回复

使用道具 举报

全局:
问题的确挺详细的,需要一些经历才能答的很好,楼主面Senior吗?
回复

使用道具 举报

🔗
MichaelPIBQ 2019-9-11 08:26:59 | 只看该作者
全局:
同问,楼主面的是senior还是new grad也可以申请的呀
回复

使用道具 举报

🔗
冰吧ip哥 2019-9-11 08:44:10 | 只看该作者
全局:
感觉是senior级别的问题,话说不考SQL嘛
回复

使用道具 举报

🔗
 楼主| enpc 2019-9-11 09:03:42 | 只看该作者
全局:
MichaelPIBQ 发表于 2019-9-11 08:26
同问,楼主面的是senior还是new grad也可以申请的呀

title是data scientist不是senior但是要2年还是3年工作经验

评分

参与人数 1大米 +1 收起 理由
MichaelPIBQ + 1 很有用的信息!

查看全部评分

回复

使用道具 举报

🔗
 楼主| enpc 2019-9-11 09:04:13 | 只看该作者
全局:
冰吧ip哥 发表于 2019-9-11 08:44
感觉是senior级别的问题,话说不考SQL嘛
. 1point 3 acres
这轮没考coding, 第一轮电面考了
回复

使用道具 举报

🔗
冰吧ip哥 2019-9-12 06:55:23 | 只看该作者
全局:
enpc 发表于 2019-9-11 09:04
这轮没考coding, 第一轮电面考了

嗯嗯,话说coding只考sql嘛,刷完leetcode的够用嘛~
回复

使用道具 举报

🔗
 楼主| enpc 2019-9-12 06:58:35 | 只看该作者
全局:
冰吧ip哥 发表于 2019-9-12 06:55
嗯嗯,话说coding只考sql嘛,刷完leetcode的够用嘛~
.--
不只sql, 还考了r/pytthon做data manipulations, 但是都不难,没有考的很深
回复

使用道具 举报

🔗
lsdah 2019-9-25 00:43:39 来自APP | 只看该作者
全局:
所以为什么用subset features楼主知道了吗?我觉得是不是因为如果用了全部features,一些strong predictors就会在每个weak classifiers里出现,导致最后bagging的结果并不能reduce variance?. 1point3acres

还有有collinearity的话,这两项的coefficients就会变成arbitrary和不稳定,增大了coefficients variance,所以每次都会不一样。加regularization就会shrink coefficients,不知道这样对不对?
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册账号
隐私提醒:
  • ☑ 禁止发布广告,拉群,贴个人联系方式:找人请去🔗同学同事飞友,拉群请去🔗拉群结伴,广告请去🔗跳蚤市场,和 🔗租房广告|找室友
  • ☑ 论坛内容在发帖 30 分钟内可以编辑,过后则不能删帖。为防止被骚扰甚至人肉,不要公开留微信等联系方式,如有需求请以论坛私信方式发送。
  • ☑ 干货版块可免费使用 🔗超级匿名:面经(美国面经、中国面经、数科面经、PM面经),抖包袱(美国、中国)和录取汇报、定位选校版
  • ☑ 查阅全站 🔗各种匿名方法

本版积分规则

>
快速回复 返回顶部 返回列表