CPT挂靠抽中H1B后被RFE

一亩三分地论坛

 找回密码
 Sign Up 注册获取更多干货
有你有策略
微策略(MicroStrategy)
2019校园招聘火热进行中
E轮2.5亿美元融资
K12教育独角兽一起作业诚聘
机器学习/数据统计/教育等职位
码农求职神器Triplebyte:
不用海投
内推多家公司面试
高效直聘+内推,70%面试率
AI帮你免费完善简历
直击全美十万个科技职位
坐标湾区
DreamCraft创始团队
招聘游戏开发工程师
游戏初创公司招聘工程师、UIUX Designer和游戏策划
把贵司招聘信息放这里
查看: 467|回复: 9
收起左侧

Capital One Data Scientist 一轮电面

[复制链接] |试试Instant~
我的人缘0
naivelamb 发表于 7 天前 | 显示全部楼层 |阅读模式
该内容以做模糊处理,您需要登录后才可查看. 登录 | Sign Up 注册获取更多干货
本楼: 【顶】   0% (0)
 
 
0% (0)   【踩】
全局: 顶  100% (12)
 
 
0% (0)  踩

2019(10-12月) 分析|数据科学类 博士 全职@Capital One - 网上海投 - 技术电面  | Other | fresh grad应届毕业生

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?Sign Up 注册获取更多干货

x
本帖最后由 naivelamb 于 2018-11-11 04:31 编辑

Position: Principal Associate, Data Scientist

一轮技术电面,跟一个在Capital One工作的Data Scientist聊了一个小时。先互相介绍了一下,给我讲了讲他在capital one做什么,之后技术面试聊了大概50分钟,只有case。

题目是有一个运动产品的零售商,来找你优化他们的在线广告竞拍系统,提高response rate。假设你有的数据是3, 000, 000用户的访问数据,每行数据有150多个column,已知overall的response rate是1/1000。
被问的问题有:
1. 选什么作为target?
Response or not
2. 选什么metrics?
AUC-ROC
3. 怎么处理NA? . check 1point3acres for more.
It depends. If NA is meaningful, leave it there. If NA is missing due to data extracation, do some simple if-else condition/mean(median)/regression to fill
4. 怎么做feature engineering?
Encode categorical varaible, use 'groupby' and 'mean/medium/std' to generate some features-baidu 1point3acres
4. 数据量特别大怎么办?
mapreduce,但是我没用过,就拿本地并行优化举了个例子,怎么分配数据给各个线程,然后怎么把数据收回来合并。
5. 模型用什么?
GBDT,lightGBM/XGB
6. 怎么评估模型表现?
k-fold CV
7. Overfitting/underfitting怎么办?
分别讨论了一下。想办法获取更多的数据,调整hyper-parameter。
8. 如果模型预测出了问题,会有什么影响?
分情况讨论了一下整体上会有什么变化,对单个用户有什么影响。

最后5分钟让提了下问题。接下来的流程是等HR回复结果,做一个data challenge(应该是给数据建模型),然后on-site。




评分

参与人数 4大米 +10 收起 理由
minnill + 1 给你点个赞!
lolofter + 1 赞一个
金小帅 + 5 很有用的信息!
park02 + 3 给你点个赞!

查看全部评分


上一篇:Factual ds 第一轮电面挂经
下一篇:c3IoT OA
我的人缘0
 楼主| naivelamb 发表于 7 天前 | 显示全部楼层
本楼: 【顶】   0% (0)
 
 
0% (0)   【踩】
全局: 顶  100% (12)
 
 
0% (0)  踩
好吧,不知道存了草稿就不能继续编辑了,我在这继续写吧。

补充内容 (2018-11-11 04:32):
请忽略...新人不熟悉论坛功能 =_=
回复

使用道具 举报

我的人缘0
sx910604 发表于 7 天前 | 显示全部楼层
本楼: 【顶】   0% (0)
 
 
0% (0)   【踩】
全局: 顶  100% (5)
 
 
0% (0)  踩
response rate 1/1000 选auroc好么
回复

使用道具 举报

我的人缘0
 楼主| naivelamb 发表于 7 天前 | 显示全部楼层
本楼: 【顶】   0% (0)
 
 
0% (0)   【踩】
全局: 顶  100% (12)
 
 
0% (0)  踩
sx910604 发表于 2018-11-11 07:58
response rate 1/1000 选auroc好么

具体选什么还是要根据模型的目的来。. From 1point 3acres bbs
我觉得这个case里,准确分辨出两个class都很重要,所以用auc-roc。如果是信用卡risk需要detect bad loan的话,那precision可能更好。
回复

使用道具 举报

我的人缘0
sx910604 发表于 7 天前 | 显示全部楼层
本楼: 【顶】   0% (0)
 
 
0% (0)   【踩】
全局: 顶  100% (5)
 
 
0% (0)  踩
naivelamb 发表于 2018-11-11 10:10
具体选什么还是要根据模型的目的来。
我觉得这个case里,准确分辨出两个class都很重要,所以用auc-roc。 ...

我以为他们考点就是unbalanced用auroc分辨不出来呢
回复

使用道具 举报

我的人缘0
金小帅 发表于 6 天前 | 显示全部楼层
本楼: 【顶】   0% (0)
 
 
0% (0)   【踩】
全局: 顶  98% (51)
 
 
1% (1)  踩
他们家面试题是看组的吗? 请问楼主target的组是在哪里?
回复

使用道具 举报

我的人缘0
金小帅 发表于 6 天前 | 显示全部楼层
本楼: 【顶】   0% (0)
 
 
0% (0)   【踩】
全局: 顶  98% (51)
 
 
1% (1)  踩
因为看其他面经好多是信用卡类的case
回复

使用道具 举报

我的人缘0
 楼主| naivelamb 发表于 5 天前 | 显示全部楼层
本楼: 【顶】   0% (0)
 
 
0% (0)   【踩】
全局: 顶  100% (12)
 
 
0% (0)  踩
金小帅 发表于 2018-11-12 11:22. 1point3acres
他们家面试题是看组的吗? 请问楼主target的组是在哪里?

这个我也不清楚,我面的是德州的组。
回复

使用道具 举报

我的人缘0
金小帅 发表于 5 天前 | 显示全部楼层
本楼: 【顶】   0% (0)
 
 
0% (0)   【踩】
全局: 顶  98% (51)
 
 
1% (1)  踩
因为我面dc结果发现面试官是tx的, 有点晕.

Anyway, 感谢!

With React+D3v4 you'll learn the basics of building fast data visualization components in about an hour.


回复

使用道具 举报

我的人缘0
金小帅 发表于 5 天前 | 显示全部楼层
本楼: 【顶】   0% (0)
 
 
0% (0)   【踩】
全局: 顶  98% (51)
 
 
1% (1)  踩
请问楼主讲mapreduce是用什么model为例子的呢?
回复

使用道具 举报

游客
请先登录

本版积分规则

提醒:发帖可以选择内容隐藏,部分板块支持匿名发帖。请认真读完以下全部说明:

■隐藏内容方法 - 不要多加空格: [hide=200]你想要隐藏的内容比如面经[/hide]
■意思是:用户积分低于200则看不到被隐藏的内容
■可以自行设置积分值,不建议太高(200以上太多人看不到),也不建议太低(那就没必要隐藏了)
■建议只隐藏关键内容,比如具体的面试题目、涉及隐私的信息,大部分内容没必要隐藏。
■微信/QQ/电子邮件等,为防止将来被骚扰甚至人肉,以论坛私信方式发给对方最安全。
■匿名发帖的板块和方法:http://www.1point3acres.com/bbs/thread-405991-1-1.html

手机版|小黑屋|联系我们&一亩三分地论坛声明

GMT+8, 2018-11-18 03:51

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表