一亩三分地

 找回密码 注册账号

扫描二维码登录本站

BBS
Offer多多
Salarytics
交友
Learn
Who's Hiring?
Visa Tracker
疫情动态
指尖新闻
Instant
客户端
微信公众号
扫码关注公众号
留学申请公众号
扫码关注留学申请公众号
Youtube频道
留学博客
关于我们
查看: 2113|回复: 12
收起左侧

Pinterest 电面 挂经

[复制链接] |只看干货 |pinterest, 面试经验, 分析|数据科学类, 数科面经
地里的匿名用户
地里的匿名用户  发表于 2020-7-22 14:38:19 |阅读模式
本楼: 👍   0% (0)
 
 
0% (0)   👎

2020(7-9月) 分析|数据科学类 硕士 全职@Pinterest - 网上海投 - 技术电面  | Fail/Rej | 在职跳槽

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?注册账号

x
电面一个小时挂了
3-4道题

第一题sql
. 1point3acres一个impression data 有 pinId, userid, timestamp
一个promoted pin data 有pinId ....
一个user table, userid, is_spammer
叫用sql 算出来% of impression that are from promoted & non spam

第二道题 pandas
给一个table, 里面有category和revenue。。。 category 有15% missing value。
叫你做data analysis fill in missing value...这道题我没有答好,有会的同学分享一下答案?
-baidu 1point3acres
游客,本帖隐藏的内容需要积分高于 188 才可浏览,您当前积分为 0。
查看如何攒积分 Click here for more info.
. 1point3acres

第四道题
如果你看到你的experiment中100个impression中有个5个click, 请问是否stat significant from 0.04

评分

参与人数 3大米 +4 收起 理由
haroldfry + 1 赞一个
zhubq + 2 很有用的信息!
Utica + 1 很有用的信息!

查看全部评分


上一篇:Morgan Stanley 做市组
下一篇:Capital One DS(以及DA, QUANT, BA)面试流程加面经
我的人缘0

升级   12.5%

fufulaijiayou 2020-7-22 23:54:56 | 显示全部楼层
本楼: 👍   100% (1)
 
 
0% (0)   👎
全局: 👍   98% (67)
 
 
1% (1)    👎
P value的definition 是probability of  the event that is equal or more extreme than the observation
所以这里的p value 已经改是 sum i = 0 to 4 where 100 impression has i click,  0.04^5 *0.96^95 (100 choose 5)  + 0.04^4 *0.96^95 (100 choose 4) + 0.04^3 *0.96^95 (100 choose 3) + ... +0.96^100
回复

使用道具 举报

我的人缘0

升级   1.5%

hwaaron 2020-7-22 16:01:37 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   95% (91)
 
 
4% (4)    👎
第三题   我感觉跟你想法一样 求答案。
第四题应该是不 significant?  因为  sqrt((0.04*0.96)/100) = 0.019    0.04 +- 0.019  》 0.05 . check 1point3acres for more.
求指点
回复

使用道具 举报

我的人缘0

升级   12.5%

fufulaijiayou 2020-7-22 23:56:33 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   98% (67)
 
 
1% (1)    👎
fufulaijiayou 发表于 2020-7-22 23:54
P value的definition 是probability of  the event that is equal or more extreme than the observation
...

看错了。。。以为是算p value。。。楼主可以算一个95% confidence interval 或者run 一个t-test
回复

使用道具 举报

我的人缘0

升级   18.57%

Utica 2020-7-23 02:08:23 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   100% (38)
 
 
0% (0)    👎
第三题感觉应该是对的。第四题我也感觉算t test就行了。不过话说回来,0.04跟 5/100 差了0.01 (25%), 从直觉上来讲也是差太多。
-baidu 1point3acres
楼主面的是什么职位啊?
回复

使用道具 举报

我的人缘0

升级   93.33%

tliu23 2020-7-24 10:52:54 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   100% (11)
 
 
0% (0)    👎
Utica 发表于 2020-7-23 02:08
第三题感觉应该是对的。第四题我也感觉算t test就行了。不过话说回来,0.04跟 5/100 差了0.01 (25%), 从直 ...

我用t-test来算的,他的回答是“你这么说好像也对”。。。。不知道他们真正想法是什么。

data scientist..

评分

参与人数 1大米 +1 收起 理由
Utica + 1 很有用的信息!

查看全部评分

回复

使用道具 举报

我的人缘0

升级   41.25%

mayuki 2020-7-24 14:16:25 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   97% (682)
 
 
2% (18)    👎
楼主几年工作经验,pin好像现在招DS最低要6+yr
回复

使用道具 举报

我的人缘0

升级   69.57%

本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   93% (55)
 
 
6% (4)    👎
本帖最后由 solv6868 于 2020-7-24 15:18 编辑
tliu23 发表于 2020-07-23 19:52:54
我用t-test来算的,他的回答是“你这么说好像也对”。。。。不知道他们真正想法是什么。

data scientist..

哈喽楼主,如果用t-test的话,其实你是做了个normal approximation to binomial,当n足够大的时候,这样做当然也是对的。

我觉得面试官可能想要的是exact probability,这个其实就是上一题的延续。
回复

使用道具 举报

我的人缘0

升级   7.14%

yyviolin 2020-7-24 22:38:09 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   71% (172)
 
 
28% (70)    👎
第二道题 pandas
给一个table, 里面有category和revenue。。。 category 有15% missing value。


楼主很不错了,这题目我面试时候直接回答也很难一下子写出来。我翻了我的cheat sheet。

貌似可以这么写,取每个category的中位数来填充。

df['revenue'] = df.groupby('category')['revenue'].apply(lambda x: x.fillna(x.median())
回复

使用道具 举报

我的人缘0

升级   18.57%

Utica 2020-7-24 22:43:09 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   100% (38)
 
 
0% (0)    👎
tliu23 发表于 2020-7-24 10:52
我用t-test来算的,他的回答是“你这么说好像也对”。。。。不知道他们真正想法是什么。

data scienti ...

嗯嗯 谢谢 楼主加油!
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册账号

本版积分规则

隐私提醒:
■拉群请前往同学同事飞友|拉群结伴版块,其他版块拉群,帖子会被自动删除
■论坛不能删帖,为防止被骚扰甚至人肉,不要公开留微信等联系方式,请以论坛私信方式发送。
■特定版块可以超级匿名:https://pay.1point3acres.com/tools/thread
■其他版块匿名方法:http://www.1point3acres.com/bbs/thread-405991-1-1.html

手机版|||一亩三分地

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

Some icons made by Freepik from flaticon.com

快速回复 返回顶部 返回列表