一亩三分地

 找回密码 注册账号

扫描二维码登录本站


Salarytics=Salary Analytics
查询工资数据
系统自动计算每年收入

科技公司如何
用数据分析驱动产品开发
coupon code 250off 立减$250

深入浅出AB Test
从入门到精通
coupon code 250off 立减$250
游戏初创公司招聘工程师、UIUX Designer和游戏策划
坐标湾区
DreamCraft创始团队
招聘游戏开发工程师
把贵司信息放这里
查看: 1696|回复: 15
收起左侧

新鲜狗家面经

[复制链接] |试试Instant~ |数科面经, 面试经验, 分析|数据科学类, google
我的人缘0

分享帖子到朋友圈
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   100% (12)
 
 
0% (0)    👎

2019(7-9月) 分析|数据科学类 博士 全职@Google - 网上海投 - 技术电面  | Other | fresh grad应届毕业生

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?注册账号

x
本帖最后由 charleswu.01 于 2019-10-4 03:03 编辑

刚面完来发面经,fingers crossed!
面试比我准备的简单多了。。。一直在准备各种难题,甚至连Power = 1-beta这种东西都给忘了。。。
大概问了一下几个问题,问题都比较基础:
1.给你一组数据测试广告效果的,有experiment control, 怎么比较两个组的mean
2.同样的那组数据,加上一个column告诉你这些数据都是来源于不同广告的(但是experiment和control是同一个广告),这个告诉你什么信息?(数据不是iid了。。。)
3.给你这组数据的分布图,他们看起来并不是normal的,你要怎么来比较mean... 1point3acres
4.power analysis需要哪些parameter, power的表达式是什么(没说出来1-beta,不过我说出来了power function = ptheta(data) under alternative hypot
游客,本帖隐藏的内容需要积分高于 188 才可浏览,您当前积分为 0。
查看如何攒积分 Click here for more info.
the sum of the square root of the odd numbers and the sum of the square root of the even numbers.

希望大家都拿到好offer!

评分

参与人数 4大米 +23 收起 理由
清道神君 + 20
everydaynet + 1 谢谢分享
space130 + 1 给你点个赞!
faithmi + 1 赞一个

查看全部评分


上一篇:capital one ds video面经
下一篇:【吐槽无良公司】装修房子 BIE第三轮技术面前一天,HR打电话来说岗位突然取消
我的人缘0
EdwardYu 2019-10-4 04:03:44 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   100% (2)
 
 
0% (0)    👎
能请问一下楼主投的是什么岗吗?PHD 的那个 core DS吗?
回复

使用道具 举报

我的人缘0
Frances0412 2019-10-4 05:17:48 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   96% (206)
 
 
3% (7)    👎
请问下LZ
Q1的metric选择是什么呢,CTR还是revenue?反正应该是quantitative data,所以就是用two tail T-test?
Q2是想问什么啊?需要把这个control & experiment的ads的数据从
Q3是compare control & experiment for the same ads,也就是两个group吗?是用Mann-Whitney U test?
当然还得看sample size, 也有的人说如果sample size足够大,那么也可以用T test但是保险起见可以用non parametric跑跑
回复

使用道具 举报

我的人缘0
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   100% (1)
 
 
0% (0)    👎
Frances0412 发表于 2019/10/04 05:17:48
请问下LZ
Q1的metric选择是什么呢,CTR还是revenue?反正应该是quantitative data,所以就是用two tail T-test?
Q2是想问什么啊?需要把这个con...
sample size大也不能用t test因为t test的assumption就是data normally distributed. 感觉Sample size大根据lln可以用z test
回复

使用道具 举报

我的人缘0
Frances0412 2019-10-4 14:09:25 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   96% (206)
 
 
3% (7)    👎
faithmi 发表于 2019-10-4 05:24
sample size大也不能用t test因为t test的assumption就是data normally distributed. 感觉Sample size大根 ...

Z test的assumption也是normal distribution啊

而且sample大的话T的结果会趋近于Z的了,用Z和T都没有区别了。。。

”By the central limit theorem, means of samples from a population with finite variance approach a normal distribution regardless of the distribution of the population. Rules of thumb say that the sample means are basically normally distributed as long as the sample size is at least 20 or 30. For a t-test to be valid on a sample of smaller size, the population distribution would have to be approximately normal.

The t-test is invalid for small samples from non-normal distributions, but it is valid for large samples from non-normal distributions.“

https://stats.stackexchange.com/ ... non-normal-when-n50

还有好几篇也是在讲T-test可以用,但是arugable...

回复

使用道具 举报

我的人缘0
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   100% (1)
 
 
0% (0)    👎
Frances0412 发表于 2019/10/04 14:09:25
Z test的assumption也是normal distribution啊

而且sample大的话T的结果会趋近于Z的了,用Z和T都没有区别了。。。

”By the central...
严格地说,按你引用的第一段话,clt valid even the population is not normally distributed, 所以test mean的时候可以用z,但是t valid only when population is normally distributed.
回复

使用道具 举报

我的人缘0
Frances0412 2019-10-5 00:18:11 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   96% (206)
 
 
3% (7)    👎
faithmi 发表于 2019-10-4 22:39
严格地说,按你引用的第一段话,clt valid even the population is not normally distributed, 所以test m ...

Hmmmm

arguable.... 我觉得关键问题不是normally distributed or not,关键是whether sample size is sufficiently large (i.e., >30 > 50) enough to be able to use CLT to get nearly normal distribution of its mean.

" The t-test is invalid for small samples from non-normal distributions, but it is valid for large samples from non-normal distributions."

再任意丢两个链接:
https://thestatsgeek.com/2013/09 ... s-to-non-normality/
https://stats.stackexchange.com/ ... non-normal-when-n50

再次重申,这个是有争议的,或者是说还是要有一些assumption。更严谨的估计是用Wilcoxon test,
If normality holds, it is 95% as efficient as the t-test. If normality does not hold it can be arbitrarily more efficient than the t-test.
回复

使用道具 举报

我的人缘0
Frances0412 2019-10-5 00:58:12 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   96% (206)
 
 
3% (7)    👎
faithmi 发表于 2019-10-4 22:39
严格地说,按你引用的第一段话,clt valid even the population is not normally distributed, 所以test m ...

这一篇post也很有趣 可以读读
https://stats.stackexchange.com/ ... essentially-useless
回复

使用道具 举报

我的人缘0
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   100% (1)
 
 
0% (0)    👎
Frances0412 发表于 2019/10/05 00:18:11
Hmmmm

arguable.... 我觉得关键问题不是normally distributed or not,关键是whether sample size is sufficiently ...
这个是有争议的 只是以前统计课的training都是t能不能用在于population distribution是不是近似于normal的。
这个题个人觉得可能应该是用bootstrap
回复

使用道具 举报

我的人缘0
hefansysu 2019-10-7 17:29:37 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   0% (0)
 
 
0% (0)    👎
感觉楼主很厉害,学习了
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册账号

本版积分规则

隐私提醒:
■为防止被骚扰甚至人肉,不要公开留微信等联系方式,请以论坛私信方式发送。
■特定版块可以超级匿名:https://pay.1point3acres.com/tools/thread
■其他版块匿名方法:http://www.1point3acres.com/bbs/thread-405991-1-1.html

手机版||一亩三分地

GMT+8, 2019-11-18 16:21

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表