2019 Fall ECE/CE/EE 录取结果播报

一亩三分地论坛

 找回密码
 Sign Up 注册获取更多干货

扫描二维码登录本站

最近看过此主题的会员


码农求职神器Triplebyte
不用海投
内推多家公司面试

科技公司如何
用数据分析驱动产品开发
Coupon code: best

深入浅出AB Test
从入门到精通
Coupon code: best

E轮2.5亿美元融资
一起作业诚聘
机器学习/数据/教育等职位
游戏初创公司招聘工程师、UIUX Designer和游戏策划
坐标湾区
DreamCraft创始团队
招聘游戏开发工程师
把贵司招聘信息放这里
查看: 2075|回复: 7
收起左侧

FB sample size题

[复制链接] |试试Instant~
我的人缘0

分享帖子到朋友圈
ds_app2018 发表于 2018-3-20 11:49:31 | 显示全部楼层 |阅读模式
本楼: 【顶】   0% (0)
 
 
0% (0)   【踩】
全局: 顶  100% (7)
 
 
0% (0)  踩

2018(1-3月) 分析|数据科学类 硕士 全职@Facebook - 内推 - 技术电面  | Other | 其他

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?Sign Up 注册获取更多干货

x
Lets say the population on Facebook clicks ads with a
游客,本帖隐藏的内容需要积分高于 188 才可浏览,您当前积分为 0。
查看如何攒积分 Click here for more info.
{P}is within DELTA of the true click through rate P, with 95% confidence.

评分

参与人数 1大米 +3 收起 理由
susiezam + 3 很有用的信息!

查看全部评分


上一篇:Insight Data Science二面面经
下一篇:LIAN面经
我的人缘0
 楼主| ds_app2018 发表于 2018-3-20 11:51:13 | 显示全部楼层
本楼: 【顶】   100% (1)
 
 
0% (0)   【踩】
全局: 顶  100% (7)
 
 
0% (0)  踩
网上有人回答的答案是这样的,觉得最后一个公式N is greater than (1 / delta)^2不是太懂,求讨论!

Interpret the question this way: we want to choose an N such that P_hat is an element of [P - delta, P + delta] with probability 95%.

First, note that since P_hat is the sum of N Bernoulli trials with some common parameter (by assumption) that we are trying to estimate, we can safely assume P_hat to be normally distributed with mean equal to the true mean (P) and variance equal to (P)(1 - P) / N.

Now, we when does a normally distributed random variable fall within delta of it's mean with 95% probability? The answer depends on how big delta is. Since P_hat is normally distributed, we know from our statistics classes that 95% of the time
游客,本帖隐藏的内容需要积分高于 10 才可浏览,您当前积分为 0。
查看如何攒积分 Click here for more info.

To put it all together: delta = 2 * Sqrt(0.25) / Sqrt(N) = 2 * .5 / Sqrt(N) => N = (1 / delta) ^ 2. So when N is greater than (1 / delta)^2, we can rest assured that P_hat will fall within the acceptable range 95% of the time.

回复

使用道具 举报

我的人缘0
cloud0325 发表于 2018-3-22 01:29:38 | 显示全部楼层
本楼: 【顶】   0% (0)
 
 
0% (0)   【踩】
全局: 顶  100% (1)
 
 
0% (0)  踩
因为这里要求minimum N, P_hat * (1 - P_hat) is maximized when P_hat is .5
so 2*sqrt(P_hat * (1 - P_hat))/sqrt(N
游客,本帖隐藏的内容需要积分高于 10 才可浏览,您当前积分为 0。
查看如何攒积分 Click here for more info.
1/delta)^2
另外,这里应该是1.96 不是 2 吧??
回复

使用道具 举报

我的人缘0
sunday2018 发表于 2018-3-24 03:34:27 | 显示全部楼层
本楼: 【顶】   0% (0)
 
 
0% (0)   【踩】
全局: 顶  88% (16)
 
 
11% (2)  踩
请问楼主面了吗?
回复

使用道具 举报

我的人缘0
hjftc001 发表于 2018-3-24 12:10:17 | 显示全部楼层
本楼: 【顶】   0% (0)
 
 
0% (0)   【踩】
全局: 顶  100% (2)
 
 
0% (0)  踩
cloud0325 发表于 2018-3-22 01:29
因为这里要求minimum N, P_hat * (1 - P_hat) is maximized when P_hat is .5
so 2*sqrt(P_hat * (1 - P_h ...

应该是1.96。楼主给的答案是用了3 sigma rule 估计的
回复

使用道具 举报

我的人缘0
h19881812 发表于 2018-3-25 23:59:33 | 显示全部楼层
本楼: 【顶】   0% (0)
 
 
0% (0)   【踩】
全局: 顶  100% (2)
 
 
0% (0)  踩
Actually, it is not very important to use 1.96 or 2 since we use CLT to do the normal approximation.

Assume X_i = 1 if the i-th user click and 0 otherwise. Assume X_i ~iid Ber(p) and sum_{i=1}^N X_i ~ Bin(N,p). Let p_hat = \sum X_i / N be the sample click-through rate.
(1) E(p_hat) = E(sum X_i / N) = 1 / N sum E(X_i) = 1 / N * Np = p
(2) Var(p_hat) = Var(sum X_i / N) = 1 / N^2 sum Var(X_i) (by iid property)  = 1 / N^2 * Np(1-p) = p(1-p) / N.
By CLT, (p_hat - p) is asymptotically normally distributed with mean 0 and variance p(1-p)/N. That is, (p_hat -
游客,本帖隐藏的内容需要积分高于 10 才可浏览,您当前积分为 0。
查看如何攒积分 Click here for more info.
exact value of 0 < p < 1, it is clear that p(1-p) <= 1/4 by some simple calculus.

Finally, we get N =  4 * delta^2 / p*(1-p) >= 4 * delta^2 / 4 = delta^2.
回复

使用道具 举报

我的人缘0
h19881812 发表于 2018-3-26 00:02:36 | 显示全部楼层
本楼: 【顶】   0% (0)
 
 
0% (0)   【踩】
全局: 顶  100% (2)
 
 
0% (0)  踩
h19881812 发表于 2018-3-25 23:59
Actually, it is not very important to use 1.96 or 2 since we use CLT to do the normal approximation. ...

Btw, when conducting a real experiment, we should be very careful about the assumption that X_i's are i.i.d.
回复

使用道具 举报

我的人缘0
linbaobei001 发表于 2018-3-28 05:51:29 | 显示全部楼层
本楼: 【顶】   0% (0)
 
 
0% (0)   【踩】
全局: 顶  90% (20)
 
 
9% (2)  踩
h19881812 发表于 2018-3-25 23:59
Actually, it is not very important to use 1.96 or 2 since we use CLT to do the normal approximation. ...

很好的答案,, 解释的很清楚,但是你最后一步好像错了,,, N= 4*p(1-p) /belta^2    分子和分母反了~
回复

使用道具 举报

游客
请先登录

本版积分规则

提醒:发帖可以选择内容隐藏,部分板块支持匿名发帖。请认真读完以下全部说明:

■隐藏内容方法 - 不要多加空格: [hide=200]你想要隐藏的内容比如面经[/hide]
■意思是:用户积分低于200则看不到被隐藏的内容
■可以自行设置积分值,不建议太高(200以上太多人看不到),也不建议太低(那就没必要隐藏了)
■建议只隐藏关键内容,比如具体的面试题目、涉及隐私的信息,大部分内容没必要隐藏。
■微信/QQ/电子邮件等,为防止将来被骚扰甚至人肉,以论坛私信方式发给对方最安全。
■匿名发帖的板块和方法:http://www.1point3acres.com/bbs/thread-405991-1-1.html

手机版|小黑屋|一亩三分地留学网

GMT+8, 2019-1-22 07:56

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表