回复: 11
跳转到指定楼层
上一主题 下一主题
收起左侧

Quora 2020 DS Summer Intern Data Challenge 过

全局:

2019(10-12月) 分析|数据科学类 博士 实习@ - 网上海投 - 在线笔试  | | Pass | 应届毕业生

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看附件。没有帐号?注册账号

x
本帖最后由 shinggghk 于 2020-1-8 08:25 编辑

我通过了这个 challenge,昨天HR发来了预约 technical 电面的邮件。
challenge 要求一周完成,但不计时,基本上几小时就能完成。内容是统计上的confidence interval 。给你4个 tables,分别是 test group assignment,experiment前后 user active time和user gender & attribution. 要求用confidence interval来看该experiment是否有效,最后写200字加2张图片report。
.google  и
问题在 google form 上。-baidu 1point3acres

第一问,选择出正确的unit of analysis 和数据结构:
三选项,1. total time per user, 2. total time per user per date, 3. total time per date。 我选1. 因为另外两选项违反 t-test assumption  (每个 observation 在 cross-section 含 unobserved individual charateristics,会违反 independent sampling assumption)

第二问,要求输入 confidence interval。比较了c
您好!
本帖隐藏的内容需要积分高于 188 才可浏览
您当前积分为 0。
使用VIP即刻解锁阅读权限或查看其他获取积分的方式
游客,您好!
本帖隐藏的内容需要积分高于 188 才可浏览
您当前积分为 0。
VIP即刻解锁阅读权限查看其他获取积分的方式
Unlock interview details and practice with AI
Curated Interview Questions from Top Companies
110.9551363918833]
['reader', 'female'] : [460.6913673558314, 899.8945469083554]
['reader', 'male'] : [739.678278996958, 1054.607579332304]
['new_user', 'unknown'] : [-9.935825860614052, 56.405688976778315]
['new_user', 'female'] : [3.262515103845068, 40.5103306296564].google  и
['new_user', 'male'] : [-0.4068322301028964, 56.646872446264766]
.1point3acres

最后写 report。写了一些结论,加了一张treatment, control 的分布图和一张 confidence interval 的图,最后提交代码。

第一次分享,求加积分. .и

评分

参与人数 15大米 +49 收起 理由
amandaywq + 1 很有用的信息!
liziwei + 2 很有用的信息!
lemon1019 + 1 赞一个
xinyuxingyuan + 2 欢迎来到论坛!
Twentysomething + 3 很有用的信息!

查看全部评分


上一篇:狗家DS new grad 电面
下一篇:Expedia DS summer intern 熱騰
全局:
Hi 感谢分享
有两个问题想请教LZ: 1. 原假设是不是per user 在这段时间里的time spent组织相等?快被题干里的total整懵了
                                 2. 题目里说Using t-test under your assumption about variance。 请问你是所有题都用了 t-test吗?是真正意义上用t分布来计算p-value的t test还是approximately equal to Z test?这里的assumption about variance是什么?(问这个问题是因为统计上的two sample t test的假设是两个组的variance相等)
回复

使用道具 举报

推荐
iVanlIsh 2020-1-17 15:07:49 | 只看该作者
全局:
这个问题出的就是有问题。control和treatment的sample size差很多,结果却比较total。我用了average做的challenge,还特地解释了为什么不能用total,结果挂了。
回复

使用道具 举报

推荐
 楼主| shinggghk 2020-1-9 05:38:05 | 只看该作者
全局:
wintergo 发表于 2020-1-9 01:19
问题都很偏统计,请问是用r做的吗?

没有语言要求。最后要上载代码和分析过程。我用 Python 做的。直接上载 jupyter notebook pdf。
回复

使用道具 举报

全局:
问题都很偏统计,请问是用r做的吗?
回复

使用道具 举报

全局:
shinggghk 发表于 2020/01/09 05:38:05

没有语言要求。最后要上载代码和分析过程。我用 Python 做的。直接上载 jupyter notebook pdf...
多谢楼主!我竟然不知道Python也能做这个 T T
回复

使用道具 举报

全局:
恭喜楼主!好高级!. 1point 3 acres
请问第一问能不能具体说说是怎么违反的啊,没怎么看懂🙈
回复

使用道具 举报

🔗
iacchris 2020-8-27 14:04:39 | 只看该作者
本楼:
全局:
👍
回复

使用道具 举报

🔗
momo001 2021-9-18 00:23:52 | 只看该作者
全局:
感谢分享,今年是也一樣的!
回复

使用道具 举报

🔗
JocelynJKGG 2021-10-6 10:12:40 | 只看该作者
全局:
momo001 发表于 2021-9-17 12:23
感谢分享,今年是也一樣的!

你刚刚做过code challege了吗?可以私信交流一下吗~
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册账号
隐私提醒:
  • ☑ 禁止发布广告,拉群,贴个人联系方式:找人请去🔗同学同事飞友,拉群请去🔗拉群结伴,广告请去🔗跳蚤市场,和 🔗租房广告|找室友
  • ☑ 论坛内容在发帖 30 分钟内可以编辑,过后则不能删帖。为防止被骚扰甚至人肉,不要公开留微信等联系方式,如有需求请以论坛私信方式发送。
  • ☑ 干货版块可免费使用 🔗超级匿名:面经(美国面经、中国面经、数科面经、PM面经),抖包袱(美国、中国)和录取汇报、定位选校版
  • ☑ 查阅全站 🔗各种匿名方法

本版积分规则

>
快速回复 返回顶部 返回列表