近期论坛无法登录的解决方案


一亩三分地论坛

 找回密码
 获取更多干活,快来注册

一亩三分地官方iOS手机应用下载
查看: 5740|回复: 6
收起左侧

发几个电面面经攒人品

[复制链接] |试试Instant~ |关注本帖
micki_q 发表于 2015-4-24 09:46:35 | 显示全部楼层 |阅读模式

2015(1-3月) 统计类 硕士 全职@Twitch, Coursera - 网上海投 - 技术电面 |Other在职跳槽

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?获取更多干活,快来注册

x
最近电面了几个网上找不到面经的公司,发下面经攒人品。都是Data Scientist的职位
.鏈枃鍘熷垱鑷1point3acres璁哄潧
公司A:Twitch
这家一上来就视频面。
1. 对recommender system in general的兴趣
2. 假设你刚进twitch,你有什么感兴趣想研究的领域,你会怎么分析
3. 你觉得twitch这个平台上,#minute per person per day是怎样的
4. 假设60%的用户game focused,40%的用户don't have dominant game favored,你要怎么办
(就是问的generally的怎么办……你要solve的方面自己决定……)
5. 假设每个用户的preference structure很不一样,你会怎么办
(again,也是问的generally怎么办)


感想:这家做游戏直播的,虽然实现做了research研究了下他们的一些模式,不过面试的时候还是感觉电波严重对不上。问的问题非常宽泛,问面试官有没有什么具体所针对的方面的时候,他一般都跟你说没啥要求,随便说。我觉得大概还是得对用户观看视频行为问题真的有practical experience的话才能对的上他们家的电波吧……
结果:当然是很迅速地被拒啦。面完一小时就被发了好人卡,超沮丧的。

公司B:coursera
第一轮是recruiting researcher面,有问个比较general的问题:Coursera现在想做private tutoring,但不知道该不该进入这个market,你会从什么角度切入这个问题。
第二轮是HM的tech面:
1. 怎么求课程长度和用户是否购买证书之间的likelihood,已知课程越长价格越高
2. 课程长度和课程价格都当做binary variable,写了一个model,让你interprete里面的coefficient
3. 上一步里的model,如果从总体enrollment level来model,和by course level的model,怎样比较coefficients,怎样比较standard errors
4. SQL:一个学生enrollment table,求每个学生的最好成绩,和对应的course session。如果highest score有duplicate怎么办?(这个面试的时候很容易忽略)
(这题我后来发现自己写漏了一句话……)
5. 给个bernoulli distribution,n个trial,k个success,p=k/n,求p的95% CI; 如果要让CI变为原来的10倍小,n应该要多大。

感想:其实考的都是很基本的东西,所以要注意回答的大方向正确,还有不要粗心……
结果:因为是刚面的所以还没有结果。

祝大家面试顺利!心想事成!. 鐗涗汉浜戦泦,涓浜╀笁鍒嗗湴
. 鐣欏鐢宠璁哄潧-涓浜╀笁鍒嗗湴
顺便求bless。


. 鍥磋鎴戜滑@1point 3 acres

评分

2

查看全部评分

本帖被以下淘专辑推荐:

wwtpcsuper 发表于 2015-4-26 02:09:07 | 显示全部楼层
关注一亩三分地公众号:
Warald_一亩三分地
感觉coursera提的问题相当好啊...
回复 支持 反对

使用道具 举报

小土豆君 发表于 2015-6-16 00:29:47 | 显示全部楼层
关注一亩三分地微博:
Warald
发现自己居然不会算bernoulli distribution 中p的CI,果然是越基础的内容越容易遗忘
回复 支持 反对

使用道具 举报

huahuazhu 发表于 2015-6-24 12:29:43 | 显示全部楼层
coursera的题目能再展开说说嘛?😓  毕业有年头了,统计课上学的东西都忘掉了. 要去面data engineer,HM说会安排analyst一起来面试。

1. 怎么求课程长度和用户是否购买证书之间的likelihood,已知课程越长价格越高
这里的likelihood是啥意思?. From 1point 3acres bbs

2. 课程长度和课程价格都当做binary variable,写了一个model,让你interprete里面的coefficient
3. 上一步里的model,如果从总体enrollment level来model,和by course level的model,怎样比较coefficients,怎样比较standard errors
看了这两个题目,更加捉急了。 完全不懂在说什么,咋办啊,看什么知识恶补一下? 555

4. SQL:一个学生enrollment table,求每个学生的最好成绩,和对应的course session。如果highest score有duplicate怎么办?(这个面试的时候很容易忽略)
(这题我后来发现自己写漏了一句话……)
这个需要对每个group里 order by score。 怎么做呢? 我在网上搜的答案,有的SQL支持 类似row_number() ,但是mysql是没有的,需要自己定义local variable 去做。 请问楼主是怎么实现的? 我还没想明白有duplicate怎么处理,是不是写一个case 来判断? 今天现学的case statement不知道用不用得上 😓
回复 支持 反对

使用道具 举报

 楼主| micki_q 发表于 2015-6-25 05:22:16 | 显示全部楼层
huahuazhu 发表于 2015-6-24 12:29
coursera的题目能再展开说说嘛?😓  毕业有年头了,统计课上学的东西都忘掉了. 要去面data engineer ...

1. probability

2. logistic

3. 这个问题比较tricky,建议从ANOVA的角度考虑(至少面试官是从这方面入手的)

4. 这个用subquery就行了吧?先找出每个人的highest score,再join by id和by score。我是这么觉得的。
回复 支持 反对

使用道具 举报

huahuazhu 发表于 2015-6-25 11:38:27 | 显示全部楼层
micki_q 发表于 2015-6-25 05:22
1. probability

2. logistic
鏉ユ簮涓浜.涓夊垎鍦拌鍧.
多谢!这下有思路了,我把这些知识点都好好准备一下
回复 支持 反对

使用道具 举报

huahuazhu 发表于 2015-6-27 08:09:34 | 显示全部楼层
我又来问问题了

coursera的第三个问题,3. 上一步里的model,如果从总体enrollment level来model,和by course level的model,怎样比较coefficients,怎样比较standard errors.1point3acres缃
怎么用ANOVA分析呢? 以前上课好像没学过这个,这两天看了一些网上的教程,感觉anova是用来分析在不同group的同一个variable,分别有一组observations。
coursera这个题目,每组的data用来fit一个model,得到coefficient,相当于每组只有一个observation嘛?这接下来怎么算啊
回复 支持 反对

使用道具 举报

本版积分规则

关闭

一亩三分地推荐上一条 /5 下一条

手机版|小黑屋|一亩三分地论坛声明

custom counter

GMT+8, 2017-6-26 05:16

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表