一亩三分地论坛

 找回密码
 获取更多干货,去instant注册!

扫码关注一亩三分地公众号
查看: 4237|回复: 6
收起左侧

发几个电面面经攒人品

[复制链接] |试试Instant~ |关注本帖
micki_q 发表于 2015-4-24 09:46:35 | 显示全部楼层 |阅读模式

2015(1-3月) 统计类 硕士 全职@Twitch, Coursera - 网上海投 - 技术电面 |Other在职跳槽

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?获取更多干货,去instant注册!

x
最近电面了几个网上找不到面经的公司,发下面经攒人品。都是Data Scientist的职位

公司A:Twitch
这家一上来就视频面。
1. 对recommender system in general的兴趣
2. 假设你刚进twitch,你有什么感兴趣想研究的领域,你会怎么分析
3. 你觉得twitch这个平台上,#minute per person per day是怎样的
4. 假设60%的用户game focused,40%的用户don't have dominant game favored,你要怎么办
(就是问的generally的怎么办……你要solve的方面自己决定……)
5. 假设每个用户的preference structure很不一样,你会怎么办
(again,也是问的generally怎么办)
. From 1point 3acres bbs

感想:这家做游戏直播的,虽然实现做了research研究了下他们的一些模式,不过面试的时候还是感觉电波严重对不上。问的问题非常宽泛,问面试官有没有什么具体所针对的方面的时候,他一般都跟你说没啥要求,随便说。我觉得大概还是得对用户观看视频行为问题真的有practical experience的话才能对的上他们家的电波吧……. 1point 3acres 璁哄潧
结果:当然是很迅速地被拒啦。面完一小时就被发了好人卡,超沮丧的。

公司B:Coursera
第一轮是recruiting researcher面,有问个比较general的问题:Coursera现在想做private tutoring,但不知道该不该进入这个market,你会从什么角度切入这个问题。
第二轮是HM的tech面:. 涓浜-涓夊垎-鍦帮紝鐙鍙戝竷
1. 怎么求课程长度和用户是否购买证书之间的likelihood,已知课程越长价格越高
2. 课程长度和课程价格都当做binary variable,写了一个model,让你interprete里面的coefficient
3. 上一步里的model,如果从总体enrollment level来model,和by course level的model,怎样比较coefficients,怎样比较standard errors. From 1point 3acres bbs
4. SQL:一个学生enrollment table,求每个学生的最好成绩,和对应的course session。如果highest score有duplicate怎么办?(这个面试的时候很容易忽略)-google 1point3acres
(这题我后来发现自己写漏了一句话……)
5. 给个bernoulli distribution,n个trial,k个success,p=k/n,求p的95% CI; 如果要让CI变为原来的10倍小,n应该要多大。

感想:其实考的都是很基本的东西,所以要注意回答的大方向正确,还有不要粗心……. from: 1point3acres.com/bbs
结果:因为是刚面的所以还没有结果。. more info on 1point3acres.com
. Waral 鍗氬鏈夋洿澶氭枃绔,
祝大家面试顺利!心想事成!
. 涓浜-涓夊垎-鍦帮紝鐙鍙戝竷
顺便求bless。



评分

2

查看全部评分

本帖被以下淘专辑推荐:

wwtpcsuper 发表于 2015-4-26 02:09:07 | 显示全部楼层
感觉coursera提的问题相当好啊...
回复 支持 反对

使用道具 举报

小土豆君 发表于 2015-6-16 00:29:47 | 显示全部楼层
发现自己居然不会算bernoulli distribution 中p的CI,果然是越基础的内容越容易遗忘
回复 支持 反对

使用道具 举报

huahuazhu 发表于 2015-6-24 12:29:43 | 显示全部楼层
coursera的题目能再展开说说嘛?😓  毕业有年头了,统计课上学的东西都忘掉了. 要去面data engineer,HM说会安排analyst一起来面试。.鏈枃鍘熷垱鑷1point3acres璁哄潧

1. 怎么求课程长度和用户是否购买证书之间的likelihood,已知课程越长价格越高
这里的likelihood是啥意思?
. 鍥磋鎴戜滑@1point 3 acres
2. 课程长度和课程价格都当做binary variable,写了一个model,让你interprete里面的coefficient
. 1point 3acres 璁哄潧3. 上一步里的model,如果从总体enrollment level来model,和by course level的model,怎样比较coefficients,怎样比较standard errors
看了这两个题目,更加捉急了。 完全不懂在说什么,咋办啊,看什么知识恶补一下? 555

4. SQL:一个学生enrollment table,求每个学生的最好成绩,和对应的course session。如果highest score有duplicate怎么办?(这个面试的时候很容易忽略)
(这题我后来发现自己写漏了一句话……)
这个需要对每个group里 order by score。 怎么做呢? 我在网上搜的答案,有的SQL支持 类似row_number() ,但是mysql是没有的,需要自己定义local variable 去做。 请问楼主是怎么实现的? 我还没想明白有duplicate怎么处理,是不是写一个case 来判断? 今天现学的case statement不知道用不用得上 😓
回复 支持 反对

使用道具 举报

 楼主| micki_q 发表于 2015-6-25 05:22:16 | 显示全部楼层
huahuazhu 发表于 2015-6-24 12:29
coursera的题目能再展开说说嘛?😓  毕业有年头了,统计课上学的东西都忘掉了. 要去面data engineer ...

1. probability

2. logistic

3. 这个问题比较tricky,建议从ANOVA的角度考虑(至少面试官是从这方面入手的). From 1point 3acres bbs

4. 这个用subquery就行了吧?先找出每个人的highest score,再join by id和by score。我是这么觉得的。
回复 支持 反对

使用道具 举报

huahuazhu 发表于 2015-6-25 11:38:27 | 显示全部楼层
micki_q 发表于 2015-6-25 05:22
1. probability

2. logistic

多谢!这下有思路了,我把这些知识点都好好准备一下
回复 支持 反对

使用道具 举报

huahuazhu 发表于 2015-6-27 08:09:34 | 显示全部楼层
我又来问问题了

coursera的第三个问题,3. 上一步里的model,如果从总体enrollment level来model,和by course level的model,怎样比较coefficients,怎样比较standard errors
怎么用ANOVA分析呢? 以前上课好像没学过这个,这两天看了一些网上的教程,感觉anova是用来分析在不同group的同一个variable,分别有一组observations。
coursera这个题目,每组的data用来fit一个model,得到coefficient,相当于每组只有一个observation嘛?这接下来怎么算啊
回复 支持 反对

使用道具 举报

本版积分规则

请点这里访问我们的新网站:一亩三分地Instant.

Instant搜索更强大,不扣积分,内容组织的更好更整洁!目前仍在beta版本,努力完善中!反馈请点这里

关闭

一亩三分地推荐上一条 /5 下一条

手机版|小黑屋|一亩三分地论坛声明 ( 沪ICP备11015994号 )

custom counter

GMT+8, 2016-12-5 13:05

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表