到底为啥那么多人转Data Science

一亩三分地论坛

 找回密码
 Sign Up 注册获取更多干货
码农求职神器Triplebyte:
不用海投
内推多家公司面试
E轮2.5亿美元融资
K12教育独角兽一起作业
北京-诚聘人工智能/教育/大数据岗
[Google级团队]
实时大数据分析领域践行者
北京/深圳-大数据/搜索/机器学习岗
把贵司招聘信息放这里
查看: 6856|回复: 7
收起左侧

发几个电面面经攒人品

[复制链接] |试试Instant~ |关注本帖
micki_q 发表于 2015-4-24 09:46:35 | 显示全部楼层 |阅读模式

2015(1-3月) 统计类 硕士 全职@Twitch, Coursera - 网上海投 - 技术电面  | Other | 在职跳槽

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?Sign Up 注册获取更多干货

x
最近电面了几个网上找不到面经的公司,发下面经攒人品。都是Data Scientist的职位

公司A:Twitch
这家一上来就视频面。.1point3acres缃
1. 对recommender system in general的兴趣
2. 假设你刚进twitch,你有什么感兴趣想研究的领域,你会怎么分析
游客,本帖隐藏的内容需要积分高于 188 才可浏览,您当前积分为 0。
查看如何攒积分 Click here for more info.


感想:这家做游戏直播的,虽然实现做了research研究了下他们的一些模式,不过面试的时候还是感觉电波严重对不上。问的问题非常宽泛,问面试官有没有什么具体所针对的方面的时候,他一般都跟你说没啥要求,随便说。我觉得大概还是得对用户观看视频行为问题真的有practical experience的话才能对的上他们家的电波吧……
结果:当然是很迅速地被拒啦。面完一小时就被发了好人卡,超沮丧的。

公司B:Coursera
第一轮是recruiting researcher面,有问个比较general的问题:Coursera现在想做private tutoring,但不知道该不该进入这个market,你会从什么角度切入这个问题。
游客,本帖隐藏的内容需要积分高于 188 才可浏览,您当前积分为 0。
查看如何攒积分 Click here for more info.
. 1point3acres.com/bbs
(这题我后来发现自己写漏了一句话……)
5. 给个bernoulli distribution,n个trial,k个success,p=k/n,求p的95% CI; 如果要让CI变为原来的10倍小,n应该要多大。

感想:其实考的都是很基本的东西,所以要注意回答的大方向正确,还有不要粗心……
结果:因为是刚面的所以还没有结果。

祝大家面试顺利!心想事成!

顺便求bless。



评分

2

查看全部评分

本帖被以下淘专辑推荐:

wwtpcsuper 发表于 2015-4-26 02:09:07 | 显示全部楼层
感觉coursera提的问题相当好啊...
回复 支持 反对

使用道具 举报

小土豆君 发表于 2015-6-16 00:29:47 | 显示全部楼层
发现自己居然不会算bernoulli distribution 中p的CI,果然是越基础的内容越容易遗忘
回复 支持 反对

使用道具 举报

huahuazhu 发表于 2015-6-24 12:29:43 | 显示全部楼层
coursera的题目能再展开说说嘛?😓  毕业有年头了,统计课上学的东西都忘掉了. 要去面data engineer,HM说会安排analyst一起来面试。-google 1point3acres

1. 怎么求课程长度和用户是否购买证书之间的likelihood,已知课程越长价格越高
这里的likelihood是啥意思?
. visit 1point3acres.com for more.
2. 课程长度和课程价格都当做binary variable,写了一个model,让你interprete里面的coefficient
3. 上一步里的model,如果从总体enrollment level来model,和by course level的model,怎样比较coefficients,怎样比较standard errors
看了这两个题目,更加捉急了。 完全不懂在说什么,咋办啊,看什么知识恶补一下? 555 鏉ユ簮涓浜.涓夊垎鍦拌鍧.

4. SQL:一个学生enrollment table,求每个学生的最好成绩,和对应的course session。如果highest score有duplicate怎么办?(这个面试的时候很容易忽略)
(这题我后来发现自己写漏了一句话……)
这个需要对每个group里 order by score。 怎么做呢? 我在网上搜的答案,有的SQL支持 类似row_number() ,但是mysql是没有的,需要自己定义local variable 去做。 请问楼主是怎么实现的? 我还没想明白有duplicate怎么处理,是不是写一个case 来判断? 今天现学的case statement不知道用不用得上 😓
回复 支持 反对

使用道具 举报

 楼主| micki_q 发表于 2015-6-25 05:22:16 | 显示全部楼层
huahuazhu 发表于 2015-6-24 12:29
coursera的题目能再展开说说嘛?😓  毕业有年头了,统计课上学的东西都忘掉了. 要去面data engineer ...

1. probability

2. logistic

3. 这个问题比较tricky,建议从ANOVA的角度考虑(至少面试官是从这方面入手的)
. 鍥磋鎴戜滑@1point 3 acres
4. 这个用subquery就行了吧?先找出每个人的highest score,再join by id和by score。我是这么觉得的。
回复 支持 反对

使用道具 举报

huahuazhu 发表于 2015-6-25 11:38:27 | 显示全部楼层
micki_q 发表于 2015-6-25 05:22 鏉ユ簮涓浜.涓夊垎鍦拌鍧.
1. probability

2. logistic

多谢!这下有思路了,我把这些知识点都好好准备一下
回复 支持 反对

使用道具 举报

huahuazhu 发表于 2015-6-27 08:09:34 | 显示全部楼层
我又来问问题了 鏉ユ簮涓浜.涓夊垎鍦拌鍧.
. Waral 鍗氬鏈夋洿澶氭枃绔,
coursera的第三个问题,3. 上一步里的model,如果从总体enrollment level来model,和by course level的model,怎样比较coefficients,怎样比较standard errors
怎么用ANOVA分析呢? 以前上课好像没学过这个,这两天看了一些网上的教程,感觉anova是用来分析在不同group的同一个variable,分别有一组observations。
coursera这个题目,每组的data用来fit一个model,得到coefficient,相当于每组只有一个observation嘛?这接下来怎么算啊
回复 支持 反对

使用道具 举报

asdfgadgfsw2 发表于 2018-2-26 18:54:47 | 显示全部楼层
楼主拿到offer了吗
回复 支持 反对

使用道具 举报

本版积分规则

提醒:发帖可以选择内容隐藏,部分板块支持匿名发帖。请认真读完以下全部说明:

■隐藏内容方法: [hide=200]你想要隐藏的内容比如面经[/hide]
■意思是:用户积分低于200则看不到被隐藏的内容
■可以自行设置积分值,不建议太高(200以上太多人看不到),也不建议太低(那就没必要隐藏了)
■建议只隐藏关键内容,比如具体的面试题目、涉及隐私的信息,大部分内容没必要隐藏。
■微信/QQ/电子邮件等,为防止将来被骚扰甚至人肉,以论坛私信方式发给对方最安全。
■匿名发帖的板块和方法:http://www.1point3acres.com/bbs/thread-405991-1-1.html

关闭

一亩三分地推荐上一条 /5 下一条

手机版|小黑屋|一亩三分地论坛声明

custom counter

GMT+8, 2018-4-25 11:01

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表