一亩三分地论坛

 找回密码
 获取更多干货,去instant注册!

扫码关注一亩三分地公众号
查看: 5740|回复: 25
收起左侧

[找工就业] 统计小硕找ds工作悲剧,贡献多家面经

[复制链接] |试试Instant~ |关注本帖
metootootoo 发表于 2015-12-12 05:17:38 | 显示全部楼层 |阅读模式

2015(10-12月)-[]Stat/Biostat硕士+3个月-1年 - 网上海投| 分析|数据科学类全职@Google, Microsoft, Akuna, Thumbtack, Linkedinfresh grad应届毕业生

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?获取更多干货,去instant注册!

x
楼主非牛校统计小硕,明年夏毕业,最近两个多月找工无果,分享些面经和感想回报地里把


其实本来就知道硕士找data scientist是很难的,自己学校的专排也不高,二三十吧。本科数学系,没有好好学习,所以出国后学习很认真,假日啥的也基本都是在学习,目前所有课都拿了A+(课比较水。。)。自己平时学了挺多网课,ML,java,算法,python,mapreduce,文本挖掘等。也喜欢参加kaggle。
喜欢编程,学python的时候还写了个小游戏。感觉自己对数学和计算机还是挺热爱的,统计和机器学习的东西都很有兴趣,所以学的挺认真。在准备面试的时候把很多东西都手推过,比如odds ratio的置信区间用delta方法和clt(看地里某个同学的面经贴后去复习的),比如神经网络的训练算法,比如gradient boosting的算法,比如logistic的来源和训练(指数分布族,梯度下降)(不过感觉时间花在这儿性价比不高。。)。。
无奈刷题开始的太晚,(以前以为是软工才要刷题。。)最近才开始刷,感恩节前几天把一些简单的数据结构和算法学了下,后面四五天大概刷了100道leetcode的easy和部分medium,从起床刷到睡觉。java还不太熟悉所有都是用python刷的。大部分可以过ac,时间效率一般在python里的一半吧。。有些比较难的medium超时了然后看别人答案再自己写。数据结构的只做简单的比如链表,stack queue,binary tree,其他复杂的跳过了。。。

以下是面经,不影响大家思路,我自己的做法用白色了。。想看答案可以ctrl加a


面经:. 1point 3acres 璁哄潧
Google quantitative analyst:
2次电面。
问了一道简单的贝叶斯题目
问了平时一般用什么工具的什么包来分析数据
问了一个估计的题目(一个袋子里全是硬币,每个硬币的head率是p,各不一样,都未知,洒出一坨硬币,每个都扔个几次,根据结果,1估计每个硬币的p,2置信区间,3估计袋子里的所有硬币的p的分布)(1mle或者bayes加个pesudo count(因为这问题源于广告点击率,bayes防止0的情况)2clt或者用binomial密度函数 3bootstrap)
google搜索点击率从上到下依次递减,你觉得这和什么因素有关,怎样设计一个实验来验证(我瞎扯)

Akuna:. 鍥磋鎴戜滑@1point 3 acres
做了个OA就跪了。。hackerrank做的,用的python,testcase全过,估计是效率太低。。
有一道是判断括号是否合法,一个月后刷leetcode才知道原来这是原题valid parentheses。。(我是用stack做的(也就是用python里的list))
有一道是骰子题,有n次扔骰子的机会,其中玩家可以选择停止,停止的那次是哪个数字就得到多少钱。问这个游戏的入场费。。(这个就是用期望,然后类似数学归纳法,知道了n-1次的情况就知道了第n次的情况。)


Microsoft:. 鐗涗汉浜戦泦,涓浜╀笁鍒嗗湴
电面:sql
Oniste:
mapreduce wordcount
m*n的方格,每个方格一个字母,从任意一个方格开始,可以往这个方格的8个方向走一步,不能重复走走过的格子,求找出所有可能组成的单词 (depth first search)
判断字符串是否回文(two pointer). 1point3acres.com/bbs
一个array包含一些整数,要求in place地把0都移到最前面(扫描,记录0的个数为id,然后碰到0,和第id个数字swap)
给出两个query的搜索结果,如何判断两个query是否一样 (根据结果里的网页里的document,生成一个大的dictionary vector,用tf-idf,然后相似度用cosine,l1 l2距离等)
地上一列平行线间隔a,一根针长度b b小于a, 随便往地上一扔,问针压线的概率 (角度cita和坐标x,二重积分,注意一下积分上下限就好。。)
还有一些简历背景和知识点check

Linkedin:
电面
Minimum window substring
当时刷题是按ac rate排的,见过这题,又是hard又ac率很低,当时刷题自然是跳过了。。. 涓浜-涓夊垎-鍦帮紝鐙鍙戝竷
我就写了个n平方复杂度的做法。。。
我本来有个思路,就是滑动窗口,左边i右边j,都初始化在最左边,j先往右动,符合条件后i往右shrink,直到不能往右,然后j继续往右。。面试官说这个也是n平方复杂度。。但我觉得这两个pointer最多扫2n次把。。可能刷题不够理解还不够。。反正后来没想出其他方法。。



. 鍥磋鎴戜滑@1point 3 acres
找工期间心情起伏,自我否定,到现在全部悲剧,告一段落,其实对自己哪里不足也有了更清晰的认识,再继续努力把。。也祝大家找到心仪的工作


评分

7

查看全部评分

 楼主| metootootoo 发表于 2015-12-12 06:10:31 | 显示全部楼层
clfhaha1234 发表于 2015-12-12 05:54-google 1point3acres
感觉DS的问题主要还是编程算法为主?lz感觉这些职位对ML的要求有多高呢
.鐣欏璁哄潧-涓浜-涓夊垎鍦
至少it公司都是coding为主,ml基本没怎么问到
. Waral 鍗氬鏈夋洿澶氭枃绔,
我在知乎看到过几个回复. 1point3acres.com/bbs

一个是fb的ds,一个是阿里内部的数据竞赛,都说到其实主要提升性能的是feature engineering,分类器就那么几个,其实调好了feature最后区别都不大,dirty tricks更重要,快点把东西实现出来更重要

我觉得也挺有道理,把几个ml的模型的思想,训练过程,优劣和适用情况搞清楚就行了,不必搞的很细致。。除非是专门研究的部门。。相比这个,可能锻炼好代码能力更重要一些。。如果去银行保险等行业,了解行业知识更重要些
回复 支持 1 反对 0

使用道具 举报

 楼主| metootootoo 发表于 2015-12-12 05:22:26 | 显示全部楼层
漏了个. From 1point 3acres bbs

Thumbtack:. Waral 鍗氬鏈夋洿澶氭枃绔,

给了个SQLlite的文件,里面有一些数据,让你写个报告分析下公司的那个什么request to quote率有没有增加. from: 1point3acres.com/bbs

我大概就是用sql把需要的数据和feature搞出来,然后用python做了点分析画了点图,然后做了个pdf报告,然后跪了..
回复 支持 反对

使用道具 举报

clfhaha1234 发表于 2015-12-12 05:54:54 | 显示全部楼层
感觉DS的问题主要还是编程算法为主?lz感觉这些职位对ML的要求有多高呢
回复 支持 反对

使用道具 举报

 楼主| metootootoo 发表于 2015-12-12 06:10:40 | 显示全部楼层
clfhaha1234 发表于 2015-12-12 05:54
感觉DS的问题主要还是编程算法为主?lz感觉这些职位对ML的要求有多高呢

至少it公司都是coding为主,ml基本没怎么问到

我在知乎看到过几个回复

一个是fb的ds,一个是ali内部的数据竞赛,都说到其实主要提升性能的是feature engineering,分类器就那么几个,其实调好了feature最后区别都不大,dirty tricks更重要,快点把东西实现出来更重要
.鏈枃鍘熷垱鑷1point3acres璁哄潧
我觉得也挺有道理,把几个ml的模型的思想,训练过程,优劣和适用情况搞清楚就行了,不必搞的很细致。。除非是专门研究的部门。。相比这个,可能锻炼好代码能力更重要一些。。如果去银行保险等行业,了解行业知识更重要些

评分

1

查看全部评分

回复 支持 反对

使用道具 举报

hit1023 发表于 2015-12-13 12:18:44 | 显示全部楼层
跟开始找,楼主加油!
回复 支持 反对

使用道具 举报

qmonkey 发表于 2015-12-15 01:31:26 | 显示全部楼层
楼主请问你的akuna申的是什么职位?
回复 支持 反对

使用道具 举报

xiaozhuxiaozhu 发表于 2015-12-15 01:42:47 | 显示全部楼层
数据结构只做简单的binary tree?
leetcode里面binary tree的题,大概有最少50道。很多题,用的思路很难,而且是面试出来这些题,之间没做过,基本就是挂。
回复 支持 反对

使用道具 举报

calalia 发表于 2015-12-15 01:54:51 | 显示全部楼层
Google quantitative analyst:
2次电面。
鏉ユ簮涓浜.涓夊垎鍦拌鍧. GOogle:. 鐗涗汉浜戦泦,涓浜╀笁鍒嗗湴
google搜索点击率从上到下依次递减,你觉得这和什么因素有关,怎样设计一个实验来验证(我记得上课说过,G家的搜索模型是markov 模型,老师还给解读了paper 楼主可以搜他家老板之前发的paper看看 讲的很具体 ~不知道我理解对了题意木有)
. more info on 1point3acres.com
我觉得楼主数学部分应该都还可以啊~
多刷两三遍题
然后面试前 准备下他家程序员的面经和LC题就好
Minimum window string那个 LC的公司标签好像就是linkedin和FB 我面FB的时候准备过
.鏈枃鍘熷垱鑷1point3acres璁哄潧
以及 觉得不是因为楼主做的不好
是因为有很多比楼主做的更好的phd. 1point 3acres 璁哄潧

这种competitive的东西 需要很stand out
很惊艳才能赢~
回复 支持 反对

使用道具 举报

蓝漠七七 发表于 2015-12-15 02:08:00 | 显示全部楼层
calalia 发表于 2015-12-15 01:54
Google quantitative analyst:
2次电面。
GOogle:

我想申请明年1月开放的quantitative analyst intern,还在紧张中
回复 支持 反对

使用道具 举报

calalia 发表于 2015-12-15 02:11:36 | 显示全部楼层
蓝漠七七 发表于 2015-12-14 12:08
我想申请明年1月开放的quantitative analyst intern,还在紧张中
. 1point3acres.com/bbs
他家QA很统计学的 没啥编程
好好复习下基本概念~
哈 我要好好看看这篇paper了 g家search engine核心技术啊
地里好多面经可以看
然后你可以联系地里面过的小伙伴问问

据说是唯一一个new grad pool~~
回复 支持 反对

使用道具 举报

蓝漠七七 发表于 2015-12-15 02:41:57 | 显示全部楼层
calalia 发表于 2015-12-15 02:11
他家QA很统计学的 没啥编程
好好复习下基本概念~
哈 我要好好看看这篇paper了 g家search engine核心技 ...

是啊是啊,我都是看到你写的那篇帖子看到有两个QA大神,准备去联系看看,帖子对我很有帮助,先谢一个~
回复 支持 反对

使用道具 举报

calalia 发表于 2015-12-15 02:45:08 | 显示全部楼层
蓝漠七七 发表于 2015-12-14 12:41
是啊是啊,我都是看到你写的那篇帖子看到有两个QA大神,准备去联系看看,帖子对我很有帮助,先谢一个~

你搜搜 数据科学面经
挺多的 起码4,5个
回复 支持 反对

使用道具 举报

 楼主| metootootoo 发表于 2015-12-16 09:09:18 | 显示全部楼层
qmonkey 发表于 2015-12-15 01:31
楼主请问你的akuna申的是什么职位?
. From 1point 3acres bbs
有点记不清了。。反正是要求用python的
可能是quantitative trader。。
回复 支持 反对

使用道具 举报

 楼主| metootootoo 发表于 2015-12-16 09:20:00 | 显示全部楼层
calalia 发表于 2015-12-15 01:54
Google quantitative analyst:
2次电面。
GOogle:

哈哈谢谢,我其实从高中开始就很喜欢数学物理和编程,觉得很好玩。
不过数学真的涉及到实变啊,泛函啊,微分方程啥的我都得跪。。基本的一些微积分和高代和统计还行。
刷题确实需要,我感觉其实也挺好玩的,只是刷的晚了。所以最近继续在刷题,顺便再玩玩kaggle,玩玩aws和学点big data的东西。牛人真的很多,找了一圈感觉自己目前确实不够资格去做it公司的data scientist,所以现在心态反而好了,觉得只要找到的第一份工作是有趣的能学到东西就行,多做点实际的东西慢慢成长比较好。
回复 支持 反对

使用道具 举报

calalia 发表于 2015-12-16 09:41:38 | 显示全部楼层
metootootoo 发表于 2015-12-15 19:20
哈哈谢谢,我其实从高中开始就很喜欢数学物理和编程,觉得很好玩。
不过数学真的涉及到实变啊,泛函啊, ...

我也是 我觉得先找个差不多的 有点空闲时间的 然后再慢慢积累慢慢练啊~~
我跪了FB的data scientist 又给了我个analyst面
认识了很多做data scientist的大神 其实技术流男生比较多. visit 1point3acres.com for more.
跟人家一比
真是提鞋的机会也木有╭(╯^╰)╮
回复 支持 反对

使用道具 举报

Rocketman456 发表于 2015-12-16 15:44:11 | 显示全部楼层
感谢楼主分享! 原来MS申DS还是有难度的~
回复 支持 反对

使用道具 举报

wyc0807 发表于 2015-12-16 21:13:12 | 显示全部楼层
写得很好。但是帖子貌似有很多字是白色的看不到。
回复 支持 反对

使用道具 举报

 楼主| metootootoo 发表于 2015-12-17 00:21:24 | 显示全部楼层
Rocketman456 发表于 2015-12-16 15:44
感谢楼主分享! 原来MS申DS还是有难度的~

因为都是it公司,所以cs的ms是没问题的
统计的话必须把数据结构和算法弄的很清楚,代码能力要很高才行。要准备的早
回复 支持 反对

使用道具 举报

ns920020 发表于 2016-3-16 04:57:15 | 显示全部楼层
楼主后来申请一月 google quantitative analysts internship了么? 有消息没啊。。。。。我也申请了。。。啥消息都没有
回复 支持 反对

使用道具 举报

本版积分规则

请点这里访问我们的新网站:一亩三分地Instant.

Instant搜索更强大,不扣积分,内容组织的更好更整洁!目前仍在beta版本,努力完善中!反馈请点这里

关闭

一亩三分地推荐上一条 /5 下一条

手机版|小黑屋|一亩三分地论坛声明 ( 沪ICP备11015994号 )

custom counter

GMT+8, 2016-12-4 22:53

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

快速回复 返回顶部 返回列表