一亩三分地

 找回密码 注册账号

扫描二维码登录本站

BBS
Offer多多
Salarytics
交友
Learn
Who's Hiring?
Visa Tracker
疫情动态
指尖新闻
Instant
客户端
微信公众号
扫码关注公众号
留学申请公众号
扫码关注留学申请公众号
Youtube频道
留学博客
关于我们
查看: 8859|回复: 34
收起左侧

分享一波自学DS analytics的面试经验和资料

    [复制链接] |只看干货
地里的匿名用户
地里的匿名用户  发表于 2020-6-26 08:07:42 |阅读模式
本楼: 👍   100% (22)
 
 
0% (0)   👎

2029(1-3月) 分析|数据科学类 硕士 全职@analytics - Other - 其他  | Other | 其他

注册一亩三分地论坛,查看更多干货!

您需要 登录 才可以下载或查看,没有帐号?注册账号

x
本帖最后由 大队管理员 于 2020-6-27 12:56 编辑

楼主原本不在tech打工,自学了ds analytics的一些内容然后面试进了tech,之后每年都会面一波data scientist的职位掂量一下自己,一般是以analytics track为主(一下就统称ds了)。由于每年都会来看看大家贡献的面筋,感觉很有意思也很有启发,所以想也分享一些我自己用的资,在这个特殊时期,希望能有所帮助,特别是帮助一些还没入门或者比较没有经验的人吧。

. From 1point 3acres bbs
1.面试准备

1)ds analytics需要准备哪些topics:1.product case study 2. sql coding(and/or python, r coding) 3.stats knowledge 4. a/b testing knowledge 5. machine learning knowledg
2)怎么准备:首先以上内容有些可以短期练成有些并不可以。所以对于几乎没product/ab testing经验的人,我建议整个面试过程拉到6-8周完成(如果你同时准备好几家公司面试,再拉的更长一点,因为每个公司都需要花一些力气去customize你的复习,所以这个时间也要算在其中),不要着急去面试(当然这个对于疫情期间可能不现实,这种特殊情况就自己balance一下吧,你要知道很多公司你没面过最大的代价是会被freeze一年)。
. check 1point3acres for more.
--product case study(耗时长):
1. 为什么考这个?因为这个可以展示ds工作的流程,主要分三部分,也可以代表ds工作的三大块内容: identify product opportunity(data analysis) + measure product performance(a/b testing) + diagnose metrics change(debug analysis)。所以面试的时候你总会被问到:how do you measure, how do you improve, how do you find out the cause of a drop...因为这些问题就是上面环节你需要回答,在真实工作中要解决的。这方面我很推荐这个帖子,写的CASE STUDY方面很到位《[面试经验] 总结如何准备Data Science analytics interview,case study详解》:https://www.1point3acres.com/bbs ... D311%26sortid%3D311

2. 对于product题目,最重要的是面试时候能够有自己的框架,以不变应万变。我根据以上三个环节分别有自己回答的struture,当你知道这类问题要怎么回答的时候,对方怎么提问你都不虚了。这部分主要想想这个回答的流程。同时,根据一些常见的产品/feature类型,你要积累一些相关的goal和metrics,比如说:改ui button颜色的时候看什么,notification feature看什么,更改ranking algorithm时候看什么,测试coupon的时候看什么之类的。
3. product sense是一个需要时间的东西,首先你要去熟悉和了解很多tech company用到的词(每个公司也不太相同,这个需要积累),比如我一开始并不知道churn, traffic, funnel之类的是啥,也不是很comfortable。建议可以多看看书,online class, podcast来培养一个思路和氛围:书可以看看lean analytics, cracking the pm interview, ds take home challenge(online paid materials), stellapeers的product回答对于新人特别有打样的功能;online class: 可以看fb alex schulz还有各种tech大佬的演讲(youtube), udacity好像有一个product design class; podcast就是:product school (特别里面第一期fb pm的一个演讲)我感觉十分inspiring。这些累了就能听能看,想想大家是怎么实际用和思考product的。
4. 面特定公司的时候,要去总结一下他们的产品线/产品(一般官网都帮你总结好了的),分分类使用看看特别是面筋里常提到的。大概的思考一下这玩意能干点啥,你喜欢它的三个优点,三个缺点。试用这件事情很重要,我每次面试都可以提出关于产品一些小细节的想法,能够给面试官一种这点我还真没想到的印象。当然并不是一定就能遇到自己玩过的产品或者点子多么惊人,但是都玩玩之后对你自己自信的提高也很重要。

--sql/python/r coding (耗时一般,取决于你的经验):
1. sql是必须要会的这个毋庸置疑,如果你不会sql的话那你必须先学,最好的方法就是做面筋题还有ds take home challenge的sql题还有leetcode的sql题(首选要面的公司,不够的话我推荐fb的sql题:因为他们的sql全是真实应用,有很多edge cases可以思考,同时难度较难),同时想系统的学习我最推荐的是:mode analytics的sql tutorial: https://mode.com/sql-tutorial/introduction-to-sql 。然后自己面筋做一遍,重要的function和应用过一遍,错题积累一下,自己掐时练习就欧了。
2. python和r的话选一个复习就可以。并且可以分几种level。首先最初级是把所有关于data manipulation的coding都学会,按照sql里面每一种操作你要知道python/r里面是怎么操作的,比如group by/count distinct,建议的资料:https://medium.com/jbennetcodes/ ... d-more-149d341fc53e  再进一步就是学会python/r简单coding:这个可以上网课专门学习一下coding,也可以考虑用mode analytics或者各种python classes,同时可以用leetcode easy来测试一下自己。如果真的很有空,可以考虑把leetcode easy都做了,一般足够了。最后要注意的就是对于一些小知识,比如说python/r里面的数据类型是什么,package名称等可能也是会被考小知识。

--stats knowledge(耗时较短):
stats一般只要会probability的知识(conditional probability),distributions还有hypothesis testing部分就可以了。如果时间少的话首先把hypothesis testing弄熟,推荐coursera上面duke的课程:intro to probability and data with r还有inferential statistics,我最喜欢这个课程在于他告诉了你整个stats里面我们为什么这么做,对于非stats专业的人很友好,对于stats专业的也许过于基础。还有一个youtube频道专门讲解stats basic terms的: zedstatistics, 很清晰。再者就是要弄熟悉各种名词的意思,能够解释给别人听。如果还有时间就做一些conditional probability,binoimial distribution的题目有时候好像也会考一下但是很少。如果真的还有时间,推荐去看harvard online class:Statistics 110: Probability, 老师很喜欢同时推导过程很清晰。我是数学专业的所以很喜欢看一些东西到底怎么推出来的,如果学习了整个推导过程,我觉得非常有利我自己对stats的理解和记忆。不然只是看表面的东西我经常要过好几遍不然我就忘。

--ab testings (耗时一般):
我第一次看udacity中google出品的ab testing class我完全没有看懂,然后我看到大家都说好我真的很怀疑我自己,但是看了三次左右吧我就开始能够get到这个class的奥秘,其实他确实是一个很实用也完整的介绍,所以还是推荐看不过如果没什么基础知识的话我觉得可以先看看别的垫一垫先!同时我在地里有曾经找到tiger slides也不错,介绍的很简明,找不到google一下或者youtube好像也有资源,这个好像是一个机构。同时可以在medium或者youtube里面搜索关于ab testing的相关内容,一般会有一些比较实际的内容介绍。最后你最好自己默写一遍ab testing的流程,默写可以帮助你记忆整个picture对于没怎么做过ab testing的人是很重要的。

--machine learning (耗时短):
这里之所以说耗时短是因为analytics一般要求不高。大概了解以下几种model就好:regression(linear/logistic),tree based model,k-means/pca。然后regression model要仔细过一遍,从假设,数学公式,应用,优缺点,算法,evaluation等方面入手。其他ml一般都考一些表面的应用,比如说这model干嘛的,优缺点,为啥用,大概的algorithm解释一下之类的。同时会考一些关于modeling的内容:比如什么是overfitting,怎么做feature selection,怎么evaluate好几个model这样。我推荐写An Introduction to Statistical Learning: With Applications in R的教授他们的网课,两个人说话超级有意思我都是当自己兴趣在看的。同时andrew ng的网课比较基础容易入门。还有最后是statquest的youtube频道介绍ml model挺清晰的,比较能帮助你intuitively了解(他们家的stats概念我倒不太喜欢,觉得介绍的不太好)。当然还有o'reily一系列的书籍可以买来看看,都是讲data science的。



游客,本帖隐藏的内容需要积分高于 50 才可浏览,您当前积分为 0。
查看如何攒积分 Click here for more info.




-baidu 1point3acres



评分

参与人数 74大米 +205 收起 理由
tiffanyyyyt + 1 给你点个赞!
wukehan1234 + 2 总结得很棒!
Quinntile + 2 很有用的信息!
kellyrxw + 1 赞一个
zry2277 + 1 给你点个赞!
ifiaxxy + 2 给你点个赞!
kristen-h + 1 赞一个
Jenson_2012 + 2 给你点个赞!
lluucciiffeerr + 1 给你点个赞!
杰奇 + 2 真的超级多干货,谢谢

查看全部评分


上一篇:Apple data analyst tech跪经
下一篇:字节跳动跪 产品题 求指点

本帖被以下淘专辑推荐:

我的人缘0

升级   48.71%

syk0607 2020-6-28 03:22:54 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   99% (181)
 
 
0% (1)    👎
感谢分享,很赞!
回复

使用道具 举报

我的人缘0

升级   2.71%

LordShrimpie 2020-6-28 06:53:32 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   100% (6)
 
 
0% (0)    👎
感谢分享,很赞!
回复

使用道具 举报

我的人缘0

升级   29.35%

righteous 2020-6-28 09:20:42 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   97% (1652)
 
 
2% (49)    👎
感谢分享,祝好运
回复

使用道具 举报

我的人缘0

升级   48.86%

FinalLi 2020-6-28 09:57:44 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   75% (21)
 
 
25% (7)    👎
感谢楼主分享
回复

使用道具 举报

我的人缘0

升级   3%

yikexiaofq 2020-6-28 12:01:32 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   0% (0)
 
 
0% (0)    👎
感谢分享,很赞!mark
回复

使用道具 举报

我的人缘0

升级   0.48%

光影流转 2020-6-28 23:19:22 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   100% (116)
 
 
0% (0)    👎
感谢lz分享!
回复

使用道具 举报

我的人缘0

升级   25.57%

colospring 2020-6-29 02:03:28 | 显示全部楼层
本楼: 👍   0% (0)
 
 
0% (0)   👎
全局: 👍   99% (156)
 
 
0% (1)    👎
小白想请教楼主一个问题呀,看很多DS hiring requirements会要求hadoop, hive这些,不过我很少见DS经验贴有提到,请问这些有必要花时间学习一下吗?还是只要SQL和python掌握好就好呀?谢谢!
回复

使用道具 举报

地里的匿名用户
地里的匿名用户  发表于 2020-6-29 02:20:11
本楼: 👍   0% (0)
 
 
0% (0)   👎
colospring 发表于 2020-6-29 02:03
小白想请教楼主一个问题呀,看很多DS hiring requirements会要求hadoop, hive这些,不过我很少见DS经验贴有 ...

hive, hadoop其实就是框架,所以我自己是了解这两个并且能够阐述大概原理就好。hive sql hive python hive r 不也是sql, python和r吗。我自己从来没有被问到,不过如果你简历写了说不定会有人专门问一下你用hive和hadoop的经验这样,感觉比较偏data engineer。

评分

参与人数 1大米 +1 收起 理由
dldlldld + 1 很有用的信息!

查看全部评分

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册账号

本版积分规则

隐私提醒:
■拉群请前往同学同事飞友|拉群结伴版块,其他版块拉群,帖子会被自动删除
■论坛不能删帖,为防止被骚扰甚至人肉,不要公开留微信等联系方式,请以论坛私信方式发送。
■特定版块可以超级匿名:https://pay.1point3acres.com/tools/thread
■其他版块匿名方法:http://www.1point3acres.com/bbs/thread-405991-1-1.html

手机版|||一亩三分地

Powered by Discuz! X3

© 2001-2013 Comsenz Inc. Design By HUXTeam

Some icons made by Freepik from flaticon.com

快速回复 返回顶部 返回列表